Добро пожаловать! Благодарим за посещение!
Подписаться на полный канал
Этот пост является частью текущей серии: Как работает поиск.
Ранее: Актуальность (2)
Вместо того чтобы тщательно захвата абсолютной наилучшим образом соответствует Вашему запросу затем эти звания с бесконечной точностью, одно время спасения стратегия поисковики пойти на "достаточно близко".

Учитывая все это время, деньги и ресурсы в мире, вот то, что мы обычно делаем.
Слово в слово, написанное через поиск. Ты смотришь на ваши документы, и посмотрите, который одним словом .... Слово два ... три ... словом. Вы получите изображение.
Этот пост является частью текущей серии: Как работает поиск.
Ранее: Актуальность (1)
Другим образом, мы можем оценить релевантность документа является термин взвешивания.
От мифа плотность ключевых слов мы знаем, что подлинная срока взвешивание осуществляется сбор мире.
Глядя на количество документов в индексе, что в перспективе появится мы можем сделать измерения информации: как хорошо, как специальный смысл ... как это слово?
Слово о не будет специального вообще появляться в слишком много документов. Ее стоимость будет близка к нулю.
Этот пост является частью текущей серии: Как работает поиск.
Ранее: Простые Запрос оптимизации.
Поиск всегда Логика: да или нет. Правда или ложь.
Либо слов в документе или нет.

Но, как видите, не все документы "рождается так". Некоторые из них по поводу нашей темы, некоторые просто сказать.
Что нам нужно, чего мы хотим, это не просто большой список результатов - мы хотим, чтобы соответствующий список результатов, отсортированных желательно, чтобы наилучшие ставки, как по верху.
Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: Сжатый индекс.
Хотя люди могут сканировать страницы, и посмотреть, если вся фраза "А высокопарной словарь" не появится, то поисковая машина не может.
Поисковая система должна:
В поисковой системе не смарт он должен работать смарт.

Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: признать этот индекс?
Память гораздо быстрее, чем просматривать вещи вверх.
Для того, чтобы поисковая система в большой спрос служить пользователям эффективно он должен держать в памяти вещи, вместо поиска его на диске.
Традиционно крупномасштабных поисковых систем будет держать их полного словаря в памяти и размещение списка на диск.

Очевидно, что чем больше Вы можете хранить в памяти, а также более подробную информацию можно прочитать обратно с одного диска действий, тем лучше.
Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: "В" Индекс (2).
Упрощен: мы, по крайней мере, несколько страниц в нашем индексе, извлекли каждое слово из этих страниц, и записаны в один индекс, где в каких страниц эти слова происходят.
Хотите поговорить номера? У нас есть очень точные из них за Английский язык.
"Мы 1.024.908.267.229 обработанных слов запуска текста и публикации подсчитывает для всех 1176470663 пять последовательностей слов, которые появляются по крайней мере в 40 раз. Существуют 13588391 уникальным словам, после выброса слов, которые появляются менее чем в 200 раз".
Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: "В" Индекс (1).
На прошлой неделе мы видели, как инвертированный индекс (где список слов указывает на перечень документов, в котором они появятся) является insanely полезным для практической деятельности и запросы.

Но что, если вы не ищете какой-либо документ, который словами поиска и народом, и двигатель, но вы ищете поиска людей?
Ну, если документ 42 в нашем примере гласит: "двигатель был найден после поиска некоторых людей", или "люди используют в поисковых системах, таких как Google", чем традиционные инвертированный индекс будет считаю, что это пятно на поиск. Ай ....
Этот пост является частью текущей серии: Как работает поиск.
Ранее Партия: Плотность ключевых слов Миф.
Если в поисковой системе будет поиск "в живую" на основе документов, он знает для возникновения этого слова мы ищем это может занять свое время, а затем просто доклад, где по его мнению, наши слова.
В нашем примере поиска только один указатель: документы сам.

В то же время что-то в поисковой системе не имеет; запроса необходимо дать ответ сейчас.
Нам нужен реальный индекс!
Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: наполнение ключевыми словами.
Плотность ключевых слов является функцией, расчет, частоты ключевых слов.
Это рассчитывается как число случаев, разделенное на количество слов, и обычно выражается в процентах.

Ни много, действительно.
Плотность ключевых слов может помочь в удобочитаемости расчетов.
Плотность ключевых слов также иногда используется в упрощенном порядке ввести местные вес ключевых слов, но никогда не следует путать с ней.

Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: Ссылки на ключевые слова.
Брошены на произвол судьбы, люди будут назначать ключевые слова (метки или ссылку), как им заблагорассудится.
Они рисуют богатую картину связанных содержание.

Ключевое слово начинки является противоестественным повторяющихся использования конкретного слова или фразы.
В вашем содержании ....

.. или вашей ссылки ...
