Рууд Хайн Добро пожаловать! Благодарим за посещение!

Подписаться на полный канал

Как работает поиск: захват Большая Красная М И М в

на Рууда Хайн.

Этот пост является частью текущей серии: Как работает поиск.
Ранее: Актуальность (2)

Вместо того чтобы тщательно захвата абсолютной наилучшим образом соответствует Вашему запросу затем эти звания с бесконечной точностью, одно время спасения стратегия поисковики пойти на "достаточно близко".

Кропотливая Precision

отсортировано мм

Учитывая все это время, деньги и ресурсы в мире, вот то, что мы обычно делаем.

Слово в слово, написанное через поиск. Ты смотришь на ваши документы, и посмотрите, который одним словом .... Слово два ... три ... словом. Вы получите изображение.

Рууд Хайн

Как работает поиск: Актуальность (2) - векторное пространство

на Рууда Хайн.

Этот пост является частью текущей серии: Как работает поиск.
Ранее: Актуальность (1)

Другим образом, мы можем оценить релевантность документа является термин взвешивания.

От мифа плотность ключевых слов мы знаем, что подлинная срока взвешивание осуществляется сбор мире.

Глядя на количество документов в индексе, что в перспективе появится мы можем сделать измерения информации: как хорошо, как специальный смысл ... как это слово?

Слово о не будет специального вообще появляться в слишком много документов. Ее стоимость будет близка к нулю.

Рууд Хайн

Как работает поиск: Актуальность (1)

на Рууда Хайн.

Этот пост является частью текущей серии: Как работает поиск.
Ранее: Простые Запрос оптимизации.

Поиск всегда Логика: да или нет. Правда или ложь.

Либо слов в документе или нет.

булево-поиск

Но, как видите, не все документы "рождается так". Некоторые из них по поводу нашей темы, некоторые просто сказать.

Что нам нужно, чего мы хотим, это не просто большой список результатов - мы хотим, чтобы соответствующий список результатов, отсортированных желательно, чтобы наилучшие ставки, как по верху.

Рууд Хайн

Как работает поиск: Простой Запрос оптимизации

на Рууда Хайн.

Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: Сжатый индекс.

Хотя люди могут сканировать страницы, и посмотреть, если вся фраза "А высокопарной словарь" не появится, то поисковая машина не может.

Поисковая система должна:

  1. Поиск в происшествий за каждое слово в фразе
  2. Смотрите, если позиции слова в документе, соответствует фразе

В поисковой системе не смарт он должен работать смарт.

Плечо частоты ключевых слов

Сортировать по частоте

Рууд Хайн

Как работает поиск: Сжатый индекс

на Рууда Хайн.

Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: признать этот индекс?

Память гораздо быстрее, чем просматривать вещи вверх.

Для того, чтобы поисковая система в большой спрос служить пользователям эффективно он должен держать в памяти вещи, вместо поиска его на диске.

Традиционно крупномасштабных поисковых систем будет держать их полного словаря в памяти и размещение списка на диск.

словарь в памяти опубликованные на диске

Неэффективные хранения

Очевидно, что чем больше Вы можете хранить в памяти, а также более подробную информацию можно прочитать обратно с одного диска действий, тем лучше.

Рууд Хайн

Как работает поиск: признать этот индекс?

на Рууда Хайн.

Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: "В" Индекс (2).

Упрощен: мы, по крайней мере, несколько страниц в нашем индексе, извлекли каждое слово из этих страниц, и записаны в один индекс, где в каких страниц эти слова происходят.

Хотите поговорить номера? У нас есть очень точные из них за Английский язык.

Google говорит;

"Мы 1.024.908.267.229 обработанных слов запуска текста и публикации подсчитывает для всех 1176470663 пять последовательностей слов, которые появляются по крайней мере в 40 раз. Существуют 13588391 уникальным словам, после выброса слов, которые появляются менее чем в 200 раз".

Рууд Хайн

Как поиск действительно работает: "В" Индекс (2)

на Рууда Хайн.

Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: "В" Индекс (1).

На прошлой неделе мы видели, как инвертированный индекс (где список слов указывает на перечень документов, в котором они появятся) является insanely полезным для практической деятельности и запросы.

инвертированный индекс

Но что, если вы не ищете какой-либо документ, который словами поиска и народом, и двигатель, но вы ищете поиска людей?

Ну, если документ 42 в нашем примере гласит: "двигатель был найден после поиска некоторых людей", или "люди используют в поисковых системах, таких как Google", чем традиционные инвертированный индекс будет считаю, что это пятно на поиск. Ай ....

Рууд Хайн

Как поиск действительно работает: "В" Индекс (1)

на Рууда Хайн.

Этот пост является частью текущей серии: Как работает поиск.
Ранее Партия: Плотность ключевых слов Миф.

Если в поисковой системе будет поиск "в живую" на основе документов, он знает для возникновения этого слова мы ищем это может занять свое время, а затем просто доклад, где по его мнению, наши слова.

В нашем примере поиска только один указатель: документы сам.

документ только индекс

В то же время что-то в поисковой системе не имеет; запроса необходимо дать ответ сейчас.

Нам нужен реальный индекс!

Рууд Хайн

Как работает поиск: Плотность ключевых слов миф

на Рууда Хайн.

Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: наполнение ключевыми словами.

Что такое плотность ключевых слов?

Плотность ключевых слов является функцией, расчет, частоты ключевых слов.

Это рассчитывается как число случаев, разделенное на количество слов, и обычно выражается в процентах.

Плотность ключевых слов пример

Что такое плотность ключевых слов, используемых для?

Ни много, действительно.

Плотность ключевых слов может помочь в удобочитаемости расчетов.

Плотность ключевых слов также иногда используется в упрощенном порядке ввести местные вес ключевых слов, но никогда не следует путать с ней.

Почему бы не использовать Поисковики Плотность ключевых слов?

местного плотность ключевых слов

Рууд Хайн

Как работает поиск: Ключевое слово начинкой

на Рууда Хайн.

Этот пост является частью текущей серии: Как работает поиск.
На прошлой неделе: Ссылки на ключевые слова.

Брошены на произвол судьбы, люди будут назначать ключевые слова (метки или ссылку), как им заблагорассудится.

Они рисуют богатую картину связанных содержание.

природный ссылок

Ключевое слово начинки является противоестественным повторяющихся использования конкретного слова или фразы.

В вашем содержании ....

ключевые слова начинкой

.. или вашей ссылки ...

ключевые слова stuffing2