Ruud Hein Bem-vindo! Obrigado por visitar!

Assine o feed completo

Como Procurar Really Works: A maioria pegar Red M & M's

por Ruud Hein.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Anteriormente: Pertinência (2)

Em vez de pegar a absoluta painstakingly melhores jogos para a sua consulta, em seguida, para classificar aqueles com precisão infinita, uma poupança de tempo estratégia tem os motores de busca ir para "perto o suficiente".

Painstaking Precisão

ordenadas-mm

Dado todo o tempo, dinheiro e recursos em todo o mundo, aqui é o que gostaríamos normalmente.

Palavra por palavra que você passar por uma pesquisa. Você olha nos seus documentos e ver que tem uma palavra .... palavra duas ... três ... palavra. Você começa a foto.

Ruud Hein

Como Procurar Really Works: Pertinência (2) - Space Vector

por Ruud Hein.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Anteriormente: Relevância (1)

Outra maneira é possível avaliar a relevância de um documento é, por prazo ponderação.

A partir da palavra-chave densidade mito, sabemos que a verdadeira expressão ponderação é feita coleta de largura.

Ao olhar para o número de documentos no índice que um termo aparece em nós podemos fazer uma medição de informações: como bom, como é especial ... como significado desta palavra?

A palavra a não ser especial em tudo, aparecendo em muitas documentos. O seu valor seria próximo de zero.

Ruud Hein

Como Procurar Really Works: Relevância (1)

por Ruud Hein.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Anteriormente: Simple Query Optimization.

Pesquisa é sempre booleanas: sim ou não. Verdadeiro ou falso.

Ou as palavras estão no documento ou não.

boolean-pesquisa

Mas como se pode ver, nem todos os documentos são "nasceram iguais". Algumas são sobre o nosso tema, alguns apenas mencionar.

O que precisamos, o que queremos, não é apenas uma grande lista de resultados - queremos uma lista de resultados relevantes, preferencialmente ordenadas de modo a que a melhor aposta surge em cima.

Ruud Hein

Como Procurar Really Works: Consulta Simples Otimização

por Ruud Hein.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Na semana passada: o comprimido Index.

Enquanto os seres humanos pode escanear uma página e ver se toda a frase "uma grandíloquo dicionário" aparece sobre o mesmo, um motor de pesquisa não pode.

Um motor de pesquisa precisa de:

  1. Busca as ocorrências de cada palavra na frase
  2. Veja se as posições das palavras no documento apto a frase

Como um motor de busca é inteligente não precisa de trabalho inteligente.

Alavancagem Keyword Freqüência

sort-by-frequência

Ruud Hein

Como Procurar Really Works: O comprimido Índice

por Ruud Hein.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Última semana: Reconhecer este índice?

A memória é muito mais rápido do que olhar as coisas.

Para que um motor de pesquisa em alta demanda para servir os seus utilizadores de forma eficiente, deve manter as coisas em memória, em vez de olhar-lo em um disco.

Tradicionalmente grandes motores de busca irá manter o seu dicionário completo na memória e ao destacamento lista em disco.

dicionário-in-memory-postings-sobre-disco

Ineficiente Armazenamento

Obviamente, quanto mais você pode manter na memória e mais informações podem ser lidos de volta com um disco acção, o melhor.

Ruud Hein

Como Procurar Really Works: Reconhecer este índice?

por Ruud Hein.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Na semana passada: "O" Índice (2).

Simplificado: temos pelo menos um poucas páginas em nosso índice, ter extraído a partir de cada palavra escrita nessas páginas e têm um índice baixo de onde, em quais páginas essas palavras ocorrem.

Quer falar com números? Temos algumas muito mais precisas para o idioma Inglês.

Google diz;

"Estamos executando o processado 1.024.908.267.229 palavras de texto e edição são as contagens para todos os cinco 1176470663 palavra-sequências que aparecem pelo menos 40 vezes. Existem 13588391 únicas palavras, palavras que aparecem depois da devolução menos 200 vezes."

Ruud Hein

Como Procurar Really Works: "O" Índice (2)

por Ruud Hein.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Na semana passada: "O" Índice (1).

Na semana passada, vimos como um índice invertido (quando uma lista de palavras aponta para uma lista de documentos em que aparecem) é incrível útil para fazer e consultas.

Índice invertido

Mas e se você não estiver procurando por qualquer documento que tenha as palavras, pessoas e motor de pesquisa, mas está à procura de motor de busca do Povo?

Bom, se documento 42 em nosso exemplo lê "o motor foi encontrada após uma pesquisa por algumas pessoas" ou "as pessoas usam um mecanismo de pesquisa como o Google" do que um tradicional índice invertido pensaria it's Spot-On para a sua pesquisa. Ai ....

Ruud Hein

Como Procurar Really Works: "O" Índice (1)

por Ruud Hein.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Parclea Anterior: A palavra-chave Densidade Mito.

Se um motor de pesquisa que busca "ao vivo" através dos documentos que sabe acerca da ocorrência da palavra que está procurando pode ser que leve o seu tempo e depois simplesmente relatório onde se verificou a nossa palavra.

Neste exemplo, o nosso motor de pesquisa só tem um índice: os documentos em si.

documento-só-index

No entanto, o tempo é algo de um motor de pesquisa não tem, a consulta deve ser respondida agora.

O que nós precisamos é de um índice real!

Ruud Hein

Como Procurar Really Works: O Mito Keyword Density

por Ruud Hein.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Última semana: Keyword Stuffing.

Qual é a palavra-chave Densidade?

Keyword Density é uma função, um cálculo, a freqüência de palavras-chave.

É calculado como o número de ocorrências dividido pelo número de palavras, e é geralmente expresso como uma percentagem.

palavra-chave densidade exemplo

Qual é a palavra-chave Densidade utilizado?

Nada muito, realmente.

Keyword densidade pode ajudar na legibilidade cálculos.

Keyword densidade também é por vezes utilizado como uma forma simplificada de introduzir palavra-chave peso local, mas nunca deve ser confundida com ela.

Porque não usar palavras-chave Search Engines Densidade?

locais e palavras-chave densidade

Ruud Hein

Como Procurar Really Works: Keyword Stuffing

por Ruud Hein.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Última semana: Keyword Ligações.

Da esquerda para a sua própria sorte, as pessoas irão atribuir palavras-chave (tag ou link) o que quiserem.

Eles pintam um retrato rico do conteúdo ligado.

natural ligando

Keyword enchimento é o desnatural uso repetitivo de uma determinada palavra ou frase.

Em seu conteúdo ....

palavra-chave enchimento

.. ou seus links ...

palavras-chave stuffing2