Bem-vindo! Obrigado por visitar!
Assine o feed completo
Esse post é parte de uma série em curso: Como Procurar Really Works.
Anteriormente: Pertinência (2)
Em vez de pegar a absoluta painstakingly melhores jogos para a sua consulta, em seguida, para classificar aqueles com precisão infinita, uma poupança de tempo estratégia tem os motores de busca ir para "perto o suficiente".

Dado todo o tempo, dinheiro e recursos em todo o mundo, aqui é o que gostaríamos normalmente.
Palavra por palavra que você passar por uma pesquisa. Você olha nos seus documentos e ver que tem uma palavra .... palavra duas ... três ... palavra. Você começa a foto.
Esse post é parte de uma série em curso: Como Procurar Really Works.
Anteriormente: Relevância (1)
Outra maneira é possível avaliar a relevância de um documento é, por prazo ponderação.
A partir da palavra-chave densidade mito, sabemos que a verdadeira expressão ponderação é feita coleta de largura.
Ao olhar para o número de documentos no índice que um termo aparece em nós podemos fazer uma medição de informações: como bom, como é especial ... como significado desta palavra?
A palavra a não ser especial em tudo, aparecendo em muitas documentos. O seu valor seria próximo de zero.
Esse post é parte de uma série em curso: Como Procurar Really Works.
Anteriormente: Simple Query Optimization.
Pesquisa é sempre booleanas: sim ou não. Verdadeiro ou falso.
Ou as palavras estão no documento ou não.

Mas como se pode ver, nem todos os documentos são "nasceram iguais". Algumas são sobre o nosso tema, alguns apenas mencionar.
O que precisamos, o que queremos, não é apenas uma grande lista de resultados - queremos uma lista de resultados relevantes, preferencialmente ordenadas de modo a que a melhor aposta surge em cima.
Esse post é parte de uma série em curso: Como Procurar Really Works.
Na semana passada: o comprimido Index.
Enquanto os seres humanos pode escanear uma página e ver se toda a frase "uma grandíloquo dicionário" aparece sobre o mesmo, um motor de pesquisa não pode.
Um motor de pesquisa precisa de:
Como um motor de busca é inteligente não precisa de trabalho inteligente.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Última semana: Reconhecer este índice?
A memória é muito mais rápido do que olhar as coisas.
Para que um motor de pesquisa em alta demanda para servir os seus utilizadores de forma eficiente, deve manter as coisas em memória, em vez de olhar-lo em um disco.
Tradicionalmente grandes motores de busca irá manter o seu dicionário completo na memória e ao destacamento lista em disco.

Obviamente, quanto mais você pode manter na memória e mais informações podem ser lidos de volta com um disco acção, o melhor.
Esse post é parte de uma série em curso: Como Procurar Really Works.
Na semana passada: "O" Índice (2).
Simplificado: temos pelo menos um poucas páginas em nosso índice, ter extraído a partir de cada palavra escrita nessas páginas e têm um índice baixo de onde, em quais páginas essas palavras ocorrem.
Quer falar com números? Temos algumas muito mais precisas para o idioma Inglês.
"Estamos executando o processado 1.024.908.267.229 palavras de texto e edição são as contagens para todos os cinco 1176470663 palavra-sequências que aparecem pelo menos 40 vezes. Existem 13588391 únicas palavras, palavras que aparecem depois da devolução menos 200 vezes."
Esse post é parte de uma série em curso: Como Procurar Really Works.
Na semana passada: "O" Índice (1).
Na semana passada, vimos como um índice invertido (quando uma lista de palavras aponta para uma lista de documentos em que aparecem) é incrível útil para fazer e consultas.

Mas e se você não estiver procurando por qualquer documento que tenha as palavras, pessoas e motor de pesquisa, mas está à procura de motor de busca do Povo?
Bom, se documento 42 em nosso exemplo lê "o motor foi encontrada após uma pesquisa por algumas pessoas" ou "as pessoas usam um mecanismo de pesquisa como o Google" do que um tradicional índice invertido pensaria it's Spot-On para a sua pesquisa. Ai ....
Esse post é parte de uma série em curso: Como Procurar Really Works.
Parclea Anterior: A palavra-chave Densidade Mito.
Se um motor de pesquisa que busca "ao vivo" através dos documentos que sabe acerca da ocorrência da palavra que está procurando pode ser que leve o seu tempo e depois simplesmente relatório onde se verificou a nossa palavra.
Neste exemplo, o nosso motor de pesquisa só tem um índice: os documentos em si.

No entanto, o tempo é algo de um motor de pesquisa não tem, a consulta deve ser respondida agora.
O que nós precisamos é de um índice real!
Esse post é parte de uma série em curso: Como Procurar Really Works.
Última semana: Keyword Stuffing.
Keyword Density é uma função, um cálculo, a freqüência de palavras-chave.
É calculado como o número de ocorrências dividido pelo número de palavras, e é geralmente expresso como uma percentagem.

Nada muito, realmente.
Keyword densidade pode ajudar na legibilidade cálculos.
Keyword densidade também é por vezes utilizado como uma forma simplificada de introduzir palavra-chave peso local, mas nunca deve ser confundida com ela.

Esse post é parte de uma série em curso: Como Procurar Really Works.
Última semana: Keyword Ligações.
Da esquerda para a sua própria sorte, as pessoas irão atribuir palavras-chave (tag ou link) o que quiserem.
Eles pintam um retrato rico do conteúdo ligado.

Keyword enchimento é o desnatural uso repetitivo de uma determinada palavra ou frase.
Em seu conteúdo ....

.. ou seus links ...
