Benvingut! Gràcies per visitar-nos!
Vos a l'alimentació completa
Aquest lloc és part d'una sèrie en curs: Com funciona realment la cerca.
Tram anterior: El mite de la densitat de paraules clau.
Si un motor de cerca de la cerca "en viu" a través dels documents que coneix de l'ocurrència de la paraula que estem buscant que pot prendre el seu temps i, a continuació, simplement informe on es troba la nostra paraula.
En aquest exemple, el nostre motor de cerca només té un índex: els documents en si.

Tanmateix, el temps és una cosa que un motor de cerca no té, la pregunta ha de ser respostes ara.
El que necessitem és un veritable índex!

El problema amb un booleà índex, on posem un poc de bandera (1) o no (0) per a cada una de les paraules per a cada document, és que creix ràpidament, i massa gran.
Tres documents, entre ells amb només quatre paraules prendre 12 1 o 0's - a més dels bits i bytes que necessitem per a emmagatzemar la paraula. Ara imagina una matriu, on un dels costats és 13940000000 columnes d'ample ...

En l'índex invertit que només el registre de llocs (els documents) en cas que una paraula es produeix.
S'anomena invertida, perquè en lloc dels documents que les ocurrències d'una paraula, la paraula als que els documents es produeix in
Ordenada pel document punter, l'índex invertit és extremadament eficient en el desenvolupament i les consultes.
Anem a reorganitzar el nostre exemple una mica perquè aquest visualment clar: 
Si la cerca de documents que contenen les paraules "cerca de la compressió" i en aquestes files, alhora, tan aviat com una fila fa un salt a un document d'identificació, es pot avançar en la fila i altres: no ús control dels intermediaris com els que ara saben que no tindran els dos paraules.
Conèixer només sí o no els successos, un índex invertit en la frase és horrible i la proximitat es posin en venda:

A continuació ...
Penjo a Twitter on gaudir de la companyia, el bullicio, l'llavors d'informació i opinió, al llarg de passar.
[...] En la primera part de la sèrie que hem estat educats en META paraules, vincles de paraules clau, paraula clau farciment, la densitat de paraules clau mite, i ara tenim "Com funciona realment la cerca:" El "Índex (1)" [. ..]
Excel lent posat en co-ocurrència en la recerca. Interessats en veure el seguiment. De recuperació d'informació hauria d'estar en el "ha de saber" llista de tots els SEO, però sorprenent com molts no entendre completament la mateixa.
Vaig pensar que entendre una mica sobre els motors de cerca, però ara estic confós. Espera amb impaciència la part 2.
Estic esperant per llegir més d'aquesta sèrie. Jo podria fer que algunes persones molt feliç si m'he referit aquí!