Ruud Hein Benvingut! Gràcies per visitar-nos!

Vos a l'alimentació completa

Com funciona realment la cerca: "El" Índex (1)

per Ruud Hein.


Aquest lloc és part d'una sèrie en curs: Com funciona realment la cerca.
Tram anterior: El mite de la densitat de paraules clau.

Si un motor de cerca de la cerca "en viu" a través dels documents que coneix de l'ocurrència de la paraula que estem buscant que pot prendre el seu temps i, a continuació, simplement informe on es troba la nostra paraula.

En aquest exemple, el nostre motor de cerca només té un índex: els documents en si.

document de només-índex

Tanmateix, el temps és una cosa que un motor de cerca no té, la pregunta ha de ser respostes ara.

El que necessitem és un veritable índex!

Índex boolean - Parli sobre la Matriu

boolean índex

El problema amb un booleà índex, on posem un poc de bandera (1) o no (0) per a cada una de les paraules per a cada document, és que creix ràpidament, i massa gran.

Tres documents, entre ells amb només quatre paraules prendre 12 1 o 0's - a més dels bits i bytes que necessitem per a emmagatzemar la paraula. Ara imagina una matriu, on un dels costats és 13940000000 columnes d'ample ...

L'índex invertit

invertida índex

En l'índex invertit que només el registre de llocs (els documents) en cas que una paraula es produeix.

S'anomena invertida, perquè en lloc dels documents que les ocurrències d'una paraula, la paraula als que els documents es produeix in

Ordenada pel document punter, l'índex invertit és extremadament eficient en el desenvolupament i les consultes.

Anem a reorganitzar el nostre exemple una mica perquè aquest visualment clar: intersecció de cerca

Si la cerca de documents que contenen les paraules "cerca de la compressió" i en aquestes files, alhora, tan aviat com una fila fa un salt a un document d'identificació, es pot avançar en la fila i altres: no ús control dels intermediaris com els que ara saben que no tindran els dos paraules.

Conèixer només sí o no els successos, un índex invertit en la frase és horrible i la proximitat es posin en venda:

París-hilton

A continuació ...

Penjo a Twitter on gaudir de la companyia, el bullicio, l'llavors d'informació i opinió, al llarg de passar.
Uneix-te a mi a Twitter!

guest presentar després


Tal com va ser anunciat en la recerca Com funciona realment el 22 de febrer de 2008.

4 respostes fins ara: 3 comentaris i 1 vincles

  1. Excel lent posat en co-ocurrència en la recerca. Interessats en veure el seguiment. De recuperació d'informació hauria d'estar en el "ha de saber" llista de tots els SEO, però sorprenent com molts no entendre completament la mateixa.

  2. Vaig pensar que entendre una mica sobre els motors de cerca, però ara estic confós. Espera amb impaciència la part 2.

  3. Geld lenen diu:

    Estic esperant per llegir més d'aquesta sèrie. Jo podria fer que algunes persones molt feliç si m'he referit aquí!

Trackbacks / Pingbacks

  1. [...] En la primera part de la sèrie que hem estat educats en META paraules, vincles de paraules clau, paraula clau farciment, la densitat de paraules clau mite, i ara tenim "Com funciona realment la cerca:" El "Índex (1)" [. ..]


Connectar amic

RECENTS LECTORS

English flagItalian flagKorean flagChinese (Simplified) flagChinese (Traditional) flagPortuguese flagGerman flagFrench flagSpanish flagJapanese flagArabic flagRussian flagGreek flagDutch flagBulgarian flagCzech flagCroat flagDanish flagFinnish flagHindi flagPolish flagRumanian flagSwedish flagNorwegian flagCatalan flagFilipino flagHebrew flagIndonesian flagLatvian flagLithuanian flagSerbian flagSlovak flagSlovenian flagUkrainian flagVietnamese flagAlbanian flagEstonian flagGalician flagMaltese flagThai flagTurkish flagHungarian flag