Välkommen! Tack för besök!
Prenumerera på full feed
Det här inlägget är en del av en pågående serie: Hur Sök verkligen fungerar.
Föregående delutbetalningen: Den Keyword Density Myth.
Om en sökmotor skulle söka "live" med hjälp av de dokument den vet om när det gäller förekomst av ordet vi letar efter det kan ta sin tid och sedan helt enkelt rapport där det konstaterades vårt ord.
I det här exemplet vår sökmotor bara har ett index: de handlingar själv.

Men tid är något som en sökmotor inte har; sökfrågan måste besvaras nu.
Vad vi behöver är en verklig index!

Problemet med en boolean index, där vi lagt en liten flagga (1) eller inte (0) för varje ord för varje dokument är att det snabbt växer sätt och alldeles för stor.
Tre dokument med bland dem bara fyra ord ta 12 1 eller 0: s - bortsett från de bits och bytes vi måste lagra ord. Nu föreställa sig en matris där en av sidorna är 13940000000 kolumner bred ...

I inverterade index vi enbart de platser (handlingar) där ordet förekommer.
Det kallas inverterad grund i stället för de dokument som de förekomster av ett ord, ordet platser till vilka dokument som den förekommer i.
Sorterat efter dokument pekare, det inverterade indexet är extremt effektivt när det utför och frågor.
Låt oss ändra vårt exempel lite att göra denna visuellt tydlig: 
Om vi söker efter dokument som innehåller orden "sök kompressionständning" och vi ner dessa rader på samma gång, så snart en rad gör ett hopp till en högre dokument ID kan du hoppa framåt i den andra raden också: ingen nytta kontrollera de mellanliggande dem som ni nu vet att de inte kommer att ha både ord.
Att veta bara om ja / nej händelser en inverterad index är hemskt på meningen och närhet matchning:

Fortsättning följer ...
Jag hänger på Twitter där jag njuta av företaget, buzz, den nuggets av info och yttrande passerar vi tillsammans.
[...] I de första delarna av serien har vi utbildade i META nyckelord, länkar, sökord stoppningsändamål, sökord densitet myt, och nu har vi "Hur Sök verkligen fungerar:" De "Register (1)" [. ..]
Excellent post om samtidig förekomst inom sökning. Intresserad av att se uppföljning. Informationssökning bör om "måste-veta-lista för alla SEOs men fantastiskt hur många som inte helt förstå det.
Jag trodde jag förstod lite om sökmotorer men nu är jag förvirrad. Otåligt väntar på del 2.
Jag ser verkligen fram emot att läsa mer av denna serie. Jag skulle kunna göra några människor väldigt glad om jag nämnde dem här!