Ruud Hein स्वागत! में आने के लिए धन्यवाद!

सदस्यता पूर्ण फ़ीड के लिए

कैसे खोज सच में काम करता है: यह सूचकांक पहचानो?

द्वारा Ruud Hein.


इस पोस्ट में चल रहे एक श्रृंखला का हिस्सा है: कैसे खोज सच में काम करता है.
पिछले सप्ताह: "यह" सूचकांक (2).

Oversimplified: हम अपने सूचकांक में एक कुछ पन्नों कम से कम, और उन पन्नों से हर एक शब्द निकाले हैं एक सूचकांक में जहाँ जो पन्नों में उन शब्दों को घटित नीचे लिखा है.

संख्या बात करना चाहते हैं? हम अंग्रेजी भाषा के लिए कुछ बहुत सटीक वाले हैं.

गूगल का कहना है;

"हम और पाठ चलाने का 1.024.908.267.229 शब्दों संसाधित सभी 1.176.470.663 पांच है कि कम से कम 40 बार प्रदर्शित शब्द दृश्यों के लिए मायने प्रकाशन कर रहे हैं. वहां 13.588.391 अद्वितीय शब्द, जो भी कम दिखाई शब्दों discarding के बाद 200 बार कर रहे हैं."

और वह उनके सूचकांक का सिर्फ एक हिस्सा है ...

अब मजा आता है ...

मैं ऐसा करने के लिए है क्या?

292020324_286705be9f_m सूचकांक में शब्दों की यह सूची (के रूप में वे इसे) एक साथ के साथ दस्तावेज़ वे एक संकेतक और स्थितीय जानकारी के रूप में है संख्या आईडी हल करने की आवश्यकता है फोन शब्दकोश.

उहउह. क्रमबद्ध.

के प्रत्येक उपर्युक्त अद्वितीय शब्दों (13588391) के कहने दो 5 अक्षर लंबा है. वह 67 मेगाबाइट अभी भी वहीं है. प्रत्येक अद्वितीय शब्द बोलो एक अनूठा दस्तावेज़ में और पाया जाता है दस्तावेज़ सूचक 5 संख्या चौड़ी है: कि एक दस्तावेज़ प्रत्येक में एक अद्वितीय शब्द के घटना की दुकान करने के लिए एक और 67 मेगाबाइट है. ने जो सबसे शायद लगता है कम से कम एक बार हर दस्तावेज़ में भी शब्द सोचो ...

जैसा कि आप देख सकते हैं, स्मृति आवश्यकताओं को भारी कर रहे हैं और हम में भी इस के लिए भंडारण की आवश्यकताओं में फैक्टरिंग शुरू नहीं किया है, हम खोज इंजन का उपयोग पता स्थितीय औंधा सूचकांक के लिए स्थितीय संकेत दस्तावेज़.

- हम अभी भी अस्थायी स्मृति में बात करने के लिए वास्तव में है कि सूची के साथ कुछ करने की जरूरत है और एक बार हम करते हैं, जैसे कि यह छँटाई ...

ठोड़ा ठोड़ा

इस संभाल करने का एकमात्र तरीका आप बाद में जो गठबंधन आँकड़ों की विखंडू के साथ काम करना है.

छँटाई ब्लॉक

एक हिस्सा है, या ब्लॉक, स्मृति में, पीछे लिखा हल पढ़ा है. एक बिंदु पर आप पूर्व विलय करने के लिए शुरू कर सकते हैं-हल ब्लॉक और एक हल सुपर सूचकांक में उन्हें वापस लिखें.

एक छोटे स्थापना में यह एक मशीन पढ़ने और लिखने ब्लाकों पर ये मशीनें विखंडू की विखंडू के साथ काम करने की एक पूरी गुच्छा है एक बड़े पैमाने पर सेटअप में है.

वितरित-अनुक्रमण

यह पहचानो?

ऐसे एक सूचकांक में तुम अनियमित या अद्यतन दस्तावेजों नई या हटा नष्ट वाले डालने नहीं कर सकते. तुम फिर से करना होगा-तरह हर अद्यतन पर.

तो तुम क्या करते हो?

आप अपने सूचकांक तरह है और इसका इस्तेमाल करते हैं: यह आपके मुख्य सूचकांक है. नई आप वेब पर खोज सामान दूसरे में, अधिक अस्थायी सूचकांक जाता है. कॉल यह पूरक सूचकांक. आदेश में पूर्ण और जब लोग तुम से परिणाम होगा खोज तिथि परिणामों को वितरित करने के लिए दोनों indexes.

हर एक बार में एक, जबकि आप पूरक सूची में से एक में नए नए सामान विलय करने की ज़रूरत होगी. अगर आप नया सामान हर दिन की तुम जो पूरक सूची में इन प्रविष्टियों के मुख्य सूचकांक में उन्हें वापस विलय और इन नहीं कर रहे हैं ... अभी तक के CPU समय के लायक हैं प्राथमिकता स्थापना के कुछ प्रकार की आवश्यकता होगी एक बहुत लगता है.

तुम सिर्फ बाहर चले गए होते और पुनः-सूचकांक में सब कुछ पूरी तरह पुराने दिनों में वापस पाठ्यक्रम में से ...

मैं चहक पर जहाँ मैं कंपनी के भनभनाना, जानकारी और राय की हम साथ उत्तीर्ण की सोने की डली आनंद बाहर रखता.
चहचहाना पर मेरे साथ!

अतिथि पोस्ट प्रस्तुत


के रूप में तैनात कैसे खोज सचमुच कार्य मार्च 7, 2008 पर.

9 जवाब अभी तक: 8 टिप्पणियाँ और 1 trackbacks

  1. spostareduro कहते हैं:

    सभी Ruud मदद के लिए धन्यवाद .. यह हमारे लिए काफी जानकारी है newbies और अन्य के साथ ..

    पुनश्च: एक "कुछ पन्नों" 12.400.000.000 .. यकीन *- के लिए मजेदार चीजें)

  2. निक जेम्स कहते हैं:

    यह एक महान श्रृंखला है Ruud, एक किसी एसईओ में बाहर शुरू करने के लिए आवश्यक के रूप में तुम ऐसी एक स्पष्ट और संक्षिप्त तरीके से चीजों को समझा.
    उदाहरण के लिए कि कैसे एक खोज इंजन अनुक्रमण सामग्री के horrendous कार्य के बारे में चला जाता है इस पोस्ट, ले लो. अगर मैं अपने आप को बाहर मैं शायद गंभीर brainache के साथ समाप्त हो गया था यह आंकड़ा करने की कोशिश की थी. यह लेख मुझे आईएनएस और एक प्रक्रिया के outs की एक बुनियादी समझ के लिए और प्रदान करने के लिए शायद ही कभी एक दूसरे सोचा दे कि हम सब ले दे दी है. लेकिन जो भी क्षमता में केवल एक दिन के अंत में हम बेहतर SEOs बनाने की दिशा में जा सकती है यह समझने.

  3. Ruud Hein कहते हैं:

    किम, खुशी श्रृंखला मूल्य से रहने के लिए!

    निक, और अच्छी टिप्पणी, आदमी के लिए धन्यवाद! हाँ, मैं भी है कि इस सामग्री को समझने बेहतर खोज समझ हमारी मदद कर सकता है. इस है और न उन सभी के लिए कई स्तरों हो तुम अपने कैलकुलेटर बाहर कोड़ा को और नंबर इसके साथ crunchy पाने की जरूरत होती है.

  4. यह भी मेरे लिए सुबह, एक और कॉफी के लिए फिर एक बार पुनः में पढ़ा, ओ) जल्दी होगा

  5. मैं सच में कैसे खोज इंजन काम ..^^.. धन्यवाद इस जानकारी के लिए .. सोचा नहीं था अब मुझे पता है .. ^ ^

  6. जेमी कहते हैं:

    हाय Ruud,
    मुझे यह बहुत दिलचस्प सामान मिला. आप कृपया backlinking रणनीति पर कोई सुझाव दे सकता है.
    धन्यवाद

  7. Ruud Hein कहते हैं:

    @ जॅमी मैं जोड़ दिया है कि इस विषय सूची. इस सुझाव के लिए धन्यवाद!

  8. Shana अल्बर्ट कहते हैं:

    ये हमारे लिए है, और धन्यवाद, Ruud.

Trackbacks / Pingbacks

  1. [...] Ruud खोज इंजन Hein लोगों के सूचकांक भाग 2 "कैसे खोज सचमुच वर्क्स" हैं "के लिए" और "पहचानो यह सूचकांक 2 नए अतिरिक्त जोड़ा गया है?" [...]


मित्र जोड़ें

हाल Readers

English flagItalian flagKorean flagChinese (Simplified) flagChinese (Traditional) flagPortuguese flagGerman flagFrench flagSpanish flagJapanese flagArabic flagRussian flagGreek flagDutch flagBulgarian flagCzech flagCroat flagDanish flagFinnish flagHindi flagPolish flagRumanian flagSwedish flagNorwegian flagCatalan flagFilipino flagHebrew flagIndonesian flagLatvian flagLithuanian flagSerbian flagSlovak flagSlovenian flagUkrainian flagVietnamese flagAlbanian flagEstonian flagGalician flagMaltese flagThai flagTurkish flagHungarian flag