Πως δουλεύουν οι μηχανές αναζήτησης
Σε αυτό το άρθρο θα δούμε σύντομα πως δουλεύουν οι μηχανές αναζήτησης παίρνοντας τις πληροφορίες που χρειάζονται από τον ιστό(web ή www). Στόχος τους να εμφανίσουν τα καλύτερα αποτελέσματα στην λέξη η έννοια που ψάχνουμε.
Δημοφιλείς Μηχανές Αναζήτησης
- Google – Κατέχει το 90% της παγκόσμιας αγοράς.
- Bing – Κατέχει το 6% στης ΗΠΑ.
- Yahoo – Κατέχει το 6% στης ΗΠΑ.
- Yandex – Κατέχει το 45% στην Ρωσία.
- Baidu – Κατέχει το 65% στην Κίνα.
- Duckduckgo η Startpage – επικεντρώνονται στην Ιδιωτικότητα.
Δομή Μηχανής Αναζήτησης
- Crawler (ερπετό) συχνά αναφέρονται και σαν spiders ή bots
- Ευρετήριο
- Κάποιον Αλγόριθμο
Πως Δουλεύει
Η διαδικασία συχνά ξεκινάει με τις αράχνες να ταξιδεύουν μεταξύ των συνδέσμων(links) στις ιστοσελίδες. Κατόπιν στις ιστοσελίδες ψάχνουν για δεδομένα και ποιο συγκεκριμένα:
- Περιεχόμενο
- Τίτλους
- Συνδέσμους(links)
από όλα αυτά παίρνει τις πληροφορίες για την δομή μιας σελίδας και το περιεχόμενο. Οι αράχνες σαρώνουν το internet όλο το 24ώρο. Όταν περνάει από μια ιστοσελίδα αποθηκεύει τη δομή της (HTML-> Hypertext Markup Language) σε μια τεράστια βάση δεδομένων(Ευρετήριο) και έτσι τηρεί θα λέγαμε αρχείο. Την επόμενη φορά που θα περάσει συγκρίνει τη καινούρια δομή και περιεχόμενο με την παλιά και κρατά το τελευταίο. Ο ρυθμός που περνάει η αράχνη επαφίεται στο πόσο σημαντική θεωρεί η μηχανή αναζήτησης την σελίδα.
Ο Αλγόριθμος
Η κατάταξη μιας σελίδας στα αποτελέσματα αναζήτησης έχει να κάνει με τον αλγόριθμο που έχει κάθε μηχανή αναζήτησης. Ο αλγόριθμος παίρνει τα δεδομένα από το ευρετήριο και κάνοντας πάρα πολλούς υπολογισμούς σε διαφορετικούς παράγοντες προβλέπει τη ψάχνουμε. Δεν σταματά όμως εκεί και μας εμφανίζει το καλύτερο δυνατό αποτέλεσμα από τα υπάρχοντα.
Τι βλέπει ένας Αλγόριθμος
Σύμφωνα με τις προδιαγραφές που δίνονται στη δημοσιότητα από διάφορες εταιρείες όπως η Google. Σημαντικό ρόλο παίζει η ταχύτητα φόρτωσης μιας σελίδας, το καλά δομημένο περιεχόμενο και φυσικά το πόσο ασφαλής είναι ένας ιστότοπος(https).
Βέβαια όλα αυτά αλλάζουν συνεχώς και οι αλγόριθμοι αναπροσαρμόζονται.
Πως όμως θα με βρει η Google
Το πιο σημαντικό είναι να ευρετηριάσει(indexing) μια αράχνη τον ιστότοπο μας. Ο καλύτερος τρόπος να γίνει αυτό είναι να έχω συνδέσμους(links). Τόσο εξωτερικούς προς άλλους ιστότοπους όσο και εσωτερικούς στο περιεχόμενο μου. Μπορούμε να σκεφτούμε το ευρετήριο(index) που θα ανήκουμε σαν δρομολόγιο σε δίκτυο δρόμων που κάνει κάποια αράχνη.