|
Sono basati su dei
software (spider o robot) che analizzano le pagine, le classificano secondo i
contenuti che sono in grado di leggervi, e le aggiungono al database. Il nome crawler (to crawl, strisciare) deriva dal fatto che gli spider si "spostano" di
pagina in pagina seguendo i link che trovano.
Gli utenti cercano prevalentemente attraverso l'immissione di
parole-chiave (o keyword) nell'apposita
maschera. I risultati sono poi restituiti sotto forma di link ordinati per
rilevanza rispetto alla chiave di ricerca.
Vantaggi: possono indicizzare numerose
pagine di uno stesso sito. Gli spider analizzano incessantemente nuove pagine,
quindi l'archivio dei motori automatici è ampio e aggiornato.
Svantaggi: questi motori non riescono ad
esaminare tutte le pagine allo stesso modo, hanno difficoltà ad es. con quelle
dinamiche. Non sempre restituiscono risultati attinenti alla ricerca.
I criteri secondo i quali i motori
automatici decidono quale pagina è più rilevante e quindi la presentano prima di
un'altra nei risultati di ricerca è basato su un algoritmo matematico che:
- È diverso per ogni motore
- Cambia frequentemente
- Non è pubblico
A questo è da aggiungere che
il ranking o la presenza stessa delle pagine dentro un
MOTORE DI RICERCA sono soggetti a cambiamenti improvvisi per
manutenzione dei database o perché nuove pagine ne prendono il posto.
Esempi: Altavista, Google |