Cap 4
Cap 4
Capitolo 4: Trovare
informazioni sul web
Pasquale Cascarano
Research Fellow
Un motore di ricerca è un insieme di programmi per computer che ci aiuta a trovare informazioni
sul Web.
Source: https://ahrefs.com/blog/it/come-funzionano-motori-di-ricerca/
Come funziona un motore di ricerca? INDICIZZAZIONE…
Il motore di ricerca visita tutte le pagine web che riesce a trovare, ossia ne analizza il codice HTML.
Le pagine gli vengono indicate in una prima ‘’To Do List’’ di URL.
PRIMO STEP: crawling. Il crawler (anche chiamato spider) costruisce questa lista di URL.
Durante la fase di crawling, il crawler analizza ogni pagina web e le pagine web ad essa collegata ed
estrapola le parole più importanti (token), come ad esempio quelle nel titolo della pagina (tag title).
Successivamente per ogni token crea una lista di URL associati a quel token (una lista di siti web che fanno
riferimento ad una precisa parola).
SECONDO STEP: l’elaborazione delle query (o interrogazioni). Il motore di ricerca analizza i token delle
query e restituisce gli URL nella lista associata.
TERZO STEP: ranking. La lista di URL è ordinata secondo un preciso algoritmo di ranking. I primi risultati di
questa lista sono quelli suggeriti per primi dal motore di ricerca.
Miopia del crawler
Quando creiamo un’interrogazione composta da più parole, vorremmo che le pagine restituite
dall’elaboratore delle query siano pertinenti a tutte quelle parole.
Il crawler analizza tutto il codice HTML e pertanto i vari tag, gli attributi presenti e i link ancorati nella
pagina web analizzata.
0.25 0
0.25
1.0
0.25
0.25
c
a 0.25
0
0.25 0.25
0
d b
Esempio di PageRank
0.25
0.71 0.25 0.2
0.25
c 0.12
a 0.08
0.08
0.25
0 0.12 0.08
0.25
0.08
d b
Search engine optimization (SEO)
Il primo step SEO è un’analisi accurata delle parole chiave da inserire nel proprio sito web.
La ricerca delle parole chiave “migliori” può essere effettuata con strumenti software appositi,
interviste agli utenti, analisi della concorrenza e utilizzando lo stesso motore di ricerca.
Per scegliere correttamente le parole chiave occorre dunque trovare il giusto equilibrio tra parole e
numero di ricerche mensili da parte degli utenti.
AND-query
OR-query
NOT-query
Alcuni operatori di ricerca (cenni)
Utilizzare correttamente questi operatori per migliorare la precisione e la pertinenza delle ricerche
online.
Esempio con operatori di ricerca
Se si conosce il dominio del sito web desiderato, è possibile limitare la ricerca a quel dominio.
Alcuni siti web di grandi dimensioni offrono funzionalità di ricerca locale all'interno dei loro
documenti.
Fare ricerca sul web
L’approccio alla ricerca è sempre più particolareggiato e prevede l’utilizzo di termini sempre più
specifici. In particolare:
Che cosa possiamo imparare dalla lista dei risultati che otteniamo con le nostre query?
Visualizziamo solitamente: Titolo, Snippet (piccola anteprima di ciò che troviamo sul sito come ad
esempio alcune frasi), URL e altri link del sito.
Uso della lista dei risultati
Per trovare informazioni sul Web dovremo utilizzare la lista dei risultati restituita dalla ricerca e filtrare.
Solitamente il Titolo è la prima fonte di informazione sulla pagina. Solo quando questo vi soddisfa
osservate lo snippet.
L’URL indica il nome del sito ed è importante per verificare l’autorevolezza dell’informazione
A questo punto una volta verificato tutto questo è probabile che la pagina contenga le
informazioni che vi interessano e potrà essere utile ai fini della vostra ricerca.
Scrematura e affinamento delle ricerche sono l’unico modo per trovare il sito web di interesse
avendo come risultato della ricerca milioni di risultati.
Dopo aver trovato una “probabile” pagina web…
Siamo arrivati alla pagina web desiderata! La domanda successiva è: “Quanto sono autorevoli le
sue informazioni?”
Nessuno è responsabile del WWW, quindi nessuno controlla la correttezza delle informazioni
riportate sulle pagine web.
Probabilmente saprete già che alcune notizie su Facebook, Instragram, TikTok, Twitter non sono
accurate. Ma occhio: non sono gli unici esempi!
Libri VS Web
Enciclopedia online open source creata da utenti Internet esperti e dedicata alla comunità.
Punti di forza: Accessibile a chiunque, numero elevato di collaboratori, diversità di contributi e vasta
copertura di argomenti, continuamente aggiornata.
Punti di debolezza: Possibilità di aggiungere informazioni errate; mancanza di convalida da esperti del
settore. Seppur esista un controllo della qualità attraverso un processo editoriale, la responsabilità della
qualità ricade sulla comunità nel complesso.
Autorevolezza di Wikipedia
Solitamente di buon livello, ma non c'è garanzia di autenticità. È errato presumere
che un articolo sia perfettamente corretto; la verifica è essenziale.
Wikipedia esempio di crowdsourcing
Il modo migliore per ottenere informazioni autorevoli è cercarle direttamente su siti noti per la loro
affidabilità.
La consultazione di siti noti per la loro autorevolezza riduce il rischio di informazioni errate e
aumenta la certezza dell'affidabilità delle risorse consultate.
Realtà o fantasia?
Secondo alcuni studi, le persone assumono un atteggiamento scettico quando incontrano nelle
pagine una serie di mancanze come le seguenti: