Il 0% ha trovato utile questo documento (0 voti)
25 visualizzazioni45 pagine

Cap 4

Storia del teatro

Caricato da

lea5lupo
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd
Il 0% ha trovato utile questo documento (0 voti)
25 visualizzazioni45 pagine

Cap 4

Storia del teatro

Caricato da

lea5lupo
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd
Sei sulla pagina 1/ 45

INFORMATICA PER LE ARTI

Capitolo 4: Trovare
informazioni sul web

Pasquale Cascarano

Research Fellow

Department of the Arts


Obiettivi del capitolo

• Spiegare come funziona un motore di ricerca web.

• Trovare informazioni usando un motore di ricerca.

• Usare operatori logici e filtri per esprimere interrogazioni complesse.

• Riconoscere e trovare fonti autorevoli di informazioni.

• Decidere se un’informazione trovata sul Web è vera o fasulla.


Motore di ricerca

Un motore di ricerca è un insieme di programmi per computer che ci aiuta a trovare informazioni
sul Web.

Sergey Brin (a sinistra) e Larry Page (a destra)


inventori del motore di ricerca Google.
Google: il motore di ricerca più usato

Source: https://ahrefs.com/blog/it/come-funzionano-motori-di-ricerca/
Come funziona un motore di ricerca? INDICIZZAZIONE…
Il motore di ricerca visita tutte le pagine web che riesce a trovare, ossia ne analizza il codice HTML.
Le pagine gli vengono indicate in una prima ‘’To Do List’’ di URL.

PRIMO STEP: crawling. Il crawler (anche chiamato spider) costruisce questa lista di URL.
Durante la fase di crawling, il crawler analizza ogni pagina web e le pagine web ad essa collegata ed
estrapola le parole più importanti (token), come ad esempio quelle nel titolo della pagina (tag title).
Successivamente per ogni token crea una lista di URL associati a quel token (una lista di siti web che fanno
riferimento ad una precisa parola).

SECONDO STEP: l’elaborazione delle query (o interrogazioni). Il motore di ricerca analizza i token delle
query e restituisce gli URL nella lista associata.

TERZO STEP: ranking. La lista di URL è ordinata secondo un preciso algoritmo di ranking. I primi risultati di
questa lista sono quelli suggeriti per primi dal motore di ricerca.
Miopia del crawler

I motori di ricerca visitano soltanto una parte del Web


(probabilmente meno della metà).

Si definisce “invisible Web” l’insieme delle pagine non


visitate dai crawler.

Un sito web può essere ‘’invisibile’’ a causa di:

1. Elevato ritmo di crescita del web.


2. Nessun riferimento in altre pagine.
3. Scrittura in un linguaggio non noto al crawler.
Ricerche con più parole

Quando creiamo un’interrogazione composta da più parole, vorremmo che le pagine restituite
dall’elaboratore delle query siano pertinenti a tutte quelle parole.

Un’interrogazione di questo genere è detta AND-query.

Come ricerca le pagine web pertinenti il motore di ricerca?

L’elaboratore delle query analizza semplicemente le liste


degli indici per ciascuno dei termini, e trova gli URL
presenti in tutte le liste (intersezione tra liste).
Questo è il modo efficiente e rapido in cui lavora il
motore di ricerca Google.
I termini descrittivi di una pagina

Il crawler non vede solo “quello che vediamo noi”, ma va oltre.

Il crawler analizza tutto il codice HTML e pertanto i vari tag, gli attributi presenti e i link ancorati nella
pagina web analizzata.

Tutto questo contribuisce alla formazione degli indici.


Ranking delle pagine

Accade spesso che la pagina che state


cercando si trovi all’inizio di una lista di milioni
di risultati, e se non in prima posizione almeno
tra le prime dieci. Com’è possibile?

L’ordine in cui vengono restituiti i risultati di


una query è determinato, almeno in parte,
da un numero che Google
chiama PageRank.

Google non ha svelato tutte le informazioni sul


modo in cui PageRank valuta i siti, ma
sappiamo che opera come un sistema di
votazione.
Ranking delle pagine

Se la pagina A, www.loStrillo.net/A.html, ha un link alla pagina B, www.celeb.com/B.html, nel


sistema di ranking il collegamento da A aumenta l’importanza di B, migliorandone la posizione in
classifica. Inoltre i link che partono da pagine con ranking elevato sono considerati più importanti
di quelli che partono da pagine con ranking inferiore.

Il crawler calcola il PageRank di una pagina.

L’elaboratore poi restituisce gli URL in ordine descrescente rispetto al ranking,


Idea di PageRank
Esempio di PageRank

0.25 0
0.25
1.0
0.25
0.25

c
a 0.25

0
0.25 0.25
0

d b
Esempio di PageRank

0.25
0.71 0.25 0.2
0.25

c 0.12
a 0.08
0.08
0.25
0 0.12 0.08
0.25

0.08

d b
Search engine optimization (SEO)

Il termine SEO si riferisce a tecniche e pratiche che rendono più


facilmente trovabile un sito e i suoi contenuti ai motori di ricerca e
ne migliorano in maniera organica il posizionamento (ranking) tra
i risultati.

Il posizionamento di una pagina influisce direttamente sulla sua


visibilità. Gli utenti tendono a cliccare sui primi risultati, rendendo il
ranking cruciale per il traffico organico.

Le attività SEO potrebbero essere fatte rientrare nel complesso


delle attività di digital marketing su cui nessun business può fare a
meno oggi di investire.
La scelta delle keyword

Il primo step SEO è un’analisi accurata delle parole chiave da inserire nel proprio sito web.

La ricerca delle parole chiave “migliori” può essere effettuata con strumenti software appositi,
interviste agli utenti, analisi della concorrenza e utilizzando lo stesso motore di ricerca.

Per scegliere correttamente le parole chiave occorre dunque trovare il giusto equilibrio tra parole e
numero di ricerche mensili da parte degli utenti.

Ecco alcuni software utili per trovare le parole chiave…


On page SEO

Si definisce SEO “on-page“ l’insieme delle attività di


ottimizzazione all’interno delle pagine di un sito.

Ottimizzazione SEO del codice HTML: aggiungere i tag title


che contiene in nome della pagina web, i tag description
che genera lo snippet, i tag heading che servono ad
individuare il titolo del contenuto e i vari paragrafi, i tag
attributi per aggiungere le descrizioni alle immagini, definire
URL e domini, controllare tutti i link presenti nella pagina in
modo da evitare la presenza di link non funzionanti.

Ottimizzazione dei contenuti: i motori di ricerca attuali sono


in grado di leggere i contenuti di una pagina web
”capendone il significato” ed attribuendone un punteggio
di qualità e pertinenza rispetto alle query. E’ fondamentale
pertanto la cura dei contenuti affinché siano utili,
interessanti e soprattutto non copiati da altri, siano scritti in
maniera naturale e comprendano parole chiave non
troppo spesso ripetute.
Off page SEO

L’ottimizzazione off-page, riguarda essenzialmente la


gestione dei link su altri siti che puntano al nostro
(backlinks).

Il numero di link verso un sito influisce sul PageRank,


ma anche la qualità dei link è cruciale. Un link da una
pagina autorevole vale di più di uno da un sito di
scarsa qualità.

La tecnica di link earning si basa sulla creazione di


contenuti di qualità per attirare link naturali.

La tecnica di link building coinvolge le tattiche attive


per ottenere link, ma è necessario farlo con cautela
(condivisione social, pay-per-click, guest blogging).
Ricerca avanzata

AND-query

OR-query
NOT-query
Alcuni operatori di ricerca (cenni)

Virgolette Doppie (" "): Ricerca di frasi esatte.


Trattino Meno (-): Escludere una parola dalla ricerca.
site: Limitare la ricerca a un sito web specifico.
filetype: Cercare file con un'estensione specifica.
OR (in maiuscolo): Trovare pagine che contengono almeno una delle parole.
intitle: Limitare la ricerca alle pagine con una parola specifica nel titolo.
define: definizioni di una parola da varie fonti.
related: Trovare siti web correlati a uno specifico sito.

Utilizzare correttamente questi operatori per migliorare la precisione e la pertinenza delle ricerche
online.
Esempio con operatori di ricerca

Cerchiamo su google il nome del vostro docente di Informatica


Ricerca per immagini

Può capitare che un’informazione a volte sia rappresentata


mediante un’imagine, in tal caso alcuni motori di ricerca
come Google ci permette di eseguire una “ricerca per
immagini”.
Esempio: come si chiama quell’attore?
Esempio: di che famoso brand è questo abito?
Ricerche mirate
La ricerca avanzata di Google è utile per applicare filtri che limitano i risultati e rendono la ricerca
più precisa.

Se si ha qualche informazione sull'argomento cercato, è possibile aggiungere vincoli alla ricerca


per restringere i risultati.

Se si conosce il dominio del sito web desiderato, è possibile limitare la ricerca a quel dominio.

Utilizzo di parole chiave per individuare il sito cercato.

Alcuni siti web di grandi dimensioni offrono funzionalità di ricerca locale all'interno dei loro
documenti.
Fare ricerca sul web

Ecco alcune linee guida specifiche che vi aiuteranno


a utilizzare le ricerche sul Web per creare relazioni e
progetti di ricerca:

Scelta dei termini della ricerca: scegliere le parole


giuste da includere in una query.
Anatomia di un risultato: come usare le informazioni
restituite nella lista dei risultati.
Uso della lista dei risultati: scremare per trovare in fretta
ciò che vogliamo, o riprovare.
Analizzare la pagina web: una volta trovata una
pagina probabile, trovare i dati desiderati nella
pagina.
La scelta dei termini di ricerca

L’approccio alla ricerca è sempre più particolareggiato e prevede l’utilizzo di termini sempre più
specifici. In particolare:

1. Uso della ricerca avanzata


2. Inizio dell’argomento generale
3. Scelta di termini descrittivi
4. Affinamento con l’aggiunta di termini
5. Imposizione di un numero non eccessivo di vincoli
6. Eliminazione di parole non essenziali ai fini della ricerca
Anatomia di un risultato

Che cosa possiamo imparare dalla lista dei risultati che otteniamo con le nostre query?

La ricerca ci mostra i primi dieci risultati in base all’algoritmo PageRank.

Visualizziamo solitamente: Titolo, Snippet (piccola anteprima di ciò che troviamo sul sito come ad
esempio alcune frasi), URL e altri link del sito.
Uso della lista dei risultati

Per trovare informazioni sul Web dovremo utilizzare la lista dei risultati restituita dalla ricerca e filtrare.

Solitamente il Titolo è la prima fonte di informazione sulla pagina. Solo quando questo vi soddisfa
osservate lo snippet.

Nello snippet sono mostrati in grassetto i termini della ricerca

L’URL indica il nome del sito ed è importante per verificare l’autorevolezza dell’informazione

A questo punto una volta verificato tutto questo è probabile che la pagina contenga le
informazioni che vi interessano e potrà essere utile ai fini della vostra ricerca.

Scrematura e affinamento delle ricerche sono l’unico modo per trovare il sito web di interesse
avendo come risultato della ricerca milioni di risultati.
Dopo aver trovato una “probabile” pagina web…

Probabilmente il risultato della scrematura ci ha restituito una pagina meritevole di un


approfondimento.

Quali azioni intraprendere dopo?


- Scorrere la pagina per capire se è quello che cercavate.
- Cercare una data per capire quanto sia aggiornata, spesso le pagine sono utile ma troppo
datate.
- Se non vogliamo leggere la pagina per intero, accertiamoci che le parole cercate siano
presenti.

Il processo di ricerca è concluso?


- Non proprio! Dipende dal contesto.
- Se siamo in un contesto informale (come una scommessa tra amici) allora il processo di ricerca
può concludersi.
- Se lavoriamo ad una relazione oppure quelle informazioni possono avere conseguenze (per
esempio dati clinici), è necessario controllare il sito e trovore informazioni di conferma.
Informazioni autorevoli

Siamo arrivati alla pagina web desiderata! La domanda successiva è: “Quanto sono autorevoli le
sue informazioni?”

Come capire se le informazioni trovate sul Web sono autorevoli?


Non credete a tutto quello che leggete

Nessuno è responsabile del WWW, quindi nessuno controlla la correttezza delle informazioni
riportate sulle pagine web.

Probabilmente saprete già che alcune notizie su Facebook, Instragram, TikTok, Twitter non sono
accurate. Ma occhio: non sono gli unici esempi!
Libri VS Web

In passato le informazioni erano tratte da libri disponibili in


biblioteca che prima di essere esposti erano revisionati da
editori, revisori e bibliotecari.

Al giorno d’oggi, tutta la letteratura scientifica subisce un


controllo serrato. Un articolo prima di essere pubblicato
subisce il vaglio di esperti in quella materia, la cosiddetta
“peer review” che talvolta può portare a modifiche
profonde del lavoro o addirittura al rifiuto della
pubblicazione.

Dopo accertamenti così serrati era probabile, ma non


garantito, che il lettore ottenesse informazioni valide.

Il Web ha cambiato tutto. Oggi chiunque può pubblicare


una pagina web affermando ciò che vuole e senza alcun
tipo di controllo. L’informazione passa dall’autore al lettore
senza alcun tipo di controllo.
Wikipedia

Enciclopedia online open source creata da utenti Internet esperti e dedicata alla comunità.

Punti di forza: Accessibile a chiunque, numero elevato di collaboratori, diversità di contributi e vasta
copertura di argomenti, continuamente aggiornata.

Punti di debolezza: Possibilità di aggiungere informazioni errate; mancanza di convalida da esperti del
settore. Seppur esista un controllo della qualità attraverso un processo editoriale, la responsabilità della
qualità ricade sulla comunità nel complesso.
Autorevolezza di Wikipedia
Solitamente di buon livello, ma non c'è garanzia di autenticità. È errato presumere
che un articolo sia perfettamente corretto; la verifica è essenziale.
Wikipedia esempio di crowdsourcing

Wikipedia è un esempio notevole di crowdsourcing, un


modello di produzione collaborativa che coinvolge un
vasto numero di persone nella creazione e modifica di
contenuti. Infatti le caratteristiche del crowdsourcing sono
le seguenti:

Contributi aperti a tutti.


Diversità di competenze.
Processo di revisione collaborative.
Comunità responsabile.
Risultato dinamico e aggiornato.

Altri esempi di crowdsourcing?

Google Translate: Utilizza il crowdsourcing per migliorare le


traduzioni. Gli utenti possono proporre traduzioni migliori e
votare su quelle proposte da altri, contribuendo così a
perfezionare il servizio.
Informazioni autorevoli

La ricerca della "verità" è complessa, quindi ci si concentra su informazioni "autorevoli".

L'autorevolezza è spesso basata su affermazioni di esperti, presumendo che siano ben


informati sull'argomento.

Le informazioni autorevoli provengono da organizzazioni rispettate e fonti con credenziali


riconosciute. Ad esempio organizzazioni come l'OMS o istituzioni mediche sono spesso fonti
affidabili in campo medico.

Le stesse persone possono essere fonti affidabili se hanno credenziali e formazione


riconosciute.
Cosa è autorevole?

Le fonti primarie, come testimoni diretti o


partecipanti a un evento, sono spesso la migliore
fonte di informazioni. Tuttavia anche le fonti
primarie possono essere inaffidabili, con
possibilità di omissioni o distorsioni.

Fonti secondarie, come la stampa, e le fonti


terziarie, come Wikipedia, sono ulteriormente
distanti dai fatti.

L'uso di più fonti aiuta a ridurre il rischio di


informazioni errate o fuorvianti.

Si consiglia di verificare sempre su più fonti


durante la ricerca online. Questo approccio
aiuta a evitare bufale, informazioni inesatte o
manipolate, e garantisce una visione più
completa e accurata.
Fonti autorevoli

Il modo migliore per ottenere informazioni autorevoli è cercarle direttamente su siti noti per la loro
affidabilità.

• Esempi di fonti autorevoli:


Per informazioni fiscali affidabili, visitate www.agenziaentrate.gov.it.
Per notizie sui viaggi spaziali, consultate www.nasa.gov o www.esa.int.
Sull'argomento degli incidenti automobilistici, il Ministero delle Infrastrutture e dei Trasporti (MIT) su
www.mit.gov.it è una fonte autorevole.

Rivolgendosi direttamente a fonti autorevoli, si garantisce un livello di affidabilità maggiore rispetto


a determinare l'affidabilità dopo aver trovato l'informazione.

La consultazione di siti noti per la loro autorevolezza riduce il rischio di informazioni errate e
aumenta la certezza dell'affidabilità delle risorse consultate.
Realtà o fantasia?

Come possiamo riconoscere un sito falso?

Secondo alcuni studi, le persone assumono un atteggiamento scettico quando incontrano nelle
pagine una serie di mancanze come le seguenti:

Link non funzionanti.


Assenza di informazioni di contatto.
Assenza di un’identità esterna al Web.
Design “sempliciotto”.
Nessun aggiornamento recente né post di blog.
Errori di ortografia.

Ma un sito può essere falso anche se non presenta questi “sintomi”.


Fake o no?
Fake!!!!
Curiosità
Nel dicembre 2012, un video di un'aquila reale
che sembrava afferrare un bambino in un
parco di Montreal ha suscitato grande
attenzione online.

Il video è stato caricato su YouTube e


rapidamente diffuso su Reddit e Twitter,
accumulando milioni di visualizzazioni in breve
tempo.

Gli autori hanno successivamente ammesso


che il video era parte di un progetto per un
corso di effetti speciali video (VFX) all'Università
di Montreal.
Pasquale Cascarano

Department of the Arts

[email protected]

Potrebbero piacerti anche