Lezione 2 Informatica
Lezione 2 Informatica
Sulla macchina su cui Tim Berners-Lee ha installato il software del WWW possiamo vedere la
scritta “This machine is a server, do not power it down”. L’indirizzo di questa macchina,
l’indirizzo Internet di questa macchina, l’URL per essere più corretti, è info.cern.ch e quella
che potete vedere è la prima pagina web prodotta da Tim Berners-Lee.
Conteneva informazioni utili a tutti gli scienziati del CERN, potevano scaricare il software che
lui aveva prodotto e anche eventuali informazioni sui protocolli del web. Anche lo sviluppo
del browser va per passi successivi. Il lime mode browser, che praticamente è costituito da
pagine solo testuali, ma è già importante il fatto che possa girare su sistemi di Linux
Windows. Da qui poi si passa al primo browser ipermediale, dove possiamo vedere la
multimedialità che viene realizzata. Nel 1994 i server web si di[ondono a livello mondiale,
quell’anno è già l’anno del web, e la prima conferenza del web che viene organizzata al CERN
è salutata come l’era di Woodstock del web.
Internet offre numerosi servizi, ognuno dei quali si basa su di uno specifico protocollo.
Sopra il TCP/IP sono infatti implementati protocolli di più alto livello, quali:
Il servizio che determinò il grande sviluppo di Internet su base mondiale fu il World Wide
Web (WWW). Il WWW è infatti una delle più importanti innovazioni nella gestione e nella
trasmissione dell’informazione dall’invenzione della carta stampata avvenuta più di 500 anni
fa.
Il WWW fu inventato nel 1989 da Tim Berners-Lee mentre lavorava al CERN (European
Laboratory for Particle Physics). Il primo sito web fu dedicato proprio al progetto WWW e fu
ospitato sul computer di Berners-Lee.
Il 30 Aprile 1993 il CERN mise il software del WWW nel pubblico dominio. Più tardi il CERN
rilasciò una release con licenza aperta che consentì di massimizzarne la diffusione. Queste
azioni consentirono al web di affermarsi (The birth of the Web | CERN).
Il WWW
Il WWW nacque come un consorzio di utenti che ha realizzato una sintassi standard, non
proprietaria, denominata HTML (HyperText Markup Language) per la composizione di
documenti.
L'HTML permette all’utente di visualizzare correttamente sul proprio monitor pagine web
provenienti da computer differenti, superando così l'incompatibilità tra il formato di
documenti provenienti da computer aventi differenti sistemi operativi (Windows, Linux,
iOS,…).
Sistema ipertestuale
Un aspetto chiave del WWW è rappresentato dal fatto che le pagine web correlate possono
risiedere su qualsiasi computer collegato ad Internet, e che una stessa pagina web può
contenere collegamenti ipertestuali che si riferiscono a documenti memorizzati in uno o più
computer geograficamente lontani.
Il World Wide Web può quindi essere immaginato come un database multimediale distribuito
su Internet che fornisce una nuova modalità di accesso all’informazione.
Modello Client/Server
Anche il WWW, come tutti gli altri servizi Internet, si basa su un’architettura Client/Server.
Per poter accedere ad un Server WWW occorre che sul computer dell’utente sia in
esecuzione un Client WWW.
I Client WWW, i più diffusi dei quali sono Mozilla Firefox, Chrome, Internet Explorer e Safari,
vengono chiamati browser.
I browser permettono all’utente di navigare all’interno della grande quantità di informazione
resa disponibile all’interno di Internet.
Linguaggio HTML
L’unità di base del sistema di informazioni disponibile sul WWW è la pagina Web, spesso
chiamata documento. Per la realizzazione di tali pagine viene utilizzato il linguaggio HTML
(HyperText Markup Language).
I marcatori HTML
Le pagine HTML sono dunque file in formato testuale che contengono, assieme al testo vero e
proprio, i tag che ne descrivono la struttura. Tali pagine si trasformano in documenti
multimediali nel momento in cui il browser ne effettua la visualizzazione. I marcatori indicano
infatti al browser come deve essere visualizzata la pagina sul monitor dell'utente.
Nel video precedente abbiamo visto come i marcatori HTML, che sono rappresentati da
parole chiave racchiuse tra parentesi acute (<…>), vengano utilizzati da un autore di una
pagina Web per:
Il coordinamento dello sviluppo del World Wide Web e la standardizzazione del linguaggio
HTML sono affidati al World Wide Web Consortium (W3C).
Protocollo HTTP
La seconda componente tecnologica primaria del WWW è il protocollo HTTP (Hyper Text
Transport Protocol).
Il protocollo HTTP è l'insieme di regole che i Client ed i Server WWW utilizzano per
comunicare, è cioè l'insieme di regole necessarie per trasferire file (testo, suono, video e altri
file multimediali) sul WWW.
Il protocollo HTTP possiede l’efficienza necessaria per realizzare i salti ipertestuali, per
consentire cioè ad un utente che naviga sul web di muoversi velocemente da un documento
ad un altro attraverso l’attivazione di un collegamento ipertestuale, anche nel caso in cui i
documenti risiedano su Server geograficamente molto lontani.
Quando un utente desidera accedere ad una pagina web apre il proprio browser e nella barra
degli indirizzi inserisce l'indirizzo della pagina che intende visitare.
Tale indirizzo inizia con la parola HTTP, questa sequenza di caratteri indica al browser quali
regole utilizzare quando inizia la comunicazione con un Server Web.
Il browser è un Client HTTP che invia le richieste ad un Server HTTP. Le quattro operazioni
svolte in sequenza dal protocollo HTTP sono le seguenti:
1. il Client WWW (browser) apre una connessione con il Server che contiene la pagina
web desiderata dall'utente;
2. il Client WWW invia al Server la richiesta del documento;
3. il Server WWW invia al Client la pagina web richiesta (o un messaggio di errore);
4. la connessione viene chiusa.
Questo ciclo viene ripetuto per ciascun documento richiesto.
Dopo la chiusura della connessione il Client WWW interpreta e visualizza sul monitor del
computer dell'utente la pagina web inviatagli dal Server.
Protocollo sateless
Ogni sessione HTTP non è pertanto correlata a quelle che la hanno preceduta o a quelle che
la seguiranno.
Questo è uno dei principali svantaggi del protocollo HTTP.
Per superare il fatto che l'HTTP è un protocollo stateless è stato introdotto l'uso dei cookie.
La funzione dei cookie è quella di aiutare un sito Web ad identificare un utente in sessioni
successive e a personalizzare le informazioni fornite.
Il cookie viene quindi creato allo scopo di memorizzare nel sistema informazioni sull'utente,
quali dati riguardanti l'identità personale e le preferenze manifestate durante l'esplorazione
del sito; ciò con l'obiettivo di fornire servizi maggiormente personalizzati (ad es. per l'acquisto
di prodotti, la visualizzazione di previsioni meteorologiciche, la lettura di notiziari locali).
Cookie
Si nota come i cookie siano dei semplici file di testo e pertanto non possono veicolare virus e
neppure installare programmi dannosi sul computer dell'utente, ciò malgrado il loro utilizzo è
controverso.
Classificazione cookie
I cookie possono essere classificati in base al loro ciclo di vita, come pure in base alla loro
provenienza.
Classificandoli in base al loro ciclo di vita, i cookies possono essere distinti in:
I cookie possono essere classificati anche in base alla loro provenienza in:
• cookie di prima parte, sono i cookie inviati al browser direttamente dal sito che
l'utente sta visitando.
• cookie di terza parte, sono cookie che vengono impostati da siti web diversi da quello
che l'utente sta visitando. Questo tipo di cookie appaiono in genere quando le pagine
web includono contenuti di siti web esterni, come ad esempio banner pubblicitari.
Questo tipo di cookie sono generalmente usati a fini pubblicitari.
Privacy e sicurezza
I cookie consentono ai siti web di fornire servizi migliori, ma non sono esenti da rischi.
Un consiglio è quello di configurare il browser in modo tale che l’utente venga avvertito prima
che un cookie sia inviato al suo computer, cosicché egli possa decidere se accettarlo o
meno.
Nonostante i cookies siano utili per superare il fatto che il protocollo HTTP è un protocollo
stateless, il loro utilizzo può causare problemi legati alla privacy e alla sicurezza.
Per tale motivo i browser offrono agli utenti la possibilità di gestire i propri cookie.
(C’è un video che descrive come si utilizzano i cookies con il browser Mozilla Firefox)
Ogni risorsa su Internet viene riferita attraverso una lunga stringa di caratteri,
chiamata Uniform Resource Locator o URL, che corrisponde all’indirizzo che tale risorsa ha
su Internet.
Descrizione di un URL
Formato di un URL
In generale un formato per gli URL è il seguente (le parentesi quadre indicano che il termine
contenuto al loro interno è opzionale):
[Protocollo:] [//Server/] Risorsa
dove:
Esempi di URL: