Cloud Storage
Cloud Storage
Nel seguito manterrò la definizione inglese «Cloud Storage» anziché riferirmi a generici metodi
di archiviazione dati in Clou: quest’ultimo termine potrebbe comportare un fraintendimento
visto che con «archiviazione» in genere si intende altro. Lo scopo di questo breve articolo è
quello di illustrare le caratteristiche generali della tematica storage rapportata al Cloud,
estremamente ampia, e che col passaggio al Cloud ne ripropone gli stessi aspetti spesso
trascurati.
Il «Cloud Storage» è uno dei tanti servizi Cloud modellati appositamente a seconda delle
esigenze ed in cui i dati vengono trasmessi e memorizzati su sistemi remoti, dove vengono
mantenuti, gestiti, sottoposti a backup e resi disponibili agli utenti attraverso collegamenti di
rete con protocolli tipicamente Ethernet, ed Internet è la rete che in genere è usata per
scrivere e leggere questi dati. Usufruire di questo servizio significa quindi pagare per averlo e
gli utenti generalmente lo fanno con una tariffa proporzionale al consumo.
Sicuramente molti di voi avranno familiarità con servizi di questo tipo: basti pensare a Dropbox,
OneDrive, Amazon Drive, Google Drive e molti altri ancora. Questi sono servizi di Cloud Storage
adattissimi per la conservazione, la gestione ed il trattamento di dati quali documenti o
immagini. Anche caricare video sul proprio spazio YouTube o Facebook significa usufruire di
servizi di Cloud Storage.
L’utilizzo che invece ne fanno le aziende, a prescindere dal fatto che non esistono in questo
caso livelli minimi gratuiti, anche se può comprendere servizi come quelli citati -pensate alle
sottoscrizioni Office365 che offrono uno spazio OneDrive da 1 o più TB per ogni dipendente- è
in genere del tutto diverso: serve per fare backup, archiviazione(1) a lungo termine, disaster
recovery, aree DevOps e molto altro ancora.
Il Cloud Storage di questo tipo segue esattamente gli stessi modelli generali del Cloud per le
imprese. Public, Private e Hybrid. Vediamone cosa comporta per il servizio di Cloud Storage.
Pubblico . Questi servizi di forniscono un ambiente multi-tenant più adatto per dati non
strutturati su abbonamento. I dati vengono archiviati nei data center del fornitore di servizi e
messi in protezione con sistemi di distribuzione gestiti direttamente dal provider. I clienti
generalmente pagano in base all'uso, in modo simile al modello di pagamento delle utenze. In
molti casi, ci sono anche spese di transazione basate sulla frequenza e sul volume dei dati a cui
si accede. Questo settore di mercato è dominato dai seguenti servizi:
Privato . In questo caso ci si riferisce a risorse storage localizzate nei datacenter dell’azienda,
distribuite come ambiente dedicato e protetto da accessi od utilizzi indesiderati. Le
implementazioni di Cloud Storage privato ospitate internamente emulano alcune delle
funzionalità dei servizi Cloud pubblici commerciali, fornendo un facile accesso e allocazione
delle risorse di archiviazione per gli utenti aziendali, nonché i protocolli di archiviazione degli
oggetti. I Cloud privati sono adatti agli utenti che necessitano di personalizzazione e maggiore
controllo sui propri dati o che hanno requisiti normativi o di sicurezza dei dati rigorosi.
Ibrido . Questa opzione di Cloud Storage è un mix di Cloud Storage privato e servizi di Cloud
Storage pubblico di terze parti, con un livello ulteriore di gestione della cosiddetta
orchestrazione, necessaria per integrare operativamente le due piattaforme. Il modello offre
alle aziende flessibilità e più opzioni di distribuzione dei dati. Un'organizzazione potrebbe, ad
esempio, mantenere internamente dati strutturati e utilizzati attivamente in un Cloud privato
locale e dati non strutturati e/o di archiviazione in un Cloud pubblico. Un ambiente ibrido
semplifica inoltre la gestione di picchi stagionali o imprevisti nella creazione di dati o
nell'accesso tramite Cloud bursting al servizio di storage esterno ed evita di dover aggiungere
risorse di storage interne.
L'adozione del modello di Cloud ibrido è aumentata molto negli ultimi anni a dispetto del fatto
che questo modello presenti sfide tecniche, aziendali e gestionali; ad esempio i carichi di lavoro
privati devono accedere e interagire con i provider di Cloud Storage pubblico, quindi la
compatibilità e una connettività di rete ampia e affidabile sono fattori importanti. Un sistema di
Cloud Storage di livello aziendale dovrebbe essere scalabile per soddisfare le esigenze attuali e
future, accessibile da qualsiasi luogo e indipendente dalle applicazioni.
I fornitori di servizi Cloud gestiscono e mantengono i dati trasferiti al Cloud ed è quindi a loro
demandata la gestione del ciclo di vita e la sicurezza del dato. I servizi di storage sono forniti
su richiesta nel Cloud, con capacità in aumento e in diminuzione secondo necessità. Le
organizzazioni che optano per il Cloud Storage eliminano la necessità di acquistare, gestire e
mantenere un'infrastruttura di storage interna e, in questo modo, il Cloud Storage ha
drasticamente ridotto il costo per gigabyte dello storage, ma i provider di Cloud Storage hanno
aggiunto spese operative che possono rendere la tecnologia notevolmente più costosa, a
seconda di come viene utilizzata. Al punto che non sono infrequenti scenari in cui conviene
mantenere lo storage del tutto privato.
I fornitori di servizi Cloud gestiscono grandi data center in più sedi in tutto il mondo. Quando i
clienti acquistano Cloud Storage da un provider, trasferiscono la maggior parte degli aspetti a
questo legati al fornitore, inclusi sicurezza, capacità, hardware necessario e relative risorse di
elaborazione, disponibilità dei dati e distribuzione in rete. Le applicazioni dei clienti possono
accedere ai dati Cloud archiviati tramite protocolli di archiviazione tradizionali apposite
interfacce o addirittura anche le applicazioni possono essere spostate in Cloud.
Il funzionamento del Cloud Storage varia a seconda del tipo di storage utilizzato. Ereditando
concetti e architetture dal mondo dello storage i tre tipi principali sono l' storage a blocchi ,
l'storage su file system e l' storage ad oggetti, ma va tenuto in debito conto che, così come
nello storage fisicamente presente nei datacenter, anche per il Cloud Storage (la cui fisicità c’è
ma non si vede) i limiti non sono mai netti con diversi gradi di sfumatura tra un tipo e l’altro.
Storage a blocchi è quella tipica dei mondi SAN, Storage Area Network, e consiste
nell’allocare grandi volumi di dati costituite da unità più piccole (blocchi) a sistemi operativi
esterni che li vedono come fossero spazio storage interno, gestendoli quindi con il proprio
file system. Tradizionalmente considerato più veloce ed affidabile di quello basato su file
system oggi la tecnologia trasmissiva e l’evoluzione dei protocolli consente di avere
prestazioni comparabili se non in alcuni casi superiori. Lo storage tipicamente SAN continua
comunque ad essere preferito laddove debbano realizzarsi sistemi di resilienza ed alta
affidabilità di applicazioni particolari, soprattutto quelle legate al mondo dei database
tradizionali (Oracle e MS SQL in particolare). Cloud Storage a blocchi significa in pratica che
il provider o comunque il servizio mette a disposizione delle VM o dei server creati nel
Cloud spazio disco di tipo SAN e fruibile grazie ai relativi protocolli. Considerando che nel
Cloud i protocolli Ethernet vanno per la maggiore in genere è iSCSI il protocollo SAN più
utilizzato.
Storage di tipo file corrisponde alle classiche NAS, Network Attached Storage, organizza i
dati in un sistema gerarchico di file e cartelle; è comunemente usato con le unità di
archiviazione del personal computer e l'archiviazione in rete. I dati sono archiviati in file e i
file sono archiviati in cartelle e sottocartelle con una precisa struttura gerarchica. Le
directory e le sottodirectory vengono utilizzate per organizzare le cartelle e individuare file
e dati oltre che per assegnare a sé stesse ed al loro contenuto regole di sicurezza e
gestione dello spazio. Un Cloud basato sull'archiviazione di file può semplificare l'accesso e
il recupero dei dati, poiché questo formato gerarchico è familiare agli utenti e richiesto da
alcune applicazioni.
Vantaggi
Pay as you go. Con un servizio di Cloud Storage, i clienti pagano solo per lo storage che
utilizzano, eliminando la necessità di grandi spese in conto capitale. Sebbene i costi di
archiviazione nel Cloud siano ricorrenti, piuttosto che un acquisto una tantum, sono spesso
così bassi che, anche come spesa continuativa, potrebbero essere comunque inferiori al
costo di mantenimento di un sistema interno.
Fatturazione delle utenze. Poiché i clienti pagano solo per la capacità che utilizzano, i
costi di archiviazione Cloud possono diminuire man mano che l'utilizzo diminuisce. Questo è
in netto contrasto con l'utilizzo di un sistema di storage interno, che sarà probabilmente
troppo configurato per gestire la crescita prevista. Un'azienda pagherà più del necessario
inizialmente e il costo dello storage non diminuirà mai.
Facilità d'uso. L'archiviazione Cloud è di facile accesso e utilizzo, quindi soprattutto gli
addetti al mondo dello sviluppo che hanno continuamente bisogno di nuovo spazio a fronte
dell’elemininazione di quello usato per vecchi progetti, possono essere operativi in
autonomia e rapidamente senza dover attendere che il personale IT addetto al data center
metta loro a disposizione l’occorrente.
Off-site security. Per sua stessa natura, il Cloud Storage pubblico offre un modo per
spostare copie di dati su un sito remoto per scopi di backup e sicurezza. Ancora una volta,
questo rappresenta un notevole risparmio sui costi rispetto a un'azienda che mantiene la
propria struttura remota.
Un sistema di Cloud Storage privato può offrire alcune delle suddette funzionalità di facilità
d'uso di un servizio Cloud pubblico, ma mancherà di gran parte della flessibilità della capacità
di archiviazione di un servizio pubblico. Alcuni produttori di hardware stanno cercando di
risolvere questo problema consentendo ai propri clienti di attivare e disattivare la capacità che
è già stata installata nei loro array e d’altra parte contemporaneamente, molti produttori
offrono capacità di migrazione verso Cloud Storage già integrate nei loro sistemi.
Svantaggi
Sicurezza. La sicurezza dei dati è il fattore più citato che può rendere le aziende caute
sull'utilizzo del Cloud Storage pubblico. La preoccupazione è che una volta che i dati
lasciano i locali di un'azienda, non ha più il controllo su come vengono gestiti e archiviati i
dati. Anche la memorizzazione dei dati regolamentati è un problema. I fornitori di servizi
hanno cercato di dissipare questi timori migliorando le loro capacità di sicurezza con la
crittografia dei dati, l'autenticazione a più fattori, l'archiviazione dei dati in più posizioni e
una maggiore sicurezza fisica.
Accesso ai dati. Anche il mantenimento dell'accesso ai dati archiviati nel Cloud può
essere un problema e potrebbe aumentare significativamente il costo dell'utilizzo
dell'archiviazione Cloud. Un'azienda potrebbe dover aggiornare la propria connessione al
servizio di Cloud Storage per gestire il volume di dati che prevede di trasmettere. Ad
esempio, il costo mensile di un collegamento ottico può raggiungere le migliaia di dollari.
Degrado delle prestazioni. E’ il tema più caldo. Non si può certo pretendere di avere i
tempi di risposta di un data center privato quando i dati sono in Cloud e le applicazioni
girano in locale. Un'azienda può incorrere in problemi di prestazioni se le sue applicazioni
interne devono accedere ai dati che ha archiviato nel Cloud. In questi casi, sarà
probabilmente necessario spostare i server e le applicazioni nello stesso Cloud o riportare i
dati necessari internamente demandando al Cloud un ruolo di tiering.
Per determinare se l'utilizzo del Cloud Storage si tradurrà in efficienze operative e sarà
conveniente, un'azienda deve seguire questi quattro passaggi:
1. Confrontare i costi una tantum e ricorrenti dell'acquisto e della gestione della capacità di
storage internamente con i costi correnti dell'archiviazione e dell'accesso ai dati nel Cloud.
3. Decidere se il servizio di Cloud Storage fornisce sicurezza e gestione dei dati adeguati.
4. Sviluppare una strategia di sicurezza Cloud interna, con procedure di accesso e utilizzo del
Cloud Storage per mantenere una gestione efficace dei dati e controllare le spese.
Backup su Cloud – come abbiamo visto è stato il tipo di applicazione che ha dato il via ad
un utilizzo sempre più esteso del Cloud Storage come area di immagazzinamento dei dati
derivanti dal backup o come minimo di una loro terza copia off-site.
Tiering dei dati meno acceduti – sempre più frequentemente i produttori di array storage
dedicati stanno offrendo soluzioni in grado di spostare, più o meno automaticamente, i dati
on premises verso aree di Cloud Storage, soprattutto per quanto riguarda i dati meno
frequentemente acceduti o del tutto freddi che stazionano su preziose risorse SSD.
DevOps - un numero crescente di aziende utilizza i servizi di Cloud Storage a tale scopo e
con l’obiettivo ridurre i costi necessari al mantenimento di strutture storage fisse utilizzate
solo saltuariamente e che costringono personale IT a dedicare risorse per soddisfare le loro
richieste in continua evoluzione. Gli sviluppatori possono aumentare le risorse di calcolo e
di archiviazione per la durata dello sviluppo e del test del progetto, quindi ridurle al
termine, in autonomia.
Applicazioni - sempre più organizzazioni stanno spostando le applicazioni chiave nel Cloud
poiché i fornitori di servizi hanno migliorato le prestazioni e rafforzato la sicurezza. Inoltre,
le aziende che sperimentano notevoli fluttuazioni stagionali nel volume di dati che creano
possono attingere allo storage Cloud per gestire queste esplosioni di attività di creazione
dei dati. Il recente fenomeno della riduzione notevole che l’utilizzo di container ha dato
all’impronta storage delle applicazioni sta rendendo ulteriormente diffusa questa pratica.
Per il mondo delle PMI vanno inoltre delineandosi sempre più frequentemente alcuni servizi
di Cloud Storage specializzati, come la sincronizzazione e la condivisione di file che possono
essere usufruiti su un singolo server o su base utente. Le funzionalità di sincronizzazione
dei file di questi servizi garantiscono che le versioni dei file archiviati localmente sul client
di sincronizzazione (un server o un PC dell'utente finale) e nel Cloud siano coerenti. Spesso
sono incluse anche funzionalità di versioning e condivisione di file. Un esempio diffusissimo:
OneDrive a corredo della licenza Office 365.
I maggiori provider
Il mercato dello storage basato su Cloud è dominato da Amazon Web Services, Google e
Microsoft Azure, ma anche fornitori di storage tradizionali come Dell EMC, Hewlett Packard
Enterprise, Hitachi Data Systems, IBM e NetApp operano in tal senso, con prodotti per tutti i tipi
di impresa e che prevedono portali Cloud self-service per il provisioning e il monitoraggio
dell'utilizzo. Alcuni servizi di archiviazione file online, come Box e Dropbox, dispongono di
servizi di archiviazione Cloud business-to-consumer (B2C), nonché di offerte business-to-
business (B2B).
Con questo articolo spero di aver fornito alle aziende che stiano considerando l'uso del Cloud
Storage gli strumenti necessari a renderle consapevoli dei pro e dei contro dell'utilizzo delle
tecnologie di Cloud computing in generale.