DataMining PDF
DataMining PDF
E-Data
Autore: Dych
ISBN: 88-7303-712-7
Pagine: 400
Formato: 14,5 x 21
Prezzo: 25,21
Collana: Cultura digitale
Il testo del presente e-book
tratto dal volume e-Data.
Maggiori informazioni online
allindirizzo:
http://www.apogeonline.com/libri
/00712/scheda
e creazione.
prodotti. Questo .NET di Microsoft. Essere sicuri che linformazione giusta arrivi a destinazione
al momento giusto: solo cos avrete a disposizione gli elementi per concretizzare le vostre idee.
Per ulteriori informazioni chiamate il Servizio Clienti allo 02.70.398.398 o visitate il sito
microsoft.com/italy/business/
Costa Crociere ospita sulle sue navi migliaia di passeggeri ogni giorno, ognuno con desideri e preferenze diversi. Costa
Crociere impara a conoscerli uno per uno: quando scelgono sul Web la crociera che hanno sempre sognato, quando sono
in navigazione, quando arrivano in porto. Anche a casa continuano a far parte del club Costa e possono raggiungerlo su
Internet, perch Costa ha una soluzione per essere sempre in contatto con i propri clienti e con tutte le agenzie di viaggio
che prenotano crociere con la sua flotta. Una soluzione integrata di Costumer Relationship Management basata su
software .NET di Microsoft.
Sommario
Data mining in supporto alle decisioni
Levoluzione del supporto alle decisioni
Query standard: il motore del DSS
Analisi multidimensionali: il potere delle sezioni e dei dadi
Modellazione segmentazione: analisi per gli utenti
esperti
Knowledge Discovery: il potere dellignoto
Alcuni esempi tratti dalla vita reale
Query standard
Analisi multidimensionali
Modellazione e segmentazione
Knowledge Discovery
Perch si ricorre al Data Mining?
Il Data Warehousing nelleffettiva realt aziendale
Cosa necessario fare per raggiungere la cima
SIG. B.: Proprio cos del Data Mining! Vogliamo fare del
Data Mining e vogliamo che lei ci spieghi come procedere.
JILL: Benissimo. Che tipo di Data Mining hanno fatto i
vostri concorrenti?
SIG. B.: Che tipo di Data Mining, Marianne?
MARIANNE: Sono stati in grado di stabilire quali loro
clienti avrebbero acquistato un nuovo prodotto, inoltre
avrebbero elaborato delle liste di nomi che avrebbero
utilizzato come base per azioni di mailing.
JILL: Un intelligente strategia di marketing mirato!
Benissimo! Ditemi, che tipo di marketing mirato state
facendo attualmente?
Si guardano gli uni con gli altri.
JILL: OK, cerchiamo di vederla in altri termini, dove
tenete i dati relativi ai clienti?
Tutti guardano Charlie.
CHARLIE: Um, quali dati relativi ai clienti?
JILL: Sa di cosa parlo, dei dati relativi ai clienti della
vostra societ. Come accedete alle informazioni sul loro
conto?
CHARLIE: Beh, alcuni di questi dati si trovano nel sistema
di fatturazione ed altri sono memorizzati nel nostro sistema
per le analisi di marketing. Per quanto riguarda i dati dei
clienti che abbiamo acquisito da meno di un anno si possono
trovare nel nostro sistema di gestione degli ordini e
dellapprovvigionamento fino a quando non riusciremo a
raccoglierli ... abbiamo anche i dati di alcuni ex-clienti in un
database di Access nel portatile di Craig.
JILL: A quali di questi clienti volete vendere i vostri nuovi
prodotti?
Si guardano gli uni con gli altri.
Analisi multidimensionali:
il potere delle sezioni e dei dadi
Lanalisi multidimensionale rappresenta il gradino
successivo nella scala delle tipologie di analisi. Mentre alcuni
utenti si accontentano di effettuare semplici query standard,
altri (in particolar modo coloro che devono effettuare
ricerche pi approfondite nellambito di dati specifici)
necessitano di tecnologie di analisi pi potenti che gli
consentano di studiare e confrontare linformazione.
Lanalisi multidimensionale offre differenti prospettive,
dimensioni o punti di vista, attraverso i quali osservare i
dati: periodo di tempo, luogo e prodotto sono esempi di
dimensioni comunemente utilizzate.
Le ragioni che spingono a effettuare analisi
multidimensionali risiedono nellesigenza di vedere
Modellazione segmentazione:
analisi per gli utenti esperti
Query standard
La Figura 3 illustra il modo in cui una piccola societ
telefonica classifica i tipi di query effettuate dai suoi utenti.
Questa societ telefonica offre report sulle vendite,
informazioni sui costi dei prodotti, report sullutilizzo della
rete e sulle entrate, oltre a report di redditivit a fine mese,
il tutto utilizzando query standard. Grazie a queste query il
personale, ovvero addetti alle vendite, Product Manager e
analisti finanziari compresi, pu esaminare gli e-Data e
prendere decisioni immediate.
Per esempio alcuni utenti hanno accesso a report
preconfezionati e possono quindi effettuare regolarmente
questa query:
Visualizza un elenco di tutti quei clienti le cui entrate
relative allutilizzo del servizio nelle fasce orarie di punta
sono diminuite per lo meno del 20 percento2.
Il risultato di questa query pu dare vita a una serie di
differenti decisioni aziendali: dallofferta di sconti sui prodotti
2
Nonostante questa query sia preconfezionata lutente pu
modificare dinamicamente la percentuale, trasformando il 20 percento
in un 35 percento, a seconda delle circostanze. Questo tipo di query
detto anche query parametrizzata.
Analisi multidimensionali
Supponiamo ora che la risposta alla query succitata porti a
formulare unaltra domanda, potremo per esempio voler
sapere:
Di quei clienti (le cui chiamate interne sono state
interrotte per pi del 20 percento delle volte nel corso di una
settimana) quali effettuano chiamate al di fuori della rete?
Questa richiesta di dati raggiunge un maggiore livello di
dettaglio, fornendo informazioni rilevanti in merito a
parametri relativi allorigine e alla destinazione delle
chiamate che potrebbero spronare a proporre servizi
aggiuntivi ai clienti pi importanti o persino portare allo
sviluppo di nuovi prodotti o servizi. Un esempio di
classificazione di possibili analisi multidimensionali
rappresentato in Figura 4.
Nord
NordOvest
SudOvest
1997
Q1
100
76
Q2
70
86
Q3
88
86
Q4
190
100
1998
Q1
90
76
Q2
66
45
68
92
92
144
60
28
Analisi
modulari
Drill-down
degli acquisti
suddivisi per cliente
Ad
hoc
Mostra gli stessi dati suddivisi per aree delle regioni nordoccidentali.
Supponiamo che la risposta a questa richiesta sia simile a
quella riportata in Tabella 2:
Nord
NordOvest
SudOvest
Regione
A
Regione
B
Regione
C
1997
Q1
100
26
Q2
70
30
Q3
88
28
Q4
190
36
1998
Q1
90
22
Q2
66
28
20
24
24
26
32
32
30
32
34
38
38
30
68
92
92
144
60
28
Nord
NordOvest
Regione
B
Citt 1
Citt 2
Citt 3
SudOvest
1997
Q1
100
20
Q2
70
24
Q3
88
24
Q4
190
26
1998
Q1
90
16
Q2
66
32
4
12
4
68
6
14
4
92
8
12
4
92
8
12
6
144
4
8
4
60
8
18
6
28
Modellazione e segmentazione
Dato che il distretto che presenta le entrate minori
quello B lutente potrebbe voler esaminare i risultati
dellanalisi relativi a questa singola area geografica per
comprendere le ragioni del problema.
La Tabella 3 mostra chiaramente che le entrate di Citt 3
sono inferiori a quelle registrate nel resto del distretto.
Incrementando il livello di dettaglio lutente ha quindi potuto
collegare un problema nelle entrate a una specifica localit
non commettendo lerrore di considerarlo una questione di
livello aziendale o territoriale.
Potrebbe esservi capitato di sentir parlare del termine
slicing and dicing (affettare e ridurre a cubetti) che consiste
nella capacit di plasmare le risposte a seconda delle
preferenze dellutente. Gli strumenti OLAP sono straordinari
proprio per la facilit con cui consentono agli utenti di
richiedere i dati in modi diversi. Dopo tutto una lista di
prodotti con le relative date di vendita non di aiuto al
manager che ne sta analizzando il ciclo di vita e necessita
che queste informazioni siano invece suddivise per zone
geografiche, per codici area o per segmenti demografici.
clienti
clienti
clienti
clienti
che
che
che
che
Knowledge Discovery
Figura 5. Un esempio di classificazione delle analisi
effettuate mediante modellazione/segmentazione.
Un istituto di credito utilizza la modellazione per la
valutazione del valore medio sia della perdita di clienti sia
della durata della relazione di clientela (Figura 5), in
entrambi i casi partendo dai dati storici contenuti nel Data
Warehouse. Alcuni esempi di modellazione potrebbero essere
i seguenti:
Il Data Warehousing
nelleffettiva realt aziendale
La maggior parte dei Data Warehouse oggi esistenti viene
utilizzata per lo pi per effettuare comuni funzioni
operazionali; questa affermazione non vuole assolutamente
essere critica quanto piuttosto evidenziare un aspetto
particolarmente proficuo dellutilizzo di Data Warehouse
operazionali. Sebbene le funzioni operazionali, quali per
esempio la realizzazione di resoconti sulle entrate o di analisi
delle vendite, possano non essere complesse o affascinanti
quanto, per esempio, le analisi sul valore della durata della
relazione di clientela, va sottolineato che si tratta comunque
di procedure aziendali estremamente frequenti. In effetti, la
maggior parte delle aziende di cui si tratter in questo
manuale, si sono buttate nel Data Warehousing iniziando
dalla realizzazione di semplici report che riportavano le
entrate mensili o gli indirizzi dei clienti; per quanto questi
report potessero essere semplici consentivano comunque
allutente di avere una prima impressione sui dati trattati.
Questi inizi furono forieri di un mutamento ben pi rilevante.