Proiect Neparametrica
Proiect Neparametrica
Referat
STATISTICĂ NEPARAMETRICĂ
Titular disciplină:
Prof.univ.dr. BOBOC Cristina- Rodica
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
CUPRINS
INTRODUCERE.................................................................................................................................3
CONȚINUT.......................................................................................................................................3
CONCLUZII......................................................................................................................................4
BIBLIOGRAFIE................................................................................................................................5
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
INTRODUCERE
Satisfacția pasagerilor transportul public aerian se referă la nivelul de mulțumire sau
satisfacție experimentat de către persoanele care utilizează serviciile de transport aerian. Este o
măsură a modului în care industria aviatică îndeplinește nevoile și așteptările pasagerilor și
clienților săi.
Am analizat o bază de date de pe website-ul Kaggle în legătură cu nivelul de satisfacție al
pasagerilor transportului aerian. Această baza de date conține 21 de variabile pe care le-am
preluat în analiza noastră. Aceste informații au fost preluate prin intermediul unui chestionar de
opinie asupra a 103904 pasageri și care a fost publicat în anul 2015 pe Kaggle.
În primul rând am analizat descriptiv datele și unde a fost necesar am realizat
transformarea lor pentru a calcula indicatori și a efectua teste statistice. Am analizat distribuția și
frecvențele datelor și nu am găsit valori aberante.
Am abordat următoarele problematici: existența corelației între satisfacția experienței de
zbor și confortul locului avut in avion, stabilirea legăturii dintre clasa zborului și curățenia din
avion, analizarea semnficației medianelor variabilelor ordinale în funcție de genul pasagerilor,
existența unei diferențe semnificative între bărbați și femei în ceea ce privește satisfacția locului
din avion și factorii care influențează satisfacția totală.
DESCRIEREA DATELOR
V1: Codul de identificare a persoanei
id: Numărul persoanei în lista de observații
Gender: Genul pasagerilor (Femeie/bărbat)
CustomerType: Tipul de client în funcție de fidelitate (Client fidel/client neloial)
Age: Vârsta pasagerilor (Ani)
TypeofTravel: Scopul zborului pasagerilor (Călătorie personală, călătorie de afaceri)
Class: Clasa calatoriei pasagerilor (Business, Eco, Eco Plus)
FlightDistance: Distanța de zbor a călătoriei (Kilometri)
Inflightwifiservice: Nivelul de satisfacție al pasagerilor în legătură cu serviciului wifi pe timpul
zborului (Toate nivelurile de satisfacție se măsoară astfel: 0: Nu se aplică; 1-5: Satisfacția
efectivă)
DepartureArrivaltimeconvenient: Nivelul de satisfacție al persoanei în legătură cu orele de
plecare și sosire
EaseofOnlinebooking: Nivelul de satisfacție al persoanei în legătură cu facilități de rezervare
online
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Tests of Normality
Kolmogorov-Smirnova
Statis
tic df Sig.
Age .054 103594 <.001
FlightDistance .158 103594 <.001
Class .322 103594 <.001
DepartureDelayinMinutes .349 103594 <.001
ArrivalDelayinMinutes .347 103594 <.001
CustomerType .499 103594 <.001
Inflightwifiservice .159 103594 <.001
DepartureArrivaltimeconvenient .193 103594 <.001
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Descriptives
Eroare
Statistic standard
Age Medie 39.38 .047
Mediana 40.00
Dispersie 228.407
Abatere 15.113
standard
Amplitudine 78
Intercuartilică 24
Amplitudine
Asimetrie -.004 .008
Aplatizare -.719 .015
Flight Medie 1189.33 3.099
Dista Dispersie 994601.775
nce Abatere 997.297
standard
Amplitudine 4952
Intercuartilică 1329
Amplitudine
Asimetrie 1.110 .008
Aplatizare .269 .015
Class Medie 2.03 .003
Dispersie .927
Abatere .963
standard
Asimetrie -.057 .008
Aplatizare -1.919 .015
Depar Medie 14.75 .118
tureD Dispersie 1452.886
elayin Abatere 38.117
Minut standard
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
es Amplitudine 1592
Intercuartilică 12
Amplitudine
Asimetrie 6.769 .008
Aplatizare 101.467 .015
Arriv Medie 15.179 .1202
alDel Dispersie 1497.588
ayin Abatere 38.6987
Minut standard
es Amplitudine 1584.0
Intercuartilică 13.0
Amplitudine
Asimetrie 6.597 .008
Aplatizare 94.537 .015
Custo Medie .82 .001
merT Dispersie .149
ype Abatere .386
standard
Inflig Medie 2.73 .004
htwifi Mediana 3.00
servic Dispersie 1.763
e Abatere 1.328
standard
Intercuartilică 2
Amplitudine
Asimetrie .040 .008
Aplatizare -.846 .015
Depar Medie 3.06 .005
tureA Dispersie 2.326
rrivalt Abatere 1.525
imeco standard
nveni Intercuartilică 2
ent Amplitudine
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Abatere 1.349
standard
Intercuartilică 2
Amplitudine
Asimetrie -.454 .008
Aplatizare -.702 .015
Seatc Medie 3.44 .004
omfor Mediana 4.00
t Dispersie 1.739
Abatere 1.319
standard
Intercuartilică 3
Amplitudine
Asimetrie -.483 .008
Aplatizare -.925 .015
Inflig Medie 3.36 .004
htente Mediana 4.00
rtain Dispersie 1.777
ment Abatere 1.333
standard
Intercuartilică 2
Amplitudine
Asimetrie -.365 .008
Aplatizare -1.061 .015
Medie 3.38 .004
Onbo Mediana 4.00
ardser Dispersie 1.660
vice Abatere 1.288
standard
Intercuartilică 2
Amplitudine
Asimetrie -.420 .008
Aplatizare -.892 .015
Legro Medie 3.35 .004
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
CONȚINUT
Coeficientul Kendall
Analiza existenței corelației între satisfacția experienței de zbor și confortul locului avut
in avion.
Satisfactia experieței călătoriei (variabila satisfaction)- variabilă numerică, masurată pe scala
ordinală
Confortul locului din avion (variabila seatcomfort)- variabilă numerică, masuratî pe o scală
ordinală
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Coeficientul Kendall este egal cu 0,326. Probabilitatea ca ipoteza H0 să fie adevarată este
de „<0,001”, care este mai mică decât 0.01 deci se va respinge ipoteza H0 cu o probabilitate de
99%. Putem concluziona că există o corelație semnificativă între cele două variabile. Valoarea
coeficientului indică faptul că relația este de intensitate medie și o corelație pozitivă.
Coeficientul Gamma
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Valoarea coeficientului este 0,172, ceea ce indică o concordanță pozitivă, puterea fiind
slabă. Probabilitatea ca ipoteza H0 să fie adevarată este de „<0,001”, care este mai mica decat
0.01 deci se va respinge ipoteza H0 cu o probabilitate de 99%. Putem concluziona ca există o
corelatie semnificativă între cele doua variabile.
Din tabel se observă că cei mai multi dintre pasageri din fiecare clasă (Eco, Eco Plus si
Business) au acordat nota 4 din 5 pentru curatenie (între 23,1% si 26,3% din fiecare clasă).
Testul Median
Frequencies
Gender
Male Female
DepartureArrivaltimeconvenient > Median 23842 24107
<= Median 27335 28620
Foodanddrink > Median 23244 23428
<= Median 27933 29299
Seatcomfort > Median 12953 13517
<= Median 38224 39210
Legroomservice > Median 12679 11988
<= Median 38498 40739
Baggagehandling > Median 13482 13649
<= Median 37695 39078
Cleanliness > Median 24755 25113
<= Median 26422 27614
Inflightentertainment > Median 12443 12770
<= Median 38734 39957
Tabelul de mai sus conține rezultatele unui test median efectuat pe șapte variabile:
Corectitudinea orei de sosire, Mâncare și băutură, Comfortul scaunului, Spatiu pentru picioare în
avion, Manipularea bagajelor, Curățenie, precum și Divertisment în timpul zborului. Testul a fost
efectuat pe baza variabilei de grupare Gen, cu categoriile Bărbat și Femeie.
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Pentru fiecare variabilă, frecvențele sunt afișate pe baza celor două sexe și sunt apoi
comparate cu valoarea medianei.
De exemplu, în variabila DepartureArrivaltimeconvenient (Corectitudinea orei de sosire)
au fost 23.842 de bărbați și 24.107 de femei ale căror valori au fost mai mari decât mediana, în
timp ce 27.335 de bărbați și 28.620 de femei, cu valori mai mici sau egale decat mediana.
Test Statisticsa
DepartureArrivaltimeconvenient Foodanddrink Seatcomfort Legroomservice Baggagehandling Cleanliness Inflightentertainment
N 103904 103904 103904 103904 103904 103904 103904
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Testul Mann-Whitney
Vom verifica, cu ajutorul testului Mann-Whitney dacă există o diferență semnificativă între
bărbați și femei în ceea ce privește satisfacția locului din avion.
Mann-Whitney test
Ranks
Acestea sunt rangurile atribuite fiecărui grup (bărbați și femei) pe baza variabilei
Seatcomfort. Astfel, avem:
N: Reprezintă numărul total de observații din fiecare grup (51.177 de bărbați și 52.727 de
femei).
Mean Rank: Afișează clasamentul mediu pentru fiecare grup. În acest caz, valoarea
pentru bărbați este de 51.267,76, iar pentru femei este de 52.617,11.
Sum of ranks: arată suma rangurilor pentru fiecare grup. Suma rangurilor pentru
persoanele de gen masculin este de 2.623.730.250,00, iar pentru cele de gen feminin este
2.774.342.310,00
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Test Statisticsa
Seatcomfort
Mann-Whitney U 1314161997.000
Wilcoxon W 2623730250.000
Z -7.459
Asymp. Sig. (2-tailed) <.001
a. Grouping Variable: Gender
Am realizat regresia logistică între toate variabilele care pot influența satisfacția
pasagerilor.
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Regresia logistică
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Variabilele cu estimator negativ si cele nesemnificative vor fi scoase din ecuație, adică:
DepartureArrivaltimeconvenient, Baggagehandling, Inflightservice, Foodanddrink,
EaseofOnlinebooking.
Toți parametrii sunt semnificativi pentru un nivel de încredere de cel puțin 99,99%.
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
Pentru o creștere cu o unitate a satisfacției persoanelor în ceea ce privește serviciul Inflight Wi-
Fi, clasa, confortul scaunului, îmbarcarea online, spațiul pentru picioare, serviciul de check-in,
serviciul de la bord, curățenia, atunci satisacția va trece de la neutru sau nemulțumit, la mulțumit.
Satisfacția crește cel mai mult la îmbunatățirea: serviciul în timpul zborului, îmbarcării
online și locului pentru picioare.
Prin aplicarea testului Chi square se obtine modelul valid, valoarea Chi square calculată
fiind 58899.064.
Ipotezele testului sunt:
H0: modelul nu este valid (nu se produce nici o îmbunătățire în funcția de verosimilitate prin
introducerea celor trei variabile comparativ cu modelul bazat doar pe șansă)
H1: modelul este valid (îmbunătățirea în funcția de verosimilitate prin introducerea celor trei
variabile este semnificativă comparativ cu modelul bazat doar pe șansă)
Model Summary
Cox&Snell R2 = 0,433
Nagelkerke R2 = 0,58
McFadden's R2 = Cox and Snell R Square / (1 - Cox and Snell R Square)
McFadden's R2 = 0.433 / (1 - 0.433)
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora
este egală sau mai mare de 0,500, aceasta este clasificată ca "mulțumit"; în caz contrar, este
clasificată ca "neutru sau nemulțumit".
CONCLUZII
BIBLIOGRAFIE
https://www.kaggle.com/datasets/teejmahal20/airline-passenger-satisfaction
București, 2023