0% au considerat acest document util (0 voturi)
42 vizualizări21 pagini

Proiect Neparametrica

Documentul prezintă o analiză a gradului de satisfacție al pasagerilor transportului aerian pe baza unei baze de date cu 21 de variabile și peste 100.000 de observații. Sunt analizate distribuția datelor, corelațiile dintre variabile precum satisfacția zborului și confortul locului, influența genului asupra satisfacției și factorii care influențează satisfacția totală.

Încărcat de

ralucaiordache103
Drepturi de autor
© © All Rights Reserved
Respectăm cu strictețe drepturile privind conținutul. Dacă suspectați că acesta este conținutul dumneavoastră, reclamați-l aici.
Formate disponibile
Descărcați ca DOCX, PDF, TXT sau citiți online pe Scribd
0% au considerat acest document util (0 voturi)
42 vizualizări21 pagini

Proiect Neparametrica

Documentul prezintă o analiză a gradului de satisfacție al pasagerilor transportului aerian pe baza unei baze de date cu 21 de variabile și peste 100.000 de observații. Sunt analizate distribuția datelor, corelațiile dintre variabile precum satisfacția zborului și confortul locului, influența genului asupra satisfacției și factorii care influențează satisfacția totală.

Încărcat de

ralucaiordache103
Drepturi de autor
© © All Rights Reserved
Respectăm cu strictețe drepturile privind conținutul. Dacă suspectați că acesta este conținutul dumneavoastră, reclamați-l aici.
Formate disponibile
Descărcați ca DOCX, PDF, TXT sau citiți online pe Scribd
Sunteți pe pagina 1/ 21

STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

ACADEMIA DE STUDII ECONOMICE BUCUREŞTI

FACULTATEA DE CIBERNETICĂ STATISTICĂ ȘI


INFORMATICĂ ECONOMICĂ

Analiza asupra gradului de satisfacție al pasagerilor


trasportului aerian

Referat
STATISTICĂ NEPARAMETRICĂ
Titular disciplină:
Prof.univ.dr. BOBOC Cristina- Rodica

Nume prenume Iordache Raluca


Livanov Miruna
Lozneanu Debora
Grupa 1063

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

CUPRINS

INTRODUCERE.................................................................................................................................3

CONȚINUT.......................................................................................................................................3

CONCLUZII......................................................................................................................................4

BIBLIOGRAFIE................................................................................................................................5

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

INTRODUCERE
Satisfacția pasagerilor transportul public aerian se referă la nivelul de mulțumire sau
satisfacție experimentat de către persoanele care utilizează serviciile de transport aerian. Este o
măsură a modului în care industria aviatică îndeplinește nevoile și așteptările pasagerilor și
clienților săi.
Am analizat o bază de date de pe website-ul Kaggle în legătură cu nivelul de satisfacție al
pasagerilor transportului aerian. Această baza de date conține 21 de variabile pe care le-am
preluat în analiza noastră. Aceste informații au fost preluate prin intermediul unui chestionar de
opinie asupra a 103904 pasageri și care a fost publicat în anul 2015 pe Kaggle.
În primul rând am analizat descriptiv datele și unde a fost necesar am realizat
transformarea lor pentru a calcula indicatori și a efectua teste statistice. Am analizat distribuția și
frecvențele datelor și nu am găsit valori aberante.
Am abordat următoarele problematici: existența corelației între satisfacția experienței de
zbor și confortul locului avut in avion, stabilirea legăturii dintre clasa zborului și curățenia din
avion, analizarea semnficației medianelor variabilelor ordinale în funcție de genul pasagerilor,
existența unei diferențe semnificative între bărbați și femei în ceea ce privește satisfacția locului
din avion și factorii care influențează satisfacția totală.

DESCRIEREA DATELOR
V1: Codul de identificare a persoanei
id: Numărul persoanei în lista de observații
Gender: Genul pasagerilor (Femeie/bărbat)
CustomerType: Tipul de client în funcție de fidelitate (Client fidel/client neloial)
Age: Vârsta pasagerilor (Ani)
TypeofTravel: Scopul zborului pasagerilor (Călătorie personală, călătorie de afaceri)
Class: Clasa calatoriei pasagerilor (Business, Eco, Eco Plus)
FlightDistance: Distanța de zbor a călătoriei (Kilometri)
Inflightwifiservice: Nivelul de satisfacție al pasagerilor în legătură cu serviciului wifi pe timpul
zborului (Toate nivelurile de satisfacție se măsoară astfel: 0: Nu se aplică; 1-5: Satisfacția
efectivă)
DepartureArrivaltimeconvenient: Nivelul de satisfacție al persoanei în legătură cu orele de
plecare și sosire
EaseofOnlinebooking: Nivelul de satisfacție al persoanei în legătură cu facilități de rezervare
online

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Gatelocation: Nivelul de satisfacție al persoanei în legătură cu locația porții de îmbarcare


Foodanddrink: Nivelul de satisfacție al persoanei în legătură cu mâncărea și băutura de pe timpul
zborului și din aeroport
Onlineboarding: Nivelul de satisfacție al persoanei în legătură cu serviciul de îmbarcare online
Seatcomfort: Nivelul de satisfacție al persoanei în legătură cu confortul locului din avion
Inflightentertainment: Nivelul de satisfacție al persoanei în legătură cu divertismentul din timpul
zborului
Onboardservice: Nivel de satisfacție al persoanei în legătură cu serviciul la bord
Legroomservice: Nivelul de satisfacție al persoanei în legătură cu spatiul pentru picioare în avion
Baggagehandling: Nivelul de satisfacție al persoanei în legătură cu manipularea bagajelor
Checkinservice: Nivelul de satisfacție al persoanei în legătură cu serviciul de check-in
Inflightservice: Nivelul de satisfacție al persoanei în legătură cu serviciul în timpul zborului
Cleanliness: Nivelul de satisfacție al persoanei în legătură cu curățenia din avion
DepartureDelayinMinutes: Întârzierea avionului la plecare (Minute)
ArrivalDelayinMinutes: Întârzierea avionului la sosire (Minute)
Satisfaction: Nivel de satisfacție pentru compania aeriană (Satisfacție, neutru sau nemulțumire)

Am modificat variabila „sex” astfel:


- Male= 0
- Female= 1
Am modficat variabila „satisfacție”
- Neutral or dissatisfied= 0
- Satisfied= 1
Am modificat variabila „tipul de client”
- Loyal= 1
- Disloyal= 0
Am modificat variabila „clasa”
- Eco= 1
- Eco plus=2
- Bussines= 3

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Tests of Normality
Kolmogorov-Smirnova
Statis
tic df Sig.
Age .054 103594 <.001
FlightDistance .158 103594 <.001
Class .322 103594 <.001
DepartureDelayinMinutes .349 103594 <.001
ArrivalDelayinMinutes .347 103594 <.001
CustomerType .499 103594 <.001
Inflightwifiservice .159 103594 <.001
DepartureArrivaltimeconvenient .193 103594 <.001

EaseofOnlinebooking .149 103594 <.001


Gatelocation .157 103594 <.001
Foodanddrink .175 103594 <.001
Onlineboarding .206 103594 <.001
Seatcomfort .225 103594 <.001
Inflightentertainment .211 103594 <.001
Onboardservice .209 103594 <.001
Legroomservice .204 103594 <.001
Baggagehandling .243 103594 <.001
Checkinservice .187 103594 <.001
Inflightservice .246 103594 <.001
Cleanliness .187 103594 <.001
Satisfaction .376 103594 <.001
a. Lilliefors Significance Correction

Testul de normalitate utilizând testul Kolmogorov-Smirnov evaluează dacă o variabilă


urmează o distribuție normală.
Pe baza acestor rezultate, putem concluziona că niciuna dintre variabilele din tabel nu
prezintă o distribuție normală. Faptul că p-value (Sig.) sunt mai mici de 0,001 indică faptul că
distribuțiile variabilelor se abat semnificativ de la normalitate.

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Descriptives
Eroare
Statistic standard
Age Medie 39.38 .047
Mediana 40.00
Dispersie 228.407
Abatere 15.113
standard
Amplitudine 78
Intercuartilică 24
Amplitudine
Asimetrie -.004 .008
Aplatizare -.719 .015
Flight Medie 1189.33 3.099
Dista Dispersie 994601.775
nce Abatere 997.297
standard
Amplitudine 4952
Intercuartilică 1329
Amplitudine
Asimetrie 1.110 .008
Aplatizare .269 .015
Class Medie 2.03 .003
Dispersie .927
Abatere .963
standard
Asimetrie -.057 .008
Aplatizare -1.919 .015
Depar Medie 14.75 .118
tureD Dispersie 1452.886
elayin Abatere 38.117
Minut standard

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

es Amplitudine 1592
Intercuartilică 12
Amplitudine
Asimetrie 6.769 .008
Aplatizare 101.467 .015
Arriv Medie 15.179 .1202
alDel Dispersie 1497.588
ayin Abatere 38.6987
Minut standard
es Amplitudine 1584.0
Intercuartilică 13.0
Amplitudine
Asimetrie 6.597 .008
Aplatizare 94.537 .015
Custo Medie .82 .001
merT Dispersie .149
ype Abatere .386
standard
Inflig Medie 2.73 .004
htwifi Mediana 3.00
servic Dispersie 1.763
e Abatere 1.328
standard
Intercuartilică 2
Amplitudine
Asimetrie .040 .008
Aplatizare -.846 .015
Depar Medie 3.06 .005
tureA Dispersie 2.326
rrivalt Abatere 1.525
imeco standard
nveni Intercuartilică 2
ent Amplitudine

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Asimetrie -.334 .008


Aplatizare -1.038 .015
Easeo Medie 2.76 .004
fOnli Mediana 3.00
neboo Dispersie 1.957
king Abatere 1.399
standard
Intercuartilică 2
Amplitudine
Asimetrie -.018 .008
Aplatizare -.910 .015
Gatel Medie 2.98 .004
ocatio Mediana 3.00
n Dispersie 1.633
Abatere 1.278
standard
Intercuartilică 2
Amplitudine
Asimetrie -.059 .008
Aplatizare -1.030 .015
Food Medie 3.20 .004
anddr Mediana 3.00
ink Dispersie 1.767
Abatere 1.329
standard
Intercuartilică 2
Amplitudine
Asimetrie -.151 .008
Aplatizare -1.145 .015
Onlin Medie 3.25 .004
eboar Mediana 3.00
ding Dispersie 1.821

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Abatere 1.349
standard
Intercuartilică 2
Amplitudine
Asimetrie -.454 .008
Aplatizare -.702 .015
Seatc Medie 3.44 .004
omfor Mediana 4.00
t Dispersie 1.739
Abatere 1.319
standard
Intercuartilică 3
Amplitudine
Asimetrie -.483 .008
Aplatizare -.925 .015
Inflig Medie 3.36 .004
htente Mediana 4.00
rtain Dispersie 1.777
ment Abatere 1.333
standard
Intercuartilică 2
Amplitudine
Asimetrie -.365 .008
Aplatizare -1.061 .015
Medie 3.38 .004
Onbo Mediana 4.00
ardser Dispersie 1.660
vice Abatere 1.288
standard
Intercuartilică 2
Amplitudine
Asimetrie -.420 .008
Aplatizare -.892 .015
Legro Medie 3.35 .004
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

omser Mediana 4.00


vice Dispersie 1.730
Abatere 1.315
standard
Intercuartilică 2
Amplitudine
Asimetrie -.350 .008
Aplatizare -.980 .015
Bagg Medie 3.63 .004
ageha Mediana 4.00
ndlin Dispersie 1.395
g Abatere 1.181
standard
Intercuartilică 2
Amplitudine
Asimetrie -.677 .008
Aplatizare -.387 .015
Chec Medie 3.30 .004
kinser Mediana 3.00
vice Dispersie 1.601
Abatere 1.265
standard
Intercuartilică 1
Amplitudine
Asimetrie -.365 .008
Aplatizare -.829 .015
Inflig Medie 3.64 .004
htserv Mediana 4.00
ice Dispersie 1.382
Abatere 1.176
standard
Intercuartilică 2
Amplitudine

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Asimetrie -.691 .008


Aplatizare -.356 .015
Clean Medie 3.29 .004
liness Mediana 3.00
Dispersie 1.722
Abatere 1.312
standard
Intercuartilică 2
Amplitudine
Asimetrie -.300 .008
Aplatizare -1.012 .015
Satisf Medie .43 .002
action Asimetrie .269 .008
Aplatizare -1.928 .015

CONȚINUT

Coeficientul Kendall
Analiza existenței corelației între satisfacția experienței de zbor și confortul locului avut
in avion.
Satisfactia experieței călătoriei (variabila satisfaction)- variabilă numerică, masurată pe scala
ordinală
Confortul locului din avion (variabila seatcomfort)- variabilă numerică, masuratî pe o scală
ordinală

H0: Nu există o legătură semnificativă între cele două variabile.


H1: Există o legatură semnificativă între cele două variabile.

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Coeficientul lui Kendall este un coeficient de corelație non-parametric utilizat pentru a


măsura gradul de concordanță între două variabile ordinale. Acest coeficient evaluează în mod
specific gradul de concordanță între clasamentele celor două variabile, indiferent de
magnitudinea diferențelor dintre valorile lor.

Coeficientul Kendall este egal cu 0,326. Probabilitatea ca ipoteza H0 să fie adevarată este
de „<0,001”, care este mai mică decât 0.01 deci se va respinge ipoteza H0 cu o probabilitate de
99%. Putem concluziona că există o corelație semnificativă între cele două variabile. Valoarea
coeficientului indică faptul că relația este de intensitate medie și o corelație pozitivă.

Coeficientul Gamma

Analiza existentei legăturii dintre clasa zborului și curățenia din avion.


Clasa (variabila class)- variabilă calitativă, măsurată pe scala ordinală.
Curățenia din avion (variabila cleanliness)- variabilă cantitativă, măsurată pe scala
ordinală.
H0: Nu există o legatură semnificativă intre cele două variabile.
H1: Există o legatură semnificativă între cele două variabile.
Coeficientul Gamma este o măsură de corelație utilizată pentru a evalua relația dintre două
variabile ordinale.

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Valoarea coeficientului este 0,172, ceea ce indică o concordanță pozitivă, puterea fiind
slabă. Probabilitatea ca ipoteza H0 să fie adevarată este de „<0,001”, care este mai mica decat
0.01 deci se va respinge ipoteza H0 cu o probabilitate de 99%. Putem concluziona ca există o
corelatie semnificativă între cele doua variabile.

Din tabel se observă că cei mai multi dintre pasageri din fiecare clasă (Eco, Eco Plus si
Business) au acordat nota 4 din 5 pentru curatenie (între 23,1% si 26,3% din fiecare clasă).

Testul Median
Frequencies
Gender
Male Female
DepartureArrivaltimeconvenient > Median 23842 24107
<= Median 27335 28620
Foodanddrink > Median 23244 23428
<= Median 27933 29299
Seatcomfort > Median 12953 13517
<= Median 38224 39210
Legroomservice > Median 12679 11988
<= Median 38498 40739
Baggagehandling > Median 13482 13649
<= Median 37695 39078
Cleanliness > Median 24755 25113
<= Median 26422 27614
Inflightentertainment > Median 12443 12770
<= Median 38734 39957

Tabelul de mai sus conține rezultatele unui test median efectuat pe șapte variabile:
Corectitudinea orei de sosire, Mâncare și băutură, Comfortul scaunului, Spatiu pentru picioare în
avion, Manipularea bagajelor, Curățenie, precum și Divertisment în timpul zborului. Testul a fost
efectuat pe baza variabilei de grupare Gen, cu categoriile Bărbat și Femeie.

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Pentru fiecare variabilă, frecvențele sunt afișate pe baza celor două sexe și sunt apoi
comparate cu valoarea medianei.
De exemplu, în variabila DepartureArrivaltimeconvenient (Corectitudinea orei de sosire)
au fost 23.842 de bărbați și 24.107 de femei ale căror valori au fost mai mari decât mediana, în
timp ce 27.335 de bărbați și 28.620 de femei, cu valori mai mici sau egale decat mediana.

Test Statisticsa
DepartureArrivaltimeconvenient Foodanddrink Seatcomfort Legroomservice Baggagehandling Cleanliness Inflightentertainment
N 103904 103904 103904 103904 103904 103904 103904

Median 3.00 3.00 4.00 4.00 4.00 3.00 4.00


Chi-Square 7.854 10.209 1.450 59.629 2.820 5.744 .126
df 1 1 1 1 1 1 1
Asymp. Sig. .005 .001 .228 <.001 .093 .017 .722

Yates' Chi- 7.819 10.169 1.433 59.516 2.796 5.714 .121


Continuity Square
Correction
df 1 1 1 1 1 1 1

Asymp. .005 .001 .231 <.001 .094 .017 .728


Sig.

 N: Indică numărul total de observații (103.904 în cazul nostru).


 Median: Afișează valoarea medianei pentru fiecare variabilă.
 Chi-square: Arată statistica testului chi-pătrat calculată pentru fiecare variabilă.
 df: Reprezintă gradele de libertate asociate testului chi-pătrat.
 Asymp. Sig.: Afișează p-value pentru fiecare test chi-pătrat.
 Yates' Continuity Correction: Prezintă statistica testului chi-pătrat cu corecția de
continuitate a lui Yates aplicată.
 Asimp. Sig. (de la final): Afișează p-value pentru testul chi-pătrat cu corecția continuității
lui Yates.

În variabila DepartureArrivaltimeconvenient, statistica testului chi-pătrat este 7,854 cu 1 grad


de libertate, generând o valoare Asymptotic Significance de 0,005. Acest p-value sugerează o
diferență semnificativă între proporțiile de bărbați și femei, peste și sub valoarea medianei.

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

În mod similar, pentru Foodanddrink, Cleanliness și Legroomservice, statisticile testului chi-


pătrat sunt semnificative din punct de vedere statistic (p-value< 0,05), ceea ce ne aduce la
concluzia trasă anterior în cazul variabilei corectitudinii timpului de sosire.
Cu toate acestea, în variabilele Seatcomfort, Baggagehandling și Inflightentertainment,
statisticile testului chi-pătrat (0,228 0,093 și, respectiv, 0,722) nu sunt semnificative statistic,
ceea ce înseamnă că nu sunt diferențe în proporțiile de bărbați și femei peste și sub mediana
acestor variabile.

Testul Mann-Whitney

Vom verifica, cu ajutorul testului Mann-Whitney dacă există o diferență semnificativă între
bărbați și femei în ceea ce privește satisfacția locului din avion.
Mann-Whitney test

Ranks

Gender N Mean Rank Sum of Ranks


Seatcomfort Male 51177 51267.76 2623730250.00

Female 52727 52617.11 2774342310.00


Total 103904

Acestea sunt rangurile atribuite fiecărui grup (bărbați și femei) pe baza variabilei
Seatcomfort. Astfel, avem:
 N: Reprezintă numărul total de observații din fiecare grup (51.177 de bărbați și 52.727 de
femei).
 Mean Rank: Afișează clasamentul mediu pentru fiecare grup. În acest caz, valoarea
pentru bărbați este de 51.267,76, iar pentru femei este de 52.617,11.
 Sum of ranks: arată suma rangurilor pentru fiecare grup. Suma rangurilor pentru
persoanele de gen masculin este de 2.623.730.250,00, iar pentru cele de gen feminin este
2.774.342.310,00

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Test Statisticsa

Seatcomfort
Mann-Whitney U 1314161997.000
Wilcoxon W 2623730250.000
Z -7.459
Asymp. Sig. (2-tailed) <.001
a. Grouping Variable: Gender

Tabelul de mai sus conține rezultatele testului Mann-Whitney U efectuat pe variabila


Seatcomfort (Confortul scaunului), având genul persoanei ca variabilă de grupare. Testul are
rolul de a determina dacă există o diferență semnificativă între bărbați și femei, privitor la
variabila Seatcomfort.

 Mann-Whitney U: valoarea U reprezintă statistica testului precizat, ce măsoară


intensitatea diferenței dintre rândurile celor două grupuri. În acest caz, valoarea U este
1.314.161.997.000.
 Wilcoxon W: Această valoare reprezintă suma rangurilor pentru unul dintre grupuri (în
acest caz, grupul mai mic, adică al bărbaților). Este utilzat pentru calcularea intensității
efectului sau pentru compararea mai multor teste în perechi. Aici, valoarea menționată
este 2.623.730.250.000.
 Z: Valoarea Z este scorul standardizat derivat din statistica U Mann-Whitney. Este folosit
pentru a evalua semnificația statistică a testului. În acest caz, valoarea Z este -7,459.
 Asymp. Sig. (2-tailed): Aceasta este p-value asociată testului U Mann-Whitney.

Statistica testului Mann-Whitney U (1.314.161.997.000) arată că există o diferență


semnificativă în distribuția scorurilor Seatcomfort între bărbați și femei.
Valoarea Z negativă (-7,459) indică faptul că rândurile bărbaților sunt în general mai mici
decât cele ale femeilor, adică femeile tind să aibă scoruri Seatcomfort mai mari.
P-value <.001 confirmă faptul că diferența dintre scorurile Seatcomfort între bărbați și femei este
semnificativă statistic.

Am realizat regresia logistică între toate variabilele care pot influența satisfacția
pasagerilor.

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Regresia logistică

Variables in the Equation


B S.E. Wald df Sig. Exp(B)
Step 1a Inflightwifiservice .479 .011 2045.318 1 <.001 1.614
Class .993 .010 10195.59 1 <.001 2.699
0
DepartureArrivaltimeco -.211 .007 879.794 1 <.001 .810
nvenient
EaseofOnlinebooking -.203 .011 366.319 1 <.001 .816
Gatelocation .072 .008 73.899 1 <.001 1.074
Foodanddrink -.061 .010 40.813 1 <.001 .941
Onlineboarding .689 .009 5725.524 1 <.001 1.992
Seatcomfort .064 .010 40.072 1 <.001 1.066
Inflightentertainment .321 .012 667.610 1 <.001 1.378
Onboardservice .226 .009 602.733 1 <.001 1.254
Legroomservice .291 .008 1419.512 1 <.001 1.338
Baggagehandling .009 .010 .855 1 .355 1.009
Checkinservice .205 .008 710.553 1 <.001 1.227
Inflightservice -.021 .011 3.840 1 .050 .979
Cleanliness .092 .011 71.860 1 <.001 1.096
Constant -8.869 .064 19418.29 1 <.001 .000
8
a. Variable(s) entered on step 1: Inflightwifiservice, Class, DepartureArrivaltimeconvenient,
EaseofOnlinebooking, Gatelocation, Foodanddrink, Onlineboarding, Seatcomfort,
Inflightentertainment, Onboardservice, Legroomservice, Baggagehandling, Checkinservice,
Inflightservice, Cleanliness.

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Variabilele cu estimator negativ si cele nesemnificative vor fi scoase din ecuație, adică:
DepartureArrivaltimeconvenient, Baggagehandling, Inflightservice, Foodanddrink,
EaseofOnlinebooking.

Prin introducerea tuturor variabilelor explicative în model, algoritmul converge in 10


iteratii pentru obtinerea solutiei optime (metoda verosimilitatii maxime de estimare a
parametrilor modelului de regresie logistica) Inițial -2LogLikelihood = 113609.743 după 10
iteratii ajungând la 83289.735.

Variables in the Equation


B S.E. Wald df Sig. Exp(B)
Step 10a Inflightwifiservice .331 .008 1678.553 1 <.001 1.392
Class 1.014 .010 11087.774 1 <.001 2.758
Gatelocation -.091 .007 158.546 1 <.001 .913
Onlineboarding .620 .009 5132.949 1 <.001 1.860
Seatcomfort .148 .009 256.696 1 <.001 1.160
Onboardservice .292 .009 1163.130 1 <.001 1.339
Legroomservice .316 .007 1773.384 1 <.001 1.371
Checkinservice .133 .007 336.216 1 <.001 1.142
Inflightservice .060 .009 43.171 1 <.001 1.062
Cleanliness .224 .009 637.484 1 <.001 1.251
Constant -9.164 .061 22481.314 1 <.001 .000
a. Variable(s) entered on step 10: Inflightservice.

Toți parametrii sunt semnificativi pentru un nivel de încredere de cel puțin 99,99%.

București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

Pentru o creștere cu o unitate a satisfacției persoanelor în ceea ce privește serviciul Inflight Wi-
Fi, clasa, confortul scaunului, îmbarcarea online, spațiul pentru picioare, serviciul de check-in,
serviciul de la bord, curățenia, atunci satisacția va trece de la neutru sau nemulțumit, la mulțumit.
Satisfacția crește cel mai mult la îmbunatățirea: serviciul în timpul zborului, îmbarcării
online și locului pentru picioare.

Omnibus Tests of Model Coefficients


Chi-square df Sig.
Step 10 Step 43.201 1 <.001
Block 58899.064 10 <.001
Model 58899.064 10 <.001

Prin aplicarea testului Chi square se obtine modelul valid, valoarea Chi square calculată
fiind 58899.064.
Ipotezele testului sunt:
H0: modelul nu este valid (nu se produce nici o îmbunătățire în funcția de verosimilitate prin
introducerea celor trei variabile comparativ cu modelul bazat doar pe șansă)

H1: modelul este valid (îmbunătățirea în funcția de verosimilitate prin introducerea celor trei
variabile este semnificativă comparativ cu modelul bazat doar pe șansă)

Sig=0,000<0,001 deci se respinge H0 deci modelul poate fi validat cu un nivel de semnificație


de 0,001

Model Summary

-2 Log Cox & Snell R Nagelkerke R


Step likelihood Square Square
10 83289.735a .433 .580
a. Estimation terminated at iteration number 6 because
parameter estimates changed by less than .001.

Cox&Snell R2 = 0,433
Nagelkerke R2 = 0,58
McFadden's R2 = Cox and Snell R Square / (1 - Cox and Snell R Square)
McFadden's R2 = 0.433 / (1 - 0.433)
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

McFadden's R2 = 0.433 / 0.567


McFadden's R2 ≈ 0.763
Toți acești coeficienți sunt cuprinși între 0,7 și 1 ceea ce indică un model de o calitate
superioară.
Classification Tablea
Predicted
Satisfaction
neutral or Percentage
Observed dissatisfied satisfied Correct
Step 10 Satisfaction neutral or dissatisfied 51401 7478 87.3
satisfied 9497 35528 78.9
Overall Percentage 83.7
a. The cut value is .500

Tabela de clasificare prezintă clasificările observate și prezise ale variabilei dependente


(Satisfacție) bazate pe modelul de regresie logistică.
Observat: Această coloană reprezintă categoriile reale ale variabilei dependente (Satisfacție) în
setul de date.
Prezis: Această coloană reprezintă categoriile prezise ale variabilei dependente bazate pe
modelul de regresie logistică.
Satisfacție: Categoriile variabilei dependente sunt împărțite în două grupuri: "neutru sau
nemulțumit" și "mulțumit".
Procent Corect: Această coloană arată procentul de predicții corecte făcute de modelul de
regresie logistică pentru fiecare categorie a variabilei dependente.
În tabel, modelul de regresie logistică a prezis următoarele:
Pentru categoria "neutru sau nemulțumit" a variabilei dependente, modelul a prezis corect
în 87,3% din cazuri. Din cele 58.879 de observații din această categorie, 51.401 au fost prezise
corect ca "neutru sau nemulțumit", iar 7.478 au fost prezise incorect ca "mulțumit".
Pentru categoria "mulțumit" a variabilei dependente, modelul a prezis corect în 78,9% din
cazuri. Din cele 45.025 de observații din această categorie, 9.497 au fost prezise incorect ca
"neutru sau nemulțumit", iar 35.528 au fost prezise corect ca "mulțumit".
În total, modelul de regresie logistică a obținut o rată de acuratețe de 83,7%, care
reprezintă procentul de predicții corecte pentru ambele categorii combinate.
Valoarea de tăiere (cut value) de 0,500 indică pragul folosit pentru determinarea
categoriilor prezise. Dacă probabilitatea prezisă ca o observație să fie în categoria "mulțumit"
București, 2023
STATISTICĂ NEPARAMETRICĂ Lozneanu Debora

este egală sau mai mare de 0,500, aceasta este clasificată ca "mulțumit"; în caz contrar, este
clasificată ca "neutru sau nemulțumit".

CONCLUZII

În cadrul acestui proiect, am analizat gradul de satisfacție al pasagerilor transportului


aerian utilizând datele dintr-o bază de date disponibilă pe website-ul Kaggle. Am utilizat metode
statistice și de analiză pentru a explora relațiile dintre diferite variabile și nivelul de satisfacție al
pasagerilor.
Factorii care au influențat în mod semnificativ satisfacția totală a pasagerilor includ:
serviciul de îmbarcare online, confortul locului din avion, divertismentul în timpul zborului,
serviciul la bord și curățenia din avion.
Conform analizei existenței corelației între satisfacția experienței de zbor și confortul
locului avut in avion, se observă o corelație pozitivă, de intesitate medie între cele două
variabile. De asemenea există o legătură pozitivă între clasa zborului și curățenia din avion.
În nivelul de satisfacție al persoanelor în legătură cu orele de plecare și sosire, dar și
mancare și băutură s-a observat o diferență semnificativă între proporțiile bărbaților și femeilor,
peste și sub valoarea medianei.
Însă în variabilele confortul locului din avion, manipularea bagajelor și divertismentul
din timpul zborului, statisticile testului arată că nu sunt diferențe în proporțiile bărbaților și
femeilor asupra valorii medianei. O altă analiza asupra persoanelor în funcție de gen indică o
diferență semnificativă între bărbați și femei în ceea ce privește satisfacția locului din avion.
Pentru ca pasagerii să fie mulțumiți de zbor, companiile aeriene se pot focusa pe unul sau
mai multe dintre aceste aspecte: serviciul Inflight Wi-Fi, clasa, confortul scaunului, îmbarcarea
online, spațiul pentru picioare, serviciul de check-in, serviciul de la bord, curățenia. Atunci
satisacția va trece de la neutru sau nemulțumit, la mulțumit.

BIBLIOGRAFIE

https://www.kaggle.com/datasets/teejmahal20/airline-passenger-satisfaction

București, 2023

S-ar putea să vă placă și