0% found this document useful (0 votes)
158 views

Stats Prin Matlab

This document is a book in Romanian on statistics using Matlab. It includes chapters on introductions to statistics, probability theory, descriptive statistics, sampling theory, statistical inference, correlation and regression. It provides examples and exercises in Matlab.

Uploaded by

Popa Iulian
Copyright
© © All Rights Reserved
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
158 views

Stats Prin Matlab

This document is a book in Romanian on statistics using Matlab. It includes chapters on introductions to statistics, probability theory, descriptive statistics, sampling theory, statistical inference, correlation and regression. It provides examples and exercises in Matlab.

Uploaded by

Popa Iulian
Copyright
© © All Rights Reserved
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 271

Iulian STOLERIU

Statistic prin

Matlab

Statistics with

Summary

Foreward
Introduction to Statistics
Elements of Probability Theory
Random experiments in Matlab
Elements of Descriptive Statistics
Sampling Theory
Selection Theory
Statistical Inference
Correlation and Regression
References

Matlab

Cuprins

Summary
List de guri .
List de tabele
Notaii . .
Prefa . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

. 2
. 5
. 8
. 11
. 13

. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
chart)
. . . .
. . . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

Experiene aleatoare . . . . . . . . . . . . . . . . . . .
Deniia axiomatic a probabilitii . . . . . . . . . .
Cmp de probabilitate . . . . . . . . . . . . . . . . . .
Cmp de probabilitate geometric . . . . . . . . . . .
Probabiliti condiionate . . . . . . . . . . . . . . . .
Variabile aleatoare . . . . . . . . . . . . . . . . . . . .
Caracteristici funcionale ale variabilelor aleatoare . .
Caracteristici numerice ale variabilelor aleatoare . . . .
Inegaliti ntre momente . . . . . . . . . . . . . . . .
Standardizarea unei variabile aleatoare . . . . . . . . .
Corelaia i coecientul de corelaie . . . . . . . . . . .
Independena variabilelor aleatoare . . . . . . . . . . .
Exemple de repartiii discrete . . . . . . . . . . . . . .
Exemple de repartiii continue . . . . . . . . . . . . . .
Transformri funcionale de variabile aleatoare . . . .
Tipuri de convergen a irurilor de variabile aleatoare
Teoreme limit . . . . . . . . . . . . . . . . . . . . . .
Exerciii rezolvate . . . . . . . . . . . . . . . . . . . . .
Exerciii propuse . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

1 Introducere n Statistic
1.1
1.2
1.3
1.4

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

Scurt istoric . . . . . . . . . . . . . . . . . . .
Modelare Statistic . . . . . . . . . . . . . . .
Organizarea i descrierea datelor . . . . . . .
Reprezentri grace . . . . . . . . . . . . . .
1.4.1 Reprezentare prin puncte . . . . . . .
1.4.2 Reprezentarea stem-and-leaf . . . . .
1.4.3 Reprezentarea cu bare . . . . . . . . .
1.4.4 Histograme . . . . . . . . . . . . . . .
1.4.5 Reprezentare prin sectoare de disc (pie
1.5 Concluzii . . . . . . . . . . . . . . . . . . . .
1.6 Exerciii propuse . . . . . . . . . . . . . . . .

2 Elemente de Teoria probabilitilor


2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
2.14
2.15
2.16
2.17
2.18
2.19

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

15

15
17
18
21
22
22
23
25
27
28
29

31

31
32
34
35
36
36
38
40
43
44
44
45
48
50
54
56
57
61
64

3 Experiene aleatoare n Matlab

3.1 Scurt introducere n Matlab . . . . . . . . . . . . . . . . . . . . . . . .


3.2 Generarea de numere (pseudo-)aleatoare . . . . . . . . . . . . . . . . . . .
3.2.1 Generarea de numere uniform repartizate ntr-un interval, U(0, 1) .
3.2.2 Generarea de numere repartizate normal, N (, ) . . . . . . . . .
3.2.3 Generarea de numere aleatoare de o repartiie dat . . . . . . . . .
3.2.4 Metoda funciei de repartiie inverse (Hincin-Smirnov) . . . . . . .
3.2.5 Generarea de numere aleatoare ntregi . . . . . . . . . . . . . . . .
3.3 Metoda Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Integrarea folosind metoda Monte Carlo . . . . . . . . . . . . . . . . . . .
3.5 Experimente aleatoare n Matlab . . . . . . . . . . . . . . . . . . . . . .
3.5.1 Simularea aruncrii unei monede . . . . . . . . . . . . . . . . . . .
3.5.2 Simularea aruncrii unui zar . . . . . . . . . . . . . . . . . . . . . .
3.6 Probabiliti geometrice . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7 Repartiii probabilistice n Matlab . . . . . . . . . . . . . . . . . . . . .
3.8 Justicri grace ale teoremei limit central . . . . . . . . . . . . . . . .
3.9 Exerciii rezolvate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.10 Exerciii propuse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4 Elemente de Statistic descriptiv


4.1
4.2
4.3
4.4
4.5

Msuri descriptive ale datelor negrupate


Msuri descriptive ale datelor grupate .
Exerciii rezolvate . . . . . . . . . . . . .
Concluzii . . . . . . . . . . . . . . . . .
Exerciii propuse . . . . . . . . . . . . .

5.1
5.2
5.3
5.4
5.5
5.6
5.7

6.7
6.8
6.9
6.10
6.11

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

. . . .
. . . .
. . . .
. . .
. . . .
. . . .
. . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

Punerea problemei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Metoda verosimilitii maxime . . . . . . . . . . . . . . . . . . . . . . . .
Metoda momentelor (K. Pearson) . . . . . . . . . . . . . . . . . . . . . . .
Metoda celor mai mici ptrate . . . . . . . . . . . . . . . . . . . . . . . . .
Metoda minimului lui 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Metoda cu intervale de ncredere . . . . . . . . . . . . . . . . . . . . . . .
6.6.1 Interval de ncredere pentru medie, cnd dispersia este cunoscut .
6.6.2 Interval de ncredere pentru medie, cnd dispersia este necunoscut
6.6.3 Interval de ncredere dispersie, cnd media este cunoscut . . . . .
6.6.4 Interval de ncredere dispersie, cnd media este necunoscut . . . .
6.6.5 Interval de ncredere pentru diferena mediilor . . . . . . . . . . . .
6.6.6 Interval de ncredere pentru raportul dispersiilor . . . . . . . . . .
6.6.7 Intervale de ncredere pentru proporii ntr-o populaie binomial .
6.6.8 Interval de ncredere pentru selecii mari . . . . . . . . . . . . . . .
Estimaii prin Matlab . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Paradox cu intervale de ncredere . . . . . . . . . . . . . . . . . . . . . . .
Exerciii rezolvate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exerciii propuse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

Introducere . . . . . . . . . . . . . . . . . . .
Exemple de statistici . . . . . . . . . . . . . .
Statistici de ordine . . . . . . . . . . . . . . .
Selecii aleatoare dintr-o colectivitate normal
Selecii n Matlab . . . . . . . . . . . . . . .
Exerciii rezolvate . . . . . . . . . . . . . . . .
Exerciii propuse . . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

6 Noiuni de teoria estimaiei


6.1
6.2
6.3
6.4
6.5
6.6

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.

5 Noiuni de teoria seleciei

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

67

67
71
71
72
73
74
75
76
77
79
79
80
81
84
86
89
94

97

97
102
103
106
107

109

109
111
115
116
124
124
127

129

129
133
135
137
138
139
140
144
145
147
148
150
151
153
155
157
158
166
166

7 Vericarea ipotezelor statistice


7.1
7.2
7.3
7.4
7.5

7.6

7.7

7.8
7.9

Punerea problemei . . . . . . . . . . . . . . . . . . . . . . .
Tipuri de teste statistice . . . . . . . . . . . . . . . . . . . .
Testul cel mai puternic . . . . . . . . . . . . . . . . . . . . .
Testarea tipului de date experimentale . . . . . . . . . . . .
Teste parametrice . . . . . . . . . . . . . . . . . . . . . . . .
7.5.1 Etapele unei testri parametrice . . . . . . . . . . .
7.5.2 Testul Z pentru medie (o selecie) . . . . . . . . . .
7.5.3 Testul Z pentru diferena mediilor a dou selecii . .
7.5.4 Testul Z n Matlab . . . . . . . . . . . . . . . . . .
7.5.5 Testul t pentru medie (o selecie) . . . . . . . . . . .
7.5.6 Testul t pentru diferena mediilor a dou selecii . .
7.5.7 Testul t n Matlab . . . . . . . . . . . . . . . . . .
7.5.8 Testul 2 pentru dispersie . . . . . . . . . . . . . . .
7.5.9 Testul 2 pentru dispersie n Matlab . . . . . . . .
7.5.10 Testul F pentru raportului dispersiilor . . . . . . . .
7.5.11 Testul F n Matlab . . . . . . . . . . . . . . . . . .
7.5.12 Teste pentru proporii ntr-o populaie binomial . .
7.5.13 Testul raportului verosimilitilor . . . . . . . . . . .
Teste de concordan . . . . . . . . . . . . . . . . . . . . . .
7.6.1 Testul 2 de concordan . . . . . . . . . . . . . . .
7.6.2 Testul de concordan Kolmogorov-Smirnov . . . . .
7.6.3 Test de independen folosind tabele de contingen
7.6.4 Teste de concordan n Matlab . . . . . . . . . . .
Teste neparametrice . . . . . . . . . . . . . . . . . . . . . .
7.7.1 Testul semnelor . . . . . . . . . . . . . . . . . . . . .
7.7.2 Testul semnelor n Matlab . . . . . . . . . . . . . .
7.7.3 Testul seriilor (runs test) pentru caracterul aleator .
7.7.4 Testul serilor (runs test) n Matlab . . . . . . . . .
Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exerciii propuse . . . . . . . . . . . . . . . . . . . . . . . .

8 Corelaie i regresie

8.1 Introducere . . . . . . . . . . . . . . . . . . . . . .
8.2 Corelaie . . . . . . . . . . . . . . . . . . . . . . . .
8.2.1 Corelaie i coecient de corelaie . . . . . .
8.2.2 Test statistic pentru coecientul de corelaie
8.2.3 Coecientul de corelaie Spearman . . . . .
8.2.4 Autocorelaie . . . . . . . . . . . . . . . . .
8.3 Regresie . . . . . . . . . . . . . . . . . . . . . . . .
8.3.1 Punerea problemei . . . . . . . . . . . . . .
8.3.2 Regresie liniar simpl . . . . . . . . . . . .
8.3.3 Caracteristici ale parametrilor de regresie .
8.3.4 Test statistic pentru 1 . . . . . . . . . . .
8.3.5 Test statistic pentru 0 . . . . . . . . . . .
8.3.6 Predicie prin regresie . . . . . . . . . . . .
8.3.7 Regresie liniar multipl . . . . . . . . . . .
8.3.8 Regresie neliniar . . . . . . . . . . . . . . .
8.4 Corelaie i regresie n Matlab . . . . . . . . . . .
8.5 Exerciii rezolvate . . . . . . . . . . . . . . . . . . .
8.6 Concluzii . . . . . . . . . . . . . . . . . . . . . . .
8.7 Exerciii propuse . . . . . . . . . . . . . . . . . . .
Index . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliograe . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

171

171
174
175
176
179
179
180
183
184
186
188
190
194
195
196
197
199
201
202
202
209
213
218
220
220
221
223
224
225
226

231

231
232
232
234
236
237
238
238
240
244
247
247
248
250
253
254
256
265
266
269
271

List de guri

1.1
1.2
1.3
1.4
1.5
1.6

Reprezentarea cu puncte. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Reprezentarea datelor discrete. . . . . . . . . . . . . . . . . . . . . . . . . .
Reprezentrile cu bare. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Reprezentare 3D prin bare. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Histogram 3D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Reprezentarea pe disc a frecvenelor relative ale notelor din tabelul cu note

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

21
22
23
24
26
28

2.1 Cuantila de ordin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43


2.2 Clopotul lui Gauss pentru X N (0, ), ( = 1, 2, 3) . . . . . . . . . . . . . . . 51
2.3 Repartiia 2 (n) pentru patru valori ale lui n. . . . . . . . . . . . . . . . . . . . . . 53
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10
3.11
3.12

Reprezentarea cu histograme a datelor uniforme. . . . . . . . . . . . . . . . . .


Reprezentarea cu histograme a datelor normale. . . . . . . . . . . . . . . . . . .
Interfa pentru generarea de numere aleatoare de o repartiie dat. . . . . . .
Generare de numere aleatoare prin metoda funciei inverse. . . . . . . . . . . .
Simularea aruncrii unei monede corecte (a) i a unui zar corect (b) . . . . . . .
Simularea jocului de darts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Problema acului lui Buon (N = 100). . . . . . . . . . . . . . . . . . . . . . . .
B(n, p) i P(np) pentru n = 100, p = 0.15 . . . . . . . . . . . . . . . . . . . . .
Vericare grac a teoremei limit central (varianta cu funciile de repartiie)
Reprezentarea funciilor de probabilitate i de repartiie pentru B(10, 0.5) . . .
Suma cumulat - micare aleatoare (brownian) 1D. . . . . . . . . . . . . . . .
Micare aleatoare n dou dimensiuni. . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

72
73
74
75
80
82
85
87
89
90
92
93

4.1 Funcia de repartiie empiric i funcia de repartiie teoretic pentru distribuia


normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.2 Reprezentare pentru numrul de accidente. . . . . . . . . . . . . . . . . . . . . . . 105
6.1 Intervalul de ncredere pentru Exerciiu 6.25. . . . . . . . . . . . . . . . . . . . . . 143
6.2 50 de realizri ale intervalului de ncredere pentru . . . . . . . . . . . . . . . . . 157
7.1
7.2
7.3
7.4
7.5
7.6
7.7

Regiune critic pentru test (a) unilateral stnga, (b) unilateral dreapta.
Regiune critic pentru test bilateral. . . . . . . . . . . . . . . . . . . . .
Reprezentarea normal a datelor. . . . . . . . . . . . . . . . . . . . . . .
Reprezentarea exponenial a datelor. . . . . . . . . . . . . . . . . . . .
Compararea prin histograme. . . . . . . . . . . . . . . . . . . . . . . . .

Fn (x) i F (x) din tabelul 7.15. . . . . . . . . . . . . . . . . . . . . . . .


Funiile empirice de repartiie n testul K-S cu dou selecii. . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

175
175
177
178
179
212
220

8.1 Scatter plot pentru IQ n familie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232


8.2 Coecient de corelaie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
7

8.3
8.4
8.5
8.6
8.7
8.8
8.9
8.10
8.11
8.12

Scatter plot pentru ranguri. . . . . . . . . . . . . . . . . . . . . . . . . .


Black box. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aproximarea unui nor de date prin dreapta de regresie. . . . . . . . . . .
Estimarea dreptei de regresie. . . . . . . . . . . . . . . . . . . . . . . . .
Predicie prin extrapolare. . . . . . . . . . . . . . . . . . . . . . . . . . .
Aproximarea datelor din Exerciiul 8.16 . . . . . . . . . . . . . . . . . .
Notele i dreapta de regresie. . . . . . . . . . . . . . . . . . . . . . . . .
Diagrama de temperaturi n funcie de altitudine, i dreapta de regresie.
Regresie tip Higuchi . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fragment incomplet dintr-un text . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

237
239
241
243
249
256
258
260
263
268

List de tabele

1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10

Tabel cu frecvene pentru date discrete. . . . . . . . . .


Date statistice negrupate . . . . . . . . . . . . . . . . . .
Tabel cu frecvene pentru date continue. . . . . . . . . .
Tabel cu frecvene pentru rata somajului. . . . . . . . .
Tabel stem-and-leaf reprezentnd punctajele studenilor.
Tabel cu nlimile plantelor. . . . . . . . . . . . . . . .
Histograme pentru datele din Tabelul 1.6. . . . . . . . .
Tabel cu nlimile plantelor. . . . . . . . . . . . . . . .
Histograme pentru datele din Tabelul 1.8. . . . . . . . .
Tabel cu frontierele claselor. . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

19
20
20
21
23
25
25
27
27
27

3.1 Repartiii uzuale n Matlab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86


3.2 Funcii Matlab utile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.1 Funcii Matlab specice pentru msuri descriptive. . . . . . . . . . . . . . . . . . 103
4.2 Tabel de frecvene pentru Exerciiu 4.6 . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.3 Medii generale i frecvene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.1 Estimatori punctuali uzuali pentru parametri. . . . . . . . . . . . . . . . . . . . . . 158
6.2 Tabel cu intervale de ncredere. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
7.10
7.11
7.12
7.13
7.14
7.15
7.16
7.17
7.18
7.19
7.20

Posibiliti decizionale. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Decizii posibile. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Erori decizionale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Teste pentru valoarea medie a unei colectiviti. . . . . . . . . . . . . .
Teste pentru egalitatea a dou medii. . . . . . . . . . . . . . . . . . . .
Tabel cu note. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Teste pentru dispersie. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Teste pentru raportul dispersiilor. . . . . . . . . . . . . . . . . . . . . .
Tabel cu teste parametrice. . . . . . . . . . . . . . . . . . . . . . . . .
Tabel cu numrul de puncte obinute la aruncarea zarului. . . . . . . .
Tabel cu numrul de goluri pe meci la FIFA WC 2006. . . . . . . . . .
Tablou de distribuie pentru P(2.25). . . . . . . . . . . . . . . . . . . .
Timpi de ateptare n staia de tramvai. . . . . . . . . . . . . . . . . .
Tabel de distribuie pentru timpii de ateptare. . . . . . . . . . . . . .
Tabel de valori pentru testul Kolmogorov-Smirnov. . . . . . . . . . . .
Tabel cu repartizarea elevilor la cursurile de limbi strine. . . . . . . .
Tabel de contingen. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabel cu repartizarea i estimaia elevilor la cursurile de limbi strine.
Tabel de contingen 2 2. . . . . . . . . . . . . . . . . . . . . . . . .
Tabel de contingen pentru testarea unui medicament. . . . . . . . .
9

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

174
174
174
188
190
193
195
197
198
203
206
206
208
209
211
213
213
215
216
217

7.21
7.22
7.23
7.24
7.25

Tabel cu preferine pentru blatul de pizza. . . . . . . .


Distribuia copiilor ntr-o familie cu 4 copii. . . . . . .
Numrul de ou sparte n ecare cutie i frecvena . .
Timpul de funcionare i frecvena . . . . . . . . . . .
Frecvena nlimii brbailor dintr-o anumit regiune.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

221
226
227
227
228

8.1
8.2
8.3
8.4
8.5
8.6
8.7
8.8
8.9
8.10
8.11
8.12

Preferinele degusttorilor de vin. . . . . . . . . . . . . . . . . . .


Tabel cu rangurile preferinelor. . . . . . . . . . . . . . . . . . . .
Evenimente rutiere n primele 6 luni. . . . . . . . . . . . . . . . .
Tabel cu rangurile pentru accidente. . . . . . . . . . . . . . . . .
Notele la Statistic i Probabiliti. . . . . . . . . . . . . . . . . .
Tabel cu temperaturi (Ti ) la diverse altitudini (hi ). . . . . . . . .
Salariul n funcie de studii i vechime . . . . . . . . . . . . . . .
Tabel cu rata maxim a batilor inimii n funcie de vrst. . . .
Tabel cu absene i note la Statistic. . . . . . . . . . . . . . . . .
nalimea i masa corporal a 10 eleve dintr-o clas. . . . . . . .
Viteza unei maini n primele 10 secunde dup plecarea de pe loc
Calicativele din anul I de studiu . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

236
236
237
237
257
258
260
266
266
266
267
268

Notaii
E(X)
D2 (X)

x=
d2 = d2 (X) =

1
n

d2 (x) =

Xi

1
n

medi de seleie

xi

medi empiri

i=1
n

i=1

[Xi X]2

dispersi de seleie @nemodi(tA

i=1
n

1
n

1
n1

d2 = d2 (X) =

dispersi teoreti vriilei letore X

1
n

X=

medi teoreti vriilei letore X

[xi x]2

dispersie empiri @nemodi(tA

i=1
n

[Xi X]2

dispersi de seleie modi(t

i=1
n

1
n1

[xi x]2

dispersie empiri modi(t

FX (x)

funi de reprtiie vFF X

Fn (x)

s2 = d2 (x) =

funi de reprtiie empiri

i=1

In ()
x

1
(x) =
e
dy
2
0 , 1 , . . . , m
2
y
2

0 , 1
y = 0 + 1 x
y = 0 + 1
2 =

1
n2

funi lui vple


prmetri de regresie
estimri le prmetrilor de regresie
drept de regresie
estimre dreptei de regresie

(yi 0 1 xi )2

estimre dispersiei erorilor

i=1

s2 =
x

1
n1

(xi x)2

1
n1

dispersi empiri vFF X

i=1

ov(X, Y ) = E(X Y ) E(X) E(Y )

sxy =

informi pisher

oreli teoreti vFF X i Y

(xi x)(yi y)

oreli empiri dintre vFF X i Y

i=1

i = yi yi
X, Y i r

reziduuri
oe(ieni de orelie teoreti iD respFD empiri

SSE =

2
i

sum ptrtelor erorilor

i=1

MSE =

SSE
n2
z
t; n

erore medie ptrti


until de ordin pentru reprtii N (0, 1))
until de ordin pentru reprtii t(n)

2 n
;
f; m, n

until de ordin pentru reprtii 2 (n)


until de ordin pentru reprtii F(m, n)
estimtor pentru prmetrul

UMVUE

estimtor nedeplst uniform de dispersie minim

x>0

funi lui uolmogorov

K(x) =

(1)k e2 k

x2

k=

i
(H0 ) su (H1 )
R

X N (, )

pete pentru intervl de nredere


ipotez nulD respFD lterntiv
oe(ientul de determinre

X urmez reprtii norml de prmetri i

en.

termenul n englez

gr .

termenul n gre

Prefa
Aceast lucrare conine materiale pentru cursul de Statistic aplicat, pe care l-am predat n
ultimii 4 ani la Facultatea de Matematic din Iai, seciile de Master. Cartea este adresat, n
primul rnd, studenilor la Matematic sau Matematici Aplicate, care au o baz riguroas de
Teoria Probabilitilor.
Lucrarea conine att noiuni teoretice din aria teoriei Probabilitilor i Statisticii Matematice, ct i diverse exerciii aplicative i implementri numerice n Matlab ale acestora. Noiunile
teoretice prezentate aici sunt prezentate n forma n care o putem utiliza uor n aplicaii practice;
multe dintre rezultatele teoretice neind nsoite de demonstraii detaliate. Pentru implementrile
numerice am utilizat aplicaia Matlab, n versiunea Matlab 7.1. Totui, multe coduri numerice
din aceast lucrare pot  rulate cu succes i n alte versiuni mai vechi ale aplicaiei.
Primul capitol al lucrrii este unul introductiv n Statistic. ncepe cu un scurt istoric al Statisticii, apoi prezentm cteva dintre ntrebrile la care se dorete a gsi rspunsuri folosind aceast
ramur a Matematicii. Capitolul continu cu prezentarea tipurilor de date statistice, metode de
organizare i reprezentare a datelor, exemple i exerciii propuse.
Capitolul al doilea este o scurt trecere n revist a unor elemente de Teoria Probabiliti, ce
stau la baza studiilor statistice. Prezentm succint noiuni fundamentale din aceast teorie, cum
ar : experimente aleatoare, cmpuri de probabilitate (clasic sau geometric), variabile aleatoare,
caracteristicile numerice i funionale ale acestora, independena evenimentelor, cmpurilor i a
variabilelor aleatoare, o trecere n revist a repartiiilor uzuale, tipuri de convergen a variabilelor
aleatoare i teoreme limit. Teorema limit central este discutat aici mai n detaliu, ind o unealt fundamental n Statistic, prezentnd cteva exemple aplicative ale acesteia. Capitolul se
ncheie cu o list de probleme propuse spre rezolvare.
Capitolul al treilea se preocup de implementarea pe computer a noiunilor de Probabiliti i
Statistic. ncepe cu o scurt introducere n aplicaia Matlab, continund cu diverse metode de
simulare ale experimentelor aleatoare i de rezolvare ale problemelor de Probabiliti i Statistic
folosind un PC. Tot aici, am prezentat validri numerice i grace ale teoremei limit central,
noiunea fr de care analiza statistic a colectivitilor de volum foarte mare ar  aproape imposibil de realizat.
Cteva noiuni de baz din Statistica descriptiv sunt prezentate n Capitolul 4, alturi de
modaliti de implementare ale acestora n Matlab.
Capitolul 5 conine fundamentarea matematic abstract a noiunilor de colectivitate statistic, selecie repetat, variabile aleatoare de selecie repetat i noiunea de statistic, prezentnd
exemple uzuale de statistici (media de selecie, dispersia de selecie, moment de selecie, funcia
de repartiie de selecie. De asemenea, am prezentat cteva rezultate mai importante referitoare
la selecia dintr-o colectivitate normal i modaliti de selecie repetat folosind Matlab.
Capitolul 6 prezint noiuni teoretice de estimaie, ct i soluii numerice de estimare a
parametrilor. Metodele discutate aici sunt: metoda momentelor, metoda verosimilitii maxime,
metoda celor mai mici ptrate, metoda minimului lui 2 i metoda intervalelor de ncredere. Capitolul se ncheie cu un set de probleme aplicative rezolvate i un set de probleme propuse.
Capitolul 7 trateaz problema testrii ipotezelor statistice pentru valorile parametrilor ce caracterizeaz populaia sau chiar a formei funciei de repartiie pentru caracteristica de interes.
Am prezentat aici cele mai des utilizate test statistice: testul Z , testul t, testul pentru varian,
testul pentru diferena mediilor a dou populaii statistice, testul pentru raportul dispersiilor,
testul Fisher, teste pentru proporii, testul Smirnov-Kolmogorov, testul 2 , teste de independen
folosind tabele de contingen, testul seriilor i testul semnelor. Aceste teste sunt prezentate mai
nti n form teoretic, apoi discutm implementrile acestora n Matlab. Pentru ecare test
statistic am ataat cel puin un exemplu, care este analizat att teoretic, ct i din punct de vedere
numeric.
Ultimul capitol al lucrrii este dedicat problemelor legate de corelaie i regresie ntre variabilele
aleatoare. Introducem aici msuri i tehnici de determinare a legturii ntre variabile aleatoare,
e.g., coecieni empirici de corelaie i noiunea de regresie.
Iulian Stoleriu

14

List de tabele

Capitolul

Introducere n Statistic
1.1 Scurt istoric
Statistica este o ramur a tiinelor ce se preocup de procesul de colectare de date i informaii,
de organizarea i interpretarea lor, n vederea explicrii unor fenomene reale. n general, prin
date (sau date statistice) nelegem o mulime de numere ce au o anumit nsemntate. Aceste
numere pot  legate ntre ele sau nu. Suntem interesai de studiul acestor date, cu scopul de a
nelege anumite relaii ntre diverse trsturi ce msoar datele culese. De regul, oamenii au
anumite intuiii despre realitatea ce ne nconjoar, pe care le doresc a  conrmate ntr-un mod
ct mai exact. De exemplu, dac ntr-o anumit zon a rii rata somajului este ridicat, este
de ateptat ca n acea zon calitatea vieii persoanelor de acolo s nu e la standarde ridicate.
Totui, ne-am dori s m ct mai precii n evaluarea legturii dintre rata somajului i calitatea
vieii, de aceea ne-am dori s construim un model matematic ce s ne conrme intuiia. Un
alt gen de problem: ardem de nerbdare s am cine va  noul preedinte, imediat ce seciile
de votare au nchis porile (exit-pole). Chestionarea tuturor persoanelor ce au votat, colectarea
i unicarea tuturor datelor ntr-un timp record nu este o msur deloc practic. n ambele
probleme menionate, observaiile i culegerea de date au devenit prima treapt spre nelegerea
fenomenului studiat. De cele mai multe ori, realitatea nu poate  complet descris de un astfel
de model, dar scopul este de a oferi o aproximare ct mai del i cu costuri limitate. n ambele
situaii menionate apar erori n aproximare, erori care in de ntmplare. De aceea, ne-am dori
s putem descrie aceste fenomene cu ajutorul variabilelor aleatoare. Plecnd de la coleciile de
date obinute dintr-o colectivitate, Statistica introduce metode de predicie i prognoz pentru
descrierea i analiza proprietilor ntregii colectiviti. Aria de aplicabilitate a Statisticii este
foarte mare: tiine exacte sau sociale, umanistic sau afaceri etc. O disciplin strns legat de
Statistic este Econometria. Aceasta ramur a Economiei se preocup de aplicaii ale teoriilor
economice, ale Matematicii i Statisticii n estimarea i testarea unor parametri economici, sau n
prezicerea unor fenomene economice.
Statistica a aprut n secolul al XVIII - lea, din nevoile guvernelor de a colecta date despre
populaiile pe care le reprezentau sau de a studia mersul economiei locale, n vederea unei mai
bune administrri. Datorit originii sale, Statistica este considerat de unii ca ind o tiin de sine
stttoare, ce utilizeaz aparatul matematic, i nu este privit ca o subramur a Matematicii. Dar
nu numai originile sale au fost motivele pentru care Statistica tinde s devin o tiin separat
de Probabiliti. Datorit revoluiei computerelor, Statistica a evoluat foarte mult n direcia
computaional, pe cnd Teoria Probabilitilor foarte puin. Aa cum David Williams scria n
[17], "Teoria Probabilitilor i Statistica au fost odat cstorite; apoi s-au separat; n cele din
urm au divorat. Acum abia c se mai ntlnesc".
Din punct de vedere etimologic, cuvntului statistic i are originile n expresia latin statisticum
collegium (nsemnnd consiliul statului) i cuvntul italian statista, nsemnnd om de stat sau
politician. n 1749, germanul Gottfried Achenwall a introdus termenul de Statistik, desemnat
15

16

Capitolul 1. Introducere n Statistic

pentru a analiza datele referitoare la stat. Mai trziu, n secolul al XIX-lea, Sir John Sinclair a
extrapolat termenul la colecii i clasicri de date.
Metodele statistice sunt astzi aplicate ntr-o gam larg de discipline. Amintim aici doar cteva
exemple:
n Agricultur, de exemplu, pentru a studia care culturi sunt mai potrivite pentru a  folosite

pe un anumit teren arabil;

n Economie, pentru studiul rentabilitii unor noi produse introduse pe pia, pentru core-

larea cererii cu ofert, sau pentru a analiza cum se schimb standardele de via;

n Biologie, pentru clasicarea din punct de vedere tiinic a unor specii de plante sau

pentru selectarea unor noi specii;

n tiinele educaiei, pentru a gsi cel mai ecient mod de lucru pentru elevi sau pentru a

studia impactul unor teste naionale asupra diverselor caregorii de persoane ce lucreaz n
nvmnt;

n Meteorologie, pentru a prognoza vremea ntr-un anumit inut pentru o perioad de timp,

sau pentru a studia efectele nclzirii globale;

n Medicin, pentru testarea unor noi medicamente sau vaccinuri;


n Psihologie, n vederea stabilirii gradului de corelaie ntre timiditate i singurtate;
n Politologie, pentru a verica dac un anumit partid politic mai are sprijinul populaiei;
n tiinele sociale, pentru a studia impactul crizei economice asupra unor anumite clase

sociale;

etc.

Pentru a analiza diverse probleme folosind metode statistice, este nevoie de a identica mai nti
care este colectivitatea asupra creia se dorete studiul. Aceast colectivitate (sau populaie)
poate  populaia unei ri, sau numai elevii dintr-o coal, sau totalitatea produselor agricole
cultivate ntr-un anumit inut, sau toate bunurile produse ntr-o uzin. Dac se dorete studiul
unei trsturi comune a tuturor membrilor colectivitii, este de multe ori aproape imposibil de
a observa aceast trstur la ecare membru n parte, de aceea este mult mai practic de a
strnge date doar despre o submulime a ntregii populaii i de a cuta metode eciente de a
extrapola aceste observaii la toat colectivitatea. Exist o ramur a statisticii ce se ocup cu
descrierea acestei colecii de date, numit Statistic descriptiv. Aceast descriere a trsturilor
unei colectiviti poate  fcut att numeric (media, dispersia, mediana, cuantile, tendine etc),
ct i grac (prin puncte, bare, histograme etc). De asemenea, datele culese pot  procesate ntrun anumit fel, nct s putem trage concluzii foarte precise despre anumite trsturi ale ntregii
colectiviti. Aceast ramur a Statisticii, care trage concluzii despre caracteristici ale ntregii
colectiviti, studiind doar o parte din ea, se numete Statistic inferenial. n contul Statisticii
infereniale putem trece i urmtoarele: luarea de decizii asupra unor ipoteze statistice, descrierea
gradului de corelare ntre diverse tipuri de date, estimarea caracteristicilor numerice ale unor
trsturi comune ntregii colectiviti, descrierea legturii ntre diverse caracteristici etc.
Statistica Matematic este o subramur a Matematicii ce se preocup de baza teoretic abstract
a Statisticii. Din datele culese pe cale experimental, Statistica Matematic va cuta s extrag
informaii i s le interpreteze. Un cercettor ntr-un domeniul teoretic al Statisticii, cum este i
Statistica Matematic, va cuta s mbunteasc metodele teoretice existente sau s introduc
altele noi. Aceasta va utiliza noiuni din Teoria probabilitilor, dar i noiuni din alte ramuri ale
Matematicii, cum ar : Algebra liniar, Analiza matematic, Teoria optimizrii. De asemenea,
partea computaional este deosebit de util n studiul Statisticii moderne, fr de care cercetarea
ar  ngreunat sau, uneori, chiar imposibil de realizat. n aceast lucrare vom utiliza pachetele
de programe Matlab pentru efectuarea calculelor, n versiunea Matlab 7.1. Acest software este
introdus i dezvoltat de compania The MathWorks (vezi [9]).

1.2. Modelare Statistic

17

1.2 Modelare Statistic


De obicei, punctul de plecare este o problem din viaa real, e.g., care partid are o susinere
mai bun din partea populaiei unei ri, dac un anumit medicament este relevant pentru boal
pentru care a fost creat, dac este vreo corelaie ntre numrul de ore de lumina pe zi i depresie.
Apoi, trebuie s decidem de ce tipuri date avem nevoie s colectm, pentru a putea da un rspuns
la ntrebarea ridicat i cum le putem colecta. Modurile de colectare a datele pot  diverse: putem
face un sondaj de opinie, sau prin experiment, sau prin simpla observare a caracteristicilor. Este
nevoie de o metod bine stabilit de colectare a datelor i s construim un model statistic potrivit
pentru analiza acestora. n general, date culese de noi pot  potrivite ntr-un model statistic prin
care
Data observat = f (x, ) + eroare de aproximare,
(1.1)
unde f este o funcie ce veric anumite proprieti i este caracteristic modelului, x este vectorul
ce conine variabilele msurate i e un parametru (sau un vector de parametri), care poate 
determinat sau nedeterminat. Termenul de eroare apare deseori n pratic, deoarece unele date
culese au caracter stochastic (nu sunt deterministe). Modelul astfel creat este testat, i eventual
revizuit, astfel nct s se potriveasc ntr-o msur ct mai precis datelor culese.
Denim o populaie (colectivitate) statistic ca ind o mulime de elemente ce posed o trasatur
comun. Aceasta poate  nit sau innit, real sau imaginar. Elementele ce constituie o colectivitate statistic se vor numi uniti statistice sau indivizi. Volumul unei colectiviti statistice
este dat de numrul indivizilor ce o constituie. Caracteristica (variabila) unei populaii statistice
este o anumit proprietate urmrit la indivizii ei n procesul prelucrrii statistice. Caracteristicile pot : cantitative (msurabile sau variabile) (e.g., 2, 3, 5, 7, 11, . . . ) i calitative (nemsurabile
sau atribute) (e.g., rou, verde, albastru etc). La rndul lor, variabilele cantitative pot  discrete
(numrul de sosiri ale unui tramvai n staie) sau continue (timpul de ateptare ntre dou sosiri
ale tramvaiului n staie). Caracteristicile pot depinde de unul sau mai multi parametri, parametrii
ind astfel caracteristici numerice ale colectivitii.
Suntem interesai n a msura una sau mai multe variabile relative la o populaie, ns aceasta s-ar
putea dovedi o munc extrem de costisitoare, att din punctul de vedere al timpului necesar, ct
i din punctul de vedere al depozitrii datelor culese, n cazul n care volumul colectivitii este
mare sau foarte mare (e.g., colectivitatea este populaia cu drept de vot a unei ri i caracteristica urmrit este candidatul votat la alegerile prezideniale). De aceea, este foarte ntemeiat
alegerea unei selecii de date din ntreaga populaie i s urmrim ca pe baza datelor selectate s
putem trage o concluzie n ceea ce privete variabila colectivitii.
O selecie (sau eantion) este o colectivitate parial de elemente extrase (la ntmplare sau nu) din
colectivitatea general, n scopul cercetrii lor din punctul de vedere al unei caracteristici. Dac
extragerea se face la ntmplare, atunci spunem c am facut o selecie ntmpltoare. Numrul
indivizilor din selecia aleas se va numi volumul seleciei. Dac se face o enumerare sau o listare
a ecrui element component al unei a populaii statistice, atunci spunem c am facut un recensmnt. Selecia ar trebui s e reprezentativ pentru populaia din care face parte. Numit
o selecie repetat (sau cu repetiie) o selecie n urma creia individul ales a fost reintrodus din
nou n colectivitate. Altfel, avem o selecie nerepetat. Selecia nerepetat nu prezint interes
dac volumul colectivitii este nit, deoarece n acest caz probabilitatea ca un alt individ s e
ales ntr-o extragere nu este aceeai pentru toi indivizii colectivitii. Pe de alt parte, dac
volumul ntregii populaii statistice este mult mai mare dect cel al eantionului extras, atunci
putem presupune c selecia efectuat este repetat, chiar dac n mod practic ea este nerepetat.
Spre exemplu, dac dorim s facem o prognoz a cine va  noul preedinte la alegerile din toamn,
eantionul ales (de altfel, unul foarte mic comparativ cu volumul populaiei cu drept de vot) se
face, n general, fr repetiie, dar l putem considera a  o selecie repetat, n vederea aplicrii
testelor statistice.
Seleciile aleatoare se pot realiza prin diverse metode, n funcie de urmtorii factori: disponibilitatea informaiilor necesare, costul operaiunii, nivelul de precizie al informaiilor etc. Mai jos
prezentm cteva metode de selecie.
selecie simpl de un volum dat, prin care toi indivizii ce compun populaia au aceeai

ans de a  alei. Aceast metod mininimizeaz riscul de a  prtinitor sau favorabil

18

Capitolul 1. Introducere n Statistic

unuia dintre indivizi. Totui, aceast metod are neajunsul c, n anumite cazuri, nu reect
componena ntregii populaii. Se aplic doar pentru colectiviti omogene din punctul de
vedere al trsturii studiate.
selecie sistematic, ce presupune aranjarea populaiei studiate dup o anumit schem
ordonat i selectnd apoi elementele la intervale regulate. (e.g., alegerea a ecrui al 10-lea

numr dintr-o carte de telefon, primul numr ind ales la ntmplare (simplu) dintre primele
10 din list).

selecie straticat, n care populaia este separat n categorii, iar alegerea se face la ntm-

plare din ecare categorie. Acest tip de selecie face ca ecare grup ce compune populaia s
poata  reprezentat n selecie. Alegerea poate  facut i n funcie de mrimea ecrui grup
ce compune colectivitatea total (e.g., aleg din ecare jude un anumit numr de persoane,
proporional cu numrul de persoane din ecare jude).

selecie cot, (care este un caz particular de selecie straticat) care se construiete prin

selectarea unui numr de elemente din ecare strat dup o anumit cot sau proporional
cu mrimea subgrupului din care face parte.

selecie ciorchine, care este un eantion straticat construit prin selectarea de selecii din

anumite straturi (nu din toate).

selecia de tip experien, care ine cont de elementul temporal n selecie. (e.g., diveri

timpi de pe o encefalogram).

Dintre seleciile nerepetate amintim:


selecie de convenien: de exemplu, alegem dintre persoanele care trec prin faa univer-

sitii.

selecie de judecat: cine face selecia decide cine ramne sau nu n selecie.
selecie de cot: selecia ar trebui s e o copie a ntregii populaii, dar la o scar mult mai

mic. Aadar, putem selecta proporional cu numrul persoanelor din ecare ras, de ecare
gen, origine etnic etc) (e.g., persoanele din Parlament ar trebui s e o copie reprezentativ
a persoanelor ntregii ri, ntr-o scar mult mai mic).

1.3 Organizarea i descrierea datelor


Presupunem c avem o colectivitate statistic, creia i se urmrete o anumit caracteristic.
(e.g., colectivitatea este mulimea tuturor studenilor dintr-o universitate nrolai ntr-un anumit
an de studii, iar caracteristica este numrul de credite obinute de studeni n decursul acelui an).
Vom numi date informaiile obinute n urma observaiei valorilor acestei caracteristici. Datele
pot  calitative sau cantitative, dup cum caracteristica (sau variabila) observat este calitativ
sau, respectiv, cantitativ. Aceste date poi  date discrete, dac sunt obinute n urma observrii
unei caracteristici discrete (o variabila aleatoare discret), sau date continue, dac aceast caracteristic este continu (o variabil aleatoare de tip continuu). n cazul din exemplu, datele vor 
cantitative i discrete.
Primul pas n analiza datelor proaspt culese este de a le ordona i reprezenta grac, dar i de a
calcula anumite caracteristici numerice pentru acestea. Datele nainte de prelucrare, adic exact
aa cum au fost culese, se numesc date negrupate. De exemplu, numrul de apeluri la 112 n luna
Iulie, specicat zilnic, este:
871 822 729 794 523 972 768 758 583 893 598 743 761 858 948
598 912 893 697 867 877 649 738 744 798 812 793 688 589 615 731

1.3. Organizarea i descrierea datelor


not
P
Q
R
S
T
U
V
W
IH
otl

freven
P
R
V
IS
IV
IU
IS
U
R
WH

19

freven reltiv
PFPP7
RFRR7
VFVW7
ITFTU7
PHFHH7
IVFVW7
ITFTU7
UFUV7
RFRR7
IHH7

Tabela 1.1: Tabel cu frecvene pentru date discrete.


De cele mai multe ori, enumerarea tuturor datelor culese este dicil de realizat, de aceea se urmrete a se grupa datele, pentru o mai uoar gestionare. Imaginai-v c enumerm toate
voturile unei selecii ntmpltoare de 15000 de votani, abia ieii de la vot. Mai degrab, este
util s grupm datele dup numele candidailor, preciznd numrul de voturi ce l-a primit ecare.
Gruparea datelor

Datele prezentate sub form de distribuie (tabel) de frecvene se numesc date grupate. Datele
de selecie obinute pot  date discrete sau date continue, dup cum caracteristicile studiate sunt
variabile aleatoare discrete sau, respectiv, continue.
(1) Dac datele de selecie sunt discrete (e.g., {x1 , x2 , . . . , xn }) i au valorile distincte
x1 , x2 , . . . , xr , r n, atunci ele pot  grupate ntr-un aa-numit tabel de frecvene (vezi exemplul
din Figura 1.1) sau ntr-un tablou de frecvene, dup cum urmeaz:
data :

x1

x2

...

xr

f1

f2

...

fr

unde fi este frecvena apariiei valorii xi , (i = 1, 2, . . . , r), i se va numi distribuia empiric de


selecie a lui X . Aceste frecvene pot  absolute sau de relative. Un tabel de frecvene (sau o
distribuie de frecvene) conine toate categoriile ce sunt observate din datele colectate i numrul
de elemente ce aparine ecrei categorii n parte, adic frecvena absolut. O frecven relativ
se obine prin mprirea frecvenei absolute a unei categorii la suma tuturor frecvenelor din
tabel. Astfel, suma tuturor frecvenelor relative este egal cu 1. Elementele unui tabel sunt, de
regul: valori pentru variabile, frecvene sau frecvene relative.
n Tabelul 1.1, sunt prezentate notele studenilor din anul al III-lea la examenul de Statistic.
Acesta este exemplu de tabel ce reprezent o caracteristic discret.

Observaia 1.1 (o glum povestit de G. Plya,1 despre cum NU ar trebui interpretat frecvena

relativ)
Un individ suferind merge la medic. Medicul l examineaz ndelung i, balansnd dezamgit
capul, i spune pacientului:
"Of... drag domnule pacient, am dou veti: una foarte proast i una bun. Mai nti v aduc
la cunotin vestea proast: suferii de o boal groaznic. Statistic vorbind, din zece pacieni ce
contracteaz aceast boal, doar unul scap."
Pacientul, deja n culmea disperrii, este totui consolat de doctor cu vestea cea bun:
"Dar, i pe pace! Dumneavoastr ai venit la mine, i asta v face tare norocos", continu
optimist doctorul.
"Am avut deja nou pacieni ce au avut aceeai boal i toi au murit, aa c... vei supravieui!"
1

Gyrgy Plya (18871985), matematician ungur

20

Capitolul 1. Introducere n Statistic

(2) Dac X este de tip continuu, atunci se obinuieste s se fac o grupare a datelor de selecie n
clase. De exemplu, ni se dau datele din Tabelul 1.2, reprezentnd timpi (n min.sec) de ateptare
pentru primii 100 de clieni care au ateptat la un ghieu pn au fost servii.
1.02
0.13
2.98
0.94
1.12
3.79
3.12
5.36

2.01
5.32
4.33
3.44
4.75
1.48
0.71
1.32

2.08
3.97
5.08
1.35
2.88
2.65
2.76

3.78
3.36
4.67
3.64
4.30
1.55
1.95

2.03
4.31
0.79
2.92
4.55
3.95
0.10

0.92
3.58
3.14
2.67
5.87
5.88
4.22

4.08
5.64
0.99
2.86
0.70
1.58
5.69

2.35
1.95
0.78
2.41
5.04
5.49
5.41

1.30
0.91
2.34
3.19
5.33
0.48
1.68

4.50
1.26
4.51
5.41
2.40
2.77
2.46

4.06
0.74
3.53
5.14
1.50
3.20
1.40

3.55
3.64
4.55
2.75
0.83
2.51
2.16

2.63
4.77
1.89
1.67
3.74
5.80
4.98

1.76
2.14
3.28
3.89
4.85
4.12
0.88

Tabela 1.2: Date statistice negrupate


Putem grupa datele de tip continuu ntr-un tablou de distribuie de forma:
data :

[a0 , a1 )

[a1 , a2 )

...

[ar1 , ar )

f1

f2

...

fr

sau sub forma unui tabel de distribuie (vezi Tabelul 1.3). Aadar, putem grupa datele de tip
ls
[a0 , a1 )
[a1 , a2 )
F
F
F

freven
f1
f2
F
F
F

vlore medie
x1
x2
F
F
F

[ar1 , ar )

fr

xr

Tabela 1.3: Tabel cu frecvene pentru date continue.


continuu de mai sus n tablou de distribuie:
[0, 1)

[1, 2)

[2, 3)

[3, 4)

[4, 5)

[5, 6)

14

17

21

18

16

14

(1.2)

Uneori, tabelul de distribuie pentru o caracteristic de tip continuu mai poate  scris i sub
forma:
data :

x1

x2

...

xr

f1

f2

...

fr

unde
xi =

ai1 + ai
este elementul de mijloc al clasei [ai1 , ai );
2
r

fi este frecvena apariiei valorilor din [ai1 , ai ), (i = 1, 2, . . . , r),

fi = n.
i=1

Aadar, dac ne este dat o niruire de date ale unei caracteristici discrete sau continue, atunci
le putem grupa imediat n tabele sau tablouri de frecvene. Invers (avem tabelul sau tabloul de
repartiie i vrem s enumerm datele) nu este posibil, dect doar n cazul unei caracteristici de

21

1.4. Reprezentri grace


vrst
[18, 25)
[25, 35)
[35, 45)
[45, 55)
[55, 65)
otl

freven
QR
UT
IPR
VU
TR
QVS

freven reltiv
VFVQ7
IWFUR7
QPFPI7
PPFTH7
ITFTP7
IHH7

freven umult
VFVQ7
PVFSU7
THFUV7
VQFQV7
IHHFHH7
E

vrst medie
PIFS
QH
RH
SH
TH
E

Tabela 1.4: Tabel cu frecvene pentru rata somajului.

tip discret. De exemplu, dac ni se d Tabelul 1.4, ce reprezint rata somajului ntr-o anumit
regiune a rii pe categorii de vrste, nu am putea ti cu exactitate vrsta exact a persoanelor
care au fost selecionate pentru studiu.
Observm c acest tabel are 5 clase: [18, 25), [25, 35), [35, 45), [45, 55), [55, 65). Vom numi
valoare de mijloc pentru o clas, valoarea obinut prin media valorilor extreme ale clasei. n
cazul Tabelului 1.4, valorile de mijloc sunt scrise n coloana cu vrsta medie. Frecvena cumulat
a unei clase este suma frecvenelor tuturor claselor cu valori mai mici.
Vom numi o serie de timp (sau serie dinamic ori cronologic) un tablou de forma
x1

x2

...

xn

t1

data :

t2

...

tn

unde xi sunt variabile de rspuns, iar ti momente de timp (e.g., rspunsurile citite de un electrocardiograf).

1.4 Reprezentri grace


Un tabel de frecvene sau o distribuie de frecvene (absolute sau relative) sunt de cele mai multe
ori baza unor reprezentri grace, pentru o mai bun vizualizare a datelor. Aceste reprezentri
pot  fcute n diferite moduri, dintre care amintim pe cele mai uzuale.

0.6

0.4

0.2

10

Figura 1.1: Reprezentarea cu puncte.

22

Capitolul 1. Introducere n Statistic

1.4.1 Reprezentare prin puncte


Reprezentarea prin puncte (en., dot plot) este folosit pentru selecii de dimensiuni mici. Sunt
reprezentate puncte aezate unul peste celalalt, reprezentnd numrul de apariii ale unei valori
pentru caracteristica dat. Un astfel de grac este reprezentat n Figura 1.1. Aceste reprezentri
sunt utile atunci cnd se dorete scoaterea n eviden a anumitor plcuri de date (en., clusters) sau
chiar lipsa unor date (goluri). Au avantajul de a conserva valoarea numeric a datelor reprezentate.
O funcie Matlab util pentru reprezentarea datelor discrete este funcia stem. Aceast funcie
reprezint datele sub forma unor linii verticale terminate cu un un cercule gol (n mod implicit)
la extremitatea opus axei. Are formatul general:
stem(X, Y, 'fill', 'type')

% deseneaza pe Y vs. X

Opiunea 'fill' poate lipsi; dac ea apare, atunci coloreaz cercurile din grac. Opiunea 'type'
se refer la tipul de linie folosit; poate  linie continu (n mod implicit), punctat (:) sau de tip
linie-punct (.). Spre exemplu, linia de cod
x = -pi:pi/10:pi;

stem(x, sin(x), 'fill', '--')

produce Figura 1.2.

Figura 1.2: Reprezentarea datelor discrete.

1.4.2 Reprezentarea stem-and-leaf


S presupunem c urmtoarele date sunt punctajele (din 100 de puncte) obinute de cei 20 de
elevi ai unei grupe la o testare semestrial:
50 34 55 41 59 61 62 64 68 18 68 73 75 77 44 77 62 77 53 79 81 48 85 96 88 92 39 96

Tabelul 1.5 reprezint aceste date sub forma stem-and-leaf (ramur-frunz). Se observ c acest
tabel arat att cum sunt repartizate datele, ct i forma repartiiei lor (a se privi gracul c
avnd pe OY drept axa absciselor i OX pe cea a ordonatelor). Aadar, 7|5 semnic un punctaj
de 75. Pentru un volum prea mare de date, aceast reprezentare nu este cea mai bun metod de
vizualizare a datelor. n seciunile urmtoare vom prezenta i alte metode utile.

1.4. Reprezentri grace


stem
10
9
8
7
6
5
4
3
2
1
0

23

lef

2
1
3
1
0
1
4

6
5
5
2
3
4
9

6
7
2
5
8

8
779
488
9

Tabela 1.5: Tabel stem-and-leaf reprezentnd punctajele studenilor.

1.4.3 Reprezentarea cu bare


Este util pentru reprezentarea variabilelor discrete cu un numr mic de valori diferite. Barele sunt
dreptunghiuri ce reprezint frecvenele i nu sunt unite ntre ele. Fiecare dreptunghi reprezint
o singur valoare. ntr-o reprezentare cu bare, categoriile sunt plasate, de regul, pe orizontal
iar frecvenele pe vertical. n Figura 1.31 sunt reprezentate datele din tabelul cu note. Se poate
schimba orientarea categoriilor i a claselor; n acest caz barele vor aprea pe orizontal (vezi
Figura 1.32 ). Pentru reprezentri grace vom folosi aplicaia Matlab. n capitolul urmtor vom

Figura 1.3: Reprezentrile cu bare.


prezenta o scurt introducere n Matlab. Pentru mai multe detalii, se poate consulta ghidul
online de utilizare [9].
Comenzile Matlab uzuale pentru reprezentarea cu bare sunt:
bar(X, Y, 'style');
barh(X, Y);
bar(X, w);
bar3(Y, w, 'style')

%
%
%
%
%

deseneaza vectorul Y vs. vectorul X


deseneaza pe orizontala vectorul Y vs. vectorul
deseneaza vectorul X vs. 1:N (N este lungimea lui X)Y
deseneaza vectorul Y prin bare 3D
w este latimea barelor, 'style' este modul reprezentarii

wi susD 'style' pote ( un dintre urmtoreleX 'detached' @re seprteAD 'grouped' @re grupte

24

Capitolul 1. Introducere n Statistic

lturtAD su 'stacked' @re suprpuseAF

Exemplu 1.2 @IA gomnd re produe primul gr( din pigur IFQ esteX
bar([2:10], [2 4 8 15 18 17 15 7 4], 0.5)
eiiD vetorul X este vetorul linie [2 3 4 5 6 7 8 9 10]D sris presurtt prin [2:10]D ir vetorul Y
este [2 4 8 15 18 17 15 7 4]F vime relor este 0.5F
@PA

gomnd

Matlab urmtore relizez l doile gr( din pigur IFQD orespunztor dtelor din

elul IFSX

barh(5:9, [3 5 6 4 2], 0.5)


@QA

n pigur IFRD m reprezentt prin re 3h trei vetoriX X @numerele nturle de l 1 l 7AD Y

@permutre letore elementelor lui X A i Z @numere nturle preD de l 14 l 2AF gei trei vetori
formez olonele mtriei M F gomnd subplot(m,n,p) divizez ferestr gr( n m n zone
dreptunghiulre i se poziionez pe zon de rng pD unde v exeut omnd e urmezF pigur IFR
este genert de odul urmtorX

X = 1:7; Y = randperm(7); Z = 14:-2:2; M = [X'; Y'; Z'];


subplot(1,3,1); bar3(M, 0.75, 'detached')
subplot(1,3,2); bar3(M, 0.75, 'grouped')
subplot(1,3,3); bar3(M, 0.75, 'stacked')

Figura 1.4: Reprezentare 3D prin bare.

1.4. Reprezentri grace

25

nlimea (n cm) frecvena


[0, 5)
[5, 10)
[10, 15)
[15, 20)
[20, 25)
[25, 30)

5
13
23
17
10
2

Tabela 1.6: Tabel cu nlimile plantelor.


Tabela 1.7: Histograme pentru datele din Tabelul 1.6.

1.4.4 Histograme
guvntul 4histogrm4 fost introdus pentru prim or de url erson2 n 1895F eest deriv din
uvintele greeti histos @gr.D ridit n susA i gramma @gr.D desenD nregistrreAF y histogram este o
form pitoril unui tel de freveneD forte util pentru seleii mri de dte de tip ontinuuF e
semn u reprezentre prin reD u urmtorele dou difereneX nu exist spii ntre re @deiD pot
pre re de nlime zero e rt ( spiu lierA i riile relor sunt proporionle u frevenele
orespunztoreF xumrul de dreptunghiuri este egl u numrul de lseD lime dreptunghiului este
intervlul lseiD ir nlime este nt ri (erui dreptunghi reprezint frevenF eri totl
tuturor dreptunghiurilor este egl u numrul totl de oserviiF h rele unei histogrme u tote
eei limeD tuni nlimile lor sunt proporionle u freveneleF nlimile relor unei histogrmei
se mi numes i densiti de frecvenF
n zul n re limile relor nu sunt tote egleD tuni nlimile lor stisfX
nlime = k
gomenzile

freven
,
lime lsei

k = ftor de proporionlitte.

Matlab uzule pentru rere histogrmelor suntX

hist(X, n);
hist(X, Y);
N = histc(X,E);
bar(E,N,'histc')
hist3(Y)

%
%
%
%
%
%
%

unde X este un vector, n este numarul de bare


deseneaza distributia vectorului X, cu numarul de bare egal cu
lungimea vectorului Y, centrate in elementele lui Y
returneaza numarul N de valori ale vectorului X, care se afla
intre elementele vectorului E
reprezinta grafic pe N determinat anterior
realizeaza o histogram 3D, unde Y este vector bidimensional

htele din elul IFT reprezint nlimile unui ention de plnte ulese de un erettor dintrEo numit
regiune riiF eprezentre u histogrme soit estor dte este e din pigur IFUF godul
re produe est gr( esteX
2

Karl Pearson (1857 1936), statistician, avocat i eugenist britanic

Matlab

26

Capitolul 1. Introducere n Statistic

X = [5*rand(5,1); 5*rand(13,1)+5; 5*rand(23,1)+10; 5*rand(17,1)+15; ...


5*rand(10,1)+20; 5*rand(2,1)+25];
% genereaza un vector X ca in Tabelul IFT
C = [2.5 7.5 12.5 17.5 22.5 27.5];
% mijloacele latimilor barelor
hist(X,C);
% deseneaza 6 histograme
axis([-1 31 0 30])
% fixeaza axele
presupunem ltinev r ( grupt dtele din elul IFT ntrEo lt mnierD n re lsele nu
sunt ehidistnte @vezi elul IFVAF n elul IFVD dtele din ultimele dou lse u fost umulte ntrEo
singur lsD de lime mi mre det elellteD deoree ultim ls din elul IFT nu ve su(iente
dteF ristogrm e reprezint dtele din elul IFV este e din pigur IFWF gonform u regul proE
porionlitii riilor u freveneleD se pote oserv primele ptru re u nlimi egle u frevenele
orespunztoreD pe nd nlime ultimei re este jumtte din vlore frevenei orespunztoreD
deoree lime estei este dulul limii elorllteF
n generlD pentru onstrui o histogrmD vom ve n vedere urmtoreleX

dtele vor ( mprite @unde este posiilA n lse de lungime eglF neori este divizri sunt nturleD
lteori v treui s le frimF

numrul de lse esteD n generlD ntre 5 i 20F


nregistri numrul de dte e d n (ere ls @numite frecveneAF
(gur e onine histogrm v ve lsele pe orizontl i frevenele pe vertilF
viniile de od urmtore simulez histogrm reprezentt n pigur IFSX

x = randn(1000, 2);
hist3(x)

% numere repartizate normal

Figura 1.5: Histogram 3D.

27

1.4. Reprezentri grace

Observaia 1.3 @IA h lungime unei lse este in(nit @eFgFD ultim ls din elul IFV este [20, )AD
tuni se oinuiete lime ultimului intervl s (e lut drept dulul limii intervlului preedentF
@PA n multe situiiD petele intervlelor lselor sunt nite proximriD ir n loul estor vom pute
utiliz lte vloriF pre exempluD s onsiderm ls [15, 20)F eest ls reprezint ls elor plnte
e u nlime uprins ntre 15m i 20mF heoree vlorile nlimilor sunt vlori releD vlorile 15 i

20 suntD de fptD proximrile estor vlori l el mi propit ntregF edrD este posiil est
ls s onin ele plnte e u nlimile situte ntre 14.5m @inlusivA i 20.5m @exlusivAF em
pute fe referire l este vlori (ind vlorile rele le lseiD numite frontierele claseiF n zul n
re m determint frontierele lseiD lime unei lse se de(nete (ind diferen ntre frontierele eEi
orespundF n onluzieD n zul lsei [15, 20)D est re frontierele 14.5 E 20.5D lime 6 i densitte
de freven

17
6 F

entru exempli(reD n elul IFIH m prezentt frontierele lselorD limile lor i

densitile de freven pentru dtele din elul IFRF

nlimea (n cm) frecvena


[0, 5)
[5, 10)
[10, 15)
[15, 20)
[20, 30)

5
13
23
17
12

Tabela 1.8: Tabel cu nlimile plantelor.


Tabela 1.9: Histograme pentru datele din Tabelul 1.8.
nlimea (n cm)

frontierele

[18, 25)
[25, 35)
[35, 45)
[45, 55)
[55, 65)

17.5 25.5
24.5 35.5
34.5 45.5
44.5 55.5
54.5 65.5

limea frecvena densitatea de frecven


8
11
11
11
11

34
76
124
87
64

4.25
6.91
11.27
7.91
5.82

Tabela 1.10: Tabel cu frontierele claselor.

1.4.5 Reprezentare prin sectoare de disc (pie chart)


e pote desen distriui unei rteristii folosind setore de dis @digrme irulreAD (ere seE
tor de dis reprezentnd te o freven reltivF eest vrint este util n speil l reprezentre
dtelor littiveF gomnd

Matlab pentru un pie chart pentru un vetor X este pie(X)F

omnd re produe pigur IFT esteX

T = [10 11.11 15.56 25.55 22.22 15.56];


pie(T,{'Nota 5','Nota 6', 'Nota 7', 'Nota 8', 'Nota 9','Nota 10'})

he exempluD

28

Capitolul 1. Introducere n Statistic

10%

Nota 5
Nota 6
Nota 7
Nota 8
Nota 9
Nota 10

16%

11%

22%
16%

26%

Figura 1.6: Reprezentarea pe disc a frecvenelor relative ale notelor din tabelul cu note

1.5 Concluzii
htele sttistie sunt mrimi oinute din msurtoriD experimenteD oservii etF eeste dte sunt
purttore de informiiF htele sttistie pot ( ntittive su littiveD dup um este sunt vlori
oservte le unor vriile ntittive suD respetivD littiveF v rndul lorD dtele ntittive pot (
disrete su de tip ontinuuF goletre de dte pentru ntreg populie este de multe ori ostisitore
@eFgFD de determint grmjul pentru tote pinile produse de o rutrieA su pote ( hir imposiil @eFgFD
determinre ntitii de preipitii zute n omni deElungul unui nAF he eeD pentru pute
nliz numite rteristii le populieiD vom ple de l nliz unor seleii lute din oletivitteF
n ele mi multe zuriD dtele sttistie neprelurte nu sunt de mre folosF y prim nliz dtelor se
pote fe prin grupre lor n tele de frevene su prin reprezentre lor gr( @prin punteD prin reD
histogrme su pe disAF htele sttistie pot ( prelurte u uurin folosind numite softuri sttistieD
de exempluX

MatlabD @ttistil kge for the oil ienesAD essgeD D htplotD

eD we etF

29

1.6. Exerciii propuse

1.6 Exerciii propuse


Exerciiu 1.1 gonstruii digrm stem-and-leaf pentru urmtorele dteD reprezentnd nul nterii
@dor ultimele dou ifreA unei seleii dintre ngjii unei numite (rmeX

56
77
75

82
59
80

88
67
74

73 64
80 65
79 69

79
76
83

80
79
72

72
69
70

69
81
79

66 59
67 74
70

83
76

77
82

81
75

76
68

72
74

58 84
83 68

63
73

85
77

Exerciiu 1.2 pormi un tel de frevene pentru dtele din tloul de distriuie dt de reli @IFPA
i deseni o histogrm pentru este dteF

Exerciiu 1.3 qrupi irul de dte de mi jos n 6 lse de lungimi egleF eprezenti dtele printrEo
histogrmF

11.2
11.1
11.7

10.9
12.4
12.1

9.3
14.6
15.2

10.7
12.3
7.9

14.9
8.9
4.6

11.5 11.9 10.2 4.7


13.1 6.7 12.7 14.3
5.5

9.7
10.8

10.7
11.2

12.6
10.9

10.4
12.6

Exerciiu 1.4 Eu nregistrt timpii de teptre 120 de persone ntrEo numit stie de trmviD
pn l sosire mijloului de trnsportF ezulttele sunt sumrizte n urmtorul tel de distriuiiX
t @n minuteA
freven

<1
2

15
8

5 10
13

10 15
19

15 20
38

20 25
23

25 30
11

30
6

eprezenti dtele din tel printrEo histogrmF

Exerciiu 1.5 eprezenti printrEo histogrm dtele din elul IFRF


Exerciiu 1.6 eu fost ntrete 45 de persone despre ulore lor fvoritF spunsurile sunt urmE
toreleX

verde
rosu
albastru
albastru
indigo
albastru

rosu
violet
verde
violet
verde
rosu

orange
albastru
albastru
orange
rosu
verde

verde
verde
rosu
rosu
verde
orange

violet
galben
rosu
albastru
orange
albastru

albastru
rosu
orange
verde
galben

galben
orange
galben
rosu
albastru

qrupi este dte pe ulori i poi le reprezenti gr( prin reF

Exerciiu 1.7 eprezentie pe dis @pie chartA rspunsurile din exeriiul nteriorF

rosu
albastru
violet
violet
rosu

30

Capitolul 1. Introducere n Statistic

Capitolul

Elemente de Teoria probabilitilor


2.1 Experiene aleatoare
xumim experien aleatoare @su experiment aleatorA orie t u rezultt inertD re pote ( repett n
numite ondiii dteF ypusul noiunii de experiment letor este experimentul deterministD semni(nd
un experiment le rui rezultte sunt omplet determinte de ondiiile n re est se desforF
ezulttul unui experiment letor depinde de numite irumstnte ntmpltore e pot preF ixE
emple de experiene letoreX jourile de noroD runre zruluiD oservre durtei de vi unui
individD oservre vremii de dou ziD oservre numrului de peluri telefonie reepionte de o enE
trl telefoni ntrEun timp dtF eplire experienei supr unei oletiviti dte se numete probF
ezulttul potenil l unei experiene letore se numete eveniment aleatorF he exempluX prii unei
dule (6, 6) l runre dou zruriD extrgere unei ile le dintrEo urnF e numete caz favorabil
pentru evenimentul letor un z n re respetivul eveniment se relizezF n eveniment letor pote
ve mi multe zuri fvorileF n eveniment letor u un singur z fvoril se numete eveniment

elementarF
pie o mulime nevidD pe re o vom numi mulime tuturor evenimentelor elementreF n element
l lui l vom not u F om numi evenimentul sigurD el eveniment re se pote reliz n urm
orirei experiene letoreF Evenimentul imposibil este el eveniment e nu se relizez n niio proF
ivenimentele letore le vom not u A, B, C, . . . F rin Ac vom not evenimentul omplementr lui AD
re se relizez tuni nd A nu se relizezF evemX Ac = \ AF
entru pute unti( nsele de relizre unui eveniment letorD sE introdus noiune de probabil-

itateF n litertur de speilitteD proilitte este de(nit n mi multe moduriX u de(nii lsi
@pre pentru prim or n lurrile lui F F vple1 AD folosind o ordre sttisti @u frevene
reltiveA su utiliznd de(nii xiomti @uolmogorovAF

Probabilitatea clasic este de(nit dor pentru zul n re experien letore re un numr (nit de
zuri egl posiile i ehiproile @tote u eei ns de se relizAF n est zD proilitte
de relizre unui eveniment este rportul dintre numrul zurilor fvorile relizrii evenimentului i
numrul zurilor egl posiile le experimentului letorF
1

Pierre-Simon, marquis de Laplace (1749 1827), matematician i astronom francez

31

32

Capitolul 2. Elemente de Teoria probabilitilor

Exerciiu 2.1 e ere proilitte oinerii unei dule l o singur runre unei perehi de zruri
ideleF wulime zurilor posiile este mulime tuturor perehilor {(i, j); i, j = 1, 6}D re re 36 de
elementeF gzurile fvorile sunt ele din mulime {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}D di 6
elementeF roilitte priiei unei dule este P =

6
36

1
= 6F

unt ns forte multe zuri n re de(nii lsi nu mi pote ( utiliztF pre exempluD n zul
n re se ere proilitte D legnd l ntmplre un punt din ptrtul [0, 1] [0, 1]D est s se
situeze desupr primei isetoreF n est zD tt numrul zurilor posiileD t i numrul zurilor
fvorile este in(nitD fnd de(nii lsi proilitii inutilizilF

Probabilitatea statistic exprim proilitte u jutorul frevenelor de relizre unui eveniment ntrE
un numr mre de experimente letore relizte n elei ondiiiF
onsiderm o experien letore @eFgFD runre unui zrA l rei rezultt posiil este evenimentul
letor A @eFgFD prii feei u 6 punteAF eeste experiment letor l putem efetu de N ori n
ondiii identie @spunem efetum N proe le experimentuluiAD stfel nt rezulttul unei proe s
nu in)ueneze rezulttul ltei @probe independenteAF notm u N frecven absolut de relizre lui
N
se v numi frecven relativF xotm u fN est rportD
A n ele N proe independenteF portul
N
e re urmtorele proprietiX

(a)

0 fN 1;

(b)

fN () = 1;

(c)

fN (Ac ) = 1 fN (A), A;

(d)

fN (A

B) = fN (A) + fN (B), d A

B = .

wi multD exist lim fN (A) i est este de(nit (ind proilitte de relizre evenimentului AD
N

nott P (A)F edrD n zul de(niiei sttistie proilitiiD est este limit irului frevenelor
reltive de produere respetivului eveniment nd numrul de proe tinde l in(nit @vezi eorem PFSRAF
n ele e urmezD vom de(ni noiune de proilitte din punt de vedere xiomtiF eest xiomti
fost introduse de mtemtiinul rus eF xF uolmogorov2 @1929A i re l z teori msuriiF

2.2 Deniia axiomatic a probabilitii


emintimD este o mulime strtD nevidF

Deniia 2.2 xumim algebr su cmp o oleie F de sumulimi le lui stfel ntX
@A F Y
@A d A F D tuni Ac F;
@A d A, B F D tuni A

(Ac = \ A)

BF

(nhidere l omplementriere)
(nhidere l reuniune (nit)F

Propoziia 2.3 @A impli


n

@9A d (Ai )i=1, n F, tuni

Ai F.
i=1

Andrei Nikolaevich Kolmogorov (1903 1987), matematician rus

@PFIA

33

2.2. Deniia axiomatic a probabilitii

Deniia 2.4 xumim algebr su cmp @su corp borelianA o oleie F de sumulimi le lui
stfel nt @AD @A din de(nii nterior sunt stisfute iD n plusD vem

@9A d (An )nN F, tuni

(nhidere l reuniune numril)

An F;

@PFPA

n=1

Observaia 2.5 @IA = R i F = {A; A R} este o lgerY


@PA F = {, } este o lgerY
@QA h A D F = {A, Ac , , } este o lgerY
@RA = R i F = {(a, b]; a < b < } este o lgerD dr nu i lgerY
@SA h e o mulime nevid i F este o lger pe D tuni perehe (, F) se numete spaiu

msurabilF

Deniia 2.6 pie F o oleie de sumulimi le lui F xumim algebr generat de F e mi mi


lger e onine F F y notm prin (F) i esteD de fptD
@PFQA

A.

(F) =
AF

h E e un spiu topologiD vom numi -algebr Borel3 D nott B(E)D Elger genert de fmili
mulimilor deshise din E D iFeFD e mi mi Elger e onine deshiii lui E F
h E = Rd D tuni B(Rd ) @su B d A este Elger genert de uurile deshise din Rd F y mulime

A Bd se numete mulime borelianF

Deniia 2.7 y funie P : (, F) RD re soiz orirui eveniment A F numrul rel P (A)D u


proprietileX

(a)

P (A) 0, A F;

(b)

P () = 1;

(c)

P (A

B) = P (A) + P (B), A, B F, A

B = ,

se numete probabilitateF
eest este de(nii xiomti dt de eF xF uolmogorovF n mp de evenimente (, F) nzestrt u
o proilitte P se numete cmp de probabilitate n sens Kolmogorov i l vom not u (, F, P )F

Observaia 2.8 h n loul ondiiei (c) vemX


(c) d (An )nN F disjunte dou te dou @Ai

Aj = , i = j A i P (

An ) F D tuni

nN

P(

An ) =
nN

P (An ).

( ditivitte)

@PFRA

nN

tuni P se v numi probabilitate aditiv pe corpul borelian (, F)D ir (, F, P ) se v numi cmp

borelian de probabilitateF
3

Flix douard Justin mile Borel (1871 1956), matematician si politician francez

34

Capitolul 2. Elemente de Teoria probabilitilor

Observaia 2.9 @IA pie o mulime u n elementeD F = P() i A F etuni


P (A) =

rd A
rd

@PFSA

de(nete o msur de proilitte pe F @proilitte n sens lsiAF


@PA n zul n re ondii (b) din de(nii proilitii lipseteD tuni spunem P de(nete o msur
pe spiul msuril (, F )D ir tripletul (, F, P ) se v numi spaiu cu msurF y proilitte este
stfel un z prtiulr l noiunii de msurD n zul n re msur ntregului spiu este P () = 1F
punem o propriette are loc a.s. @prope sigurA d re lo ntotdeunD u exepi unei mulimi

A pentru re P (A) = 0F y stfel de mulime se v numi mulime P -nulF

2.3 Cmp de probabilitate


riniplul onept l teoriei proilitilor este spaiu probabilistic su cmp de probabilitateF n ele e
urmezD nd ne vom referi l mp de proilitteD vom nelege un triplet (, F, P )D u urmtorele
proprietiX
@iA este o mulime strt @mulime tuturor evenimentelor elementre le unui experiment stohsE
tiAY
@iiA F P @A este o -algebrD iFeFD sunt ndeplinite urmtorele ondiiiX
@ 1 A F Y
@2 A A F = Ac F Y
@3 A (An )nN F =

An F Y
nN

@iiiA P : F R e o funie stisfnd ondiiileX


@P1 A P () = 1Y
@P2 A A F D P (A) 0Y
@P3 A (An )nN , An

Am = , n = mD vem P (

P (An )F

An ) =
nN

nN

erminologieX
@iA ilementele lui F se numes evenimente ir sunt elemente de probF
@iiA y mulime A F D u A ElgerD o vom numi suE Elger lui F F
@iiiA A F D P (A) se v numi probabilitatea lui AF
@ivA h P (A) = 0D tuni A se v numi mulime P -nulF
@vA h P (A) = 1D tuni A este evenimentul sigurD su spunem A se relizez aproape [email protected]
ht (ind un ir (An )nN n D de(nim

lim inf An =
n

Am

n=1 mn

lim sup An =
n

Am .

@PFTA

n=1 mn

n generlD lim inf An lim sup An F n z de eglitte vom spune irul (An )nN re limit i vom srie
n

lim An = lim inf An = lim sup An .

@PFUA

Observaia 2.10 hin punt de vedere euristiD lim inf An reprezint evenimentul re se relizez nd
n

35

2.4. Cmp de probabilitate geometric

tote An se relizezD mi puin un numr (nitF e de lt prteD lim sup An nsemn relizre unei
n

in(niti de evenimente din irul A1 , A2 , . . . F

Teorema 2.11 (Borel-Cantelli4 )


pie (An )nN D un ir de evenimenteF etuniX

(i) h

P (An ) < ,

tuni

n=1

lim sup An

= 0.

(ii) h

P (An ) =

i evenimentele {An }n sunt independenteD tuni

n=1

lim sup An

= 1.

2.4 Cmp de probabilitate geometric


presupunem m dispune de un proedeu prin re putem lege l ntmplre un punt dintrEun
intervl [a, b]F n plusD vom presupune est proedeu ne sigur nu exist poriuni privilegite le
intervlului [a, b]D iFeFD orire r ( dou suintervle de eei lungimeD este l fel de proil puntul
s d n orire dintre este intervleF h m folosi de mi multe ori proedeul pentru lege un
numr mre de punteD este vor ( reprtizte proximtiv uniform n [a, b]D iFeFD nu vor exist punte
n veintte ror puntul les s d mi desD ori de te ori e lesF he ii reiese proilitte
un punt s d ntrEun suintervl l lui [a, b] este dependent de lungime elui suintervl i nu de
pozii s n interiorul lui [a, b]F wi multD est este hir proporionl u lungime suintervluluiF
e pote oserv nlogi u experien legerii dintrEun numr de zuri egl posiileF
h [a, b] e mulime zurilor egl posiile i [c, d] [a, b] este mulime zurilor fvorileD tuni
proilitte puntul les s d n [c, d] este

P (A) =

msur ([c, d])


dc
=
.
msur ([a, b])
ba

n prtiulrD d x (c, d)D tuni proilitte puntul les letor dintrEun intervl s oinid
u un punt dininte stilit este zero iD stfelD ntrezrim posiilitte teoreti un eveniment s i
proilitte nulD fr el s (e evenimentul imposiil F
n mod u totul nlogD d se i l ntmplre un punt dintrEun domeniu plnr DD stfel s nu existe
punte su poriuni privilegite n est domeniuD tuni proilitte puntul s d n sudomeniul
D D este ri D F
ri D
n trei dimensiuniD o proilitte similr este rportul dou volumeX volumul mulimii zurilor fvorE
ile i volumul mulimii zurilor egl posiileF
4

Francesco Paolo Cantelli (1875 1966), matematician italian

36

Capitolul 2. Elemente de Teoria probabilitilor

2.5 Probabiliti condiionate


pie spiul proilisti (, F, P ) i A, B F D u P (B) > 0F he(nim probabilitatea evenimentului A

condiionat de realizarea evenimentului B D nott P (A|B) su PB (A)D prinX


PB (A) =

P (A B)
.
P (B)

@PFVA

Observaia 2.12 PB (A) stfel de(nit v ( o proilitte pe F D ir tripletul (, F, PB ) este un mp


de proilitteF

Propoziia 2.13 @A (formula probabilitilor totale) pie (Bi )iI , (I N) o prtiie lui D stfel nt
P (Bi ) > 0, i I F etuni
@PFWA

P (Bi ) PBi (A), A F.

P (A) =
iI

@A (formula lui Bayes5 ) n ondiiile de l @A iD n plusD P (A) > 0D vemX

PA (Bi ) =

P (Bi ) PBi (A)


P (Bj ) PBJ (A)

@PFIHA

, i I.

jI

@A h B1 , B2 , . . . , Bn F D stfel nt P (B1

P (B1

B2

B2

Bn ) > 0D tuniX

Bn ) = P (B1 ) PB1 (B2 ) . . . PB1

Bn1 (Bn ).

@PFIIA

2.6 Variabile aleatoare


hin punt de vedere euristiD o variabil aleatoare este o funie e i vlori ntmpltoreF n vi de
zi u zi ntlnim numerose stfel de funiiD eFgFD numerele e pr l extrgere lotoD numrul lienilor
deservii l un numit ghieu ntrEo numit periodD timpul de teptre unei persone ntrEo stie de
utouz pn l sosire estui etF riilele letore le vom not u litere de l sfritul lfetului

X, Y, Z su , , i lteleF
pie (, F, P ) un mp de proilitte i (E, E) un spiu msurilF
y funie X : (, F, P ) (E, E) se numete variabil aleatoare @v.a.A d
pentru orie B E, X 1 (B) F
@mi spunem X este o funie FmsurabilAF
n prtiulrD dX

(E, E) (Rd , B(Rd ))D tuni X este vector aleator @su v.a.A d-dimensional();

(E, E) (R, B(R))D tuni X este o variabil aleatoare realY

(E, E) (Rnm , B(Rnm )D tuni X este o matrice aleatoareF

Thomas Bayes, (1702 1761) matematician britanic

@PFIPA

37

2.6. Variabile aleatoare

heoree mulimile {(, x], x R} generez B(R)D pentru X : (, F, P ) R s (e o vFF rel este
su(ient
@PFIQA

x R, { | X() x} F.
not

om utiliz notiile {X x} = { | X() x} iD n generlD


not

{X B} = { | X() B}
h X : (, F, P ) Rd este o vFFD tuni

F(X) = {X 1 (B), B Bd }
este o lgerD denumit algebra generat de v.a. X F estfelD (X) este e mi mi sulger
lui F stfel nt X este msurilF
h (Xn )nN este un ir de vFF rele stfel nt Xk () X(), prope pentru toi D tuni X
este tot o vFF relF
pie Xi : (, F, P ) (E, E), (i I) o fmilie de vFFF he(nim lger genert de fmili {Xi , i N}D
nott (Xi , i I)D e mi mi lger pentru re Xi , i I D sunt msurileF
riilele letore pot lu o mulime el mult numril de vlori @i le numim v.a. discreteA su pote
lu o mulime ontinu de vlori @un intervl (nit su in(nit din RAD i le vom numi @v.a. de tip continuuAF
ixemple de vFF disreteX numrul feei prute l runre unui zrD numrul de priii le unui trmvi
ntrEo stie ntrEun numit intervlD numrul de insuese prute pn l primul sues etF hin ls
vFF de tip ontinuu mintimX timpul de teptre l un ghieu pn l servireD preul unui tiv (nnir
ntrEo period ine determintF
y vFF disret X se pote srie su form

xi Ai (), , J N.

X() =

@PFIRA

iJ

eii A este funi inditore mulimii AD ir Ak = X 1 ({xk })F yservm u uurin


n

Ai =

Aj = , i = j.

Ai

i=1

neoriD unei o vFF disrete i se triuie urmtorul tablou de repartiieX

X:

xi
pi

@PFISA

unde pi = P (X = xi ), i J N,

pi = 1F pre exempluD tloul de reprtiie pentru vFF e reprezint


i=1

numrul de punte e pre l runre unui zr idel esteX

1/6

1/6

1/6

1/6

1/6

1/6

38

Capitolul 2. Elemente de Teoria probabilitilor

y vFF X rel se numete de tip continuu d exist f : Rd R msuril forel e ndeplinete


ondiiileX

(a)

f (x) 0, FsF

(b)

f (x) dx = 1
R

(c)

PX (B) =

f (x) dx,

B F.

puni f se numete densitatea de repartiie lui X F


n urmtorele dou seiuniD vom de(ni ele mi importnte rteristii funionle i numerie le unei
vriile letore X : (, F, P ) (R, B(R))F

2.7 Caracteristici funcionale ale variabilelor aleatoare


Repartiia
Repartiia @su legeaD su distribuiaA lui X este o msur de proilitte pe Bd D PX : Bd [0, 1]D dt
prin

PX (B) = P (X B), B Bd .

@PFITA

eprtii unei vFF de tip disret @de form PFIRA este stfelX

PX (B) =

P (Ak )xj (B),

@PFIUA

jJ

unde

d a B

0,

a (B) =

1,

n rest

eprtii unei vFF X de tip ontinuu esteX

PX (B) =

f (x) dx,

B Bd ,

@PFIVA

unde f (x) este densitte de reprtiie lui X F n lim englezD pentru reprtiie se foloses termeniiX

distribution su lawF
Funcia de repartiie (su funcia de repartiie cumulat)
xumim funcie de repartiie tt vF rele X o funie F : R [0, 1]D dt prin

F (x) = P (X x).
estfelD F (x) = PX ((, x])D di este reprtii mulimii (, x]F
ermenul n englez pentru funi de reprtiie este cumulative distribution function @dfAF
h X = (X1 , X2 , . . . , Xd ) : (, F, P ) Rd este un vetor letorD tuni funi de reprtiie se

2.7. Caracteristici funcionale ale variabilelor aleatoare

39

de(nete (ind F : Rd [0, 1]D dt prin

F ((x1 , x2 , . . . , xd )) = P (X1 x1 ; X2 x2 ; . . . , Xd xd ).
roprieti le funiei de reprtiieX

este restore @F (x) F (y), x, y R, x y AY

este ontinu l drept @ lim F (y) = F (x), x RAY

lim F (x) = 0 i lim F (x) = 1.

n zul unei vriile letore disreteD u tloul de reprtiie dt de @PFISAD funi s de reprtii
ntrEun punt x esteX

F (x) =

pi .

@PFIWA

{i; xi x}

h X este o vriil letore ontinu i f este densitte s de reprtiieD tuni funi de reprtiie
este dt de formulX

F (x) =

f (t) dt,

x R.

@PFPHA

Observaia 2.14 heseori n lule proilistieD vem de lult evenimentul P (X > x)D pentru un
x R dtF xumim funcie de repartiie complementarD funi Fc : R [0, 1]D dt prin F (x) = P (X >
x) = 1 F (x), x RF

Funcia caracteristic
xumim funcie caracteristic tt vF rele X o funie X : R CD dt prinX

ei t xk pk ,

X (t) =

d X =

kJ

ei t x f (x) dx,

X (t) =

xk Ak , (X = disret)
kJ

d X = vriil letore ontinuF

eiiD i este numrul imginrD (i2 = 1)F


roprieti le funiei rteristieX

|X (t)| = 1, t RY

a X (t) = X (a t), t R, a RY

a X+b (t) = X (a t)eibt , t R, a RY

X (t) = X (t), t RY

X : R C este uniform ontinuY

ti , tj R, zi , zj C vem

X (ti tj )zi zj 0.

i, j=1

40

Capitolul 2. Elemente de Teoria probabilitilor

Funcia de probabilitate (sau de frecven)


xi Ai (), , Ai F, J NF xumim funcie de

pie X o vriil letore disretD X() =


iJ

probabilitate @de frecvenA tt vriilei letore disrete X o funie f : R RD de(nit prin


unde pi = P (Ai ), i J.

f (xi ) = pi ,

puni de proilitte @en., proility distriution funtionA pentru o vriil letore disret este
similr densitii de reprtiie pentru o vriil letore ontinuF ntrEdevrD proprietile pe re le
stisfe funi de proilitte suntX

f (xi ) 0, i J,
n

f (xi ) = 1.
i=1

2.8 Caracteristici numerice ale variabilelor aleatoare


IF Media

Deniia 2.15 h X este o vFF de tip disretD X() =

xi Ai (), , J ND tuni media


iJ

estei vFF se de(nete prinX

E(X) =

@PFPIA

xi P (Ai ).
iJ

Deniia 2.16 h X este o vFF de tip ontinuuD u densitte de reprtiie f : R RD tuni media
(teoretic) estei vFFD d exist @3A @nu tote vFF de tip ontinuu dmit medie E vezi reprtii guhyAD
se de(nete stfelX

E(X) =

xf (x)dx,

(d est integrl exist).

@PFPPA

Observaia 2.17 he(nii mediei pote ( dt ntrEun dru mult mi generlD folosind integrala LebesqueF
eest integrl este generlizre integrlei iemnnF umrizm mi josD grdul i fr demonstriile
ferenteD onstrui mediei unei vFF releF
n

Pasul 1X

xi Ai () se numete v.a. simplF entru vFF simpl X de(nim

y vFF X u X() =

medi @nott u E(X)A stfelX

i=1

n
not

E(X) =

X() dP () =

Pasul 2X

xi P (Ai ).
i=1

h X : R i X 0D tuni exist un ir Xn : R, (n N) de vFF simple stfel

nt

0 X1 () Xn () X(),
i

lim Xn () = X().

2.8. Caracteristici numerice ale variabilelor aleatoare

41

he(nim

E(X) = lim E(Xn ).


n

Pasul 3X

pie X : R o vFFF etuni X = X X D unde


+

X () = max{X(), 0} = (X)+ ().

X + () = max{X(), 0},
n est z de(nim media lui X D

E(X) = E(X + ) E(X ),


ori de te ori mr un dintre E(X + ) i E(X ) este (nitF gnd mele sunt (niteD tuni spunem

X este o v.a. integrabilF


h X = X1 + iX2 : CD de(nim medi vFF omplexe X prin

E(X) = E(X1 ) + iE(X2 ),


ori de te ori mele medii exist i sunt (niteF
h X este un vetor letorD X = (X1 , X2 , . . . , Xd )T : Rd D tuni de(nim medi lui X prin

E(X) = (E(X1 ), E(X2 ), . . . , E(Xd ))T .

Propoziia 2.18 pie X : Rd o vFF u densitte de reprtiie f i o funie msuril g : Rd RF


etuni

E(g(X)) =

g(x)f (x) dx.


Rd

n prtiulrD d g : R R este funi identiD tuniX

E(X) =

X() dP () =

xf (x) dx,
R

i stfel redesoperim de(nii mediei unei vFF de tip ontinuu din he(nii PFITF
eli nterior se mi numete i formula de transport pentru integrlD deoree integrl strt
pe mulime este 4trnsportt4 ntrEo integrl iemnn pe RF
PA Dispersia @su vrinA i tere stndrd
h X este o vriil letore i X = X E(X) @numit abaterea lui X de l medi sAD tuni

E(X) = 0F edrD nu putem msur grdul de mprtiere vlorilor lui X n jurul mediei sle dor
lulnd X E(X)F evem nevoie de o lt msurF eest este dispersi vriilei letoreF

Deniia 2.19 h X este o vFF disretD X() =

xi Ai (), , J N, u medi E(X) = mD


iJ

de(nim dispersia lui X (indX

D2 (X) =

(xi m)2 pi ,

unde pi = P (Ai ), i J.

@PFPQA

iJ

Deniia 2.20 pie X : R o vFF de tip ontinuu pentru re medi pote ( de(nit @exist E(X) =

42

Capitolul 2. Elemente de Teoria probabilitilor

m RAF he(nim dispersi lui X @su vrin lui X A ntitte


D2 (X) = E[(X m)2 ] =

(x m)2 f (x) dx.

@PFPRA

xotiile onsrte pentru dispersie sunt D2 (X) su 2 F

Observaia 2.21 hispersi sris integrl strt @vezi propozii nteriorA esteX
2 =

(X() m)2 dP ().

xumim abatere standard @su deviaie standardA ntitte =

2 F

QA Momente
entru o vFF X de tip disretD X() =

xi Ai (), , J ND
iJ

u E(X) = m i pi = P (Ai ), i J D de(nim momenteleX

k (X) = E(X k ) =

@momente iniile de ordin k);

xk p i
i
iJ

k (X) = E(|X|k ) =

@momente solute de ordin k);

|xi |k pi
iJ

(xi m)k pi

@momente iniile entrte de ordin k);

|xi m|k pi

@momente solute entrte de ordin k);

k (X) = E((X m)k ) =


iJ

k (X) = E(|X m|k ) =


iJ

entru o vFF X de tip ontinuu e dmite medie m = E(X) < D de(nim momenteleX

k (X) = E(X k ) =

xk f (x) dx =

k (X) = E(|X|k ) =

@momente iniile de ordin k);

X k dP

|x|k f (x) dx =

@momente solute de ordin k);

|X|k dP

k (X) = E((X m)k ) =

(x m)k f (x) dx =

@momente iniile entrte);

k (X) = E(|X m|k ) =

(X m)k dP

|x m|k f (x) dx =

|X m|k dP

@momente solute entrte);

RA Cuantile
pie o vFF X u funi de reprtiie F (x)F

Deniia 2.22 entru (0, 1)D de(nim cuantila de ordin vlore x stfel ntX
F (x ) = P (X x ) = .

@PFPSA

Observaia 2.23 @IA guntilele sunt msuri de poziieD e msor loi unei numite oservii f
de restul dtelorF e um se pote oserv din pigur PFID vlore x este el numr rel pentru re
ri hurt este hir F

43

2.9. Inegaliti ntre momente


@PA

n zul n re X este o vriil letore disretD tuni @PFPSA nu pote ( sigurt pentru orie

F nsD d exist o soluie estei euiei F (x) = D tuni exist o in(nitte de soluiiX intervlul
e sepr dou vlori posiileF

Figura 2.1: Cuantila de ordin .


@QA

gzuri prtiulre de untileX mediana @ = 1/2AD cuartile @ = i/4,

i = 1, 4AD decile @ =

j/10, i = 1, 10AD percentile @ = k/100, k = 1, 100AD promile @ = l/1000, l = 1, 1000AF


SA Modul @vlore e mi proilA
iste e vlore x pentru re f (x ) @densitte de reprtiie su funi de proilitteA este mximF
y reprtiie pote s nu i niiun modD su pote ve mi multe moduleF

2.9 Inegaliti ntre momente


@A r (X + Y ) cr (r (X) + r (Y ))D unde cr = 1 pentru r (0, 1] i cr = 2r1 pentru r > 1F
@A (r (X))1/r (s (Y ))1/s , 0 r s;

(Lyapunov 6 )
(H lder7 )Y

@A E|XY | (E|X|r )1/r (E|Y |s )1/s , r, s > 1, r1 + s1 = 1;


@dA (E|X + Y |r )1/r (E|X|r )1/r + (E|Y |r )1/r ;

(M inkowski8 )

@eA pie g : R R onvexF etuni vem g(E(X)) E(g(X)).

(Jensen9 )

@fA h a > 0, p N , tuni vemX

P ({|X| a})
6

p (X)
;
ap

(M arkov 10 )

Aleksandr Mikhailovich Lyapunov (1857 1918), matematician rus, student al lui Cebev
Otto Ludwig Hlder (1859 1937), matematician german
8
Hermann Minkowski (1864 1909), matematician german
9
Johan Ludwig William Valdemar Jensen (1859 1925), matematician si inginer danez
10
Andrei Andreyevich Markov (1856 1922), matematician rus, student al lui Cebev
7

44

Capitolul 2. Elemente de Teoria probabilitilor

n prtiulrD pentru p = 2 i X e nlouit u vriil letore (X m)D (m = E(X))D oinemX

P ({|X m| a})

2
.
a2

(Cebev11 )

@PFPTA

h n ineglitte lui geev lum = k D unde k ND tuni oinemX

P ({|X m| k})

1
,
k2

@PFPUA

suD ehivlentX

P ({|X m| < k}) 1

1
.
k2

@PFPVA

n zul prtiulr k = 3D oinem regula celor 3 X

P ({|X m| 3})

1
0.1.
9

su

P ({m 3 < X < m + 3})

8
,
9

@PFPWA

semni(nd o mre prte din vlorile posiile pentru X se ) n intervlul [m 3, m + 3]F

2.10 Standardizarea unei variabile aleatoare


pie vriil letore X D de medie m i dispersie 2 F

Deniia 2.24 riil letore X =


mtAF

X m
se numete variabila aleatoare standardizat @su norE

roprietile vriilei letore stndrdizteX

E(X) = 0,

D2 (X) = 1.

2.11 Corelaia i coecientul de corelaie


goneptul de orelie @su ovrinA este legt de modul n re dou vriile letore tind s se
modi(e un f de elltY ele se pot modi( (e n eei direie @z n re vom spune X i Y
sunt diret <su pozitiv> orelteA su n direii opuse @X i Y sunt invers <su negtiv> orelteAF
2
2
pie X, Y vFF u mediileD respetivD mX , mY i dispersiile X D respetivD Y F glulnd dispersi sumei

X + Y D oinemX
D2 (X + Y )

= E[(X + Y (mX + mY )2 )]
= E[(X mX )2 ] + E[(Y mY )2 ] + 2E[(X mX )(Y mY )]
= D2 (X) + D2 (Y ) + 2E[(X mX )(Y mY )].

11

Pafnuty Lvovich Chebyshev (1821 1894), matematician rus

2.12. Independena variabilelor aleatoare

45

Deniia 2.25 he(nim corelaia @su covarianaA vFF X i Y D nott prin ov(X, Y )D ntitte
ov(X, Y ) = E[(X mX )(Y mY )]F

Proprietatea 2.26 @A

gontinund irul nterior de eglitiD putem srieX

D2 (X + Y ) = D2 (X) + D2 (Y ) + 2 ov(X, Y ).

@PFQHA

(b) ov(X, Y ) = ov(Y, X) = E[(X mX )(Y mY )] = E(XY ) mX mY F


(c) ov(X, X) = D2 (X)D pentru orie vFF X F
(d) ov(X + Y, Z) = ov(X, Z) + ov(Y, Z)D pentru orie vFF X, Y, Z F
(e) h X i Y sunt vFF independente @iFeFD relizrile lui X nu depind de relizrile
lui Y AD tuni ov(X, Y ) = 0F eipro nu este ntotdeun devrtF
2
2
pie vFF X i Y D pentru re presupunem vriiile X i Y sunt (nite i nenuleF gonsiderm vFF
X mX
Y mY
i Y =
F
stndrdizteD X =
X
Y

Deniia 2.27 e numete coecient de corelaie @teoretiA l vFF X i Y ovrin vriilelor stnE
drdizte X i Y F xotm stfelX

(X, Y ) = ov(X, Y ) =

Observaia 2.28 @A

ov(x, Y )
.
X Y

@PFQIA

h X i Y sunt independente @iFeFD relizrile unei sunt independente de

relizrile eleillte vezi seiune urmtoreAD tuni

(X, Y ) = 0.
pentru orie vFF X i Y F

(b)

1 (X, Y ) 1,

(c)

h Y = aX + b (a, b R)D tuni

+1,
(X, Y ) =
1,

d a = 1;
d a = 1.

2.12 Independena variabilelor aleatoare


goneptul de independen vFF su evenimentelor este forte importnt din puntul de vedere l
lulului proilitilor evenimentelor ompuse din evenimente mi simpleF sndependen este unul
dintre oneptele priniple re deosees eori proilitilor de eori msuriiD nevnd ehivlent
n teori din urmF

Deniia 2.29 pie (, F, P ) un mp de proilitteD A, B F dou evenimente ritrreF


@IA

h numite informii despre evenimentul B u in)uent n vreun fel relizre evenimentului AD

tuni vom spune A i B sunt evenimente dependenteF he exempluD evenimentele A = mine plou i

B = mine mergem la plaj sunt dependenteF


@PA

presupunem evenimentul B stisfe reli P (B) > 0F om spune evenimentele A i

B sunt independente d proilitte lui A este independent de relizre evenimentului B D di

46

Capitolul 2. Elemente de Teoria probabilitilor

proilitte ondiiont
@PFQPA

P (A| B) = P (A),
ehivlent u

P (A B)
= P (A).
P (B)

utem resrie ultim eglitte su form simetriX


@PFQQA

B) = P (A) P (B).

P (A

heoree n reli @PFQQA nu mi este nevoie de ondiie suplimentr pentru P (B)D este preferil s
de(nim independen dou evenimente ritrre stfelX
hou evenimenteD A, B F se numes independente (stochastic) d reli @PFQQA re loF

Deniia 2.30 @iA ivenimentele A1 , A2 , . . . , An se numes independente n ansamblu d pentru (ere


sumulime {i1 , i2 , . . . , ik } mulimii {1, 2, . . . , n} vem

P (Ai1

Ai 1

Aik ) = P (Ai1 ) P (Ai2 ) . . . P (Aik ).

@PFQRA

@iiA punem evenimentele A1 , A2 , . . . , An sunt independente dou cte dou d pentru orire dou
evenimenteD Ai i Aj D din est mulimeD vem

P (Ai

@PFQSA

Aj ) = P (Ai ) P (Aj )).

@iiiA n generlD evenimentele (Ai )iI F, (I N), se numes independente d

P(

Aj ) =
jJ

@PFQTA

P (Aj ),
jJ

pentru orie J I, J(nitF

Observaia 2.31 sndependen dou te dou evenimentelor nu impli independen n nsmluF


exempli(m onsidernd urmtore experienF
gonsiderm runre dou monede ideleF pie A evenimentul 4f e pre l prim moned este
stem4D B evenimentul 4f e pre l dou moned este stem4D ir C evenimentul 4dor l o
moned din ele dou prut f u stem4F e oserv u uurin evenimentele AD B i C sunt
independente dou te douD deoreeX

P (A

C) = P (A) P (C) =

1
;
4

P (B

C) = P (B) P (C) =

1
;
4

P (A

B) = P (A) P (B) =

1
.
4

otodtD mi oservm orire dou dintre ele determin n mod uni pe l treileF edrD indepenE
den dou te dou nu impli independen elor trei evenimente n nsmluD fpt oservt i din
reli

0 = P (A

C) = P (A) P (B) P (C) =

1
.
8

Deniia 2.32 h {Mi , i I N}D u Mi F D este o fmilie de orpuriD tuni spunem


este sunt independente (stochastic) d pentru orie sumulime (nit J I i pentru orie legere

47

2.12. Independena variabilelor aleatoare


de evenimente Aj Mj D este ndeplinit ondii

P(

Aj ) =
jJ

@PFQUA

P (Aj ).
jJ

Deniia 2.33 @IA punem vFF (Xi )iI : (, F) R, (I N), sunt independente (n ansamblu)
d orpurile generte de Xi D {(Xi )}iI D formez o fmilie de orpuri independenteF
@PA

punem vFF (Xi )iI : (, F) R, (I N), sunt independente dou cte dou d orire r (

dou vriile letore din est fmilieD este sunt independente n sensul de(niiei de l @IAF

Observaia 2.34 he(nii vriilelor letore independente @n nsmluA este ehivlent uX


entru orie k 2 i orie legere mulimilor oreliene B1 , B2 , . . . , Bk F, vemX

P (X1 B1 , X2 B2 , . . . , Xk Bk ) = P (X1 B1 ) P (X2 B2 ) . . . P (Xk Bk ),

@PFQVA

suD u lte uvinteD evenimentele {X1 B1 }, {X2 B2 }, . . . , {Xk Bk } sunt independente n nsmluF

Exemplu 2.35 onsiderm runre unui zrF erunm zrul de dou ori i notm u X1 D respetivD
X2 D vFF e reprezint numrul de punte prute l (ere runreF ividentD vlorile estor vFF sunt
din mulime {1, 2, 3, 4, 5, 6}F edrD

Xi : {1, 2, 3, 4, 5, 6}, i = 1, 2.
evemX

P {X1 = i}

{X2 = j}

1
36
= P ({X1 = i}) P ({X2 = j}),
= P ({X1 = i, X2 = j}) =

i, j {1, 2, 3, 4, 5, 6},

est nsemnnd vriilele letore X1 i X2 sunt independente stohsti @runrile u fost


efetute independent un de elltAF

Teorema 2.36 gonsiderm fmili de vFF {X1 , X2 , . . . , Xn },

Xi : (, F) R, i = 1, nF

rmtorele (rmii sunt ehivlenteX

(i)

X1 , X2 , . . . , Xn sunt vFF independente stohsti;

(ii)

P (X1 B1 , X2 B2 , . . . , Xn Bn ) = P (X1 B1 ) P (X2 B2 ) . . . P (Xn Bn ), Bi ;

(iii)

F(X1 , X2 ,..., Xn ) (x1 , x2 , . . . , xn ) = FX1 (x1 ) FX2 (x2 ) . . . FXn (xn ), x1 , x2 , . . . , xn R;

(iv)

(X1 , X2 ,..., Xn ) (t) = X1 (t1 ) X2 (t2 ) . . . Xn (tn ), t = (t1 , t2 , . . . , tn ) Rn .

hou dintre dintre ele mi importnte proprieti le vFF independente sunt urmtoreleX

Teorema 2.37 h X1 , X2 , . . . , Xn sunt vFF releD independenteD stfel nt


E(|Xk |) < , k = 1, 2, . . . , n,

@PFQWA

48

Capitolul 2. Elemente de Teoria probabilitilor

tuni E(|X1 X2 . . . Xn |) < iX


@PFRHA

E(X1 X2 . . . Xn ) = E(X1 ) E(X2 ) . . . E(Xn ).

Teorema 2.38 h X1 , X2 , . . . , Xn sunt vFF releD independenteD stfel nt


D2 (Xk ) < , k = 1, 2, . . . , n,
tuni D2 (X1 + X2 + . . . + Xn ) < iX

D2 (X1 + X2 + . . . + Xn ) = D2 (X1 ) + D2 (X2 ) + . . . + D2 (Xn ).

@PFRIA

2.13 Exemple de repartiii discrete


n dreptul (erei reprtiiiD n prntezD pre numele u re est re pote ( pelt n
@IA Repartiia uniform discretD U(n)

MatlabF

@unidA

riem X U(n)D d vlorile lui X sunt {1, 2, . . . , n}D u proilitile

P (X = k) =
wedi i dispersi suntX E(X) =

n+1
2 ,

1
,
n

D2 (X) =

k = 1, 2, . . . , n.

n2 1
12 .

Exemplu: numrul de punte re pr l runre unui zr idel este o vlore letore reprtizt U(6)F
@PA Repartiia Bernoulli12 , B(1, p)

@binoA

riem X B(1, p)F FF de tip fernoulli pote lu dor dou vloriD X = 1 @suesA su X = 0 @insuE
esAD u proilitile P (X = 1) = p; P (X = 0) = 1 pF
wedi i dispersi suntX E(X) = p; D2 (X) = p(1 p)F

Exemplu: runre o singur dt unei monede idele pote ( modelt (ind o vFF B(1, 0.5)F
@QA Repartiia binomial, B(n, p):

@binoA

riem X B(n, p) @shem ilei revenite su shem extrgerilor u repetiieA

(n > 0, p (0, 1))D d

vlorile lui X sunt {0, 1, . . . , n}D u proilitile


k
P (X = k) = Cn pk (1 p)nk , k = 0, 1, . . . , n.

wedi i dispersi suntX E(X) = np; D2 (X) = np(1 p)F

h (Xk )k=1,n B(1, p) i (Xk )k independente stohstiD tuni X =

Xk B(n, p)F
k=1

12

Jacob Bernoulli (1654 1705), matematician elveian

49

2.13. Exemple de repartiii discrete

Exemplu: runre de 15 ori unei monede idele pote ( modelt (ind o vFF inomil B(15, 0.5)F
@RA Repartiia hipergeometric, H(n, a, b)

@hygeA

X H(n, a, b) @shem ilei nerevenite su shem extrgerilor fr repetiieA (n, a, b > 0) d


P (X = k) =

k nk
Ca Cb
,
n
Ca+b

pentru orie k e stisfe max(0, n b) k min(a, n).

wedi i dispersi suntX EX =

E(Xi ) = np; D2 (X) = np(1 p)


i=0

Observaia 2.39 @iA h (Xk )k=0,n B(1, n)D u p =

a+bn
F
a+b1

@vFF dependente stohstiAD tuni

a
a+b

Xi H(n, a, b).

X=
i=1

D2 (Xi )D deoree (Xi )i

n zul shemei ilei nereveniteD nu mi putem srie eglitte ntre D2 (X) i


i=0

nu sunt independente stohstiF


@iiA

entru N = a + b

nD putem fe proximre

a+bn
a+b1

D2 (X) np(1 p) 1

a+bn
a+b

=1

n
ND

de unde

n
.
N

@PFRPA

yservm reprtiiile inomil i hipergeometri u eei medieD ns dispersiile difer prin termenul
N n
N 1 F

n zul n re numrul de ile este mult mi mre det numrul de extrgeri @N

est termen devine proximtiv 1

n
N

nAD tuni

F n plusD d N este forte mreD tuni trend N n

@PFRPAD gsim i dispersiile elor dou reprtiii oinidF gu lte uvinteD nd numrul de ile din urn
este forte mreD nu mi ontez d extrgere ilelor se fe u repetiie su nuF eest fpt l vom
utiliz n eori seleieiD nd extrgerile se f dintrEo oletivitte de volum forte mreF
@SA Repartiia Poisson13 , P()

@poissA

lorile sle reprezint numrul evenimentelor spontne @u intensitte A relizte ntrEun numit intervl
de timpF entru un > 0D spunem X P() @lege evenimentelor rreA d X i vlori nturleD u
proilitile

P (X = k) = e

k
, k N.
k!

E(X) = ; D2 (x) = F
@TA Repartiia geometric, Geo(p)

@geoA

lorile sle reprezint numrul de insuese vute pn l oinere primului suesD


stiind proilitte de oinere unui suesD pF
13

Simon-Denis Poisson (1781 1840), matematician i zician francez, student al lui Laplace

50

Capitolul 2. Elemente de Teoria probabilitilor

punem X Geo(p),

(p (0, 1)) d X i vlori n ND u proilitile

P (X = k) = p(1 p)k ,
E(X) =

pentru orie k N,

unde p 0.

1p
1p
F
; D2 (X) =
p
p2

Observaia 2.40 h X Geo(p)D tuni vriil letore Y = X + 1 reprezint ateptarea pn la


primul succesF
@UA Repartiia binomial cu exponent negativ, BN (m, p)

@nbinA

lorile sle reprezint numrul de insuese oinute ninte de se reliz suesul de rng mF
n zul prtiulr m = 1D oinem reprtii geometriF
entru m 1, p (0, 1)D spunem X BN (m, p) d X i vlorile {mD m + 1D m + 2, . . . }D u
proilitile
m1
P (X = k) = Cm+k1 pm (1 p)k , k m, p 0.

wedi i dispersi suntX E(X) =

m(1 p)
m(1 p)
; D2 (X) =
F
p
p2

2.14 Exemple de repartiii continue


@IA Repartiia uniform, U(a, b)

@unifA

FF X U(a, b) (a < bA d funi s de densitte este

f (x; a, b) =

E(X) =

1
ba

, d x (a, b)

, ltfel.

a+b
(b a)2
, D2 (X) =
F
2
12

Exemplu: elegere l ntmplre unei vlori din intervlul (0, 1)D n zul n re orie vlore re eei
ns de ( lesD urmez o reprtiie U(0, 1)F gomnd rand din

Matlab relizez est experiment

@vezi pitolul urmtorAF


@PA Repartiia normal, N (, )

@normA

punem X N (, ), d X re densitteX

f (x; , ) =

(x)2
1
e 22 , x R.
2

E(X) = i D2 (X) = 2 F
e mi numete i reprtii gussinF n zul = 0, 2 = 1 densitte de reprtiie devineX
x2
1
f (x) = e 2 , x R.
2

@PFRQA

51

2.14. Exemple de repartiii continue


n est z spunem X urmez repartiia normal standardD N (0, 1)F

qr(ul densitii de reprtiie pentru reprtii norml este clopotul lui Gauss @vezi pigur PFPAF hin
gr( @pentru = 1AD se oserv mjoritte vlorilor nenule le reprtiiei normle stndrd se ) n
intervlul ( 3, + 3) = (3, 3)F eest (rmie se pote demonstr u jutorul reliei @PFPWAF

Figura 2.2: Clopotul lui Gauss pentru X N (0, ),

( = 1, 2, 3)

h Z N (0, 1)D tuni X = Z + N (, )F n mod similrD d X N (, )D tuni Z =

N (0, 1)F entru o vFF N (0, 1) funi de reprtiie este telt @vlorile ei se gses n teleA i re o
notie speilD (x)F i e de(nit prinX
x

1
(x) =
2

y2
2

dy.

@PFRRA

x R.

@PFRSA

puni de reprtiie lui X N (, ) este dt prin

F (x) = (

x
),

@QA Repartiia log-normal, logN (, )

@lognA

eprtii logEnorml este forte util n wtemtiile pinnireD reprezentnd o reprtiie de preuri
viitore pentru un tiv (nnirF h X N (, )D tuni Y = eX este o vFF nenegtivD vnd
densitte de reprtiie

f (x; , ) =

1
e
x 2

(ln x)2
2 2

, d x > 0
, d x 0

0
edrD Y logN (, ) d ln Y N (, )F
wedi i dispersi sunt dte de E(X) = e+
@RA Repartiia exponenial, exp()

/2

D2 (X) = e2+ (e 1)F


@expA

lorile sle sunt timpi relizi ntre dou vlori spontne reprtizte P()F

52

Capitolul 2. Elemente de Teoria probabilitilor

punem X exp() ( > 0) d re densitte de reprtiie

ex

wedi i dispersi suntX E(X) =

, d x > 0

f (x; ) =

, d x 0

1
1
i D2 (X) = 2 F

Observaia 2.41 eprtii exponenil stisfe propriette Enumitei lips de memorieD iFeFD
P ({X > x + y}|{X > y}) = P ({X > x}), x, y 0.
iste uni distriuie ontinu u est proprietteF histriui geometri stisfe o vrint disret
estei proprietiF Vericai!

@SA Repartiia Gamma, (a, )

@gamA

y vFF X (a, )D a, > 0D d densitte s de reprtiie esteX

f (x; a, ) =

a
a1 x
e
(a) x

D d x > 0,
D d x 0.

0
unde este funi lui iulerD

: (0, ) (0, ),

xa1 ex dx.

(a) =
0

wedi i dispersi suntX E(X) =

a
a
, D2 (X) = 2 .

Observaia 2.42 @iA (1, ) exp()F

@iiA h vFF {Xk }k=1,n exp() sunt independente stohstiD tuni sum lor

Xk (n, )F
k=1

@TA Repartiia Weibull14 , W bl(k, )

@wblA

eest reprtiie este semntore u reprtii exponenil @est oinnduEse n zul prtiulr

k = 1A i pote model reprtii mrimii prtiulelorF gnd k = 3.4D distriui eiull este semnE
tore u e normlF gnd k D est reprtiie se propie de funi lui hirF
om spune X W bl(k, ) (k > 0, > 0) d re densitte de reprtiie

f (x; k, ) =

x k
x k1 ( )
e

0
wedi pentru reprtii X W bl(k, ) este E(X) = 1 +
14

, d x 0
, d x < 0.
1
F
k

Ernst Hjalmar Waloddi Weibull (1887 1979), matematician i inginer suedez

2.14. Exemple de repartiii continue


@UA Repartiia 2 , 2 (n)

53

@chi2A

y vFF X 2 (n) @se itete repartiia hi-ptrat cu n grade de libertateA d densitte s de reprtiie
esteX

f (x; n) =

1
n
( n )2 2
2

x 2 1 e 2

D d x > 0,
D d x 0.

unde este funi lui iulerF qr(ul estei reprtiii @pentru diverse vlori le lui nA este reprezentt
n pigur PFQF
wedi i dispersi suntX E(2 ) = n, D2 (2 ) = 2n.

Observaia 2.43 @A
@A

1
eprtii 2 (n) esteD de fptD reprtii ( n , 2 )F
2

h vFF independente Xk N (0, 1) pentru k = 1, 2, . . . , nD tuni


2
2
2
X1 + X2 + + Xn 2 (n).

n prtiulrD d X N (0, 1)D tuni X 2 2 (1)F

Figura 2.3: Repartiia 2 (n) pentru patru valori ale lui n.

@VA Repartiia Student (W. S. Gosset15 ), t(n)

@tA

punem X t(n) @u n grde de liertteA d densitte de reprtiie esteX

n+1
2
f (x; n) =
n n
2
E(X) = 0, D2 (X) =
15

x2
1+
n

n+1
2

x R.

n
.
n2

William Sealy Gosset (1876 1937), statistician britanic, care a publicat sub pseudonimul Student

54

Capitolul 2. Elemente de Teoria probabilitilor

@WA Repartiia Fisher16 , F(m, n)

@fA

punem X F(m, n) @u m, n grde de liertteA d densitte de reprtiie esteX

m
( m ) 2 ( m+n ) m 1
2
n
x2
1+
( m )( n )
2
2
f (x) =

0
E(X) =

m
n

m+n
2

x > 0;

x 0.

n
2n2 (n + m 2)
, D2 (X) =
.
n2
m(n 2)2 (n 4)

@IHA Repartiia Cauchy17 , C(, )

@fr orespondent n

MatlabA

punem X C(, ) d densitte de reprtiie esteX

f (x; , ) =

,
[(x )2 + 2 ]

x R.

x dmite medieD dispersie su momente333

2.15 Transformri funcionale de variabile aleatoare


Funcii de o variabil aleatoare
resupunem X este o vriil letore ontinuD rei i se unote densitte de reprtiieD fX (x)F
xotm u FX (x) funi s de reprtiieF
pie g(x) este o funie msuril @forelAF etuni Y = g(X) de(nete o lt vriil letoreF horim
s gsim densitte de reprtiie pentru g(X)F notm u DY = {x R; g(x) y}F utem srieX

{Y y} = {g(X) y} = { , X() DY }

not

( = {X DY }).

etuniD

FY (y)

= P (X DY ),
=

fX (x) dx.

@PFRTA

DY
not

h g(x) este ijetiv i x = h(y) = g 1 (y)D tuni densitte de reprtiie lui Y este dt deX

fY (y) = fX (h(y))

dh(y)
.
dy

Exemplu 2.44 gonsiderm funi


g(x) = ax + b, a = 0.
16
17

Sir Ronald Aylmer Fisher (1890 1962), statistician, eugenist, biolog i genetician britanic
Augustin Louis Cauchy (1789 1857), matematician francez

@PFRUA

2.15. Transformri funcionale de variabile aleatoare

55

h fX (x) este densitte de rprtiie unei vriile letore X D tuni densitte de reprtiie
vriilei letore Y = g(X) este

fY (y) =

1
fX
|a|

yb
a

Funcii de dou variabile aleatoareX


pie X, Y vriile letore rele de(nite pe mpul de proilitte (, F, P )F

Deniia 2.45 y funie fX,Y (x, y) se numete densitate de repartiie bivariat dX


(i)

fX,Y (x, y) 0,

pentru orie x, y R;

@PFRVA

@PFRWA

fX,Y (x, y) dx dy = 1.

(ii)

n est zD funi F (x, y) = P (X x, Y y) =

repartiie bivariatF

fX,Y (u, v) du dv se numete funcie de

h f (x) este densitte de reprtiie lui X i g(y) este densitte de reprtiie lui Y D ir X, Y sunt
independente stohstiD tuni
vetorul idimensionl V = (X, Y ) re densitte de reprtiie fX,Y (x, y) = f (x)g(y).
snversD d fX,Y (x, y) = f (x)g(y)D tuni X, Y sunt independente stohstiF
n zul generl @n re X i Y nu sunt independenteAD d fX,Y (x, y) este densitte de reprtiie
vetorului idimensionl V = (X, Y )D tuni densitile de reprtiie lui X D respetiv Y D suntX

fX,Y (x, y) dy iD respetivD g(y) =

f (x) =
R

fX,Y (x, y) dx.

@PFSHA

rmtore propoziie determin re este densitte de reprtiie unei funii de un vetor letor e
re densitte de reprtiie unosutF

Propoziia 2.46 pie vetorul letor V = (X1 , X2 ) : R2 D de tip ontinuuD u densitte de reprtiie
unosutD f (x)D f : D2 V () R i (e vetorul letor W = (Y1 , Y2 ) : R2 D de tip ontinuuD
u densitte de reprtiie neunosut g(x)D g : D1 W () RD @D1 , D2 EdeshiiAF pie funi

: D1 D2 D ijetivD de ls C 1 F etuni re loX


g(y1 , y2 ) = f (1 (y1 , y2 ), 2 (y1 , y2 ))|J|,
unde

x1 = 1 (y1 , y2 ), x2 = 2 (y1 , y2 ), J =

@PFSIA

(x1 , x2 )
x1 x2
x1 x2
=

.
(y1 , y2 )
y1 y2
y2 y1

Observaia 2.47 utem poi determin i densitile de reprtiie mrginle pentru Y1 i Y2 F estfelD
este formule u pliii determinre formulei densitii de reprtiie pentru sumD produsulD diferE
en su tul dou vriile letoreF

56

Capitolul 2. Elemente de Teoria probabilitilor

Exemplu 2.48 (repartiia raportului a dou variabile aleatoare)


pie vetorul letor (X, Y )D e re densitte de reprtiie f (x, y) i (e trnsformreX

u = x/y;
v = y.
rnsformre invers esteX

x = u v = 1 (u, v);
y = v = (u, v).
2

toinul trnsformrii este J =

(x, y)
(u, v)

= v F qsim densitte de reprtiie tului

X
Y D

f (u v, v) |v| dv.

f X (u) =
Y

@PFSPA

2.16 Tipuri de convergen a irurilor de variabile aleatoare


pixm (, F, P ) un mp de proilitte i Xn , X : R o vriil letore u medi m i dispersi

2 (niteF

Deniia 2.49 punem X


@IA

Xn converge aproape sigur la X @nott Xn X A d


a.s.

P ( lim Xn = X) = 1,
n

ehivlent u reli

0 F, P (0 ) = 1, stfel nt lim Xn () = X(), 0 .


n

@PA

prob

Xn converge n probabilitate la X @nott Xn X AD d


> 0, lim P ({ : |Xn () X()| }) = 0.
n

@QA

Lr

Xn converge n medie de ordin r la X @nott Xn X AD d


|Xn () X()|r dP () = 0,

lim

ehivlent u

|xn x|r f (x)dx = 0.

lim

@RA

R
rep

Xn converge n repartiie l X @nott X, su Xn X A d


lim E(g(Xn )) = E(g(X)), g : Rd R, ontinu i mrginit.

57

2.17. Teoreme limit


@SA

Xn converge la X n sensul funciei de repartiie d


lim FXn (x) = FX (x), x punt de ontinuitte pentru FX .

@TA

Xn converge la X n sensul funciei caracteristice d


lim Xn (t) = X (t), t Rd .

Teorema 2.50 (legturi ntre diverse tipuri de convergen)


(a)
(b)

Lr

prob

Xn X impli Xn X @din ineglitte lui wrkovA.


(c)

@dA

prob

a.s.

Xn X impli Xn X.

prob

Xn X impli Xn X.

rmtorele tipuri de onvergen sunt ehivlenteX onvergen n reprtiieD onvergen n funie

de reprtiie i onvergen n funie rteristiF

2.17 Teoreme limit


pie (, F, P ) un mp de proilitte i X : (, F, P ) R o vFF e nregistrez rezulttele posiile
unui numit experiment letorF utem model repetii estui experiment prin introduere unui ir de
vFFD (Xn )nN : (, F, P ) RF xeEm dori est ir s dein eei informie @din punt de vedere
proilistiA i X F n est sopD introduem noiune de vriile letore identi reprtizteF

Deniia 2.51 riilele letore X1 , X2 , . . . , Xn , . . . se numes identic repartizate d funiile


orespunztore de reprtiie stisf irul de eglitiX

FX1 (x) = FX2 (x) = . . . = FXn (x) = . . . ,

x R.

@PFSQA

hD n plusD presupunem vFF din irul de mi sus sunt independente stohstiD tuni putem privi
est ir de vFF un model pentru repetri independente le experimentului n elesi ondiiiF hei
vem deE fe u un ir de funii u e iu vlori ntmpltoreD sum unui numr su(ient de mre de
vriile letore i pierde rterul letorF

eoremele limit lsie desriu omportre simptoti sumei Sn =

Xk D potrivit normliztF
k=1

punem irul (Xn )n urmez legea slab @respetivD tareA a numerelor mari dX

Sn E(Sn ) a.s.
Sn E(Sn ) prob
0, (respetivD
0),
n
n

(n )

n eori roilitilor exist mi multe rezultte re stiles ondiiile n re un su ellt dintre


legile nteriore u loF rezentm n ontinure dor ele mi importnte dintre eleD i numeX teoremele
lui geev i rininD pentru lege slD i teorem lui uolmogorov pentru lege treF

Teorema 2.52 (Cebev)


h vFF (Xn )nN stisf ondiiileX

58

Capitolul 2. Elemente de Teoria probabilitilor


@iA

tuni

tote Xn dmit momente solute de ordin 2 @iFeFD 2 (Xn ) < AY


1
@iiA lim 2 D2 (Sn ) = 0D
n n

Sn E(Sn ) prob
0,
n

nd n .

Demonstraie. gonform ineglitii lui geev plite vriilei letore


P(

Sn
E
n

Sn
n

1 2
D
2

Sn
n

Sn
D vemX
n

1 1 2
D (Sn ) 0,
2 n2

nd n .

Observaia 2.53 n plusD d Xn sunt identi reprtizteD u E(Xn ) = m, n ND tuni onluzi


nterior devineX

Sn prob
m.
n

estfelD teorem ne spune D dei vriilele letore independente pot lu vlori deprtte de mediile lorD
medi ritmeti unui numr su(ient de mre de stfel de vriile letore i vlori n veintte
lui mD u o proilitte forte mreF

Teorema 2.54 (Teorema lui Bernoulli)


onsiderm o experien n re proilitte de relizre unui eveniment A este P (A) = pF e f

N experiene independenteF h N este numrul de relizri le lui A din ele N experiene tuniD
pentru orie > 0D vemX

lim P

N
p < = 1.
N

@PFSRA

gu lte uvinteD irul frevenelor reltive onverge a.s. l proilitte pF est nsemn D d se
efetuez o seleie de volum mre N i se oin N zuri fvorileD tuni putem (rm D a.s.D
proilitte evenimentului erett este egl u freven reltivF

Demonstraie. om soi (erei experiene i o vriil letore Xi D stfel nt

1,
Xi =
0,

d n experien i evenimentul A sE relizt;


d experien i evenimentul A nu sE reliztF

yservm Xi B(1, p)F etuniD deoree experimentele sunt independenteD vemX


n

Xi = N B(n, p), E(N ) = N p,

D2 (N ) = N p(1 p).

i=1

eplind ineglitte lui geev vriilei letore

N
N
E
N
N

ehivlent u

N
D oinemX
N

< 1

D2

N
N
2

N
p(1 p)
p < 1
,
N
N 2

59

2.17. Teoreme limit


de unde onluzi doritF

Teorema 2.55 @rinin18 A (legea slab a numerelor mari)


h Xn , n 1D sunt vriile letore e dmit momente solute de ordin 1D sunt independente dou
te dou i identi reprtizteD tuni irul (Xn )n urmez lege sl numerelor mriD iFeFD

1
n

n
prob

Xk E(X1 ), (n ).

@PFSSA

k=1

Teorema 2.56 @uolmogorovA (legea tare a numerelor mari)


pie irul de vFF (Xn )nN D independenteD sunt identi reprtizte i E(|X1 |) < F
pie E(Xn ) = m, n N F etuni irul (Xn )n stisfe lege tre numerelor mriD diX

1
n

n
a.s

@PFSTA

Xk m, (n ).
k=1

Observaia 2.57 gonluzi legii sle numerelor mri se mi pote srie i su formX
P

lim

X1 + X2 + + Xn
=m
n

= 1.

Teorema 2.58 @vgA (teorema limit central)


h vFF (Xn )nN sunt independente i identi reprtizteD u m i 2 (niteD tuniX
n

Y N (0, 1), pentru n .

Xk nm
k=1

Observaia 2.59 @A eorem vg ne spune D d vem un ir de vFF independente stohsti i


identi reprtizteD tuniD pentru n su(ient de mreD sum stndrdiztD

Sn =
este o vFF de reprtiie N (0, 1)F
uD mi putem spune distriui vFF X =

1
n

@A xotm u
not

Zn =

Sn nm

n
n

k=1

@PFSUA

Xk este proximtiv norml N (m, )F


n
n

Xk nm .
k=1

etuniD onvergen din teorem limit entrl este ehivlent u

lim P (Zn x) = (x), x R,

@PFSVA

unde (x) este de(nit n @PFRRAD su

lim P

18

Sn nm

b
n

1
=
2

ex dx = (b) (a).
a

Aleksandr Yakovlevich Khinchin (1894 1959), matematician rus

@PFSWA

60

Capitolul 2. Elemente de Teoria probabilitilor

@A h m = 0, 2 = 1D tuni vg devine

Xk Y N (0, 1), pentru n .


k=1

@A vg ne permite s proximm sume de vFF identi reprtizteD vnd orie tip de reprtiii @tt timp
t vrii lor e (nitAD u o vFF normlF n exemplu r ( proximre reprtiiei normle u reprtii
inomil nd numrul de nerri e forte mre @vezi teorem lui de Moivre-Laplace de mi josAF
e pune prolemX Ct de mare ar trebui s e n, n practic, pentru c teorema limit central s e

aplicabil? h vriilele letore {Xk }k sunt dej norml reprtizteD tuni teorem proximre
sumei stndrdizte u o vriil norml esteD de fptD o eglitteD (ind devrt pentru orie n N F
h {Xk }k nu sunt norml reprtizteD tuni un numr n stfel nt n 30 r ( su(iient pentru
proximre u reprtii norml deiD d reprtii lui Xk este simetriD proximre r pute ( un
i pentru un numr n mi mi de 30F
@dA vege tre numerelor mri e forte util n metode de simulre tip wonte grlo @vezi eiune QFRAF

Teorema 2.60 @de woivre19 E vpleA


pie X1 , X2 , . . . , Xn , . . . un ir de vFF independente stohstiD identi reprtizte B(1, p) i (e Sn =

X1 + X2 + + Xn F etuniD pentru orie < a < b < D vemX


lim P

Sn np
b
a
npq

1
=
2

ex dx.

(q = 1 p)

@PFTHA

Demonstraie. hemonstri rezult imedit din @PFSWAD innd ont


E(Sn ) = np i D2 (Sn ) = npq.

Observaia 2.61 @IA edrD d prmetrul n este su(ient de mreD tuni o reprtiie inomil
pote ( proximt u un normlD u medi np i dispersi npq F n prtiD

proximre este un su(ient de un d np 5 i n(1 p) 5Y


est proximre pote ( muntit d plim ftori de oreieF
utem proxim funi de reprtiie reprtiiei inomile prinX

P (X k) =

1
k + 2 np

npq

@PFTIA

unde este funi de reprtiie pentru reprtii norml stndrdD iFeFD

1
(x) =
2
ermenul

1
2

y2
2

x R.

din @PFTIA este folosit o vlore de justre nd se fe proximre unei vriile letore

disrete u un ontinuF
19

dy,

Abraham de Moivre (1667 1754), matematician francez

61

2.18. Exerciii rezolvate

n eli modD putem proxim funi de proilitte reprtiiei inomile folosind densitte reprE
tiiei normle stndrdX

P (X = k) =
unde (x) =

d
dx (x)

k np

npq

npq

@PFTPA

este densitte de reprtiie reprtiiei normle stndrdF

y vrint muntit proximrii @PFTPA esteX

= P
=
@PA

1
1
<X <k+ )
2
2
k + 1 np
k 1 np
X np
<
<
2
2
npq
npq
npq

= P (k

P (X = k)

1
k + 2 np

npq

1
k 2 np

npq

n generlD d dorim s proximm o reprtiie disret @e re medi i dispersi 2 A u un

normlD tuni sriemX

P (X k) =
i

P (X = k) =

k+

1
2

@PFTQA

@PFTRA

2.18 Exerciii rezolvate


Exerciiu 2.62 y moned idel este runt de 100 de oriD ir X este vriil letore e reprezint
numrul de fee u stem pruteF

(a)

gre este proilitte de oine ext 52 de stemec

(b)

se luleze P (45 X 55)F polosii proximre u o vriil letore normlF

Soluie:

@A

evem de lult P = P (X = 52)F ns X este o vriil letore distriuit B(100, 0.5)D

dr rezulttul ext esteX


52
P = C100 (0.5)52 (0.5)48 = 0.0735.

h proximm rezulttul folosind formul @PFTQAD oinemX

P =

100 0.5 0.5

52 50
100 0.5 0.5

0.0737.

gu vrint muntitD oinemX

P =

52 + 1 50
2
25

1
52 2 50

25

0.0736.

62

Capitolul 2. Elemente de Teoria probabilitilor

@A xotm u FX funi de reprtiie pentru vriil letore inomil X F etuniD

P (45 X 55)

= P (X 55) P (X < 45)


=

FX (55) FX (44)
55
k
C100 (0.5)k (0.5)100k = 0.7287.

=
k=45

h folosim proximre u reprtii normlD oinemX

P (45 X 55)

1
55 + 2 50

25

1
45 2 50

25

= 0.7287.

MatlabD este proiliti pot ( lulte folosind odul din ixeriiul QFIU din pitolul urmtorF

Exerciiu 2.63 (a) n mgzinul de l olul strzii intr n medie 20 de lieni pe orF tiind numrul
lienilor pe or este o vriil letore reprtizt oissonD s se determine re este proilitte
ntrEo numit or s intre n mgzin el puin 15 lienic

(b) gre este proilitte D ntrEo numit zi de luru @de 10 oreAD n mgzin s intre el puin 200 de
lienic gluli est proilitte n dou moduriX folosind funi de reprtiie oisson i folosind
proximre u reprtii normlF

Soluie:

@A roilitte este P1 = P (X 15) = 1 P (X < 14) = 1 FX (14) = 0.8951F


10

10

10

@A P2 = P (

Xk 200) = 1 P (

Xk < 199) = 1 F

Xk (199)

k=1

k=1

k=1

eproximnd u reprtii normlD gsim

P2 = 1

199 + 0.5 200

200

Xk P(200)F

= 0.5094, unde

=1

0.5

200

= 0.5141.

MatlabD este proiliti pot ( lulte folosind odul din ixeriiul QFPP din pitolul urmtorF

Exerciiu 2.64 n eten turmentt ple de l r spre sF presupunem puntul de plere


este puntul O de pe x orizontl i se mi dor pe est x stfelX n (ere unitte de timpD
est ori fe un ps l stngD u proilitte 0.5D ori fe un ps l dreptD u proilitte 0.5D
independent de pii nterioriF polosind eorem limit entrlD estimi proilitte D dup 100 de
piD est nu juns l mi mult de doi pi de puntul de plereF

Soluie:

pie Xi vriil letore e reprezint psul pe re etenul l fe l momentul i @i NAF

triuim X = 1D d fe un ps l stngD i X = 1D d fe un ps l dreptF edrD X


este o vriil letore disret e pote lu dor dou vloriD 1 i 1D mele u proilitte 0.5F e
lulez u uurinD E(X) = 0 i D2 (X) = 1F untem interesi s )m e se ntmpl dup 100 de

63

2.18. Exerciii rezolvate


n

piF gonsiderm mi nti Sn =

Xi F etuniD
i=1
n

E(Sn ) =

E(Xi ) = 0

D2 (Sn ) =

i=1

D2 (Xi ) = n,
i=1

deoree {Xi }i=1, n sunt independenteF entru n 30D eorem limit entrl spune Sn N (0,

n)F

entru n = 100D S100 N (0, 10)F roilitte erut este @utilizm i reli @PFTQAAX

2+

P (|S100 | 2) = P (2 S100 2) =

1
2

10

1
2 + 2 0
10

= 0.1583.

Exerciiu 2.65 roilitte o numit pies produs de un strung s (e reut este p = 0.003F
tiliznd teorem woivreEvpleD s se evlueze proilitte dintrEun lot de 7000 de piese lute l
ntmplreD el mult 25 s (e reuturiF

Soluie:

xotm u Xi vriil letore re i vlore 0D d pies de rng i este un i X = 1D

d pies de rng i este reutF estfelD Xi B(1, 0.003)F heoree vriilele Xi sunt independenteD sum
7000

Xi B(7000, 0.003).

S7000 =
i=1

evem de lult proilitte P (S7000 25)F eproximre folosind eorem limit entrl este @utiE
lizm formul PFTIAX

25 + 1 7000 0.003
P (S7000 25) ( 2
7000 0.003 0.997

= 0.8373.

e de lt prteD folosind formul extD oinemX


25
k
C7000 pk (1 p)7000k = 0.8380.

P (S7000 25) =
k=1

Exerciiu 2.66 he te ori v treui s runm un zr oret pentru D u proilitte 0.98D tere
frevenei reltive feei u se punte de l p =

Soluie:

1
6

s (e ntre 0.05 i 0.05c

gutm n stfel nt

0.05

n
1
0.05
n
6

= 0.98.

@PFTSA

xe teptm vlore lui n s (e mreD dei putem pli eorem limit entrlF heoree freven
solut n re medi E(n ) = n p i D2 (n ) = n p q D plind vgD vem vriil letore stndrdE
izt

n np
N (0, 1).

npq

64

Capitolul 2. Elemente de Teoria probabilitilor

polosind estD resriem eglitte @PFTSA stfelX

0.98

0.05 n

npq

0.05 n

npq

0.3

n
5

0.3

=
n
5

de unde 0.3

0.3

n
5

1 0.3

= 0.99 i 0.3

n
5

n
5
n
5

= 2 0.3

n
5

= z0.99 = 2.33 @until de ordin 0.99 pentru reprtii norml

stndrdF hin ultim eglitte gsim n 301F

Exerciiu 2.67 pie vriilele letore independente X i Y D mele reprtizte exp(1)F e ere densiE
tte de reprtiie vriilei letore Z =

Soluie:

X
F
Y

polosim formul @PFSPAF h f (x) este densitte de reprtiie pentru exponenilD tuni

vem

= f (x) f (y) exy , x > 0, y > 0,

1
|v| euvv dv =
, u > 0.
f X (u) =
Y
(1 + u)2

f (x, y)

2.19 Exerciii propuse


Exerciiu 2.1 gre este proilitte de oine el puin 60 stemeD runnd o moned idel de 100
oric gluli est proilitte i folosind proximre u reprtii normlF

Exerciiu 2.2 y moned idel este runt de n = 500 de ori i numrm @kA te steme u prutF
gluli proilitte Pn numrul k/n s se )e ntre vlorile 0.45 i 0.55F hetermini d inegliE
tte lui geev este stisfutF eproximi Pn folosind teorem limit entrlF

Exerciiu 2.3 e d vriil letore X P(10)F hetermini medi lui X i devii stndrdD
F gluli P (|X | 2) i ompri u ineglitte lui geevF

Exerciiu 2.4 riil letore X urmez distriui inomil u n = 50 i p = 0.15F gluli


P (X > 2) i proximi est vlore folosind teorem limit entrlF

Exerciiu 2.5 e d X B(n, 0.4)F


@iA h n = 50D gsii e mi mi vlore lui x pentru re P (X > x) < 0.05F
@iiA qsii e mi mi vlore lui n pentru re P (X = 0) < 0.01F

Exerciiu 2.6 e tie vFF X urmez reprtii geometri i P (X = 0) = 0.1F gluli P (X > 10)
i P (X < 7)F

Exerciiu 2.7 FF Y urmez reprtii geometriF h P (Y = 1) = 0.25 i P (Y = 2) = 0.15D


luli E(Y )F

65

2.19. Exerciii propuse


Exerciiu 2.8 h X B(10, 0.25)D luli P ( < X < + ) @ = E(X), = D2 (X)AF
Exerciiu 2.9 e tie Y B(n, p) re E(Y ) = 24 i D2 (Y ) = 8F qsii vlorile pentru n i pF

Exerciiu 2.10 n zr este runt pn se oine f u 6 punteF xotm u N numrul de runri


neesreF gre este vlore teptt lui N c hr vrinc

Exerciiu 2.11 y urn onine 49 de ile numerotte de l 1 l 49 i extrgem 6 ileF gluli proilE
itte de oine ext 4 ile u numr prF hetermini um est proilitte folosind proximre
u reprtii normlF

Exerciiu 2.12 y vriil letore de tip ontinuuD X D re E(X) = 5 i E(X 2 ) = 34F se gses o
limit inferior pentru proilitte P (2 < X < 8)F

Exerciiu 2.13 n f unui jutor de h de eli liruD re eveniment este mi proilX s tigi
3 prtide din 4 su s tigi 5 prtide din 8c

Exerciiu 2.14 se rte D d vriilele letore X1 , X2 , X3 , . . . , Xn sunt independenteD tuni


2
2
2
i vriilele letore X1 , X2 , X3 , . . . , Xn sunt independenteF

Exerciiu 2.15 notm u X numrul de ou depuse de o ufni uliu @Bubo BuboA ntrEun numit nF
X este o vriil letore e re reprtiiX
X:

0.1

0.1

0.3

0.5

entru (ere ouD proilitte din el s is un pui este 0.8D independent de tote elellte ouF
notm u Y numrul de pui e pr ntrEun ui lut l ntmplreF e ereX
@A

qsiie reprtii vriilei letore Y Y

@A

gluli E(Y ) i D2 (Y )F

@A

hetermini i reprezenti gr( funi de reprtiie vriilei letore X F

Exerciiu 2.16 n numite fmiliiD prinii ontinu s i opii pn u el puin te un opil de


(ere sexF presupunem proilitte de ve un opilD indiferent de sexD este 0.5F entru stfel
de fmiliiD gsiiX
@iA

proilitte de ve 4 opiiY

@iiA

vlore teptt numrului de opiiF

Exerciiu 2.17 erti D d n shem ilei revenite numrul de extrgeri n este forte mreD proE
ilitte p extrgerii unei ile le este forte mi ir produsul n p rmne onstntD tuni shem
oisson pote ( proximt prin shem inomilD iFeFD
k
lim Cn pk q nk =

n
p0

e k
,
k!

pentru orie k N.

=np

Exerciiu 2.18 pie X U(0, 1)F qsii i identi(i reprtii vriilei letore Y = ln X F

66

Capitolul 2. Elemente de Teoria probabilitilor

Exerciiu 2.19 xotm u Sn numrul de steme e pr l runre repett de n ori unei monede
ideleF polosii eorem limit entrl pentru proximX
@A

P (S100 > 57)Y

@A

P (473 < S1000 548)F

@A

istimi proilitte P (S50 = 25)F

Exerciiu 2.20 n zr este runt de 48 de oriF tilizi eorem limit entrl pentru proximX
@A

proilitte sum puntelor oinute s (e mi mre det 165F

@A

proilitte sum puntelor oinute s (e ntre 160 i 175F

Exerciiu 2.21 rintre ele n ilete de exmenD dor m sunt 4fvorile4 @iFeFD sunt preferte de studenii
exminiAF tudenii vin pe rnd i extrg te un iletD fr iletul extrs s mi (e reintrodus npoiF
hintre primii doi studeni re u extrs ileteD re re ns mi mre de trge un ilet 4fvoril4c

Exerciiu 2.22 pie X i Y dou vriile letore i = (X, Y ) este oe(ientul de orelieF se
determine oe(ientul de orelie dintre vriilele letore a X + b i c Y + d

(a, b, c, d R)F

Exerciiu 2.23 (formula local de woivreEvple) hemonstri D d p (0, 1), q = 1 p i xk =


knp

npq D

tuni
k
lim Cn pk q nk =
n

uniform pentru xk (a, b),

x2
1
k
e 2 ,
npq 2

(a, b < )F

Exerciiu 2.24 pie vriil letore X D rei densitte de reprtiie este unosutF e ere densitte
de reprtiie vriilei letore Y = X 2 F rtiulrizi pentru X N (0, 1)F

Exerciiu 2.25 erti reprtii 2 (n) este norml pentru n mre @u = n i 2 = 2nAF

Capitolul

Experiene aleatoare n
3.1 Scurt introducere n

Matlab

Matlab

Matlab este un phet omeril de progrme de nlt performn produs de The MathWorks, Inc.D
dedit lulului numeri i reprezentrilor gr(e n domeniul tiinelor i inginerieiF ilementul de z
u re operez

MatlabEul este mtrie @Matlab este ronim de l MATrix LABortoryAF Matlab

este un softwre stndrd n mediile universitreD preum i n domeniul eretrii i rezolvrii prtie
prolemelor legte de proesre semnlelorD identi(re sistemelorD lulul sttistiD prelurre dtelor
experimentleD mtemtii (nnireD mtemtii plite n diverse domenii etF ge mi importnt
rteristi

MatlabEului este uurin u re pote ( extinsF v progrmele dej existente n MatlabD

utiliztorul pote dug propriile sle oduriD dezvoltnd pliii spei(e domeniului n re lurezF

MatlabEul inlude pliii spei(eD numite ooloxEuriF eeste sunt oleii extinse de funii Matlab
@(iere wA re dezvolt mediul de progrmre de l o versiune l ltD pentru rezolv proleme din
domenii vriteF truturlD

MatlabEul este relizt su form unui nuleu de zD u interpretor propriuD

n jurul rui sunt onstruite tooloxEurileF


rezentm mi jos o surt introduere n

Matlab priniplelor funii i omenzi folosite n est

lurreF entru o trtre mi detlitD putei onsult un mnul de utilizre su WF polosind omnd

demo din Matlab D putei urmri o demonstrie priniplelor filiti din MatlabD t i phetelor
de funii @toolboxA de re i pute ( interesiF hintre esteD mintim Statistics ToolboxD re este o
oleie de funii folosite pentru nlizD modelre i simulre dtelorF gonineX nliz gr(elor @qsAD
diverse reprtiii proilistie @etD inomilD oissonD 2 AD generre numerelor letoreD nliz
regresionlD desrieri sttistieF
gomenzile

Matlab pot ( srise n (iere u extensi .mD e urmez poi ( ompilteF n (ierEm

onst dintrEo suesiune de instruiuniD u posiilitte pelrii ltor (iereEw preum i pelrii
reursiveF he semeneD

Matlab pote ( folosit pe un mediu omputionl intertivD z n

re (ere linie este prelurt imeditF ydt introduse expresiileD este pot ( vizulizte su
evlute imeditF he exempluD introdund l lini de omnd

>> a = sqrt((sqrt(5)+1)/2)

67

68

Capitolul 3. Experiene aleatoare n Matlab

Matlab de(nete o vriil de memorie aD rei i triuie vlore


a =

1.2720
riilele sunt de(nite u jutorul opertorului de triuireD =D i pot ( utilizte fr delr
de e tip suntF lore unei vriile pote (X o onstntD un ir de rtereD pote reiei din
lulul unei expresii su l unei funiiF

entru gsi informii imedite despre vreo funie prede(nitD omnd help v vine n jutorF
he exempluD

>> help length


(ez urmtoreleX

LENGTH
Length of vector.
LENGTH(X) returns the length of vector X. It is equivalent
to MAX(SIZE(X)) for non-empty arrays and 0 for empty ones.
See also numel.
gomnd help pote ( utilizt dor d se unote ext numele funieiF eltfelD folosire omenE
zii lookfor este reomndtF he exempluD omnd

>> lookfor length


produeX

NAMELENGTHMAX Maximum length of MATLAB function or variable name.


VARARGIN Variable length input argument list.
VARARGOUT Variable length output argument list.
LENGTH
Length of vector.

Matlab este un mediu omputionl orientt pe luru u vetori i mtrieF y linie de od de form
>> v = [1,3,5,7,9]

sau

v = [1 3 5 7 9]

de(nete un vetor linie e re omponentele 1, 3, 5, 7, 9F eest pote ( relizt i folosind oE


mnd v = 1:2:9 di (ez numerele de l 1 l 9D u psul 2F entru un vetor olonD folosim
puntEvirgul ntre elementeD di

>> v = [1;3;5;7;9]

% vector coloana

69

3.1. Scurt introducere n Matlab


y lt vrint de de(ni un vetor este

>> v = linspace(x1,x2,n)
di v este un vetor linie u n omponenteD l intervle egle ntre x1 i x2F

he(nire mtrielor se pote fe prin introduere expliit elementelor sle su prin instruiuni
i funiiF v de(nire expliitD treuie inut ont de urmtoreleX elementele mtriei sunt uprinse
ntre prnteze drepte @[ ]AD elementele unei linii treuie seprte prin spii liere su virguleD liniile
se sepr prin semnul puntEvirgulF he exempluD omnd

>> A = [1 2 3; 4, 5, 6]
de(nete mtrie

A =
1
4

2
5

3
6

epelul elementelor unei mtrie se pote fe prin omenzile A(i,j) su A(:,j) @elementele de
olon j A su A(i,:) @elementele de lini iAY

puni

Matlab ones(m,n) de(nete o mtrie mnD vnd tote omponentele egle u 1F puni

zeros(m,n) de(nete o mtrie zero m nF puni eye(n) de(nete mtrie unitte de ordin nF
hup um vom vede mi josD

Matlab permite de(nire unor funii forte omplite prin sriere

unui odF h funi e o vem de de(nit este un simplD tuni vem vrint utilizrii omenzii

inlineF pre exempluD de(nim funi f (x, y) = e5x sin 3y X


>> f = inline('exp(5*x).*sin(3*y)')
f =
Inline function:
f(x,y) = exp(5*x).*sin(3*y)
utem poi lul f (7, ) prin

>> f(7,pi)
0.5827
n progrm

Matlab pote ( sris su form (ierelor script su (ierelor de tip funcieF emele

tipuri de (iere sunt srise n formt egssF eeste tipuri de (iere permit rere unor noi funiiD
re le pot omplet pe ele dej existenteF n (ier script este un (ier extern re onine o seven
de omenzi

MatlabF

rin pelre numelui (ieruluiD se exeut seven

Matlab oninut n

estF hup exeui omplet unui (ier sriptD vriilele u re est opert rmn n
zon de memorie pliieiF piierele sript sunt folosite pentru rezolvre unor proleme re er

70

Capitolul 3. Experiene aleatoare n Matlab


omenzi suesive tt de lungiD nt r pute deveni greoie pentru lurul n mod intertivD di
n modul linie de omndF

entru introdue dte n

MatlabD putem opi dtele diret ntrEun (ier MatlabD prin de(nire unui

vetor su unei mtrie de dteF he exempluD urmtorele dte u fost introduse prin 4opyEpste4 n
mtrie dataX

>> data =
21.3 24.1
18.4 20.5
22.1 16.6
];
htele din

[
19.9 21.0
17.5 23.2
23.5 19.7

% atribuirea valorilor matricei data


% prima linie a datelor copiate
% ultima linie a datelor copiate
% inchidem paranteza ce defineste matricea de date

Matlab pot ( slvte stfelX

>> cd('c:\fisierul_de_lucru');
>> save Timpi_de_reactie data;

% alegem fisierul unde salvam datele


% salveaza in fisierul Timpi_de_reactie.mat

htele pot ( renrte folosind omnd

load Timpi_de_reactie
Timpi_de_reactie

% incarca datele din fisier


% afiseaza datele incarcate

Fiierele funcie

Matlab rez drul propie extinderii funiilor sleD prin posiilitte rerii de noi (iereF estfelD d

prim linie (ierului .m onine uvntul functionD tuni (ierul respetiv este delrt (ind (ier
funieF riilele de(nite i mnipulte n interiorul (ierului funie sunt lolizte l nivelul esteiF

rin urmreD l terminre exeuiei unei funiiD n memori lultorului nu rmn det vriilele de
ieire le esteiF porm generl primei linii unui (ier esteX

function[param_iesire] = nume_functie(param_intrare)
undeX

function este este uvntul re delr (ierul (ier funieY


nume_functie este numele funieiD re este totun u numele su re se slvez (ierulY
param_iesire sunt prmetrii de ieireY
param_intrare sunt prmetrii de intrreF
gomenzile i funiile re sunt utilizte de nou funie sunt nregistrte ntrEun (ier u extensi .mF

Exemplu 3.1 pisierul medie.m lulez medi ritmeti sumei ptrtelor omponentelor unui vetor
X @lterntivD est luru pote ( relizt prin omnd mean(X.^2)AX

3.2. Generarea de numere (pseudo-)aleatoare

71

function m2 = medie(X)
n = length(X); m2 = sum(X.^2)/n;

MatlabEul inlude pliii spei(eD numite ooloxEuriF eeste sunt oleii extinse de funii Matlab
@(iereEmA re dezvolt mediul de progrmre de l o versiune l ltD pentru rezolv proleme din
domenii vriteF Statistics Toolbox reprezint o oleie de funii folosite pentru nlizD modelre i
simulre dtelor i onineX generre de numere letoreY distriuiiD nliz gr( intertiv @qsAD
nliz regresionlD desrieri sttistieD teste sttistieF
n elul QFP m dunt tev omenzi utile n

MatlabF

3.2 Generarea de numere (pseudo-)aleatoare


xumerele generte de

Matlab sunt rezulttul ompilrii unui progrm dej existent n MatlabD dr

el vor ( pseudo-aleatoareF utem fe strie de modul progrmt de generre le estor numere i s


onsiderm este sunt numere letoreF

3.2.1 Generarea de numere uniform repartizate ntr-un interval, U(0, 1)


Funcia rand
puni rand generez un numr letor reprtizt uniform n [0, 1]F
he exempluD omnd
a (rand < 0.5)
simulez runre unei monede ideleF wi putem spune numrul X stfel genert este un
numr letor reprtizt B(1, 0.5)F

he semeneD numrul
a sum(rand(10,1) < 0.5)
urmez reprtii B(10, 0.5) @simulre 10 runri le unei monede ideleAF

rand(m, n) generez o mtrie letore u m n omponente reprtizte U(0, 1)F


gomnd a + (b a) rand generez un numr pseudoEletor reprtizt uniform n [a, b]F
polosind omnd s = rand('state')D i se triuie vriilei s un vetor de 35 de elementeD
reprezentnd stre tul genertorului de numere letore uniform @distriuiteAF entru
shim stre urent genertorului su iniilizre luiD putem folosi omnd

rand(method, s)
unde method este metod prin re numerele letore sunt generte @est pote ( 'state'D

'seed' su 'twister'AD ir s este un numr nturl ntre 0 i 232 1D reprezentnd stre iniilE
iztoruluiF he exempluD

72

Capitolul 3. Experiene aleatoare n Matlab


rand('state', 125)
(xez genertorul l stre 125F

Observaia 3.2 rintrEo generre de numere letore uniform distriuite n intervlul (a, b) nelegem
numere letore re u eei ns de ( oriunde n (a, b)D i nu numere l intervle egleF
pigur QFI reprezint u histogrme dte uniform distriuite n intervlul [2, 3]D produse de omnd

MatlabX

hist(5*rand(1e4,1)-2,100)

Figura 3.1: Reprezentarea cu histograme a datelor uniforme.

3.2.2 Generarea de numere repartizate normal, N (, )


Funcia randn
puni randn generez un numr letor reprtizt norml N (0, 1)F
randn(m, n) generez o mtrie letore u m n omponente reprtizte N (0, 1)F
entru shim metod prin re sunt generte numerele letore normle su stre genertoruE
luiD folosim omndX

randn(method, s)
unde unde method este metod prin re numerele letore sunt generte @est pote ( 'state'
su 'seed'AD ir s este un numr nturl ntre 0 i 232 1D reprezentnd stre iniiliztoruluiF

gomnd m + randn generez un numr letor reprtizt norml N (m, )F he exempluD odul
urmtor produe pigur QFPX

3.2. Generarea de numere (pseudo-)aleatoare


x = 0:0.05:10;
y = 5 + 1.1*randn(1e5,1);
hist(y,x)

73

% date distribuite N (5, 1.1)

250

200

150

100

50

10

Figura 3.2: Reprezentarea cu histograme a datelor normale.

3.2.3 Generarea de numere aleatoare de o repartiie dat


gomenzile

Matlab
legernd@`prmbD mD nA

random@9lege9D `prmbD mD nAF


yrire dintre ele dou omenzi generez o mtrie letoreD u m linii i n oloneD vnd omponente
numere letore e urmez reprtii legeF n lo de lege putem srie orire dintre expresiile din telul
din pigur QFIF he exempluD

normrnd @SD HFPD IHHD IHAY


generez o mtrie letore u 100 10 omponente reprtizte N (5, 0.2)F

random @9poiss9DHFHID PHHD SHAY


generez o mtrie letore u 200 50 omponente reprtizte P(0.01)F
tiliznd omnd

randtool
putem reprezent intertiv seleii letore pentru diverse reprtiiiF gomnd deshide o interf
gr( e reprezint prin histogrme seleiile doriteD pentru prmetrii dorii @vezi pigur QFQAF htele
generte de

Matlab pot ( exportte n (ierul Workspace u numele doritF he exempluD folosind dtele

din pigur QFQD m genert o seleie letore de 10000 de numere e urmez reprtii lognorml de
prmetri = 2 i = 0.5 i m slvtEo @folosind utonul ExportA ntrEun vetor LF

74

Capitolul 3. Experiene aleatoare n Matlab

Figura 3.3: Interfa pentru generarea de numere aleatoare de o repartiie dat.

3.2.4 Metoda funciei de repartiie inverse (Hincin-Smirnov)


Propoziia 3.3 pie X este o vriil letore de o reprtiie dtD pentru re funi s de reprtiieD
F (x)D este ontinu i strit restoteD n orie punt n re est nu este 0 su 1F pie U o vriil
letore reprtizt U(0, 1)F etuniD vriil letore Y = F 1 (U ) urmez eei reprtiie i X F

Demonstraie. xotez u FY funi de reprtiie pentru Y F ertm FY este tomi funi de reprtiie
lui X F evem suesivX

FY (x)

= P (Y x) = P (F 1 (U ) x)
= P (U F (x)) = F (x),

x [0, 1].

tiliznd est rezulttD urmtore propoziie rezult imeditX

Propoziia 3.4 pie X o vriil letore n propozii preedentF h {U1 D U2 D . . . D Un } sunt


vriile letore independenti stohsti i identi reprtizte U(0, 1)D tuni {F 1 (U1 )D F 1 (U2 )D . . . D

F 1 (Un )} formez o seleie ntmpltore de numere e urmez reprtii lui X F

Exemplu 3.5

pie vriil letore X exp()F puni s de reprtiie este F : R [0, 1],

1 e x , x > 0D ir F 1 esteX

ln(1 u) , u (0, 1);


F 1 (u) =
0
, ltfel.

F (x) =

75

3.2. Generarea de numere (pseudo-)aleatoare

etuniD d {u1 D u2 D . . . D un } sunt numere letore uniform reprtizte n [0, 1]D vem {F 1 (u1 )D

F 1 (u2 )D . . . D F 1 (un )} formez o seleie ntmpltore de numere reprtizte exp()F


n pigur QFRD m reprezentt gr( o dou seleii de volum 150 de numere letore reprtizte exp(5)Y
un genert prin metod funiei de reprtiie inverseD ellt genert de funi

Matlab prede(nit

exprndF eleiile generte u fost ordonte desrestorF puni Matlab re generez (gur este
prezentt mi josF
epelre funiei se fe prin tstre n ferestr de luru n Matlab omezii expsel(5)F
function expsel(lambda)
% functia expsel.m
% generez 150 de numere cu metoda Hincin-Smirnov si le ordonez descrescator
Y = sort(-lambda*log(1-rand(150,1)), 'descend');
plot(Y, 'bo'); hold on
% desenez selectia si retin figura
% generez 150 de numere cu exprnd si le ordonez descrescator
Z = sort(exprnd(lambda, 150,1), 'descend');
plot(Z, 'r*')
% desenez Z cu rosu
legend('metoda functiei inverse','generare cu exprnd')

Figura 3.4: Generare de numere aleatoare prin metoda funciei inverse.

3.2.5 Generarea de numere aleatoare ntregi


Funciile floor, ceil, round, fix
unt funii folosite pentru generre de numere letore ntregiF he exempluD funi floor(x) este
prte ntreg lui xF estfelD omenzile

floor@IIBrand@PHDIAAY
ceil@IIBrand@PHDIAAY
generez (ere te 20 de numere ntregi ntre 0 i 10D distriuite uniform disretF hiferen dintre ele
dou funii este floor(x) fe rotunjire l numrul ntreg )t l stng lui xD pe nd ceil(x) fe

76

Capitolul 3. Experiene aleatoare n Matlab

rotunjire l numrul ntreg )t l drept lui xF


puniile round(x) i fix(x) rotunjes numrul rel x l el mi propit numr ntregD n direi lui D
respetivD n direi lui zeroF
entru generre de numere ntregi n

MatlabD mi putem folosi urmtorele omenziX

randsample(populatie, k)
randsample(n, k)
randsample(populatie, k, replace)
rim omnd generez o seleie uniform @disretA nerepett de k numere nturle lese letor din
vetorul populatieF h n loul vetorului populatie este n @omnd douAD tuni se relizez o
seleie uniform nerepett de k numere din mulime {1, 2, . . . , n}F e trei omnd ne d posiilitte
s ontrolm d selei este su nu este repettF h vriil replace este true su 1D tuni
selei oinut este un repettD ir d vriil replace este false su 0D tuni selei oinut
este un nerepettF
he exempluD omnd

randsample([50:2:100], 10, 0)
generez o seleie nerepett de 10 numere pre ntre 50 i 100X

66

72

50

68

88

74

82

80

94

76

etorul X dt de

X = randperm(n)
este o permutre letore elementelor mulimii {1, 2, . . . , n}F

3.3 Metoda Monte Carlo


wetod wonte grlo este o metod de simulre sttistiD e produe soluii proximtive pentru o mre
vriette de proleme mtemtie prin efeture de experimene sttistie pe un omputerF e pote
pli tt prolemelor u deterministeD t i elor proilistie i este folositore n oinere de soluii
numerie pentru proleme re sunt pre di(ile n ( rezolvte nlitiF iste o metod folosit de seoleD
dr ptt sttutul de metod numeri din nii 1940F n 1946D F lm1 devenit primul mtemtiin
re dt un nume estui proedeuD ir numele vine de l zinoul wonte grlo din priniptul wonoD
unde se prti forte mult jourile de noroD n speil dtorit joului de rulet @rulet a un genertor
simplu de numere letoreAF he semeneD xihols wetropolis2 dus ontriuii importnte metodeiF
ere l z generre de numere letore onvenile i oservre fptului o prte dintre este
veri( o propriette su numite proprietiF n generlD orie metod re re l z generre de
1
2

Stanislaw Marcin Ulam (1909 1984), matematician de origine polonez, nscut n Lvov, Ucraina
Nicholas Constantine Metropolis (1915 1999), zician grec

3.4. Integrarea folosind metoda Monte Carlo

77

numere letore n vedere determinrii rezulttului unui lul este numit o metod wonte grloF
yrie eveniment (zi re pote ( vzut un proes stohsti este un ndidt n ( modelt prin
metod wgF

3.4 Integrarea folosind metoda Monte Carlo


spunem dorim s folosim metode wonte grlo pentru evlure integrlei
b

f (x) dx.

I=

@QFIA

n generlD pentru evlu numeri integrlD metod wonte grlo nu este prim legereD ns este forte
util n zul n re integrl este di(il @su imposiilA de evlutF eest metod devine mi e(ient
det lte metode de proximre nd dimensiune spiului e mreF
h dorim plire metodei wgD tuni vem de les un din urmtorele vrinteX

Varianta 1 ndrm gr(ul funiei f ntrEun dreptunghi


D = [a, b] [c, d],
unde c < inf f i d > sup f F ivlum integrl folosinduEne de lulul proilitii evenimentului AD
[a, b]

[a, b]

un punt les l ntmplre n interiorul dreptunghiului D s se )e su gr(ul funiei f (x)F pem


urmtore experien letoreX legem n mod uniform @omnd rand ne ofer est posiilitte
n

MatlabA un punt din interiorul dreptunghiului i testm d est punt se ) su gr(ul lui

f (x)F epetm experien de un numr N @mreA de ori i ontilizm numrul de priii f (N ) le


puntului su gr(F entru un numr mre de experieneD proilitte un punt genert letor n
interiorul dreptunghiului s se )e su gr(ul funiei v ( proximt de freven reltiv relizrii
evenimentuluiD di

f (N )
.
N

P
e de lt prteD proilitte teoreti este

P =

I
,
ri dreptunghi

de unde proximre

ri dreptunghi

f (N )
.
N

@QFPA

otuiD est metod nu e forte e(ientD deoree N treuie s (e forte mre pentru ve o preizie
unF

Exemplu 3.6 tiliznd metod wonte grloD s se evlueze integrl


5
2

ex dx.

I=
2

Soluie:

qenerm 106 punte letore n interiorul ptrtului [2, 5] [0, 1] i veri(m re dintre

78

Capitolul 3. Experiene aleatoare n Matlab


2

este se ) su gr(ul funiei f (x) = ex , x [0, 1]F rmtore funie

Matlab lulez inteE

grl doritX

function I = integrala(N)
x = 7*rand(N,1)-2; y = rand(N,1);
f = find(y < exp(-x.^2));
I = 7* length(f)/N;

%
%
%
%

functia integrala.m
genereaza N numere aleatoare in [2, 5] [0, 1]
2
numar punctele aflate sub graficul functiei ex
formula @QFPA

y rulre funieiD integrala(1e6)D ne furnizez rezulttul I = 1.7675F

Varianta 2 utem resrie integrl n form


b

I = (b a)

@QFQA

f (x)h(x) dx,
a

unde

1
ba
h(x) =
0

, d x [a, b],
, ltfel.

puni h(x) de(nit mi sus este densitte de reprtiie unei vFF X U[a, b]D ir reli @QFIA se
resrie
@QFRA

I = (b a)E(f (X)).
polosind lege sl numerelor mriD putem proxim I prinX

ba
N

@QFSA

f (Xk ),
k=1

unde Xk sunt numere letore e urmez reprtii U[a, b]F


utem generliz est metod pentru lulul integrlelor de tipul

f (x) dx, unde V Rn .


V

Exemplu 3.7 se evlueze integrl din ixemplul @QFTA folosind formul @QFSAF
Soluie:

godul

Matlab este urmtorulX

x = 7*rand(1e6,1)-2;
g = exp(-x.^2);

% genereaza 106 numere aleatoare U(2, 5)


2
% g(x) = ex
106

I = mean(g)

% media

suD restrnsD putem pel urmtore omndX

g(xi )
i=1

estimate = 7*mean(exp(-((7*rand(10^6,1)-2).^2)))

% I 1.7671

79

3.5. Experimente aleatoare n Matlab


Exemplu 3.8 ivlund integrl

ex dx

I=
0

printrEo metod wonte grlo s se estimeze vlore numrului trnsendent eF @e = I + 1AF

Soluie:

estimate = mean(exp(rand(10^6,1))) + 1

% e 2.7183

3.5 Experimente aleatoare n

Matlab

utem simul diverse experiene letore folosind omenzile din

MatlabF he exempluD simulre runrii

unei monede idele su unui zr idelF entru est vom utiliz funi

rand
e generez un numr @pseudoEAletor uniform n intervlul [0, 1] @iFeFD orie punt din est intervl re
eei ns de pre l rulre omenziiF

3.5.1 Simularea aruncrii unei monede


gomnd
a @rand ` HFSAY
simulez runre unei monede ideleF om mi spunem numrul X stfel genert este un
numr letor reprtizt B(1, 0.5) @similr u shem ilei reveniteD n zul n re o urn re ile
le i negre n numr egl i extrgem o il l ntmplreA

xumrul
a sum @rand@QHDIA`HFSA
urmez reprtii B(30, 0.5) @simulre 30 runri le unei monede ideleAF

eeli experiment pote ( modelt i prin omnd

round(rand(30,1))
entru numr te fee de un numit tip u prutD folosim

sum(round(rand(30,1)))

Exemplu 3.9 horim s sriem o funie

MATLAB re s simuleze runre repett unei monede

msluiteD pentru re proilitte teoreti de oine o numit f este p (0, 1)F se determine
proilitte l runre monedei s oinem f u stema i s deseneze o (gur re s justi(e
gr( onvergen irului frevenelor reltive l est proilitteF

80

Capitolul 3. Experiene aleatoare n Matlab


function moneda(N,p);
x = rand(1, N);
V = (x < p);
Sn = cumsum(V);
x = 1:N;
Fn = Sn./Ar;
semilogx(1:N, Fn, 'b-', [1,N],[p, p], 'm:');
axis([0 N 0 1]);
title('moneda')
xlabel('aruncari');ylabel('probabilitatea')

%
%
%
%
%
%
%
%
%
%

functia moneda.m
aruncam moneda
valoarea de adevar a lui (x<p)
suma cumulata
vectorul nr de aruncari
frecventa relativa a stemei
reprezinta grafic Fn
axele
numele figurii
numele axelor

moneda

zar

1
5/6

probabilitatea

probabilitatea

3/4

0.5

0.5

1/4
1/6
0

10

10
10
aruncari

10

10

10

10
10
aruncari

10

10

Figura 3.5: Simularea aruncrii unei monede corecte (a) i a unui zar corect (b)
y rulre funieiD eFgFD moneda(1e5,0.5)D produe gr(ul din pigur QFS(a)F he semeneD se pote
simul i runre unei monede msluiteD d legem prmetrul p l funiei s (e diferit de 0.5F

3.5.2 Simularea aruncrii unui zar


entru neputD s onsiderm o vriil letore e pote ve dor 3 rezultte posiileD A, B i C D
u proilitile de relizre 0.5, 0.2 iD respetivD 0.3F entru model est vriil letore n

MatlabD proedm stfelX legem uniform l ntmplre un numr x din intervlul [0, 1]F h x 0.5D
tuni onvenim rezulttul A sE reliztD d 5 < x 0.7D tuni rezulttul B sE reliztF eltfelD
rezulttul vFF X este C F h est experiment se repet de multe oriD tuni rezulttele pot ( folosite
n estimre proilitilor de relizre vriilei letoreF gum t vom fe mi multe experimenteD
u tt vom proxim mi ine vlorile teoretie le proilitilorD dei putem spune m proximt
vriil letore X F
v runre unui zr idelD vem 6 rezultte posiileD i numeD prii unei fee u 1, 2, 3, 4, 5 su 6
punteF entru simul est experimentD modi(m n mod onvenil prolemF om onsider
puntele din intervlul [0, 1] formez mulime tuturor zurilor posiile i mprim intervlul [0, 1] n

81

3.6. Probabiliti geometrice


6 suintervle de lungimi egleX
(0,

1
1 2
2 3
3 4
4 5
5
), ( , ), ( , ), ( , ), ( , ), ( , 1) .
6
6 6
6 6
6 6
6 6
6

orespunztoreD respetivD elor se feeD s ziem n ordine restore puntelor de pe eleF om


vede mi trziu @vezi metod wonte grloA legere estor intervle u pete nhiseD deshise su
mixte nu re efet prti supr lulului proilitii doriteF eumD d dorim s simulm n

Matlab

prii feei u 3 punte l runre unui zr idelD vom lege @omnd randA un numr 4l ntmplre4
2
din intervlul [0, 1] i veri(m d est se ) n intervlul ( 6 , 3 )F edrD omnd
6

Matlab

(rand < 3/6 & rand > 2/6)


simulez runre unui zr idelF g o oservieD deoree ele 6 fee sunt identieD putem simpli(
est omnd i srie

(rand < 1/6).

Exemplu 3.10 horim s simuleze n

Matlab runre repett unui zr oretF

se determine

proilitte l runre zrului s oinem f u trei punte i s deseneze o (gur re s justi(e


gr( onvergen irului frevenelor reltive l est proilitte @vezi pigur QFS(b)AF

function dice(N);
% functia dice.m
u = rand(1, n);
% probabilitatea aparitiei fetei
Z1 = (u < 3/6 & u > 2/6);
% aparitia fetei
freq = cumsum(Z1)./(1:n);
% frecventa relativa
subplot(1,2,2);
% activeaza fereastra din stanga
semilogx(1:n, freq, 'b-', [1, n], [1/6,1/6], 'm:');
axis([0 n 0 1]);
% axele
title('zar')
% numele figurii
xlabel('aruncari');ylabel('probabilitatea')
piierul dice.m simulez runre unui zr oret de un numr N de oriF y rulre funieiD eFgFD

dice(1e5) produe gr(ul din pigur QFS(b)F

3.6 Probabiliti geometrice


Exemplu 3.11 (aproximarea lui folosind jocul de drts)
n e onst joulc presupunem suntem l nivelul neptorF evem de runt o sget suitD
e pote penetr u uurin lemnulD spre o tl ptrt din lemnD n interiorul rui se ) desent
un er irumsris ptrtuluiF h sget se n(nge n interiorul disului tuni i tigt un puntD
d nu E nu tigi nimiF epetm joul de un numr N de ori i ontilizm l sfrit numrul de
punte umulteD s ziem est numr este N F
presupunem suntei un jutor sl de drts @st impli fptul orie punt de pe tl re
eei ns de ( intitAD dr nu de sl nt s nu nimerii tlF gu lte uvinteD presupunem
de (ere dt nd runi sgetD e se n(nge n tlF

82

Capitolul 3. Experiene aleatoare n Matlab

e ere s se proximeze vlore lui pe z joului de mi sus i s se srie un progrm n

Matlab

re s simuleze experimentulF

Soluie: notm u A evenimentul sget s se n(ng hir n interiorul disuluiF n zul n re


numrul de runri N e forte mreD tuni proilitte evenimentului AD P (A)D este ine proximt
N
de limit irului frevenelor reltiveD di lim
F
n N
e de lt prteD P (A) =

aria disc
aria perete

puni

4.

edrD putem proxim prin

N
N

(pentru N

Matlab re proximez pe este prezentt mi josF

1).

@QFTA

wetod re stt l z proximrii

lui este o metoda Monte CarloD rei suport teoreti este prezentt n prgrful QFRF

function Pi = darts(N)
% numar de aruncari
theta = linspace(0,2*pi,N);
% genereaza vectorul theta
x = rand(N,1); y = rand(N,1);
% (x,y) - intepaturi
X = 1/2+1/2*cos(theta); Y = 1/2+1/2*sin(theta);
% cerc in polar
plot(x,y,'b+',X,Y,'r-');
% deseneaza cercul si punctele
S = sum((x-.5).^2 + (y-.5).^2 <= 1/4);
% numarul de succese
Prob = S/N;
% frecventa relativa
approxpi =4*Prob;
% aproximarea lui pi
axis([0 1 0 1]);
% deseneaza axele
title([int2str(N),' aruncari, \pi \approx ', num2str(approxpi)]);
y simpl rulre funieiD darts(2000)D ne generez pigur QFTF

Figura 3.6: Simularea jocului de darts.

3.6. Probabiliti geometrice

83

Exemplu 3.12 @proximre lui folosind prolem ului lui fu'on3 A


gonsiderm un prhet formt din lme prleleD vnd lime aF se )e proilitte un
de lungime l (l < a)D runt l ntmplre pe prhetD s ting un dintre liniile despritore le
prhetuluiF imuli n

Matlab runre de 100 de ori uluiF

Soluie: utem reformul prolem stfelX


Pe un plan sunt trasate drepte paralele, astfel nct distana dintre oricare dou drepte alturate s e a.
Pe acest plan, se arunc la ntmplare un ac de lungime l < a. Se cere probabilitatea ca acul sa ntretaie
una dintre drepte.
ozii ului f de dreptele reelei este dt de distn d mijloului su l o drept i unghiul
pe re l fe direi ului u e dreptelorF treui s vem d [0, a] i [0, ]F hin punt de
vedere teoretiD ul pote ( reprezentt un punt n plnul ( 0 d)F
wulime zurilor egl posiile esteX

D = {(d, ) | 0 d a, 0 }.
wulime zurilor fvorile esteX

D = {(d, ) D | 0 d l sin }.
roilitte ul s ntretie un dintre drepte esteX

P (A) =

2l
aria(D )
=
.
aria(D)
a

hin rezulttul de mi susD se ntrevede oinere pe le experimentl de proximri le lui F he exempluD


d lum a = 2lD tuni P (A) =

1
F

erunm ul de N ori i oservm n m zuri tit un dintre

liniiF entru N su(ient de mreD

P (A) =

1
m
.

fu'on efetut experimentul de 2000 de oriD n urm rui lE proximt pe prin 3.1430F n

MatlabD putem proxim pe prin prolem ului lui fu'on stfelX

function Pi = buffon(N)
clf; l = 1; a = 2;
d = a*rand(N,1); theta = pi*rand(N,1);
T = sum(d<1*sin(theta));
% contabilizeaza numarul de taieturi
Prob = T/N;
% frecventa relativa
approxpi = 2*l/(a*Prob);
% aproximarea lui pi
disp('Aproximarea lui pi este '); disp(approxpi);
ulnd odulD buffon(1e6)D oinemX
Aproximarea lui pi este 3.1421

Observaia 3.13 @IA even T = sum(d<1*sin(theta)); lulez numrul zurilor fvorile stE
3

Georges-Louis Leclerc, Comte de Buon (1707 1788), naturalist i matematician francez

84

Capitolul 3. Experiene aleatoare n Matlab

felX

(d<1*sin(theta)) furnizez un vetor u N omponenteF gomponent i estui vetor este vlore


de devr ropoziiei di < l*sin(thetai )F om oine vlore 1 d propozii este devrt i
0 d nu esteF puni sum lulez sum omponentelor vetoruluiD di ext numrul zurilor
fvorileF
@PA entru ilustr este runri ntrEun gr(D nu vom mi pute utiliz sriere vetoril oordoE
ntelorF entru oine o (gur de genul pigur QFUD vom modi( progrmul nterior stfelX
function Pi = buff(N)
clf; l = 1; a = 2;
L = 5
% lungimea retelei de drepte
T = 0;
% initializare numar de taieturi;
for i=1:N
x = L*rand
% abscisa centrului acului
d = a*rand;
% ordonata centrului acului
theta = pi*rand;
% unghiul theta
% ~~~~~~~~~~~~~ deseneaza acul ~~~~~~~~~~~~~~~~~~~~~~~~~~~~
plot([x-l*cos(theta)/2,x+l*cos(theta)/2],[d-l*sin(theta)/2,d+l*sin(theta)/2],'b-')
hold on;
if (d<1*sin(theta)/2 | a-d < l*sin(theta)/2)
% acul taie o linie
T = T+1;
% contabilizeaza nr. de taieturi
end
end
plot([-0.5 L+0.5] , [0,0], 'g-');
% deseneaza y = 0
plot([-0.5 L+0.5] , [a,a], 'g-');
% deseneaza y = 1
axis ([-0.5 L+0.5 -0.5 a+0.5]);
% deseneaza axele
approxpi = 2*l*N/(a*T);
% aproximarea lui pi

title (['Problema acului lui Buffon (n = ', num2str(N), ')']);


@QA h notm u X numrul de ntretieturi le ului u liniile reelei n N runri @X este o vriil
letoreAD tuni est prolem ne pote furniz un estimator statistic pentru @vezi gpitolul TAD
est (ind

2lN
.
a E(X)

n pigur QFU m reprezentt o simulre 100 de runri le ului pe o ree de linii prleleF

3.7 Repartiii probabilistice n

Matlab

puniile de proilitteD f (x) @pentru vriile letore disreteAD i densitte de reprtiieD f (x) @penE
tru vriile letore ontinueAD se introdu n

pdf('LEGE', x, <param>)

Matlab u jutorul omenzii pdfD stfelX


su

LEGEpdf(x, <param>)F

85

3.7. Repartiii probabilistice n Matlab

Figura 3.7: Problema acului lui Buon (N = 100).

puni de reprtiieD F (x)D unei vriile letore se pote introdue n

cdfD stfelX
cdf('LEGE', x, <param>)

su

Matlab u jutorul omenzii

LEGEcdf(x, <param>)F

snvers funiei de reprtiie pentru reprtiii ontinueD F 1 (y)D se introdue u omnd icdfD stfelX

icdf('LEGE', y, <param>)

su

LEGEinv(y, <param>)F

n omenzile de mi susD LEGE pote ( orire dintre legile de reprtiie din elul QFID x este un slr su
vetor pentru re se lulez f (x) su F (x)D y este un slr su vetor pentru re se lulez F 1 (y)D
ir <param> este un slr su un vetor e reprezint prmetrul @prmetriiA reprtiiei onsiderteF

Observaia 3.14 pie X o vriil letore i F (x, ) funi s de reprtiieD (ind prmetrul reprE
tiieiF entru un x RD reli mtemti

P (X x) = F (x)
o putem srie stfel n

MatlabX
cdf('numele repartiiei lui X',x,).

@QFUA

Matlab proilitii P (X < x)F h reprtii onsidert


este un ontinuD tuni orespondentul n Matlab este tot @QFUAD deoree n est z

rolem pote pre l evlure n

P (X x) = P (X < x) + P (X = x) = P (X < x).

86

Capitolul 3. Experiene aleatoare n Matlab

he exempluD d X N (5, 2)D tuni

P (X < 4) = cdf('norm', 4, 5, 2).


h X este de tip disretD tuni

P (X [x])
, x nu e ntreg
P (X < x) =
P (X m 1) , x = m Z,
unde [x] este prte ntreg lui xF
he exempluD d X B(10, 0.3)D tuni

P (X 4)

P (X < 5)

cdf('bino', 4, 10, 0.3) = 0.8497.

elul QFI onine tev reprtiii uzule i funiile orespunztore n


reprtiii proilistie disrete

binoX
nbinX
poissX
unidX
geoX
hygeX

MatlabF

reprtiii proilistie ontinue

reprtii inomil B(n, p)


reprtii inomil negtiv BN (n, p)
reprtii oisson P()
reprtii uniform disret U(n)
reprtii geometri Geo(p)
reprtii hipergeometri H(n, a, b)

normX
unifX
expX
gamX
betaX
lognX
chi2X
tX
fX
wblX

reprtii norml N (, )
reprtii uniform ontinu U(a, b)
reprtii exponenil exp()
reprtii qmm (a, )
reprtii fet (m, n)
reprtii lognorml logN (, )
reprtii 2 (n)
reprtii student t(n)
reprtii pisher F(m, n)
reprtii eiull W bl(k, )

Tabela 3.1: Repartiii uzuale n Matlab

3.8 Justicri grace ale teoremei limit central


Exemplu 3.15 n pigur QFV m reprezentt gr( @u reA funiile de proilitte pentru reprtiiile
inomil i oissonD tuni nd numrul de extrgeri n shem inomil este un numr mreF yservm
pentru un numr n su(ient de mreD ele dou gr(e se suprpunF eest este o demonstrie gr(
urmtorei onvergeneX
k
lim Cn pk q nk =

n
p0

=np

e k
.
k!

@QFVA

3.8. Justicri grace ale teoremei limit central

87

0.12

0.1

0.08

0.06

0.04

0.02

10

15

20

25

30

Figura 3.8: B(n, p) i P(np) pentru n = 100, p = 0.15

n prtiD propriette @QFVA este stisfut pentru

n 30, p 0.1, = n p 0.1.


hin (gur QFVD oservm gr(ul re form lopotului lui qussD justi(nd gr( fptul funiile
de proilitte pentru inomil @albastruA i oisson @rouA tind l densitte de reprtiie pentru
reprtii normlF

n = input('n='); p = input('p=');
lambda = n*p;
a=fix(lambda-3*sqrt(lambda)); b=fix(lambda+3*sqrt(lambda));
% a si b sunt valorile din problema celor 3
x=a:b;
fB=binopdf(x,n,p); fP=poisspdf(x,lambda);
bar(x',[fB',fP'])

Exemplu 3.16 n pigur QFWD m reprezintt u albastru funi de reprtiie pentru Sn @Sn B(n, p))D
pentru n = 0.3 i ptru vlori le lui nD n {20, 50, 200, 10000}D ir u linie roieD funi de reprtiie
pentru o vriil letore reprtizt N (0, 1)F hin ele ele 4 gr(eD oservm um gr(ul funiei de
reprtiie pentru Sn se propie de gr(ul funiei de reprtiie pentru N (0, 1)D nd n este su(ient de
mre @pentru n = 10000 se suprpun gr(eleAF godul

Matlab e generez gr(ul din pigur QFW esteX

clear all; clf;


% reseteaza var. de memorie si figura
n = [20,50,200,10000]; p = 0.3;
for i=1:4
x = -4:0.01:4; y = n(i)*p + x*sqrt(n(i)*p*(1-p));
f = cdf('bino', y, n(i), p);
% functia de repartitie pentru B(n, p)
subplot(2,2,i); plot(x,f,'b'); hold on;
stairs(x,normcdf(x, 0, 1),'r');
% functia de repartitie pentru N (0, 1)
title(['n = ',num2str(n(i))])
axis([-4.05 4.05 -0.05 1.05])
end

88

Capitolul 3. Experiene aleatoare n Matlab

%
help rand
lookfor normal
X=[2 4 6 5 2 7 10]
X=[3; 1; 6.5 ;0 ;77]
X = -10:2:10
length(X)
t=0:0.01:3*pi
X.^2
X.*Y
cumsum(X)
cumprod(X)
min(X)
max(X)
sort(X)
sort(X, 'descend')
erf(X)
exp(x)
log(x)
sqrt(x)
factorial(n)
A = ones(m,n)
B = zeros(m,n)
I = eye(n)
A = [3/2 1 3 7; 6 5 8 8; 3 6 9 12]
size(A)
det(A)
inv(A)
A'
A(:,7)
A(1:20,1)
nchoosek(n,k)
1e5
exp(1)
bar(X) su barh(X)
hist(X)
hist3(x,y,z)
plot(X(1:5),'*m')
plot(t,X,'-')
plot3(X,Y,Z)
stairs(X)
subplot(m,n,z)
semilogx i semilogy
hold on
clf
clear all
title('Graficul functiei')
find
legend

% permite dugre de omentrii in od


% help spei( pentru funi rand
% ut intrrile n Matlab pentru normal
% vetor linie u 7 elemente
% vetor olon u 5 elemente
% vetor u numerele intregi de l 10 l 10D din 2 n 2
% lungime vetorului X
% de(nete o diviziune [0, 3] u diviziune 0.01
% ridi tote omponentele vetorului X l putere dou
% produsul doi vetori
% sum umult elementelor vetorului X
% produsul umultiv l elementelor vetorului X
% relizez minimum dintre omponentele lui X
% relizez mximum dintre omponentele lu X
% ordonez omponentele lui X n ordine restore
% ordonez omponentele lui X n ordine desrestore
% funi erore
% lulez exponenil ex
% lulez logritmul nturl ln(x)
% lulez rdilul ordinului doi dintrEun numr
% n!
% A e mtrie m nD u tote elementele 1
% mtrie m n zero
% mtrie unitteD n n
% mtrie 3 3
% dimensiune mtriei A
% determinntul mtriei A
% invers mtriei A
% trnspus mtriei A
% olon 7E mtriei A
% sote primele 20 de linii le lui A
% ominri de n lute te k
% numrul 105
% numrul e
% reprezentre prin re
% reprezentre prin histogrme
% reprezentre prin histogrme 3Eh
% desenez primele 5 omponente le lui X D u * magenta
% desenez gr(ul lui X versus tD u linie ontinu
% desenez un gr( n 3Eh
% desenez o funie sr
% mprte gr(ul n m n zone & desenez n zon z
% logritmez vlorile de pe siD respFD ordont
% reine gr(ul pentru reliz o nou (gur
% terge (gur
% terge tote vriilele de(nite
% dug titlu (gurii
% gsete indiii elementelor nenule le unui vetor
% tez o legend l un gr(

Tabela 3.2: Funcii Matlab utile

89

3.9. Exerciii rezolvate


n = 20

n = 50

0.8

0.8

0.6

0.6

0.4

0.4

0.2

0.2

0
4

0
2

n = 200

n = 10000

0.8

0.8

0.6

0.6

0.4

0.4

0.2

0.2

0
4

0
2

Figura 3.9: Vericare grac a teoremei limit central (varianta cu funciile de repartiie)

3.9 Exerciii rezolvate


Exerciiu 3.17 y moned idel este runt de 100 de oriD ir X este vriil letore e reprezint
numrul de fee u stem pruteF

@A gre este proilitte de oine ext 52 de stemec


@A se luleze P (45 X 55)F polosii proximre u o vriil letore normlF

Soluie:

godul

Matlab urmtor lulez proilitile eruteD lulte nliti n ixeriiul PFTP

din pitolul preedentF

P1 = nchoosek(100,52)*(0.5)^52*(0.5)^48
% solutia exacta
P1 = 1/5*normpdf(2/5)
% solutia aproximativa 1
P1 = normcdf(2.5/5) - normcdf(1.5/5)
% solutia aproximativa 2
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
P2 = binocdf(55,100,0.5) - binocdf(44,100,0.5)
% solutia exacta
P2 = normcdf(5.5/5) - normcdf(-5.5/5)
% solutia aproximativa

Exerciiu 3.18 resupunem nlime unei persone este o vFF X reprtizt normlF wedi de
nlime jutorilor unei ehipe de shet msulin este 195 cmD u devii stndrd 5 cmF nlime
uii de l vestirul ehipei este de 2 metriF

(a) hetermini proentul dintre jutorii ehipei re sunt pre nli pentru tree de est u fr
s se pleeF @resupunem se ple dor d nlime lor este mi mre de 2mAF

(b) se determine proilitte nlimile jutorilor s (e ntre 190 cm i 210 cmF

90

Capitolul 3. Experiene aleatoare n Matlab

Soluie:

@A roilitte jutorii s (e 4pre nli4 esteX

P1 = P (X > 200) = 1 P (X 200) = 1 FX (200) 0.1587.


roentul utt este r = P1 100 15.87%F n

MatlabD

P1 = 1 - normcdf(200, 195,5))*100
@A glulm

P2 = P (190 < X < 210) = FX (210) FX (190) 0.84.


n

MatlabD
P2 = normcdf(210, 195,5) - normcdf(190, 195,5)

Exerciiu 3.19 rmtore funie

Matlab @prin omnd fF(10,0.5)A reprezint gr( @vezi pigur

QFIHA funi de proilitte @prin punte i reA i funi de reprtiie le legii de proilitte inoE
mileF

function fF(n,p);
x=0:n;
FP=pdf('bino', x, n ,p); subplot(1,3,1); plot(x, FP, '*')
axis([-0.5 n+0.5 0 0.32])
title('Functia de probabilitate')
subplot(1,3,2), bar (x, FP); axis ([-0.5 n+0.5 0 0.32])
title('Functia de probabilitate')
FR=cdf('bino', x, n ,p); subplot(1,3,3); stairs(x, FR)
title('Functia de reparti\c{t}ie');axis ([0 n 0 1])

Functia de probabilitate

Functia de probabilitate

Functia de repartitie
1

0.3

0.3

0.75
0.2

0.2
0.5

0.1

0.1
0.25

10

10

10

Figura 3.10: Reprezentarea funciilor de probabilitate i de repartiie pentru B(10, 0.5)

3.9. Exerciii rezolvate

91

Exerciiu 3.20 ginev nregistrt zilni timpul ntre dou sosiri suesive le trmviului ntrEo nE
umit stieD i gsit D n medieD est este de 20 de minuteF e tie est timp este distriuit
exponenilF h o person juns n stie ext nd trmviul pleD )i re sunt nsele e
s tepte el puin 15 minute pn vine urmtorul trmviF

Soluie:

xotm u T timpul de teptre n stie ntre dou sosiri suesive le trmviului i u FT

funi s de reprtiieF tim T exp()D unde = 20F edrD vem de lult P (T 15)D re esteX

P (T 15) = 1 P (T < 15) = 1 FT (15),


i est este

1 - cdf('exp',15, 20) = 0.4724,


ee e impli 47.24% nseF

Exerciiu 3.21 presupunem X este o vFF ontinu e reprezint nlime @n mA rilor


dintrEo rF e tie P (X 170) = 0.1F tiind X este norml distriuitD u medi m = 175D s se
determine dispersi lui X F

Soluie:

pie vriil letore

Y =

X 175
.

heoree X N (175, )D gsim Y N (0, 1)F hin ondii P (X 170) = 0.1D oinemX

5
P (Y ) = 0.1,

de unde

5
= icdf('norm',0.1,0,1) = 1.28,

de unde 3.91D dr 2 15.3F

Exerciiu 3.22 (a) n mgzinul de l olul strzii intr n medie 20 de lieni pe orF tiind numrul
lienilor pe or este o vriil letore reprtizt oissonD s se determine re este proilitte
ntrEo numit or s intre n mgzin el puin 15 lieniF

(b) gre este proilitte D ntrEo numit zi de luru @de 10 oreAD n mgzin s ntre el puin 200 de
lienic gluli est proilitte n dou moduriX folosind funi de reprtiie oisson i folosind
proximre u reprtii normlF

Soluie:
odul

oluiile nlitie u fost prezentte n pitolul nteriorD n ixeriiul PFTQF rezentm ii

Matlab pentru lulul proilitilor eruteF


P1 = 1 - poisscdf(14,20);
P2 = 1 - poisscdf(199,200);

suD

P2 = 1 - normcdf(-0.5/sqrt(200))

92

Capitolul 3. Experiene aleatoare n Matlab

Exerciiu 3.23 (a) imuli n Matlab o vriil letore disret X e pote lu dor dou vloriD
X = 1D u P (X = 1) = p i X = 1D u P (X = 1) = 1 p, (p (0, 1)).
(b)

gonsiderm urmtorul joX se run o moned oret de N ori i d pre stem tigm

1 RON D ir d pre nulD pierdem 1 RON F se reprezinte vFF re reprezint tigul S(n) umuE
lt l (ere runreF he semeneD s se ontilizeze de te ori sE ntors ln l 0F

Soluie:

@A tilim un p [0, 1]F gu omnd randD generm un numr letor dup reprtii

U(0, 1)F etuniD omnd

Matlab

(rand < p)

ne (ez vlore de devr propoziiei rand < pF edrD

Matlab (ez 1 d rand

< p @proE
ilitte est s se ntmple este pA i (ez 0 d rand > p @proilitte evenimentului este
1 pAF rin urmreD pentru simul vriil letore fernoulli erut folosim odulX
p = input('p = ');
X = 2*(rand < p)-1;

% introduc probabilitatea p
% variabila aleatoare X

200

150

S(n)

100

50

50

100

5
aruncari

10
4

x 10

Figura 3.11: Suma cumulat - micare aleatoare (brownian) 1D.


@A roedm stfelX mi nti iniilizez un vetor e re tote omponentele egle u 1F erun o
moned de N oriF h pre evenimentul fvorilD tuni pentru runre @omponentA respetiv
shimm vlore 1 @pierdereA n +1 @stigAF v (nlD f sum umult l (ere ps i o reprezint
gr( @vezi pigur QFIIAF entru ontiliz numrul de zerouri le vetorului CastigD lulm lungime
vetorului e re drept omponente rngurile pentru re vetorul Castig este 0F godul

N = input('N = ');
S = -1*ones(N,1);
u = rand(N,1);
S(u < 0.5) = 1;
Castig = cumsum(S);
plot(1:N, Castig, '*')
Z=length(find(Castig == 0))

%
%
%
%
%
%
%

Matlab esteX

numar de repetitii ale jocului


un vector cu toate componentele egale cu -1
un vector cu N numere U(0, 1)
aruncare favorabila => schimb componenta -1 cu 1
suma cumulata la fiecare moment
deseneaza graficul

numarul de componente nule

3.9. Exerciii rezolvate

Exerciiu 3.24 se simuleze n

93

Matlab o vriil letore le rei vlori reprezint numrul de

eeuri vute pn l prii pentru prim or feei u 3 punte l runre unui zr idelF gre este
proilitte de oine est f din el mult 3 runric

Soluie:

pie X vFF uttF eest urmez reprtii Geo(1/6)F roilitte de oine f

teptt din el mult 3 runri este totun u proilitte de oine el mult 2 eeuri pn l
prii estei feeF n

MatlabD sriemX

X = geornd(1/6)
P = geocdf(2,1/6)

Exerciiu 3.25 rmtorul od

Matlab generez o mire hoti n dou dimensiuni @vezi pigur

QFIPAD e re puntul de plere n origineF n est od m utilizt numere letore reprtizte normlF

function walk2d(n)
x = [0; cumsum(randn(n,1))];
plot(x,y)

y = [0; cumsum(randn(n,1))];

Figura 3.12: Micare aleatoare n dou dimensiuni.

94

Capitolul 3. Experiene aleatoare n Matlab

3.10 Exerciii propuse


Exerciiu 3.1 qeneri n Matlab un set de 6 numere letore lese @uniform disretA din mulime
{1, 2, . . . , 49}F

Exerciiu 3.2 punem an i bn sunt echivalente asimptotic @sriem an bn A d


lim

polosind simulre n

an
= 1.
bn

MatlabD dovedii
n

n
e

(formul lui Stirling4 )

2n.

Exerciiu 3.3 histn X l re sunt runte mingile runte de o min utomt de servit mingi
de tenis este o vriil letore u reprtii normlF wedi distnei este neunosutD dr devii
stndrd este 1.2 mF
@A tiind P (X 20) = 0.95D s se gses vlore teptt distnei @diD E(X)AF
@A presupunem E(X) = 18F gluli P (X 18AF
@A tilii reprtii vriilei letore Z =

X18
1.2

i luli proilitte P (Z 2 20)F

Exerciiu 3.4 gonsiderm vriilele letore X N (2, 5) i Y N (3, 4)F gluli P (X + Y < 4)F
Exerciiu 3.5 e d vriil letore X 2 (50)F gluli P (X > 75)F hetermini vlore c RD
stfel nt P (X c) = 0.9F

Exerciiu 3.6 tim X1 , X2 , X3 sunt vriile letore reprtizte norml stndrdF gluli
2
2
2
proilitte P (X1 + X2 + X3 > 5)F

Exerciiu 3.7 qsii vlorile lui a pentru re urmtorele identiti n re pre o vriil letore
norml stndrd Z s se relizezeX
@A P (0 < Z < a) = 0.4616;

@A P (Z > a) = 0.1894;

@A P (0.5 < Z < a) = 0.3814;

@dA P (Z = a) = 0.5.

Exerciiu 3.8 eorem limit entrl (rm sum unui ir de vFF independente i identi reprtizte
re o form normlD indiferent e tip de reprtiie u vriilele din irF horim s dovedim est gr(D
prin simulri n

MatlabD legnd o funie de reprtiie l ntmplreF

legem 40 de numere din

intervlul 90, 1]D e u un dintre densitile de reprtiie de mi josF glulm sum lorD nott S40 F
epetm est eperiment de 1000 de ori i relizm un gr( u re @20 de reA rezulttelor oinuteF
n eli sistem de oordonteD desenm densitte de reprtiie N (, )D unde = (S40 ) i = (S40 )F
rmrii t de ine se potrives ele dou gr(eF
@A

f (x) = 2xY

@A

f (x) = 3x2 Y

@A

f (x) = 2 4|x 0.5|F

Exerciiu 3.9 gt de mre r treui s (e nD stfel nt sum Sn din exeriiul preedent s (e proxiE
mtiv normlc spundei l est ntrere legndD pe rndD te n = 1, 5, 15, 20 numere letore
n [0, 1]D pentru (ere dintre densitile de reprtiie de l (a) (c)D luli de (ere dt Sn i repeti
experimentul de 1000 de oriF heterminiD de (ere dtD pe el n pentru re oinei e mi un
potrivire ntre gr(ul u re i gr(ul densitii de reprtiieF
4

James Stirling (1692 - 1770), matematician scoian

95

3.10. Exerciii propuse


Exerciiu 3.10 tilizi metod wonte grlo pentru gsi proximri pentru urmtorele integrleX
1

(a)

x+

x dx,

(b)
2

4
dx,
1 + x2

(c)

sin(x) dx,
0

1 x2 y 2 dy dx.

(d)
1

Exerciiu 3.11 imuli n Matlab vriil letore disret X e re tloul de distriuieX


2

qsii i folosii

11

0.1

X:

0.3

0.4

0.2

Matlab pentru reprezent gr( funi de reprtiie F (x) vriilei letore X F

gluli F (10)F

Exerciiu 3.12 polosii Matlab pentru reprezent gr(D n eli sistem de oordonteD funiile de
reprtiie pentru vriilele letore X B(n, p) i Y H(n, a, b) pentru N = a + b mreF tusti(i
gr( omentriul din yservi PFQW (ii)F

Exerciiu 3.13 riei o funie

Matlab re s genereze o vriil letore e urmez reprtii

B(n, p)D u n i p ritrryF

Exerciiu 3.14 @prdoxul de l tF etersurgA


presupunem ntrEun zino se desfor urmtorul jo u un singur jutorD pe reEl numim J F y
moned idel este runt irD d pre f u stem @S AD tuni J primete 2 din prte seiD
ir joul ontinuF h l dou runre pre tot stemD tuni J primete 4 i joul ontinu mi
deprteD pn nd l o runre pre ellt fD z n re joul se opreteF v (ere nou priie
feei S D sum pe re J o ve se dulezF h notm u X vriil letore e reprezint sum
tigt de J D tuni tloul su de distriuie esteX

X=
se simuleze n

22

23

1
2

1
22

1
23

...

2n

...

...

1
2n

...

Matlab est joD preiznd l (nl sum tigt de J F gre este sum medie tigt

de J l est joc

Exerciiu 3.15 hetermini e fe urmtore omnd MatlabX


normcdf(-3:0.1:7, 2, sqrt(3))

Exerciiu 3.16 pie vriil letore X N (5, 2)F hetermini x0 stfel nt P (X x0 ) = 0.05F
Exerciiu 3.17 polosii

Matlab pentru lege 4 ri dintrEun phet de 52F

epetiD pn oinei

dou perehiF

Exerciiu 3.18 @A gluli ri de su ur norml stndrd @lopotul lui qussA uprins ntre
sisele x = 0.75 i x = 1.25F
@A

eproximi ri de l (i) folosind o metod wonte grloF

96

Capitolul 3. Experiene aleatoare n Matlab

Exerciiu 3.19 heseni o histogrm u 50 de numere exponenil reprtizteD de medie 5F istimi


medinF

Exerciiu 3.20 imuli n

Matlab sum stndrdizt 100 de numere reprtizte normlD de medie

3 i dispersie 2F eprezenti printrEo histogrmF

Exerciiu 3.21 nlime femeilor dintrEo numit regiune rii este o vriil letore reprtizt
normlD u medi 163.6m i devii stndrd 5.2mF
@A

hetermini proilitte o femeieD les l ntmplre din e regiuneD s (e mi nlt de

170mF
@A

nlime wriei este 172mF ge proent dintre femeile regiunii sunt mi sunde det wric

Exerciiu 3.22 hurt de vi unui e este tiut ( o vriil letore normlD de medie 1000h
i deviie stndrd 8hF
@A gre este proilitte un e les l ntmplre s i durt de vi ntre 900h i 1100h de
funionre ontinuc
@A gluli est proilitte folosind o metod wonteEgrloF

Capitolul

Elemente de Statistic descriptiv


onsiderm o populie sttisti de volum N i o rteristi eiD X D e re funi de reprtiie F F
esupr estei rteristii fem n oserviiD n urm ror ulegem un set de dte sttistieF hup
um m vzut n gpitolul 1D dtele sttistie pot ( prezentte ntrEo form grupt @desrise prin tele de
freveneA su pot ( negrupteD ext um u fost ulese n urm oservrilorF entru nliz estorD
pot ( utilizte diverse tehnii de orgnizre i reprezentre gr( dtelor sttistie nsD de ele mi multe
oriD este metode nu sunt su(iente pentru o nliz detlitF untem interesi n triui estor dte
numite vlori numerie reprezenttiveF ot ( de(nite mi multe tipuri de stfel de vlori numerieD eFgFD
msuri le tendinei entrle @mediD modulD medinAD msuri le dispersiei @dispersiD devii stndrdAD
msuri de poziie @untileD distn interuntiliA etF n est pitolD vom introdue diverse msuri
desriptive numerieD tt pentru dtele grupteD t i pentru ele negrupteF

4.1 Msuri descriptive ale datelor negrupate


gonsiderm un set de dte sttistie negrupteD x1 , x2 , . . . , xn @xi R, i = 1, 2 . . . , n, n N AD e
orespund unor oservii fute supr vriilei X F he(nim urmtoreleX

(1) Valoarea medie empiric


iste o msur tendinei entrle dtelorF entru o seleie {x1 , x2 , . . . , xn }D de(nimX

x=

1
n

xi ,
i=1

(ind media empiric. h {x1 , x2 , . . . , xN } sunt tote ele N oservii @recensmntA supr rE
teristiii populieiD tuni mrime

1
N

xi
i=1

se numete media (empiric a) populaieiF om vede mi trziu D pentru estim medi ntregii
populii sttistieD nu este neesr s vem tote vlorile {x1 , x2 , . . . , xN }D i dor o seleie eiD i vom
pute folosi x un estimtor pentru F

entru (ere iD ntitte di = xi x se numete deviaia fa de medieF eest nu pote ( de(nit

97

98

Capitolul 4. Elemente de Statistic descriptiv

o msur grdului de mprtiere dtelorD deoree


n

(xi x) = 0.
i=1

(2) Momentele empirice


Momentele empirice de ordin k se de(nes stfelX
k =

1
n

@pentru seleieA.

xk
i
i=1

eest formul mi este unosut i su denumire de formula generalizat a mediilorF entru k = 1D


oinem medi empiri @ritmetiA @xAD pentru k = 1D oinem media armonic @xh AD pentru k = 2

vem media ptratic @xq AF h inem ont i de media geometricD

xg =

x1 x2 xn ,

tuni reli dintre este medii esteX

xh xg x xq .


entru ntreg oletivitteD momentele de ordin k sunt

mk =

1
N

xk ,
i

(k N).

i=1

entru (ere k ND momentele empirice centrate de ordin k se de(nes stfelX

k =

1
n

pentru seleie,

(xi x)k ,
i=1

k =

1
N

pentru populie.

(xi )k ,
i=1

(3) Dispersia empiric


eest este o msur mprtierii dtelor n jurul vlorii mediiF entru o seleie {x1 , x2 , . . . , xn }D
de(nim dispersia empiricX

s2 =

1
n1

(xi x)2

i=1

1
[
x2 n()2 ] .
x
n 1 i=1 i

entru ntreg populie de volum N D dispersia populaiei este de(nit prin msur

2 =

Observaia 4.1 gntitte

1
n

1
N

(xi )2 .
i=1

(xi x)2 este tot o msur dispersiei @empirieA de seleieF om

i=1

vede mi trziu legere lui s2 este mi potrivit ntrEun nume sensF he ltfelD mele vlori pot (

4.1. Msuri descriptive ale datelor negrupate

99

folosite estimtori i dispersiei populieiD 2 F

(4) Deviaia empiric standard


iste tot o msur mprtierii dtelor n jurul vlorii mediiF entru o seleie {x1 , x2 , . . . , xn }D de(nim

deviaia empiric standard:


n

1
n1

s=

(xi x)2 .

i=1

entru ntreg populie de volum N D deviaia standard a populaiei este de(nit prin msur
N

1
N

(xi )2 .
i=1

(5) Amplitudinea (plaja de valori, range)


entru un set de dteD amplitudinea @en., rngeA este de(nit (ind diferen dintre vlore e mi
mre i vlore e mi mi dtelorD iFeFD xmx xmin F

(6) Scorul Z
iste numrul deviiilor stndrd pe re o numit oservieD xD le re su su desupr medieiF entru
o seleie {x1 , x2 , . . . , xn }D scorul Z este de(nit stfelX

z=

xx

.
s

z=

x
.

entru o populieD sorul Z esteX

(7) Corelaia (covariana) empiric


h vem n perehi de oserviiD (x1 , y1 ), (x2 , y2 ), . . . (xn , yn )D de(nim corelaia (covariana) empiric

(de selecie):
covsel =

1
n1

(xi x)(yi y ).

@RFIA

(xi x )(yi y ).

@RFPA

i=1

govrin empiri pentru ntreg populie esteX

covpop =

1
N

i=1

(8) Coecientul de corelaie empiric


r=
r=

covsel
,
sx sy

covpop
,
x y

oe(ient de orelie de seleie,


oe(ient de orelie pentru populie.

(9) Funcia de repartiie empiric


e numete funcie de repartiie empiric soit unei vriile letore X i unei seleii {x1 , x2 , . . . , xn }D

funi Fn : R RD de(nit prin

Fn (x) =

rd{i; xi x}
.
n

@RFQA

100

Capitolul 4. Elemente de Statistic descriptiv

ropozii de mi jos rt funi de reprtiie empiri proximez funi de reprtiie teoreti


@vezi pigur RFIAF

Propoziia 4.2 pie o oletivitte sttisti i X o rteristi sD e se dorete ( studitF xotez


u F (x) funi de reprtiie lui X F entru o seleie de vlori le lui X D {x1 , x2 , . . . , xn }D onstruim

funi de reprtiie empiriD Fn (x)F etuniX


prob

Fn (x) F (x), nd n ,

x R.

Demonstraie. xotez u A evenimentul {X x} i u p = P (A)F e f n repetiii le estui eveniment


i freven reltiv relizrii evenimentului A este
rd{i; xi x}
n

=
= Fn (x).
n
n
estfelD onluzi propoziiei este o onsein imedit teoremei lui fernoulli PFSRF

Figura 4.1: Funcia de repartiie empiric i funcia de repartiie teoretic pentru distribuia
normal.

(10) Coecientul de asimetrie @en., skewnessA este l treile moment stndrdiztD re se de(nete prin
1 =

3
3/2

y reprtiie este simetri d 1 = 0F om spune simetri este pozitiv @su l dreptA d 1 > 0

101

4.1. Msuri descriptive ale datelor negrupate


i negtiv @su l stngA d 1 < 0F edrD vom veX
n

n1/2

(xi x)3
i=1

1 =

@pentru seleieA

(xi x)2 )3/2

1
1 =
n 3

(xi )3

@pentru populieA.

i=1

i=1

(11) Excesul (coecientul de aplatizare sau boltire) @en., kurtosisA se de(nete prin
K=

4
3.
2
2

evem stfelX
n

(xi x)4

n
i=1
n

K=

@pentru seleieA

2 2

(xi x) )

K=

1
n 4

(xi )4 3

@pentru populieA,

i=1

i=1

iste o msur oltirii distriuiei @l ptrule moment stndrdiztAF ermenul (3) pre pentru
indiele kurtosis l distriuiei normle s (e egl u 0F om ve o reprtiie mezocurtic pentru

K = 0D leptocurtic pentru K > 0 su platocurtic pentru K < 0F n indie K > 0 semni( fptul D
n veintte moduluiD ur densitii de reprtiie re o oltire @suireA mi mre det lopotul lui
qussF entru K < 0D n e veintte ur densitii de reprtiie este mi plt det ur lui qussF

(12) Cuantile
Cuantilele (de ordin n) sunt vlori le unei vriile letore re sepr reprtii ordont n n pri
egleF
h n = 2D tuni vem o singur until de ordin 2D numit medianaD nott prin x0.5 su MeF
resupunem oserviile sunt ordonteD x1 < x2 < < xn F entru est ordineD de(nim vlore
medinX

x0.5 =

(n+1)/2

(x

n/2

D d n = imprY

+ xn/2+1 )/2 D d n = prY

h n = 4D untilele se numes cuartile @sunt n numr de 3AF rim urtilD nott x0.25 su Q1 D
se numete cuartila inferioarD dou urtil este medinD ir ultim urtilD nott x0.75 su Q3 D se
numete cuartila superioarF hiferen Q3 Q1 se numete distana intercuartilicF
h n = 10 se numes decile @sunt n numr de 9AD d n = 100 se numes percentile @sunt n numr de

99AD d n = 1000 se numes permile @sunt n numr de 999AF unt msuri de poziieD e msor loi
unei numite oservii f de restul dtelorF

(13) Modul
Modul @su valoarea modalA este e vlore x din setul de dte re pre el mi desF n numite
zuriD d dtele sunt dej grupteD putem dor estim modul suD lterntivD s preizm ls re
l onineD numit clasa modalF he exempluD pentru dtele din elul IFI este 6D ir pentru dtele din
elul IFR ls modl este [35, 45)F n set de dte pote ve mi multe moduleF h pr dou

102

Capitolul 4. Elemente de Statistic descriptiv

stfel de vloriD tuni vom spune setul de dte este bimodalD pentru trei stfel de vlori vem un set
de dte trimodal etF n zul n re tote vlorile u eei freven de priieD tuni spunem nu
exist modF he exempluD setul de dte

5 6

4 4

nu dmite vlore modlF xu exist un simol re s noteze distintiv modul unui set de dteF

4.2 Msuri descriptive ale datelor grupate


gonsiderm un set de dte sttistie grupte @de volum nAD e orespund elor n oservii supr vriilei

X F htele grupte sunt n genul elor prezentte n pigurile IFI i IFRF


entru o seleie u vlorile de mijlo {x1 , x2 , . . . , xn } i frevenele solute orespunztoreD {f1 D f2 D
n

. . . D fn }D u

fi = nD de(nimX
i=1

1
xf =

n
s2 =

xi fi ,

medi @empiriA de seleieD @suD medi pondertA

i=1
n

1
n1

fi (xi xf )2 =

i=1

s=

s2 ,

1
n1

x2 fi n x2
f
i

dispersi empiriD

i=1

devii empiri stndrdF

pormule similre se pot d i pentru msurile desriptive le ntregii populiiF


wedin pentru un set de dte grupte este e vlore e sepr tote dtele n dou pri egleF e
determin mi nti ls e onine medin @numit clas medianAD poi presupunem n interiorul
(erei lse dtele sunt uniform distriuite @vezi ixeriiu RFSAF
n mod u totul nlog determinm untilele pentru un set de dte grupteD diferen (ind D de est
dtD ordinul de seprre dtelor se shim dup um este ordinul untileiF
entru ) modul unui set de dte grupteD determinm mi nti ls e onine est vlore @ls
modlAD ir modul v ( vlore entrl lseiF

Observaia 4.3 onsiderm urmtore prolemF v rutri din ol fost dus o min nou de
frit pineF eest min de pine r treui s frie pini re s i n medie m = 400 de grmeF
entru test d min respetiv ndeplinete norm de grmjD m pus deoprte @l ntmplreA

n pini produse ntrEo zi lurtoreD n sopul de le ntriF punem stfel m fut o seleie de
volum n din mulime pinilor produse n e ziF horim s deidem dD ntrEdevrD min este sett
l prmetrii potriviiF n urm ntririi elor n piniD oinem dtele @empirieAX {x1 , x2 , . . . , xn } @n
grmeAF glulm medi msei estor i oinemX

x=

1
n

xi .
i=1

sntuitivD r ( de teptt est x s proximeze @ntrEun numit sensA ms medie @teoretiA pinilor
produse de est minF entru pute oine est proximreD m ve nevoie de un riteriu re

103

4.3. Exerciii rezolvate

s ne spun x mF wi multD m dori s (m onvini est proximre nu depinde de entionul


de pini lesD diD d m ( les lte pini i fut medi mselor lorD m ( oinut din nou o vlore
forte propit de mF entru onstrui un stfel de riteriuD vem nevoie de un dru teoreti mi
strt pentru modelre dtelor sttistieF eest dru l vom onstrui n pitolele e urmezF
n elul RFID m prezentt tev funii

Matlab spei(e pentru msurile desriptiveF


% media valorilor elementelor lui x;
% media geometric a elementelor lui x;
% media armonic a elementelor lui x;
% cuantila de ordin a vectorului x;
% distana intercuantilic, x0.75 x0.25 ;
% valoarea median a lui x;
% deviaia standard i dispersia valorilor lui x;
% amplitudinea (range) vectorului x;
% modul lui x;
% realizeaz scorul elementelor lui x;
% momentul de ordin k al lui x;
% sorteaza crescator elementele vectorului x;
% maximum i minimum pentru elementele lui x;
% skewness pentru elementele lui x;
% kurtosis pentru elementele lui x;
% percentilele de ordin p ale lui x;
% reprezint grac funcia de repartiie empiric a lui x;
% covariana dintre x i y ;
% coecientul de corelaie dintre x i y ;
% aeaz media i dispersia pentru LEGE(<param>);

mean(x)
geomean(x)
harmmean(x)
quantile(x,alpha)
iqr(x)
median(x)
std(x), var(x)
range(x)
mode(x)
zscore(x)
moment(x,k)
sort(x)
max(x), min(x)
skewness(x)
kurtosis(x)
prctile(x,p)
cdfplot(x)
cov(x,y)
corrcoef(x,y)
LEGEstat(<param>)

Tabela 4.1: Funcii Matlab specice pentru msuri descriptive.

4.3 Exerciii rezolvate


Exerciiu 4.4 rmtorul set de dte reprezint preurile @n mii de euroA 20 de seD vndute ntrEo
numit regiune unui orX

113 60.5 340.5 130


111.5 525 50 122.5

79 475.5
125.5 75

90 100 175.5 100


150 89 100 70

hetermini mplitudineD mediD medinD modulD urtilele i distn interurtili pentru este dteF
gre vlore este e mi reprezenttivc

Soluie:

ernjm dtele n ordine restoreX

50

60.5

70

75 79 89

90

100

100

100

111.5

104

Capitolul 4. Elemente de Statistic descriptiv


113.5

122.5

125.5

130

150

175.5

340.5

475.5

525

emplitudine este 525 50 = 475D medi lor este 154.15D medin este 105.75D modul este 100D urtil
inferior este Q1 = 84D urtil superior este Q3 = 140D Q2 = M e i distn interurtili este

d = Q3 Q1 = 56F
wedin este vlore e mi reprezenttiv n est zD deoree ele mi mri trei preuriD nume

340.5D 475.5D 525D mres medi i o f mi puin reprezenttiv pentru elellte dteF n zul n re
setul de dte nu este simetriD vlore medin este e mi reprezenttiv vlore dtelorF n

MatlabD

X = [113; 60.5; 340.5; 130; 79; 475.5; 90; 100; 175.5; 100; ...
111.5; 525; 50; 122.5; 125.5; 75; 150; 89; 100; 70
a = range(X);
m = mean(X);
Me = median(X);
Mo = mode(X);
Q1 = quantile(X,0.25); Q2 = quantile(X,0.5); Q3 = quantile(X,0.75); d = Q3 - Q1;

Exerciiu 4.5 gonsiderm dtele din elul IFTF hetermini mplitudineD mediD medinD modulD
dispersi i prim urtil pentru este dteF

Soluie:
x=

emplitudine este a = 30F wedi este

(x f )
1
=
(2.5 5 + 7.5 13 + 12.5 23 + 17.5 17 + 22.5 10 + 27.5 2) = 13.9286.
n
70

hispersi esteX

s2

1
( (x2 f ) n x2 )

n1
1
=
(2.52 5 + 7.52 13 + 12.52 23 + 17.52 17 + 22.52 10 + 27.52 2 70 13.92862 )
69
= 37.06.
=

gls medin este ls [10, 15)F heoree n lsele nteriore @[0, 5) i [5, 10)A se ) dej 5 + 13 = 18
dte mi mii det medinD pentru ) nlime medin plntelor @iFeFD e vlore re este
mi mre det nlime 35 de plnte i mi mi det nlime lte 35 de plnteAD v treui s
determinm e vlore din ls medin e este mi mre det lte 17 vlori din est lsF edrD
vem nevoie de determin o frie

17
23

dintre vlorile lsei medineF n onluzieD vlore medin este

M e = 10 +

17
5 = 13.6957.
23

gls modl este [10, 15)D ir modul este vlore entrl lseiD 12.5F
glulm um prim urtilF mprim setul de dte n ptruF rim urtil este e vlore dintre
ele 70 re este mi mre det lte 18 vloriD di Q1 = 10F

smplementre n

MatlabX

x = [2.5; 7.5; 12.5; 17.5; 22.5; 27.5];


% centrele claselor
f = [5; 13; 23; 17; 10; 2];
% frecventele
n = 70; m = sum(x.*f)/n; s2 = (sum(x.^2.*f) - n*m^2)/(n-1);

105

4.3. Exerciii rezolvate

Exerciiu 4.6 y ompnie de sigurri nregistrt numrul de idente pe lunD e u vut lo ntrEun
numit stD n deurs de un n @52 de sptmniAF eeste suntD n ordineX

1, 0, 2, 3, 4, 1, 4, 0, 4, 2, 3, 0, 3, 3, 1, 2, 3, 0, 1, 2, 3, 1, 3, 2, 3, 2,
4, 3, 4, 2, 3, 4, 4, 3, 2, 4, 1, 2, 0, 1, 3, 2, 0, 4, 1, 0, 2, 2, 4, 1, 2, 2
(a) gonstruii un tel de frevene re s onin numrul de identeD frevenele solute i reltiveF
(b) qsii medi empiriD medin i devii stndrd empiriF
(c) eprezenti prin re rezulttele din telul de freveneF
(d) qsii i reprezenti gr( @cdfplotA funi de reprtiie empiri numrului de identeF
(e) eproximi proilitte s ( vut el puin dou identeF

Soluie:

puni de reprtiie empiri esteX


numrul
frevF sF
frevF relF

0
7
0.1346

1
9
0.1731

2
14
0.2692

3
12
0.2308

4
10
0.1923

Tabela 4.2: Tabel de frecvene pentru Exerciiu 4.6

Fn (x) = P (X x) =

0,

,
52

16
,
52

30 ,
52

42
,

52

1,

d x < 0;
d x [0, 1);
d x [1, 2);
d x [2, 3);
d x [3, 4);
d x 4.

qr(ul lui Fn (x) este reprezentt n pigur RFPF

Figura 4.2: Reprezentare pentru numrul de accidente.

106

Capitolul 4. Elemente de Statistic descriptiv

roilitte erut l (e) esteX

P (X 2) = 1 P (X < 2) = 1 P (X 1) = 1 Fn (1) = 1

godul

16
= 0.6923.
52

Matlab pentru lule i gr(e esteX

Y = [zeros(7,1);ones(9,1);2*ones(14,1);3*ones(12,1);4*ones(10,1)];
m = mean(Y); s = std(Y); Me = median(Y);
subplot(1,2,1); bar(0:4,[7,9,14,12,10])
% graficul cu bare
subplot(1,2,2); cdfplot(Y)
% graficul functiei de repartitie empirice
hup rulre oduluiD oinemX

m =
2.1731

s =
1.3094

Me =
2

Exerciiu 4.7 estm medi notelor oinute de studenii din ultimul n l unei universitiF preE
supunem pentru este note vem medi de seleie x = 7.24 i devii stndrd s = 0.7F wedi t
este 8.45F gre i este pozii mediei tleD rportt l mediile olegilor tic @iFeFD te deviii stndrdD

sD dedesutul su desupr mediei de seleie te situezicA

Soluie:

glulm sorul Z F evemX

z=

xx
8.50 7.24
=
= 1.8 deviii stndrd desupr mediei de seleie.

0.7

4.4 Concluzii
ttisti desriptiv este e prte ttistiii e se oup de ulegereD lsi(re i desriere dtelor
sttistieF rim grij ttistiii desriptive este grupre dtelorD rezulttele estei grupri pr n
tele iD eventulD su form de gr(eF entru o desriere mi detlit tendinelor dtelor uleseD se
de(nes diverse msuri desriptiveD n funie de rspunsurile pe re le utmF hup um m vzut n
est pitolD msuri desriptive pot ( de(nite tt pentru dtele negrupteD t i pentru ele grupteF
wsurile tendinei entrle studiz vlorile medii le unui set de dte sttistieD msurile de dispersie
jut l desriere mprtierii dtelor n jurul medieiD ir ele pentru poziie @untileleA sunt utilizte
pentru desriere loiei unei numite oservii n rport u elellte dteF
n generlD volumul populiei este mreD stfel msurile i 2 sunt forte rr lulteF he ele mi
multe oriD este sunt estimte folosind orespondenii lor pentru seleiiD x i s2 F h de(nii pentru

x pre nturlD folosire lui

1
n1

n lo de

1
n

n formul dispersiei de seleie pote pre surprinztoreF

eest re sop o mi un proximre vlorii 2 u jutorul vlorii s2 D prin reduere erorii de


proximre e pote pre n zul seleiilor de volum miF heoree vlorile x i s2 sunt dor nite
estimii le vlorilor rele orespunztore pentru ntreg populieD este posiil este s nu (e
forte preise i s vem nevoie de teste sttistie pentru vlidre ipotezelor fute supr prmetrilor
reliF eeste vor ( disutte mi pe lrg n pitolele e urmezF

107

4.5. Exerciii propuse


wediul

Matlab filitez lulul estor msuri pentru mele tipuri de dteF n rol forte importnt

l re introduere dtelor n pliieF n exeriiile rezolvte m exempli(t implementre formulelor


nteriore n

MatlabF

4.5 Exerciii propuse


Exerciiu 4.1 entru evlure rezulttelor oinute l tez de wtemti de tre elevii unei numite
oliD se fe un sondj de volum 35 printre elevii oliiD ir notele lor sunt sumrizte n elul RFQF
note
freven

4
3

5
6

6
7

7
8

8
5

9
4

10
2

Tabela 4.3: Medii generale i frecvene


@iA se luleze mediD dispersi i vlore medin le seleiei onsiderteD preiznd formulele
folositeF
@iiA se srie i s se reprezinte gr( funi de reprtiie pentru est seleieF
@iiiA notm u X vriil letore re guvernez populiF tiliznd selei de mi susD s se
proximeze proilitte P (6 X 8)F

Exerciiu 4.2 gonsiderm dtele grupte din elul IFIF entru este dteD s se luleze mediD
modulD medinD dispersi i devii stndrdF

Exerciiu 4.3 gonsiderm dtele din elul IFPF entru este dteD s se luleze mediD modulD
medinD dispersi i distn interurtiliF

Exerciiu 4.4 gonsiderm dtele din elul IFRF entru este dteD s se luleze mediD modulD
medinD dispersi i devii stndrdF

Exerciiu 4.5 gluli mediD modulD medinD dispersi i urtilele pentru dtele din elul IFSF
Exerciiu 4.6 hetermini urtilele pentru dtele din elul RFQF
Exerciiu 4.7 hetermini urtilele i deilele pentru dtele din elul IFIF
Exerciiu 4.8 hetermini mplitudineD mediD medinD modulD urtilele i distn interurtili
pentru urmtorele dteX

22

19

13

11

20

18

15

108

Capitolul 4. Elemente de Statistic descriptiv

Capitolul

Noiuni de teoria seleciei


5.1 Introducere
Deniia 5.1 xumim colectivitate statistic @su populaieA o mulime nevid de elemente re este
erett din punt de vedere l unei su mi multor rteristiiF ilementele oletivitii le vom
numi indivizi @su uniti statisticeAF om not u o unitte sttistiF h populi este (nitD
tuni numrul n l unitilor sttistie e o ompun @iFeFD rd@AA l vom numi volumul colectivitii @su

volumul populaieiAF
gonsiderm o populie @oletivitte sttistiA F tudiem populi din puntul de vedere l unei
rteristii sleD X F eest rteristi este o numit propriette urmrit l indivizii ei n proesul
prelurrii sttistie i o vom simil u o vriil letore de(nit pe F rolem esenil ttistiii
wtemtie este de stili lege de proilitte pe re o urmez rteristi X F entru gsi est
lege @reprtiieAD vem nevoie mi nti de un numr reprezenttiv de oservii supr oletivitii F e
z estor oserviiD vom determin prin inferen o lege re s reprezinte vriil X F

Deniia 5.2 om numi selecie @su sondajA o suoletivitte oletivitii erette F xumrul eleE
mentelor seleiei port numele de volumul seleciei (sondajului)F eleiile pot ( repette su nerepetteF
y seleie se numete repetat @su bernoullianA d dup exminre individului est se reintrodue
n oletivitteY n z ontrr vem o selecie nerepetatF n prtiD volumul oletivitii este mult
mi mre det volumul seleieiF n este zuriD selei nerepett pote ( onsidert (ind seleie
repettF eleiile pe re le vom onsider n ontinure sunt numi seleii repette din oletivitte
sttistiF
horim um s introduem un dru mtemti strt pentru este seleii repette @pentru o ordre
mi detlitD se pote onsult IIAF
gonsiderm spiul msuril (, F)D unde F este un orp orelin de pri le lui F grteristi X
urmrit pote ( reprezentt de o vriil letore de(nit pe (, F)F horim s de(nim mtemti o
seleie repett de volum nF iuristiD idee este urmtoreX efetu n sondje repette dintrEo mulime

D este ehivlent u onsider o singur seleie dintrEo populie de genul 4 multiplicat de n ori4F
gonstruim stfelX

(n) = ,

F (n) = F F F,

109

110

Capitolul 5. Noiuni de teoria seleciei

produs rtezin de n oriF n element l lui (n) v (

(n) = (1 , 2 , . . . , n ),
numit selecie repetat de volum nF guplul ((n) , F (n) ) se numete spaiul seleciilor repetate de volum

nF pie vriilele letore


Xi : (n) R,

Xi ( (n) ) = X(i ),

i = 1, n.

eeste sunt vriile letore de(nite pe ((n) , F (n) )D sunt independente stohsti @pentru vFF

{X(i )}i=1, n

sunt independenteA i sunt identi reprtizteD u funi de reprtiie omun FX @se

veri( usor FXi = FX , i = 1, nAF om numi Xi , i = 1, nD variabile aleatoare de selecie repetat de

volum nF om numi vector de selecie repetat de volum nD vetorul Y D stfel ntX


Y : (n) R,

Y ( (n) ) = (X1 ( (n) ), X2 ( (n) ), . . . , Xn ( (n) )).

entru un (n) (xtD omponentele vetorului Y ( (n) ) se numes valori de selecie repetat de volum nF
om not u

Ln = Y ((n) ) Rn ,
iEl vom numi spaiul valorilor de selecie repetat de volum nF ilementele lui Ln le vom not prin

x = (x1 , x2 , . . . , xn ),
(xi = Xi ( (n) ), pentru (n) (xtD i = 1, 2, . . . , n).

Deniia 5.3 om numi statistic @su funcie de selecieA vriil letore


Sn (X) = g(X1 , X2 , . . . , Xn ),
unde g este o funie g : Rn R msuril @iFeFD B B(R),

g 1 (B) B(Rn )AF

g o oservieD numele de 4sttisti4 este folosit n litertur de speilitte tt pentru vriil


letore de mi susD t i pentru vlore eiD nelesul ext desprinznduEse din ontextF eprtii
unei sttistii se mi numete i repartiia (distribuia) de selecieF

NotaiiX

n literturD sttisti este nott u un dintre urmtoreleX

Sn (X),

S(X, (n) ),

S(X, n),

S(X1 , X2 , . . . , Xn ).

lore numeri

Sn (x) = g(x1 , x2 , . . . , xn )
se numete valoarea funciei de selecie pentru un (n) (xtF

Observaia 5.4 edrD o sttisti este o funie de vriilele letore de seleieF rin intermeniul
sttistiilor putem trge onluzii despre populi D din re provenit entionul (n) F eori proE
ilitilor ne ofer proedee de determinre tt reprtiiei exte lui Sn (X)D t i reprtiiei
simptotie lui Sn (X)F Repartiia exact este e e pote ( determint pentru orie volum l seleieiF

5.2. Exemple de statistici

111

n generlD d se lurez u seleii de volum redus @n < 30AD tuni reprtii ext r treui s (e
unosut a prioriD d se dorete lure de deizii prin inferenF Repartiia asimptotic este reprtii
limit Sn (X) nd n D ir utilizre estei ondue l rezultte une dor pentru n 30F
he ele mi multe oriD o funie de seleie @sttistiA este utilizt n urmtorele zuriX

n proleme de estimre puntul prmetrilorY


n oinere intervlelor de nredere pentru un prmetru neunosutY
o sttisti test pentru veri(re ipotezelor sttistieF

5.2 Exemple de statistici


pie (, F) o oletivitte sttisti i X o rteristi erett sF notm u f (x) i F (x) densiE
tte de reprtiieD respetivD funi de reprtiie pentru X F eeste pot ( unosute su neunostute

a priori i le vom numi funcii teoretice @respetivD densitate de repartiie teoretic i funcie de repartiie
teoreticAF h se unote f (x)D tuni putem determin = E(X) i 2 = D2 (X)D d este existD
i le vom numi medie teoretic i dispersie teoreticF
n zul n re un su mi multe rteristii teoretie orespunztore lui X nu ne sunt a priori
unosuteD vom ut s le determinm prin inferenD di prin extrgere unor seleii de dte din
oletivitteD lulnd rteristiile respetive pentru seleiile onsiderte i poi extrpolnd @n nE
umite ondiii i dup numite riteriiA l ntreg oletivitteF
onsiderm (n) o seleie repett de volum n din oletivitte dt i Xi , i = 1, nD vriilele
letore de seleieF gu jutorul estorD putem onstrui diverse funii de seleieF

Media de selecie

@meanA

Deniia 5.5 xumim medie de selecie (repetat de volum n)D sttisti


X( (n) ) =

1
n

Xi ( (n) ),

(n) (n) .

@SFIA

i=1

entru un (n) (xtD s notm u {x1 , x2 , . . . , xn } vlorile de seleie orespunztore vriilelor letore
de seleie {X1 , X2 , . . . , Xn }F etuni vlore mediei de seleie pentru un (n) (xt esteX

x=

1
n

(medi empiri).

xi
i=1

Propoziia 5.6 wedi de seleie stisfe urmtorele proprietiX


D2 (X) =

E(X) = E(X),
1
n

D2 (X)
;
n

@SFPA

E(X),

nd n .

@SFQA

Xi
i=1

a.s.

112

Capitolul 5. Noiuni de teoria seleciei

Observaia 5.7 @IA n pitolele urmtore vom srie reli @SFRA su form restrnsX
X=

1
n

Xi .

@SFRA

i=1

entru simplitte formulelorD de um ninte vom fe strie de dependen de (n) n formuleD re


se v sunelegeF
@PA

ropozii SFPR preizez re este reprtii mediei de seleie pentru vriile letore de seleie

dintrEo oletivitte normlD ir ropozii SFPT preizez re este reprtii simptoti mediei de
seleie pentru vriile de seleie ntrEo oletivitte orereF

Momente de selecie

Deniia 5.8 xumim moment de selecie (repetat de volum n) de ordin k, (k N )D sttisti


1
k (X) =
n

n
k
Xi .
i=1

lore momentului de seleie de ordin k pentru un (n) (xt esteX

1
k (x) =
n

(moment iniil empiri de ordin k).

xk
i
i=1

n zul prtiulr k = 1D vemX

1 (X) = X.

Propoziia 5.9 entru orire k (xtD k N D vemX


E(k (X))
D2 (k (X))

1
n

(momente iniile teoretie pentru X)

E(X k ) = k (X),
D2 (X k )
,
n

n
k
Xi

a.s.

k (X), nd n .

i=1

Momente de selecie centrate

Deniia 5.10 xumim moment de selecie centrat de ordin kD sttisti


k (X) =

1
n

[Xi X]k .
i=1

lore momentului de seleie de ordin k pentru un (n) (xt esteX

k (x) =

1
n

[xi x]k
i=1

(moment entrt empiri de ordin k).

5.2. Exemple de statistici

113

Propoziia 5.11 entru orire k (xtD k N D vemX


E(k (X))
1
n

(momente entrte teoretie pentru X)

E([X ]k ) = k (X),

a.s.

k (X), nd n .

(Xi X)k

i=1

Dispersie de selecie

@varA

Deniia 5.12 xumim dispersie de selecie (repetat de volum n)D sttisti


1
n

d2 (X) = 2 (X) =

[Xi X]2 .
i=1

entru simplitteD o vom not u d2 (X)D ir vlore estei pentru un (n) (xt esteX

d2 (x) =

1
n

(dispersi empiri).

[xi x]2

@SFSA

i=1

he ele mi multe oriD n loul lui d2 (X) se utilizez sttisti d2 (X)D de(nit prinX

d2 (X) =

1
n1

[Xi X]2 .

@SFTA

i=1

eest se mi numete i dispersie de selecie modicatD ir vlore ei pentru un (n) (xt esteX

s2 = d2 (x) =

1
n1

(dispersi empiri modi(t ).

[xi x]2
i=1

wotivi pentru onsiderre sttistiii d2 (X) este dt de proprietile din propozii urmtoreX

Propoziia 5.13 hispersiile de seleie veri( urmtorele reliiX


E(d2 (X)) =

n1 2
D (X),
n

E(d2 (X)) = D2 (X)

prob

d2 (X)

@SFUA

D2 (X), nd n .

@SFVA

Observaia 5.14 @iA hup um vom vede n pitolul urmtorD primele dou relii rt sttisti
d2 (X) este un estimtor nedeplst pentru dispersi teoretiD pe nd d2 (X) este estimtor deplstF

@iiA h medi teoreti oletivitii este unosut a prioriD E(X) = RD tuni dispersi de
seleie d2 (X) devineX

d2 (X) =

1
n

[Xi ]2 .
i=1

ropozii SFQH preizez re este reprtii estei sttistiiF

@SFWA

114

Capitolul 5. Noiuni de teoria seleciei

Funcia de repartiie de selecie

@cdfplotA

Deniia 5.15 pie X1 , X2 , . . . , Xn vriile letore de seleie repett de volum nF xumim funcie
de repartiie de selecie (repetat de volum n)D funi

Fn : R (n) R,

Fn (x, (n) ) =

n(x)
,
n

(x, (n) ) R (n) ,

unde n(x) = rd {i, Xi ( (n) ) x} reprezint numrul de elemente din seleie mi mii su egle u xF
eli din de(niie pote ( sris i su formX

Fn (x) =

1
n

(, x] (Xi ),

x R,

i=1

unde A este funi inditore mulimii AF

entru un x R (xtD Fn ( (n) ) este o vriil letore distriuit inomil B(n, F (x))F

entru (ere (n) (n) (xtD Fn (x) i vlorileX

Fn (x) =

rd {i, xi x}
,
n

@iFeFD este funi de reprtiie empiri de(nit n RFQAF

Propoziia 5.16 puni de reprtiie de seleie stisfe urmtorele reliiX

E(Fn (x))

(Fn (x))

= F (x), x R;
1
=
[F (x)(1 F (x))],
n

x R;

n ttistiD exist o serie de riterii re permit s se preieze propiere lui Fn (x) de F (x)F wi josD

mintim dor tev dintre eleF

Propoziia 5.17 puni de reprtiie de seleie stisfe onvergen


a.s.

Fn (x) F (x), x (xt n R.

Demonstraie. ezulttul este o onsein diret legii tri numerelor mriF

Propoziia 5.18 puni de reprtiie de seleie stisfe onvergen

n(Fn (x) F (x)) N ( 0, F (x)(1 F (x)) ), x (xt n R.

Demonstraie. ezulttul este o onsein diret ropoziiei SFIT i teoremei limit entrlF

Teorema 5.19 (Glivenko-Cantelli) pie X o rteristiD F (x) funi s de reprtiie i Fn (x) funi

de reprtiie empiri orespunztore unei seleii de volum nF etuni Fn (x) converge uniform l F (x)D

diX

sup |Fn (x) F (x)| 0, u proilitte 1.

xR

115

5.3. Statistici de ordine

Teorema 5.20 (Kolmogorov) pie rteristi X de tip ontinuuD re re funi de reprtiie teoreti

F i (e funi de reprtiie de seleie Fn F h notm u

dn = sup |Fn (x) F (x)|,


xR

tuni vemX

lim P ( n dn < x) = K(x) =

(1)k e2 k

x2

x > 0.

@SFIHA

k=

Observaia 5.21 puni K de(nit prin @SFIHA se numete funcia lui Kolmogorov i re vlorile telteF
y vom utiliz mi trziu n eori deiziei @testul uolmogorovAF

5.3 Statistici de ordine


Deniia 5.22 h vriilele letore din selei {X1 , X2 , . . . , Xn } le rernjm n ordine mrimii
lor i sriem

X(1) X(2) X(n) ,


tuni vom numi vriil letore X(i)) statistica de ordine de ordin iD pentru orie i = 1, 2, . . . , nF
entru o seleie dtD vlore sttistiii de ordine de ordin i o vom not prin x(i) D pentru orie i =

1, 2, . . . , nF
ttisti X(1) se numete prima statistic de ordine i este ntotdeun minimumul seleieiD iFeFD

X(1) = min{X1 , X2 , . . . , Xn }.
ttisti X(n) se numete ultima statistic de ordine i este ntotdeun mximumul seleieiD iFeFD

X(n) = max{X1 , X2 , . . . , Xn }.
he exempluD d vem vlorile de seleie

x1 = 8,

x2 = 7,

x3 = 9,

x4 = 5,

x5 = 3,

tuni

x(1) = 3,

x(2) = 5,

x(3) = 7,

x(4) = 8,

x(5) = 9.

h n = 2m + 1D tuni X(m) = X( n+1 ) = X D di medi de seleie este o sttisti de ordine n est


2

zF h n = 2mD tuni vem dou vlori de mijloD X(m) i X(m+1) F heoree X = 1 (X(m) + X(m+1) )D
2
medi de seleie nu este sttisti de ordine pentru n prF
he(nim amplitudinea (range) seleiei (ind sttisti A = X(n) X(1) F ttistiile X(n) X i X(1) X
se numes deviaiile extreme ale selecieiF
hei vriilele letore de seleie sunt independenteD totui sttistiile de ordine sunt dependenteF
presupunem F (x) este funi de reprtiie seleiei dte i f (x) densitte de reprtiieF rmE
tore propoziie stilete funiile de reprtiie pentru sttistiile de ordineF

116

Capitolul 5. Noiuni de teoria seleciei

Propoziia 5.23 entru un k (xtD funi de reprtiie pentru X(k) esteX


n

pentru orie x R.

j
Cn F (x)j [1 F (x)]nj ,

FX(k) (x) =
j=k

Demonstraie. evem suesivX


FX(k) (x)

d
P (X(k) x)
dx
= P ({el puin un X din n x})
=

= P ({el puin k suese n n nerri})


n
j
Cn [P (X x)]j [1 P (X x)]nj

=
j=k
n

j
Cn F (x)j [1 F (x)]nj ,

pentru orie x R.

j=k

n prtiulrD pentru k = 1D oinem funi de reprtiie elui mi mi element l seleieiX


pentru orie x R.

FX(1) (x) = 1 [1 F (x)]n ,

puni de reprtiie elui mi mre element l seleiei esteX

FX(n) (x) = [F (x)]n ,

pentru orie x R.

5.4 Selecii aleatoare dintr-o colectivitate normal


onsiderm o oletivitte sttisti i X o rteristi sD e urmez ( studit din punt
de vedere sttistiF pie {X1 , X2 , . . . , Xn } vriile letore de seleie repett de volum nF n ele mi
multe zuri prtieD X urmez o reprtiie norml @gussinAF he regulD d volumul populiei
este mi @n < 30AD tuni onsiderm dor populii normleD ir pentru n > 30 putem onsider orie tip
de reprtiie pentru oletivitteF wi josD prezentm tev rezultte utile referitore l selei dintrEo
oletivitte gussinF

Propoziia 5.24 (repartiia mediei de selecie pentru o selecie gaussian)


h Xi N (, ), i = {1, 2, . . . , n}D tuni sttisti X stisfeX

XN

,
n

(n N )

Demonstraie. om folosi metod funiei rteristieF entru o vriil letore N (, ) funi


rteristi esteX
1

(t) = ei t 2

2 2

hin reli @PFQWA i

aX (t) = X (at),

@SFIIA

5.4. Selecii aleatoare dintr-o colectivitate normal

117

oinem funi rteristi lui X esteX


n
t

ei n

X (t) =

2 t2
2 n2

= e

it

1
2

t2

k=1

di X urmez lege de reprtiie N (,

).
n

y onsein diret estei propoziii este urmtoreX

Propoziia 5.25 h Xi N (, ), i = {1, 2, . . . , n} sunt vriile letore de seleieD tuni


Z=

X
N (0, 1).

Propoziia 5.26 (repartiia mediei de selecie pentru o selecie oarecare)


h {X1 , X2 , . . . , Xn } vriile letore de seleie repett de volum nD e urmez o reprtiie dtD
tuni pentru un volum n su(ient de mreD sttisti X stisfeX

XN

,
n

(n > 30)

Demonstraie. eest rezultt este o onsein imedit onluziei teoremei limit entrlF

Observaia 5.27 h n este su(ient de mreD tuni onluzi ropoziiei SFPS rmne vlil i
n zul n re vem o seleie repett de volum n dintrEo oletivitte sttisti e nu este neprt
gussinF

Propoziia 5.28 h i N (i , i ) sunt vriile letore independente stohsti i ai R, i = 1, nD


n

ai i stisfe proprietteX

tuni vriil letore =


i=1

2
a2 i .
i

ai i ,
i=1

i=1

Demonstraie. hemonstri este zt pe metod funiei rteristieF

[Exerciiu!]

Propoziia 5.29 pie i N (i , i ) vriile letore independente stohsti i ai R, i = 1, nF


entru (ere rteristi i onsiderm te o seleie repett de volum ni D pe re o vom not u i F
etuni sttisti Y = a1 1 + a2 2 + . . . + an n stisfe proprietteX

Y N

2
i
a2
.
i
ni
i=1
n

ai i ,
i=1

Demonstraie. heoree i N (i , i )D din ropozii SFPR oinem medi de seleie orespunztoreD


i D stisfeX
i N

i
i ,
ni

118

Capitolul 5. Noiuni de teoria seleciei

eplind rezulttul ropoziiei SFPV vriilelor letore independente {1 , 2 , . . . , n }D oinem onluzi


doritF
rmtore propoziie este un z prtiulr l ropoziiei SFPWF

Propoziia 5.30 (repartiia diferenei mediilor de selecie pentru colectiviti gaussiene)


gonsiderm o seleie de volum n1 dintrEo populie norml N (1 , 1 ) i o seleie de volum n2 dintrEo
oletivitte N (2 , 2 )D ele dou seleii (ind lese independent un de elltF xotm u 1 iD respetivD

2 mediile de seleie orespunztore seleiilor leseF etuni sttisti

1 2 N 1 2 ,

2
1

n1

2
2

n2

Demonstraie. eplim rezulttul ropoziiei SFPW pentru zul prtiulr n re vem dor dou vriile
letoreD 1 i 2 D ir a1 = 1, a2 = 1F

Observaia 5.31 @IA gonluzi propoziiei nteriore se mi pote srie stfelX


Z=

@PA

(1 2 ) (1 2 )
2
1
n1

2
2
n2

N (0, 1).

presupunem vem dou populii sttistie normleD 1 i 2 D ir este o rteristi omun

elor dou populiiD e urmez ( studitF @he exempluD populiile sttistie s (e mulime pieselor
produse de dou strunguri ntrEo zi de luruD ir rteristi omun s (e ms lorAF mi presupunem
deviiile stndrd le rteristiilor onsiderte sunt unosute @iFeFD deviiile sunt dte dej n rte
tehni elor dou strunguriAF entru (ere dintre ele dou oletivitiD onsiderm te o seleie
repettD de volume n1 D respetivD n2 @diD vom selet n1 dintre piesele produse de strungul nti i n2
piese produse de el deEl doile strungAF notm u 1 D respetivD 2 mediile de seleie orespunztoreF
ropozii nterior preizez re este reprtii diferenei stndrdizte le elor dou medii de seleieF
eest ne v ( deoseit de utilD spre exempluD n veri(re ipotezei msele medii le pieselor produse
de ele dou strunguri oinid @vezi pitolul eori deizieiAF

Propoziia 5.32 pie {X1 , X2 , . . . , Xn } vriile letore independente stohstiD stfel nt Xi


N (0, 1) D i = {1, 2, . . . , n}F etuni vriil letore
n

H2 =

2
Xk 2 (n).
i=1

Demonstraie. entru demonstr propoziiD folosim metod funiei rteristieF entru estD
vem nevoie de funi rteristi pentru X 2 D unde X N (0, 1)F
notm u f (x) funi densitte de reprtiie pentru X D dt de reli @PFRQA u = 0F xotm u

G(y) funi de reprtiie pentru X 2 i u g(y) densitte s de reprtiieF evemX

G(y) = P (X 2 y) =

,
P (y X y) ,

y 0;
y > 0,

5.4. Selecii aleatoare dintr-o colectivitate normal


de unde

g(y) = G (y) =

2 y [f ( y)

y 0;

+ f ( y)] ,

119

y > 0,

0
,
=

f ( y) ,
1
y

y 0;
y > 0.

puni rteristi pentru X 2 v (X

= E ei t X

X 2 (t)

(1 2it)

1
=
2

1
2

y 2 e 2 dy
0

heoree vriilele letore {Xi }i sunt independente stohstiD putem pli reli @PFQWA i oinemX
n

H 2 (t)

n
i=1

= E(eit

2
Xi

E eitXi

)=
i=1

n
n

2
Xi (t) = (1 2it) 2 .

=
i=1

eest este funi rteristi pentru o vFF 2 (n)F

Observaia 5.33 y onsein imedit estei propoziii este D d X N (0, 1)D tuni vFF
X 2 2 (1)F rmtore propoziie este tot o onsein diret ropoziiei SFQPF

Propoziia 5.34 (repartiia dispersiei de selecie cnd media colectivitii este cunoscut)
pie {X1 , X2 , . . . , Xn } vriile letore independente stohstiD stfel nt Xi N (, )D pentru

i = {1, 2, . . . , n}F etuni vriil letore


H2 =

1
2

(Xi )2 2 (n).
i=1

Demonstraie. entru (ere i = {1, 2, . . . , n}D onsider vriilele letore


Yi =
gonform ropoziiei SFPSD vem Yi N (0, 1),

Xi
.

i = 1, nF eplim rezulttul propoziiei SFQP pentru

vriilele letore {Y1 , Y2 , . . . , Yn } i oinem onluzi doritF

Lema 5.35 h X i Y sunt vriile letore independente stohstiD stfel nt X 2 (n) i


X + Y 2 (n + m)D tuni Y 2 (m)F

Demonstraie. hemonstri se zez pe metod funiei rteristieD folosind fptul


X (t) Y (t) = X+Y (t), t R.

120

Capitolul 5. Noiuni de teoria seleciei

Lema 5.36 pie X rteristi unei oletiviti sttistie N (, )D X medi de seleie repett de
volum n i d2 (X) dispersi de seleie repettF etuniD sttistiile

n
(X )

n1 2
1
d (X) = 2
2

(Xi X)2

sunt independente stohstiF

i=1

Demonstraie. hemonstri este tehni i nu m inlusEo n est mterilF eest lem este demonE
strt n R @eorem sFPFSAF

Propoziia 5.37 pie X N (, ) rteristi unei populii sttistie i (e {X1 , X2 , . . . , Xn } vriE


ile letore de seleie repett de volum nF etuni sttisti

1
2

2 =

(Xi X)2 2 (n 1).


i=1

Demonstraie. utem srieX


1
2

(Xi )2
i=1

=
suD

n
2
Zi

i=1

undeX

Zi =

1
2

(Xi X)2 +
i=1

n
(X )2
2

n1 2
2
d (X) + Z ,
2

Xi
N (0, 1)

Z=

@SFIPA

@SFIQA

N (0, 1).

tiliznd ropozii SFQRD oservm memrul stng l eglitii @SFIPA este o vriil letore reprtiE
zt 2 (n)F polosind yservi SFQQD onluzionm l doile termen din memrul drept este reprtizt

2 (1)F tiliznd lem nterior i folosind rezulttul ixeriiului PFIRD deduem vriilele letore
2

Z i

n1
2

d2 (X) sunt independente stohstiF pem pel l vem SFQSD i jungem l onluzi propozE

iieiF

Observaia 5.38 gonluzi propoziiei SFQU se pote resrie stfelX


n1 2
d (X) 2 (n 1),
2

@SFIRA

unde d2 (X) este dispersi de seleieF

Lema 5.39 h X i Y sunt vriile letore independente stohstiD u X N (0, 1) i Y 2 (n)D


tuni sttisti

T =

X
Y
n

t (n).

Demonstraie. pie f (x) i g(y) densitile de reprtiie pentru X D respetivD Y F evemX


x2
1
f (x) = e 2 , x R,
2

121

5.4. Selecii aleatoare dintr-o colectivitate normal


n
y
y 2 1 e 2
n n
2 2 ( 2 )
g(y) =

, y > 0;
, y 0.

hin independenD gsim densitte de reprtiie vetorului (X, Y ) esteX


x2 +y
2

y 2 1 e
h(x, y) = f (x)g(y) = n+1
2 2

n
2

(x, y) R (0, ).

gonsiderm o trnsformre estui vetorD

t = x

y
n

v = y,
n vetorul (T, Y )F hensitte de reprtiie estui vetor este @vezi ropozii PFRTAX
n

t2

v 2 1 e 2 (1+ n )
k(t, v) = n+1
2 2 n
2

v
,
n

(t, v) R (0, ).

hensitte de reprtiie mrginl pentru T esteX

k1 (t)

k(t, v) dv
0

n+1
2

n n
2

1+

t2
n

n+1
2

t R,

di tomi densitte de reprtiie unei vriile letore t(n)F

Propoziia 5.40 h {X1 , X2 , . . . , Xn } sunt vriile letore de seleie repett de volum nD e


urmez reprtii unei rteristii X N (, ) unei oletiviti sttistieD tuni sttisti

t=

X
t(n 1).
d (X)

n1

@eiiD t(n 1) este reprtii tudent u (n 1) grde de liertteD ir d (X) =

d2 (X) AF

Demonstraie. eplim lem nterior pentru vriilele letore


X=

N (0, 1)

Y =

n1 2
d (X) 2 (n 1).
2

Observaia 5.41 eest propoziie v ( folosit n teori deizieiD n prolem testrii mediei teoretie
nd dispersi teoreti este neunosut a prioriF
rmtore propoziie este un z prtiulr l ropoziiei SFRHX

122

Capitolul 5. Noiuni de teoria seleciei

Propoziia 5.42 h vriilele letore {X0 , X1 , . . . , Xn } sunt independente stohstiD identi reprE
tizte N (0, 1)D tuni vriil letore

X0

T =

t (n).

2
2
2
X1 +X2 + ... +Xn
n

Demonstraie. gonluzi rezult prin plire ropoziiei SFQP i vemei SFQWF

Propoziia 5.43 (repartiia diferenei mediilor de selecie cnd dispersiile sunt necunoscute, egale)
gonsiderm o seleie de volum n1 dintrEo populie norml N (1 , 1 ) i o seleie de volum n2 dintrEo
oletivitte N (2 , 2 )D ele dou seleii (ind lese independent un de elltF xotm u 1 , 2 i

d2 = d2 (X1 )D d2 = d2 (X2 ) mediile de seleie i dispersiile de seleie orespunztore seleiilor leseF

1
2
etuni sttisti

T =

(1 2 ) (1 2 )
(n1 1)d2 + (n2 1)d2
1
2

n1 + n2 2
1
1
n1 + n2

t (n1 + n2 2).

Demonstraie. gonsiderm vriil letore


U=

(1 2 ) (1 2 )

1
n1

1
n2

e veri( u uurin U N (0, 1)F pie vriil letore

V =
gonform reliei @SFIRAD vem

(n2 1) d2
(n1 1) d2
2
1
+
.
2
2

(n1 1) d2
1
2

2 (n1 1) i

(n2 1) d2
2
2

2 (n2 1)F heoree este dou

sttistii sunt independenteD tuni sum lorD sttisti V D stisfe V 2 (n1 + n2 2)F gonluzi
propoziiei rezult prin simpl plire vemei SFQW vriilelor letore U i V F

Propoziia 5.44 h X 2 (m) i Y 2 (n) sunt vriile letore independenteD tuni vriil
letore

F =

n X
F(m, n).
m Y

Demonstraie. pie f (x) i g(y) densitile de reprtiie pentru X iD respetivD Y F evemX


m
x 2 1 e x
m m2
2 2 ( 2 )
f (x) =

0
n
y
y 2 1 e 2
n n
2 2 ( 2 )
g(y) =

, x > 0;
, x 0.

, y > 0;
, y 0.

5.4. Selecii aleatoare dintr-o colectivitate normal

123

hin independen elor dou vriile letoreD gsim densitte de reprtiie vetorului (X, Y ) esteX
m

x 2 1 y 2 1 e

h(x, y) = f (x)g(y) =

m+n
2

m
2

x+y
2

n
2

(x, y) (0, ) (0, ).

gonsiderm o trnsformre estui vetorD

t = n x

m y
:

v = y,
n vetorul (F, Y )F hensitte de reprtiie estui vetor este @vezi ropozii PFRTAX
m
2

m
n

k(u, v) =

u 2 1 v
2

m+n
2

m+n
2 1

m
2

e 2 (1+ n

n
2

u)

(t, v) (0, ) (0, ).

hensitte de reprtiie mrginl pentru F esteX

k1 (u)

k(u, v) dv
0
m
2

m+n
m
m
2
u 2 1 1 +
u
n
m
n
2 2

m
n

m+n
2

u > 0,

di tomi densitte de reprtiie unei vriile letore F(m, n)F

Propoziia 5.45 h {X1 , X2 , . . . , Xm+n } sunt vriile letore independenteD identi reprtizte
N (0, 1)D tuni vriil letore
F =

2
2
2
n
X1 + X2 + . . . + Xm
2
2
2
m Xm+1 + Xm+2 + . . . + Xm+n

F(m, n).

Demonstraie. hemonstri rezult imedit prin plire rezulttelor ropoziiilor SFQP i SFRRF

Propoziia 5.46 (repartiia raportului dispersiilor pentru colectiviti gaussiene)


pie X1 N (1 , 1 ) i X2 N (2 , 2 ) rteristiile dou populii sttistieD 1 i 2 F hin (ere
populie extrgem te o seleie repettD de volume n1 D respetivD n2 D i onsiderm d2 = d2 (X1 ) i
1
1

d2 = d2 (X2 ) dispersiile de seleie orespunztore elor dou seleii repetteF etuni sttisti
2
2
F =

2
2 d2
1
F(n1 1, n2 1).
2
1 d2
2

Demonstraie. esriem F n form ehivlentX


F =
unde

2 =
1

1
2
1

n2 1 2
1
,
n1 1 2
2

n1

(X1 i X1 )2 ,
i=1

2 =
2

1
2
2

n2

(X2 j X2 )2 ,
j=1

124

Capitolul 5. Noiuni de teoria seleciei

{X1 i }i=1, n1 i {X2 i }i=1, n2 sunt vriile de seleie repett de volume n1 D respetivD n2 D e urmez
reprtii vriilelor letore X1 D respetivD X2 F ttistiile X1 i X2 sunt mediile de seleie orespunE
ztoreF
polosind onluzi ropoziiei SFQUD vem

2 (n1 1),
1

2 (n2 1).
2

gonluzi estei propoziii urmez n urm plirii rezulttului ropoziiei SFRSF

Propoziia 5.47 (repartiia raportului dispersiilor pentru colectiviti gaussiene)


untem n ondiiile ropoziiei SFRTD u meniune mediile teoretie 1 i 2 sunt unosute a prioriF
etuni

F1 =

2
2 d2
1
F(n1 , n2 ),
2
1 d2
2

unde d2 i d2 sunt dte deX


1
2

2
1

1
=
n1

n1
2

(X1 i 1 )

(n1 ),

2
2

i=1

1
=
n2

n2

(X2 j 2 )2 (n2 ).
j=1

Demonstraie. hemonstri este similr u e de mi ninteF e foloses rezulttele ropoziiilor SFQR


i SFRSF
[Exerciiu!]

5.5 Selecii n

Matlab

tiliznd funiile

legernd(< param >, m, n)

@SFISA

random( lege , < param >, m, n)

@SFITA

introduse n gpitolul ID putem gener vriile letore de seleie de un volum dtD nF entru estD
v treui m = n n @SFISA i @SFITAF estfelD omnd

random('norm',100,6, 50,50)
generez o mtrie ptrtiD de dimensiune 50F utem privi est mtrie letore stfelX (ere
olon s orespunde unei vriile letore de seleie de volum 50D rei i preizm ele 50 de vlori
le sle oinute l o oservieF n totlD vem 50 de oloneD orespunznd elor 50 de vriile letore
de seleieF edrD m genert 50 de vriile letore de seleie de volum 50D e urmez reprtii

N (100, 6)F

5.6 Exerciii rezolvate


Exerciiu 5.48 onsiderm ms medie unor tone de ioolt produse de o min este o
rteristi X N (100, 0.65)F n vedere veri(rii prmetrilor miniiD dintre sutele de mii de tone
produse n e zi sEu les l ntmplre 1000 dintre esteF

5.6. Exerciii rezolvate

125

gluli ms medie i devii stndrd le mediei de seleieD X F


gluli P (98 < X < 102)F
n ton este delrt reut d ms s medie este su 98 de grme su peste 102 de grmeF
gluli proentul de reuturi vuteF

Soluie:

hin teorieD tim medi de seleie X urmez reprtii N (100, 0.65/ 1000) @vezi ropozii

SFPRAF edrD

X = 100,

X 0.02.

roilitte P1 = P (98 < X < 102) este

P1 = P (X < 102) P (X 98) = FX (102) FX (98) 1.


roilitte de ve un reut esteX

P2

= P {X < 98}

{X > 102}

= P (X < 98) + P (X > 102)


= FX (98) + 1 FX (102),
de undeD proentul de reuturi este

r = P2 100% 0.2091%,
di proximtiv 2 reuturi l 1000 de toneF
n

MatlabD este pot ( lulte stfelX


mu = 100; sigma = 0.65; n=1000;
% n = volumul selectiei
X = normrnd(mu, sigma, n,n);
% am generat selectia de volum n
Xbar = mean(X); S = sigma/sqrt(n);
% Xbar = media de selectie
m = mean(Xbar); s = std(Xbar);
% media si deviatia standard
P1 = normcdf(102, mu, S) - normdf(98, mu, S);
P2 = normcdf(98,mu,sigma) + 1 - normcdf(102,mu,sigma);
rebut = P2*100;

Exerciiu 5.49 xumrul trnziilor l urs din xew ork esteD n medieD de 90000 pe sptmnD u
devii stndrd 7000F presupunem urmrim numrul trnziilor ursiere ntrEun n ntreg @52 de
sptmniAF xotm u X medi de seleie pentru numrul trnziilor ursiere pe ntregul n urmritF
gluli re este proilitte evenimentului {X < 95000}F gte trnzii sEu fut @n medieA n
el nc

Soluie:

polosind de(niiD P = P (X < 95000) = F (95000),

unde FX este funi de reprtiie pentru X D ir

XN

7000
95000,
52

126
n

Capitolul 5. Noiuni de teoria seleciei

Matlab sriem stfelX


P = normcdf(9.5e4,9e4,7e3/sqrt(52))
N = 52*90000 = 4 680 000

% probabilitatea
% nr. de tranzactii

Exerciiu 5.50 ws @n grmeA unui numit tip de frnzele produse de o min ntrEo rutrie este
o vriil letore N (400, 10)F entru ontrol d min respet stndrdele ntittiveD sEu
ntrit l ntmplre 50 dintre frnzelele produse ntrEo zi de respetiv minF

(a) polosind

MatlabD s se genereze o stfel de seleie letore i s se determine medi empiri i

devii stndrd empiri pentru est seleieF @x i sA

(b) inile re u ms su 380g su peste 420g nu sunt onforme u stndrdul ggF se gses
propori de pini re nu respet stndrdul mseiF

Soluie:

@A xumrul de reuturi este r = P 100D unde P este proilitte pinile s nu (e n

onformitte u stndrdul gg esteX

P = P ({X < 380}

{X > 420}) = P (X 380) + 1 P (X 420) = FX (380) + 1 FX (420).

X = normrnd(400,10, 50,1);
m = mean(X); s = std(X);
r = (normcdf(380,400,10)+1-normcdf(420,400,10))*100

% selectie aleatoare
% = 4.5%

Exerciiu 5.51 n vedere studierii unei rteristii X e re densitte de reprtiie


x (0, 1);

0,

f (x) =

2 x,

x (0, 1).

sE efetut o seleie repett de volum n = 100F e ere s se determine proilitte P (X < 0.65)D
unde X este medi de seleieF

Soluie:

e oserv u uurin f (x) ndeplinete ondiiile unei funii de reprtiieD di este

msurilD nenegtiv i

f (x) dx =

2 x dx = 1.
0

entru lul proilitte erutD vem nevoie de E(X) i D2 (X)F evemX


1

E(X) =

2 x2 dx =

x f (x) dx =
0

D2 (X) = E(X 2 ) (E(X))2 =

x2 f (x) dx
R

edrD reprtii mediei de seleie X este

XN

2
,
3

2
1

,
3
18 100

4
1
=
.
9
18

5.7. Exerciii propuse

127

utem um lul proilitte erutF i esteX

P (X < 0.65) = FX (0.65) = normcdf(0.65, 2/3, 1/(30*sqrt(2))) = 0.2398.

5.7 Exerciii propuse


Exerciiu 5.1 gonsiderm funi f : R RD dt prin

1 e x

f (x, , ) =
0

, x > ;
, x .

@A entru e vlori le prmetrilor i D funi f (x) este o densitte de reprtiiec


@ notm u X vriil letore e re est densitte de reprtiieAY
@A pixm = 0 i = 1F pie {X1 , X2 , . . . , X64 } o seleie repett e urmez reprtii lui X D i notm
u X medi de seleieF eproximi proilitte P 0.85 X 1.15 F

Exerciiu 5.2 pie X N (, 3) @ neunosutA i notm u X medi de seleie pentru o seleie letore
efetut supr lui X F
@A eproximi vlore volumului de seleie pentru re proilitte P X 1 < < X + 1 = 0.95F
@A qsii o proximre lui D n zul n re vem informi P (X 10) = 0.1F
@A eri(i reli de l (ii) folosind proximre gsit pentru F

Exerciiu 5.3 hemonstri ropoziiile SFPTD SFPV i SFRUF


Exerciiu 5.4 presupunem 42% din populi u drept de vot intenionez s voteze pe X n
funi de preedinte l riiF gre este proilitte D fnd un sondj de opinie printre 100 de
votniD proentul elor re l votez pe X s (e ntre 40% i 50%c

Exerciiu 5.5 presupunem 17% dintre et enii unei numite ri sunt stngiF gre este proE
ilitte D legnd l ntmplre 100 de eteniD un proent de el puin 25% s (e stnggic @iFeFD re
este proilitte de gsi el puin 25 de stngi ntrEo seleie letore de 100FA

Exerciiu 5.6 polosind MatlabD seleti l ntmplre 10 de judee din ele 41 le riiF e(i judeele
selette n ordine lfetiF

Exerciiu 5.7 gonsiderm o seleie letore e urmez reprtii exp(25) @eFgFD pte pesri nernd
s prind (ere te un singur peteD tiind timpul mediu de prindere este 25minAF
qsii P (X(3) 15) @iFeFD timpul neesr pentru prindere elui deEl treile pete nu depete 15minAF

Exerciiu 5.8 gonsiderm o seleie repett de volum 350 de vriile letore e urmez reprtii
f (x) = 2 x, x (0, 1)F gluli P X 0.6 F

Exerciiu 5.9 pie X1 , X2 , . . . , Xn o seleie repett de volum n de vFF reprtizte U(0, 1)F qsii
densitile de reprtiie pentru prim i ultim sttisti de ordineF

128

Capitolul 5. Noiuni de teoria seleciei

Exerciiu 5.10 pie X1 , X2 , . . . , Xn o seleie repett de volum n de vFF reprtizte U(0, 1)F qsii
medi i devii stndrd pentru X(2) F

Exerciiu 5.11 y perehe de zruri idele este runt de 200 de oriF gre este proilitte s oinem
o sum de 7 n el puin 20% dintre zuric

Exerciiu 5.12 pie X1 , X2 , . . . , Xn o seleie de vFF rterizte de funi de reprtiie F (x) =


0 x F qsii funiile de reprtiie pentru prim i ultim sttisti de ordineF

Exerciiu 5.13 @A erti d U U(0, 1)D tuni


X = + tan
@A

qeneri n

1
2

C(, ).

Matlab o seleie de 500 de vriile letore e urmez reprtii guhy C(100, 10)F

Capitolul

Noiuni de teoria estimaiei


6.1 Punerea problemei
presupunem ni se d un set de oservii letore {x1 , x2 , . . . , xn } supr unei rteristii X
unei populii sttistieF puni de proilitte @respetiv densitte de reprtiieA rteristiii
pote (

omplet spei(tD de exempluD X U(0, 1)Y


spei(tD dr u prmetru@iA neunosut@iAF he exempluD X P() su X N (, )Y
neunosutD z n re se pote pune prolem de ( estimtF
n mod evidentD n primul z de mi sus nu vem nimi de estimtF h funi de proilitte
@densitte de reprtiieA este dej unosutD dr el puin unul dintre prmetrii si este neunosut a

prioriD se pune prolem s estimm vlore prmetrilor de re est depindeF om spune stfel
vem o prolem de estimare parametricF n est pitolD ne vom oup de estimre prmetrilor unei
reprtiii dteF
presupunem vem rteristi X re urmez reprtii oinut din funi de proilitte @su
densitte de reprtiieA f (x, )D unde este un prmetru neunosutF n generlD est prmtru pote
( un vetor @ Rp )D le rui omponente sunt prmetrii reprtiiei lui X F wi susD f este funi
de proilitte d vriil letore X este de tip disretD ir f este densitte de reprtiie lui X D
d este o vriil letore de tip ontinuuF
opul teoriei estimiei este de evlu prmetrii de re depinde f D folosind dtele de seleie i znduE
ne pe rezulttele teoretie prezentte n pitolele nterioreF
pie {X1 , X2 , . . . , Xn } vriile letore de seleie repett de volum nD e urmez reprtii lui X F
resupunem totodt X dmite medie i notm u = E(X) i 2 = D2 (X)F

Deniia 6.1 @IA e numete funcie de estimaie @puntulA su estimator l lui D o funie de seleie
@sttistiA


= (X1 , X2 , . . . , Xn ),
u jutorul rei dorim s l proximm pe F n est zD neEm dori s tim n e sens i t de ine
este est proximieF

129

130

Capitolul 6. Noiuni de teoria estimaiei

@PA y sttisti este un estimator nedeplasat @en., ised estimtorA pentru d

E() = .

eltfelD spunem este un estimator deplasat pentru D ir deplasarea @distorsiuneA se de(nete stfelX

b(, ) = E() .

estfelD b(, ) este o msur erorii pe re o fem n estimre lui prin F

Exemplu 6.2 @IA hispersi de seleie modi(t


d2 (X) =

1
n1

[Xi X]2
i=1

este un estimtor nedeplst pentru dispersi teoreti D2 (X)D ir dispersi de seleie

d2 (X) =

1
n

[Xi X]2
i=1

este un estimtor deplst pentru D2 (X)D deplsre (ind

b(s2 , 2 ) =

2
.
n

[Exerciiu!]

@QA h {x1 , x2 , . . . , xn } sunt dte oservteD tuni (x1 , x2 , . . . , xn ) se numete estimaie lui F
edrD o estimie pentru un prmetru neunosut este vlore estimtorului pentru selei oservtF

rin uz de notieD vom not tt estimtorul t i estimi u i vom fe diferen ntre ele prin
preizre vriilelor de re depindF

@RA xumim eroare n medie patratic unui estimtor pentru @en., men squred errorA ntitte

MSE(, ) = E

Observaia 6.3 utem srieX

E() + E() 0

D2 () + 2E

D2 () + (b(, ))2 .

] [E()

+E

E()

edrD MSE pentru un estimtor nedeplst este D2 ()F

@SA pie 1 i 2 doi estimtori pentru F etuniD vlore

MSE(1 , )

MSE(2 , )

se numete eciena relativ @en., reltive e0ienyA lui 1 n rport u 2 F om spune un estimtor

131

6.1. Punerea problemei

1 este mi e(ient det 2 d MSE(1 , ) MSE(2 , ) pentru tote vlorile posiile le lui i

MSE(1 , ) < MSE(2 , ) pentru mr un F

@TA n estimtor pentru , , se numete estimator nedeplasat uniform de dispersie minim @en.,
niformly winimum rine nised istimte E UMVUEA d pentru orie i orie lt estimtor

nedeplst pentru D D vem

D2 () D2 ( ).

@UA istimtorul pentru este un estimator consistent d


prob

(X1 , X2 , . . . , Xn ) ,

nd n .

n est zD vlore numeri estimtoruluiD (x1 , x2 , . . . , xn )D se numete estimaie consistent pentru


F

@VA istimtorul pentru este un estimator absolut corect d


(i)
(ii)

E() = ;

lim D2 () = 0.

n est zD vlore numeri estimtoruluiD (x1 , x2 , . . . , xn )D se numete estimaie absolut corect


pentru F

@WA istimtorul pentru este un estimator corect d


(i)
(ii)

lim E() = ;

lim D2 () = 0.

n est zD vlore numeri estimtoruluiD (x1 , x2 , . . . , xn )D se numete estimaie corect pentru F

Propoziia 6.4 ttisti d2 (X) este un estimtor solut oret pentru 2 = D2 (X)D ir sttisti d2 (X)

este un estimtor oretD dr nu solut oretD pentru D2 (X)F


[Exerciiu!]

Propoziia 6.5 h este un estimtor solut oret pentru D tuni estimtorul este onsistentF

Demonstraie. tilizm ineglitte lui geev n formX

P ({| | < }) 1

D2 ()
, > 0.
2

innd ont lim D2 () = 0 oinem onluzi doritF


n

Demonstraie. evemX
E(d2 (X)) = E

D2 (d2 (X)) =

1
n1

[Xi X]2

= D2 (X)

i=1

n3 2
4

0,
n
n(n 1) 2

nd n .

@TFIA

132

Capitolul 6. Noiuni de teoria estimaiei

Observaia 6.6 pie un estimtor pentru F trtul estui estimtorD 2 nu esteD n generlD estimE
torul pentru 2 F
he exempluD s presupunem X N (0, 1) i vem urmtorele 20 de oservii supr lui X X

0.3617; -2.0587; -2.3320; -0.3709; 1.2857; 0.5570; -0.1802; -0.0357; 1.9344; 1.3056
0.0831; -0.3277; -0.3558; 0.4334; -1.2230; -1.0381; -2.7359; -0.0312; 2.0718; -0.5944
0.6286; -0.5350; 2.2090; -0.6057; 1.4352; 1.1948; 0.7431; -0.1214; 0.8678; -1.0030
n estimtor solut oret pentru medi teoreti lui X D X = 0D este X F
@pentru selei dtD X = 0.0521AF riil letore X 2 urmez reprtii 2 (1) i re medi X 2 = 1
@vezi reprtii 2 AF n estimtor solut oret pentru X 2 este X 2 F e de lt prteD pentru selei
dt vem X 2 1.4 ir X
edrD n generl

X2

= 0.027F

= X F

Observaia 6.7 entru un numit prmetru pot exist mi muli estimtori solut oreiF he exemE
pluD pentru prmetrul din reprtii P oisson P() exist urmtorii estimtoriX

d2 (X).

e pune prolemX Cum alegem pe cel mai bun estimator i pe ce criteriu? h utilizm ineglitte lui
geev n form @TFIAD tuni r ( (res 4el mi un estimtor4 s (e el de dispersie minimF
@IHA xumim ntitte de informie reltiv l prmetrul oninut n selei orespunztore de
volum n @informaie FisherA expresiX

In () = n E

ln f (X, )

@TFPA

Teorema 6.8 (Rao1 -Cramer2 )


gonsider rteristi X u funi de proilitte f (x, ), u (a, b) i pentru re exist

f
F

gonsiderm

= (X1 , X2 , . . . , Xn )D un estimtor solut oret pentru F etuniD

D2 ()

1
.
In ()

@TFQA

@IIA xumim eciena unui estimtor solut oret pentru D vloreX

e() =

1
In ()
.

D2 ()

@IPA n estimtor solut oret pentru se numete estimator ecient d e() = 1D di

D2 () = In ().
1
2

Calyampudi Radhakrishna Rao (1920 ), statistician indian


Harald Cramr (1893 1985), matematician i statistician suedez

@TFRA

133

6.2. Metoda verosimilitii maxime

Propoziia 6.9 wedi de seleie X pentru o seleie dintrEo oletivitte norml este un estimtor
e(ient pentru medi teoreti E(X)F
[Exerciiu!]

@IQA n estimtor oret pentru se numete estimator sucient @exhustivA d funi de proilitte
@densitte de reprtiieA se pote srie n formX

f (x, ) = g(x)h((x), ),

@TFSA

unde h : R R+ i g : Rn R+ este msuril i nu depinde de F puniile g i h nu sunt unieF

Observaia 6.10 yrie estimtor e(ient pentru un prmetru este i estimtor su(ient pentru F
[Exerciiu!]
@IRA e numete funcie de verosimilitate @suD simpluD verosimilitteAD sttisti
n

L(X1 , X2 , . . . , Xn ; ) =

f (Xk , ).
k=1

entru Xk = xk , k = 1, nD funi L(x1 , x2 , . . . , xn ; ) este densitte de reprtiie pentru vetorul


letor V = (X1 , X2 , . . . , Xn )F
utem srie informi pisher n funie de verosimilitte stfelX

In () = E

ln L(X1 , X2 , . . . , Xn ; )

@TFTA

n ontinureD disutm urmtorele metode de estimre puntul prmetrilorX

metod verosimilitii mximeY


metod momentelorY
metod minimului lui 2 Y
metod elor mi mii ptrteY
metod intervlelor de nredereF

6.2 Metoda verosimilitii maxime


pie rteristi X studitD re re funi de proilitte f (x; ) @unde = (1 , 2 , . . . , p ) sunt
prmetri neunosuiAF presupunem vem n oservii supr rteristiii X D di m les o
seleie de dteD

x1 , x2 , . . . , xn .
pie {X1 , X2 , . . . , Xn } vriilele letore de seleie repett de volum nF

Deniia 6.11 @IA xumim estimator de verosimilitate maxim @mximum likelihood estimtorA pentru
sttisti

= (X1 , X2 , . . . , Xn ), pentru re se oine mximumul funiei de verosimilitteD
n

L(X1 , X2 , . . . , Xn ; ) =

f (Xk , ).
k=1

134

Capitolul 6. Noiuni de teoria estimaiei

@PA lore unei stfel de sttistii pentru o oservie dt se numete estimaie de verosimilitate maxim
pentru F

Observaia 6.12 eest metod estimez 4vlore e mi verosimil4 pentru prmetrul F

L
s existe pentru estimtorul de verosimilitte mxim s (e lultF h

est existD tuni est estimtor se oine soluie sistemului de euiiX


xu este neesr

L(X1 , X2 , . . . , Xn ; )
= 0,
k

@TFUA

k = 1, 2, . . . , p,

re este ehivlent u urmtorul sistemX

ln L(X1 , X2 , . . . , Xn ; )
=
k

ln f (Xi ; )
= 0,
k

i=1

k = 1, 2, . . . , p.

@TFVA

Exemplu 6.13 istimi prin metod verosimilitii mxime prmetrii unei rteristii X N (, )F
Soluie:

vege de proilitte pentru X N (, ) este

f (x, , ) =

(x)2
1
e 22 , x R.
2

elegem o seleie repett de volum nD pe re o vom not (XK )k=1, n F


rmetrii rteristiii X sunt = (, ) i funi de verosimilitte soit seleiei este

L(X1 , X2 , . . . , Xn ; , )

f (Xk , , )
k=1
n

1
n e
n (2) 2

k=1

(Xk )2
2 2

estfelD

1
n
n (2) 2

ln L(X1 , X2 , . . . , Xn ; , ) = ln

1
2 2

(Xk )2 .
k=1

edrD pentru gsi estimtorii de verosimilitte mxim pentru i D vem de rezolvt sistemulX

L
1

= 2

(Xk ) = 0;
k=1

L
n
1

= + 3

(Xk )2 = 0.
k=1

e oserv u usurin solui sistemului e onvine @inem ont > 0A este

1
n

Xk = X,
k=1

1
n

(Xk X)2 = d(X).

@TFWA

k=1

eri(m um d vlorile gsite sunt vlori de mximF entru estD mtrie hessin lult
pentru vlorile oinute treuie s (e negtiv de(nitF wi ntiD lulm mtrie hessinF eest

135

6.3. Metoda momentelor (K. Pearson)


esteX

H(, ) =

2L
=

2
3

eum lulm H(, )F


n
2

2
3

(Xk )
k=1

n
2

n
2
2L

H(, ) =

=

(Xk )

k=1

3
n 2

(Xk )2

k=1

0
2n ,
2

re este o mtrie negtiv de(nitD deoree vlorile sle propriiD di rdinile polinomului rteristi

det(H(, ) I2 ) = 0,

sunt

1 =

n
<0
2

2 =

2n
< 0.
2

heiD estimtorii i oinui prin metod verosimilitii mxime sunt


=X

= d(X).

Observaia 6.14 he remrt fptul estimtorii oinui prin metod verosimilitii mxime nu sunt
solut oreiD i dor oreiF

6.3 Metoda momentelor (K. Pearson)


n numite zuriD vlorile ritie pentru funi de verosimilitte sunt di(il de lultF he eeD e
nevoie de lte metode pentru gsi estimtori pentru prmetriF
pie rteristi X re re funi de proilitte f (x; ) @unde = (1 , 2 , . . . , p ) sunt prmetri
neunosuiA e dmite momente pn l ordinul p @diD p = E(X p ) < AF horim s gsim estiE
mtori @estimiiA puntule le prmetrilor neunosuiF entru estD efetum oservii supr
rteristiiiD di legem o seleie de dteD

x1 , x2 , . . . , xn .
pie {X1 , X2 , . . . , Xn } vriilele letore de seleie repett de volum nF wetod momentelor onst n
estimre prmetrilor neunosui din ondiiile momentele iniile de seleie s (e egle u momentele
iniile teoretie respetiveD le lui X F eest nsemn vem de rezolvt un sistem de euii n re
neunosutele sunt prmetrii e urmez ( estimiF

Deniia 6.15 xumim estimator (punctual) pentru obinut prin metoda momentelor solui

136

Capitolul 6. Noiuni de teoria estimaiei

= (1 , 2 , . . . , p ) (ii k = k (X1 , X2 , . . . , Xn ), k = 1, p) sistemuluiX


1 (X1 , X2 , . . . , Xn )

= 1 (X),

2 (X1 , X2 , . . . , Xn )

= 2 (X),
F
F
F

p (X1 , X2 , . . . , Xn )

@TFIHA

= p (X),

unde k (X1 , X2 , . . . , Xn ) sunt momentele de seleie de ordin k pentru X D

1 (X1 , X2 , . . . , Xn ) =

1
n

k
Xi ,
i=1

i k (X) sunt momentele teoretie pentru X @re depind de AD diX

k = E(X k ),

k = 1, 2, . . . , p.

y estimaie @puntulA pentru v ( o relizre estimtorului = (1 , 2 , . . . , p )D unde omponentele

sunt k = k (x1 , x2 , . . . , xn )D k = 1, p)F

Observaia 6.16 eest metod este fundmentt teoreti pe fptul momentele de seleie sunt
estimtori solut orei pentru momentele teoretie orespunztoreF wetod nu pote ( plit reprE
tiiilor re nu dmit medie @eFgFD reprtii guhyAF

Exemplu 6.17 pie X U(a, b) rteristi unei populiiD unde a < b sunt numere releF tiliznd
metod momentelorD determini estimtori pentru petele intervluluiF

Soluie:

h X U(a, b)D tuni

E(X) =

a+b
,
2

D2 (X) =

de unde

E(X 2 ) = D2 (X) + [E(X)]2 =

(b a)2
,
12

a2 + ab + b2
.
3

istemul @TFIHA se srie stfel n est zX

1 (X1 , X2 , . . . , Xn )

= E(X)

2 (X1 , X2 , . . . , Xn )

unde

1 =

1
n

= E(X ),

Xi ,

2 =

i=1

1
n

n
2
Xi .
i=1

snlouind n reliile @TFIIAD vem de gsit solui (, urmtorului sistemX


a b)

a+b =
ab =

2 1
4 2 3 2 .
1

@TFIIA

137

6.4. Metoda celor mai mici ptrate


eest esteX

a = 1

= 1 +
b

2 2 ;
1

2 2 .
1

pnd lulele i innd ont 1 = X D oinem estimtorii pentru a iD respetivD bX

a=X

=X+
b

3 s;

3 s,

unde

X=

1
n

Xi

1
n

s=

i=1

(Xi X)2 .
i=1

istimiile puntule pentru a i b suntX

1
a=

xi
i=1

3
n

(xi

= 1
b
n

x)2 ,

i=1

xi +
i=1

3
n

(xi x)2
i=1

6.4 Metoda celor mai mici ptrate


iste o metod de estimre prmetrilor n zul modelelor linireD di tuni nd vem un set de
vriile letore Yi , i = 1, n e depind linir de prmetrii neunosuiF pie = (1 D 2 D . . . D p ) vetorul
e onine prmetrii neunosui i presupunem Yi depind de eti dup urmtorul sistemX
p

Yi =

xij j + i ,

i = 1, 2, . . . , n,

@TFIPA

j=1

suD sris su form mtrielX

X = (xij ) Rmp .

Y = X + ,

riilele letore i sunt eroriD despre re presupunem X

E(i )
D2 (i )

= 2 ,

i = 1, 2, . . . , n;

cov (i , j ) = 0,

@TFIQA

i = j.

Metoda celor mai mici ptrate onst n determinre prmetrilor i stfel nt sum ptrtelor erorilor
s (e minimF est nsemn vem de rezolvt prolem de minimX
n

2 = min
i

min

i=1

Yi
i=1

2
xij j .

j=1

estfelD un estimtor = (1 D 2 D . . . D p ) prin metod elor mi mii ptrte este solui sistemuluiX

Yi
i=1

2
xij j = 0,

j=1

j = 1, 2, . . . , p,

138

Capitolul 6. Noiuni de teoria estimaiei

ehivlentD

xik xij j =
i=1 j=1

xik Yi ,

k = 1, 2, . . . , p.

i=1

ltimul sistem pote ( sris su form mtrielX

X X = X Y,
de unde gsim estimtorul este
1

= (X X)

X Y.

Exemplu 6.18 pie X o rteristi e dmite medieD = E(X)D i (e X1 D X2 D . . . D Xn vriilele


letore de seleie repett de volum nF ttisti = X este estimtorul oinut prin metod elor
mi mii ptrte pentru medi teoreti D di este solui prolemei de minimizre
n

Soluie:

@TFIRA

(Xi )2 .

min
i=1

heoree este medi vriilelor letore de seleieD putem onsider (ere vriil o

putem srie su form

Xi = + i ,

i = 1, 2, . . . , n,

@TFISA

u i stisfnd ondiiile @TFIQAF olui prolemei @TFIRA este solui euiei

(Xi )2 = 0,
i=1

di

1
n

Xi .

i=1

6.5 Metoda minimului lui 2


gonsiderm rteristi X e urmez ( studitD e urmez lege de proilitte dt de f (x, ),
unde = (1 D 2 D . . . D p ) Rp sunt prmetri neunosuiF pie X1 D X2 D . . . D Xn vriilele letore

de seleie repett de volum nF entru oine un estimtor prin metoda minimului lui 2 pentru D
proedm dup um urmezF
hesompunem mulime vlorilor lui X D X()D n lseD stfelX
k

Oi ,

X() =

Oi

Oj = , i = j.

i=1

gonstruim evenimentele

Ai = { (n) (n) ; X(i ) Oi },

i = 1, 2, . . . , k.

e oserv u uurin
k

(n)

Ai ,
i=1

Ai

Aj = , i = j.

6.6. Metoda cu intervale de ncredere

139

xotm u

pi () = P (n) (Ai ),

i = 1, 2, . . . , k,

iFeFD proilitte un individ lut l ntmplre s prin lsei Oi F etuniD


k

pi () = 1.
i=1

wi fem urmtorele notiiX

ni = freven solut evenimentului Ai n orie seleie repett de volum nY

Ni = vriilele letore de seleie orespunztore lui ni @i = 1, k AF

Observaia 6.19 etorul letor N = (N1 , N2 , . . . , Nk ) urmez o reprtiie multinomil de prmetri


pi (), i = 1, k F

Deniia 6.20 ttisti se numete estimator obinut prin metoda minimului lui 2 pentru d
este soluie prolemei de minim
k

min
i=1

[Ni n pi ()]2
n pi ()

Propoziia 6.21 eprtii urmtorei sttistie este


k

i=1

[Ni n pi ()]2
2 (k p 1).
n pi ()

6.6 Metoda cu intervale de ncredere


onsiderm o rteristi X rei lege de proilitte este dt de f (x, )D u prmetru neE
unosutF entru estim vlore rel lui D efetum n oserviiD oinnd seleiX

x1 , x2 , . . . , xn .

hup um m vzut nteriorD putem gsi o estimie puntul prmetruluiD (x1 , x2 , . . . , xn )F istiE

mi puntul nu ne preizez t de prope se gsete estimi (x1 , x2 , . . . , xn ) f de vlore


rel prmetrului F he exempluD d dorim s estimm ms medie unor produse limentre fE
rite de o numit minD tuni putem gsi un estimtor puntul @eFgFD medi de seleieA re s ne
indie est este de 500 de grmeF sdel r ( d est informie r ( prezentt su formX
ms medie este 500g10gF
utem oine stfel de informii d vom onstrui un intervl n reD u o proilitte destul de mreD
s gsim vlore rel lui F
onsiderm o seleie repette de volum nD X1 , X2 , . . . , Xn D e urmez reprtii lui X F horim s
gsim un intervl letor re s opere u o proilitte mre @eFgFD 0.95D 0.98D 0.99 etA vlore posiil
prmetrului neunosutF

Deniia 6.22 pie (0, 1)D forte propit de 0 @de exempluD = 0.01D 0.02D 0.05 etAF xumim
interval de ncredere @en., on(dene intervlA pentru prmetrul u proilitte de nredere 1 D

140

Capitolul 6. Noiuni de teoria estimaiei

un intervl letor (, )D stfel nt

P ( < < ) = 1 ,

@TFITA

unde (X1 , X2 , . . . , Xn ) i (X1 , X2 , . . . , Xn ) sunt sttistiiF


entru o oservie (n) (xtD petele intervlului @letorA de nredere vor ( funii de vlorile de
seleieF he exempluD pentru dtele oservteD x1 , x2 , . . . , xn D intervlul

(x1 , x2 , . . . , xn ), (x1 , x2 , . . . , xn )
se numete valoare a intervalului de ncredere pentru F entru simplitte nsD vom folosi termenul
de 4intervl de nredere4 tt pentru intervlul propriuEzisD t i pentru vlore estuiD nelesul
desprinznduEse din ontextF
lore se numete nivel de semnicaie su probabilitate de riscF

Observaia 6.23 entru determin un intervl de nredereD metod de luru este dup um urmezX
se v onsider funie de seleie S(X1 , X2 , . . . , Xn ; )D onvenil lesD re s urmeze o lege unosut
i independen de F notm u g(s) est reprtiieF e determin poi vlorile s1 i s2 @re depind
de AD stfel nt
s2

g(s) ds = 1 .

P (s1 < S < s2 ) =

@TFIUA

s1

gum sttisti S depinde de D reli @TFIUA determin un intervl letor (, ) e stisfe @TFITAF
sntervlul de nredere vriz de l o seleie l ltF
gu t este mi mi @de regulD = 0.01 su 0.02 su 0.05AD u tt ns @re este (1 ) 100%A
vlore rel prmetrului s se gses n intervlul gsit este mi mreF hei nsele 99% su

99.99% pr ( forte propite i r d rezultte semntoreD sunt zuri n re (ere sutime ontezF
he exempluD s presupunem ntrEun n lendristi un eveniment re ns de 99% de se relizD n
orie zi nuluiD independent de elellte zileF etuniD ns est eveniment s se relizeze n (ere
zi nului n tot deursului estui n este de 0.99365 2.55%F h ns de relizre n (ere zi r (
fost de 99.99%D tuni rezulttul r ( fost 96.42%D ee e nsemn o diferen forte mre genert
de o diferen iniil forte miF
sntervlul de nredere pentru vlore rel unui prmetru nu este uniF h ni se du ondiii
suplimentre @eFgFD (xre unui ptAD tuni putem oine intervle in(nite l un pt i (nite l
elllt ptF
n ontinureD vom ut intervle de nredere pentru prmetrii unor rteristii normleF

6.6.1 Interval de ncredere pentru medie, cnd dispersia este cunoscut


pie X N (, ) rteristi unei populii sttistieD unde este neunosut i este unosutF entru
onstrui un intervl de nredere pentru medi teoreti D efetum o seleie repett de volum n i
(xm nivelul de nredere 1 1D (0, 1)F elegem urmtore sttistiX

Z=

X
N (0, 1)

@onform ropoziiei 5.25).

@TFIVA

141

6.6. Metoda cu intervale de ncredere


utem determin un intervl numeri (z1 , z2 ) stfel nt

@TFIWA

P (z1 < Z < z2 ) = (z2 ) (z1 ) = 1 ,


unde : R+ R+ este funcia lui LaplaceD

1
(x) =
2

y2
2

@TFPHA

dy.

he ndt e intervlul (z1 , z2 ) este determintD putem srieX

P (z1 <

ehivlent u

X
< z2 ) = 1 ,

X z2 < < X z1
n
n

= 1 ,

de unde intervlul de nredere pentru u nivelul de semni(ie (1 ) este

(, ) =

X z2 ,
n

X z1
n

wi rmne de stilit um determinm vlorile z1 i z2 F


histingem trei zuriX

(1) h nu se unote o lt informie suplimentr despre D tuni legem (z1 , z2 ) (ind intervl
de lungime minim pentru (xtF eest se oine nd z1 = z2 @vezi yservi TFPRAD de undeX

(z2 ) (z2 ) = 1 .
innd ont (z) = 1 (z)D ultim relie se redue l

(z2 ) = 1

,
2

de unde gsim pe z2 (ind until de ordin 1 D i nume z1 F


2
2
edrD

z1 = z1 ,
2

z2 = z1 ,
2

i intervlul de nredere pentru medi teoreti nd este unosut esteX

(, ) =

X z1 ,
2
n

X + z1
2
n

@TFPIA

(2) h pentru medi teoreti nu se preizez o limit superiorD tuni n @TFIWA leg intervlul
letor (z1 , z2 ) de form (, z2 )F nlouind n @TFIWA oinemX

P ( < Z < z2 ) = (z2 ) () = 1 ,


=0

142

Capitolul 6. Noiuni de teoria estimaiei


de unde z2 = z1 F n est zD intervlul de nredere esteX

(, ) =

X z1 ,
n

(3) h pentru medi teoreti nu se preizez o limit inferiorD tuni n @TFIWA leg intervlul
letor (z1 , z2 ) de form (z1 , )F nlouind n @TFIWA oinemX

P (z1 < Z < ) = () (z1 ) = 1 ,


=1

de unde z1 = z = z1 F n est zD intervlul de nredere esteX

(, ) =

X + z1
n

Observaia 6.24 n zul (1) de mi susD m les intervlul letor de lungime minimD unde est
lungime este

l = (z2 z1 ).
n

entru gsi est intervlD vem de rezolvt prolemX

min

(z2
n

z1 )

z2

g(z) dz = 1 .

z1

entru o rezolvD folosim metod multiplitorilor lui vgrngeF pie funi

L(z1 , z2 ; ) = (z2 z1 ) +
n

z2

g(z) dz = 1 .

@TFPPA

z1

horim s )m z1 i z2 e relizez min L(z1 , z2 ; )F eeste sunt soluiile sistemuluiX

L = 0

z1
L = 0,

z2
di


g(z1 ) = 0

g(z ) = 0,

1
n

u soluiile z1 = z2 @e nu onvineA i z1 = z2 F

Exemplu 6.25 y min de nghet umple upe u nghetF e dorete nghet din upe s i
ms de = 250gF hesigurD este prti imposiil s umplem (ere up u ext 250g de nghetF
resupunem ms oninutului din up este o vriil letore reprtizt normlD u ms neunosE
ut i dispersi unosutD = 3gF entru veri( d min este justt ineD se leg l ntmplre

30 de nghette i se ntrete oninutul (ereiF yinem stfel o seleie repettD x1 D x2 D . . . D x30


dup um urmezX

143

6.6. Metoda cu intervale de ncredere

257
248

249
256

251
247

251
250

252
247

251 251 249


251 247 252

248
248

248
253

251
251

253
247

248
253

245
244

251
253

e tie un estimtor solut oret pentru ms medie este medi de seleieD X = 250.0667F
e ere s se gses un intervl de nredere pentru D u nivelul de on(den 0.99F

Soluie:

hup um m vzut mi susD un intervl de nredere pentru esteX

(, ) =
rmtorul od

x z1 ,
2
n

x + z1
2
n

Matlab furnizez un intervl de nredere zt pe dtele de seleie oservteF

n=30; sigma=3; alpha = 0.01;


x=[257 249 251 251 252 251 251 249 248 248 251 253 248 245 251 ...
248 256 247 250 247 251 247 252 248 253 251 247 253 244 253];
z = icdf('norm',1-alpha/2,0,1);
% cuantila de ordin 1-alpha/2 pentru normala
m1 = mean(x)-z*sigma/sqrt(n); m2 = mean(x)+z*sigma/sqrt(n); % capetele intervalului
fprintf('(m1,m2)=(%6.3f,%6.3f)\n',m1,m2);
% afiseaza intervalul dupa modul dorit
ulnd odulD oinem intervlul de nredere pentru nd este unosutX

(, ) = (248.659, 251.478).

Figura 6.1: Intervalul de ncredere pentru Exerciiu 6.25.

144

Capitolul 6. Noiuni de teoria estimaiei

Observaia 6.26 @IA ixist funii prede(nite n Matlab e furnizez estimtori puntuli i intervle
de nredereF e se ompr rezulttul din est exeriiu u el din ixemplul TFPU @estimre intervlului de
nredere nd nu este unosutA su ixeriiul TFRP @intervle furnizte de funii
@PA

Matlab prede(niteAF

n zul n re volumul seleiei este mre @de ele mi multe ori n prtiD est nsemn

n 30A metod de determinre unui intervl de nredere prezentt mi sus se pote pli i pentru
seleii dintrEo oletivitte e nu este neprt normlF eest este o onsein fptului D pentru n
mreD sttisti Z urmez reprtii N (0, 1) pentru orie form reprtiiei rteristiii X @onform
teoremei limit entrlAF
@QA sntervlele de nredere determinte mi sus sunt vlide pentru selei @repett su nerepettA dintrE
o populie in(nitD su pentru seleii repette dintrEo populie (nitF n zul seleiilor nerepette din
oletiviti (niteD n estimre intervlelor de nredere vom ine ont i de volumul N l populieiF pre
exempluD d selei de volum n se fe dintrEo populie (nit de volum N i n 0.005N D tuni un
intevl de nredere entrt pentru medi populiei esteX

(, ) =

X z1
2
n

N n
,
N 1

X + z1
2
n

N n
N 1

@TFPQA

6.6.2 Interval de ncredere pentru medie, cnd dispersia este necunoscut


xe )m n ondiiile din seiune preedent @iFeFD o rteristi normlD X N (, )AD mi puin
fptul este unosutF h devii stndrd nu este unosutD tuni e v treui estimtF tim
dej o estimie solut oret pentru este sttisti d (X)D dt prin

d (X) =

1
n1

(Xi X)2 .
i=1

entru estim medi teoreti neunosut printrEun intervl de nredereD legem sttisti

T =

X
t(n 1),
d (X)

@onform ropoziiei 5.40).

@TFPRA

n mod nlog u zul preedentD gsim intervlul de nredere n funie de ele trei zuri mintite mi
susX

(1) h nu se unote o lt informie suplimentr despre D tuni intervlul de nredere pentru


medi teoreti nd este neunosut esteX

(, ) =

d (X)
X t1 ; n1 ,
2
n

d (X)
X + t1 ; n1
2
n

@TFPSA

(2) h pentru medi teoreti nu se preizez o limit superiorD tuni intervlul de nredere esteX
(, ) =

d (X)
X t1; n1 ,
n

145

6.6. Metoda cu intervale de ncredere

(3) h pentru medi teoreti nu se preizez o limit inferiorD tuni intervlul de nredere esteX
(, ) =

d (X)
X t; n1
n

eiiD prin t; n1 m nott until de ordin pentru reprtii t u (n 1) grde de liertteF

Exemplu 6.27 se gses un intervl de nredere pentru ms medie din ixeriiul TFPSD n zul
n re tere stndrd nu mi este unosutF

Soluie:

hup um m vzut mi susD un intervl de nredere pentru esteX

(, ) =
rmtorul od

d (X)
x t1 ; n1 ,
2
n

d (X)
x + t1 ; n1
2
n

Matlab furnizez un intervl de nredere zt pe dtele de seleie oservteF

n=30; alpha = 0.01;


x=[257 249 251 251 252 251 251 249 248 248 251 253 248 245 251 ...
248 256 247 250 247 251 247 252 248 253 251 247 253 244 253];
dev = std(X);
% deviatia standard de selectie
t = icdf('t',1-alpha/2,n-1);
% cuantila de ordin 1-alpha/2 pentru t(n-1)
m1 = mean(x)-t*dev/sqrt(n); m2 = mean(x)+t*dev/sqrt(n);
% capetele intervalului
fprintf('(m1,m2)=(%6.3f,%6.3f)\n',m1,m2);
% afiseaza intervalul dupa modul dorit
ulnd odulD oinem intervlul de nredere pentru nd este unosutX

(, ) = (248.572, 251.561).

Observaia 6.28 @IA e se ompr rezulttul din est exemplu u el din ixemplul TFPS @estimre
intervlului de nredere nd este unosutA su ixeriiul TFRP @intervle furnizte de funii

Matlab

prede(niteAF
@PA

pormulele din est seiune sunt prtie tuni nd selei se fe dintrEo oletivitte gussin

de volum n miF gnd n este mreD tuni v ( o diferen forte mi ntre vlorile z1 i t1 ; n1 D de
2
2
ee m pute folosi z1 n loul vlorii t1 ; n1 F wi multD pentru un n mre @n 30AD intervlele de
2
2
nredere oinute mi sus rmn elei pentru orie form reprtiiei rteristiii X D nu neprt
pentru un gussinF edrD pentru o seleie de volum mre dintrEo oletivitte orereD un intervl
de nredere pentru medi populieiD nd dispersi nu este unosutD esteX

(, ) =

X z1
2

d (X)
,
n

X + z1
2

d (X)

@TFPTA

6.6.3 Interval de ncredere dispersie, cnd media este cunoscut


pie X N (, ) o rteristi unei populii studiteD pentru re unotem medi teoreti dr
nu i dispersi 2 F horim s estimm dispersi prin onstruire unui intervl de nredereF elegem o
seleie repett X1 , X2 , . . . , Xn e urmez reprtii lui X F pixm nivelul de semni(ie F

146

Capitolul 6. Noiuni de teoria estimaiei

entru estimre puntul lui 2 nd medi este unosut folosim sttisti d2 (X) de(nit prin

d2 (X) =

1
n

[Xi ]2 .
i=1

sntervlul de nredere pentru dispersie se onstruiete u jutorul sttistiii

1
n 2
d (X) = 2
2

@onform ropoziiei SFQRA.

(Xi )2 2 (n),
i=1

heterminm intervlul letor din ondiiX

P 2 <
1

n 2
d (X) < 2 = Gn (2 ) Gn (2 ) = 1 ,
2
2
1
2

unde ii Gn (x) reprezint funi de reprtiie teoreti pentru reprtii 2 u n grde de liertteF
n funie de fptul d vem su nu informii suplimentre despre dispersie @nlog n eiune
TFTFIAD gsim intervlul de nredere pentru 2 D dup um urmezX

(1) nu vem informii suplimentre despre dispersieX


( 2 , 2 ) =

n d2 (X)
2 ; n

n d2 (X)
,
2 ; n
1
2

@TFPUA

(2) vem informii dispersi este nemrginit superiorX


( 2 , 2 ) =

n d2 (X)
,
2 n
;

+ ;

@TFPVA

(3) vem informii dispersi este nemrginit inferiorX


( 2 , 2 ) =

n d2 (X)
2
1; n

@TFPWA

unde prin 2 n m nott until de ordin pentru reprtii 2 u n grde de liertteF


;

Exemplu 6.29 y fri produe tone de ioolt ntrind 100g (ereF entru se estim tere
msei de l est vloreD sE fut o seleie de 35 de toneD oinnduEse vlorileX

100.12;
99.89;
99.76;
100.12;

99.92;
100.15;
100.1;
98.63;

100.1;
99.9;
99.24;
99.03;

99.89;
99.7;
98.19;
100.3;

100.07; 99.88; 100.11; 99.90; 99.97; 100.2;


100.2;
99.7;
100.2; 100.1; 100.04; 99.89;
100.15; 100.5;
99.79; 98.95; 100.23; 99.89;
98.68.

qsii un intervl de nredere @u = 0.05A pentru devii stndrd msei tonelor produse de reE
spetiv friF

6.6. Metoda cu intervale de ncredere


Soluie:

wi ntiD lulm d2 (x)F evemX

d2 (x) =
hin teleD su utiliznd

1
35

35

[Xi 100]2 = 0.3.


i=1

MatlabD gsim untileleX


2
0.975; 35 = 53.2033;

147

2
0.025; 35 = 20.5694.

MatlabD untilele se lulez stfelX


icdf('chi2',0.975, 35);

icdf('chi2',0.025, 35)

sntervlul de nredere pentru dispersie este @folosind formul @TFPUAAX

( 2 , 2 ) = (0.20, 0.51).
entru vrii stndrdD intervlul de nredere esteX

(, ) = ( 0.2, 0.51) = (0.44, 0.71).

6.6.4 Interval de ncredere dispersie, cnd media este necunoscut


pie X N (, ) o rteristi unei populii studiteD pentru re nu unotem medi su dispersiF
he exempluD X reprezint timpul de produere unei reii himieF horim s estimm dispersi prin
onstruire unui intervl de nredereF elegem o seleie repett X1 , X2 , . . . , Xn e urmez reprtii
lui X F pixm nivelul de semni(ie F
entru estimre puntul lui 2 nd medi este neunosut folosim sttisti d2 (X) de(nit prin

d2 (X) =

1
n1

[Xi X]2 .
i=1

sntervlul de nredere pentru dispersie se onstruiete u jutorul sttistiii

n1 2
1
d (X) = 2
2

(Xi X)2 2 (n 1),

@onform ropoziiei SFQUA.

i=1

heterminm intervlul letor din ondiiX

2 <
1

n1 2
d (X) < 2
2
2

= Gn1 (2 ) Gn1 (2 ) = 1 ,
2
1

unde Gn1 (x) reprezint funi de reprtiie teoreti pentru reprtii 2 u (n 1) grde de liertteF
n funie de fptul d vem su nu informii suplimentre despre dispersie @nlog n seiune
TFTFIAD gsim intervlul de nredere pentru 2 esteX

148

Capitolul 6. Noiuni de teoria estimaiei

(1) nu vem informii suplimentre despre dispersieX


( 2 , 2 ) =

(n 1)d2 (X)

,
2 ; n1
1

(n 1)d2 (X)

2 ; n1

@TFQHA

unde prin 2 n1 m nott until de ordin pentru reprtii 2 u (n 1) grde de liertteF


;

(2) vem informii dispersi este nemrginit superiorX


( 2 , 2 ) =

(n 1)d2 (X)

,
2 n1
;

+ ;

@TFQIA

(3) vem informii dispersi este nemrginit inferiorX


( 2 , 2 ) =

(n 1)d2 (X)

2
1; n1

@TFQPA

Observaia 6.30 sntervle de nredere pentru devii stndrd se oin prin extrgere rdinii pE
trte din petele de l intervlele de nredere pentru dispersieF

Exemplu 6.31 qsii un intervl de nredere @u = 0.05A pentru devii stndrd oninutului de
niotin unui numit tip de igriD d o seleie de 24 de ui re devii stndrd oninutului
de niotin de 1.6mgF

Soluie:

wi ntiD s = d (x) = 1.6F hin teleD su utiliznd

2
0.975; 24 = 39.3641;

MatlabD gsimX

2
0.025; 24 = 12.4012.

sntervlul de nredere pentru dispersie este @folosind formul @TFQHAAX

( 2 , 2 ) = (1.56, 4.95).
entru vrii stndrdD intervlul de nredere esteX

( 1.5608, 4.9544) = (1.25, 2.22).

6.6.5 Interval de ncredere pentru diferena mediilor


pie X1 i X2 rteristiile dou populii normleD N (1 , 1 )D respetivD N (1 , 1 )D pentru re nu
se unos mediile teoretieF elegem din prim populie o seleie repett de volum n1 D nott prin

(X1k )k=1, n1 D e urmez reprtii lui X1 D ir din dou populie legem o seleie repett de volum
n2 D nott prin (X2k )k=1, n2 D e urmez reprtii lui X2 F pixm nivelul de semni(ie F notm
dispersiile de seleie pentru (ere rteristi prin

d2
1

1
=
n1 1

n1
2

(X1k X1 )
i=1

d2
2

1
=
n2 1

n2

(X2k X2 )2 .
i=1

149

6.6. Metoda cu intervale de ncredere

entru gsi un intervl de nredere pentru diferen mediilorD preizm mi nti sttistiile re stu
l z onstruirii intervluluiF utem ve urmtorele trei zuriX
2
2
@IA dispersiile 1 i 2 sunt unosute a prioriF elegem sttisti

Z=

(X1 X2 ) (1 2 )

@onform ropoziiei 5.29).

N (0, 1).

2
1
2
+ 2
n1
n2

@TFQQA

sntervlul de nredere pentru diferen mediilor esteX

X1 X2 z1
2

2
1

n1

2
2

n2

X1 X2 + z1
2

2
1

n1

2
2

n2

2
2
@PA dispersiile 1 = 2 = 2 i neunosuteF entru gsi un intervl de nredere pentru diferen

mediilorD legem sttisti @vezi ropozii SFRQAX

T =

(X1 X2 ) (1 2 )
(n1 1)d2 + (n2 1)d2
1
2

n1 + n2 2
1
1
n1 + n2

t (n1 + n2 2),

@TFQRA

sntervlul de nredere pentru 1 2 esteX

X1 X2 t1 ; n1 +n2 2
2

(n1

1)d2
1

+ (n2

1)d2
2

(n1 1)d2 + (n2 1)d2


1
2

X1 X2 + t1 ; n1 +n2 2
2

1
2

n1 + n2 2
1
1
n1 + n2
n1 + n2 2
1
1
n1 + n2

,
1
2

2
2
@QA dispersiile 1 = 2 D neunosuteF entru un intervl de nredere pentru 1 2 D legem sttisti

T =

(X1 X2 ) (1 2 )
d2
d2
1
+ 2
n1
n2

t(N ),

@TFQSA

unde

N=

s2
s2
1
+ 2
n1
n2
s2
1
n1

1
+
n1 1

s2
2

n2

2
1
n2 1

s2 = d2 (x1 ), s2 = d2 (x2 ) .
1

n est zD un intervl de nredere pentru 1 2 l nivelul de semni(ie esteX

X1 X2 t1 ; N
2

d2
1
n1

d2
2
n2

X1 X2 + t1 ; N
2

d2
1
n1

d2
2
n2

@TFQTA

150

Capitolul 6. Noiuni de teoria estimaiei

Observaia 6.32 entru un volum de seleie n mre @n 30AD intervlele de nredere oinute mi sus
rmn elei pentru orie form reprtiiei rteristiii X D nu neprt pentru un gussinF

6.6.6 Interval de ncredere pentru raportul dispersiilor


pie X1 i X2 rteristiile dou populii normleD N (1 , 1 )D respetivD N (2 , 2 )D pentru re nu
se unos mediile i dispersiile teoretieF elegem din prim populie o seleie repett de volum n1 e
urmez reprtii lui X1 D ir din dou populie legem o seleie repett de volum n2 e urmez
reprtii lui X2 F pixm nivelul de semni(ie F entru gsi un intervl de nredere pentru rportul
dispersiilorD

2
1 /
2
2

onsiderm sttisti

F =

2
2 d2
1
F(n1 1, n2 1),
2
1 d2
2

@onform ropoziiei SFRTA.

@TFQUA

heterminm poi un intervl letor (f1 , f2 ) stfel nt

P (f1 < F < f2 ) = Fn1 1, n2 1 (f2 ) Fn1 1, n2 1 (f1 ) = 1 ,


unde Fn, m este funi de reprtiie pentru reprtii Fisher u (n, m) grde de liertteF elegemX

f1 = fn1 1, n2 1;
2

f2 = fn1 1, n2 1; 1 ,
2

unde fn, m; reprezint until de ordin pentru reprtii F isher u (n, m) grde de liertteF
2
2
sntervlul de nredere pentru rportul dispersiilorD 1 /2 esteX

d2
1
fn1 1, n2 1; ,
2
d2
2

d2
1
fn1 1, n2 1; 1
2
d2
2

@TFQVA

Exemplu 6.33 hou strunguri sunt potrivite s produ piese identie pentru o omndF entru
estim d terile dimetrelor pieselor produse de ele dou mini sunt sensiil egleD sEu lut l
ntmplre dou seturi de volume n1 = 7 i n2 = 10 de piese din ele dou loturiF wsurtorile u ondus
l urmtorele rezultteX
votul 1

25.06

24.95

25.01

25.05

24.98

24.97

25.02

votul 2

25.01

25.09

25.02

24.95

24.97

25.03

24.99

24.97

25.03

24.98

se determine un intervl de nredere pentru rportul dispersiilor dimetrelor pieselor produse de ele
dou loturi @ = 0.1AF e v presupune dimetrele pieselor urmez o reprtiie normlF

Soluie:

polosim @TFQVAF heterminm mi nti dispersiile empirieF eeste suntX

d2 =
1

1
6

(L1i L1i )2 = 0.0412

i=1

d2 =
2

1
9

10

(L2j L2j )2 = 0.0409.


j=1

guntilele suntX

f6, 9; 0.05 = 0.2440

f6, 9; 0.95 = 3.3738.

151

6.6. Metoda cu intervale de ncredere


polosind

MatlabD putem lul untilele stfelX


f1 = finv(0.05, 6, 9);

f2 = finv(0.95, 6, 9);

qsim intervlul de nredereX

(f1 , f2 ) (0.25, 3.4).

6.6.7 Intervale de ncredere pentru proporii ntr-o populaie binomial


O singur populaie
entru o populie sttistiD prin proporie a populaiei vom nelege proentul din ntreg oletivitte
e stisfe o numit propriette @su re o numit rteristiA @eFgFD propori de studeni integrliti
dintrEo numit fultteAF e de lt prteD prin proporie de selecie nelegem proentjul din vlorile de
seleie e stisf o numit propriette @eFgFD propori de studeni integrliti dintrEo seleie letore
de 40 de studeni i unei fultiAF ropori unei populii este un prmetru @pe re l vom not u

pAD ir propori de seleie este o sttisti @pe re o notm ii prin pAF


pie X o rteristi inomil unei oletivitiD u proilitte de sues p @eFgFD numrul de
steme prute l runre unei monede ideleD z n re p = 0.5AF horim s onstruim un intervl
de nredere pentru propori populieiD pF entru estD vem nevoie de seleii de volum mre din
est oletivitteF n estimtor potrivit pentru p este propori de seleieD di

p=p=

X
.
n

rintrEun 4volum mre4 vom nelege un n e stisfeX n 30D n p > 5 i n (1 p) > 5F wedi vriilei
n

letore X este E(X) = npD ir dispersi este D2 (X) = np(1 p)F utem srie pe X (ind X =

Xi D
i=1

unde Xi sunt vriile letore fernoulli B(1, p)F entru un volum n mreD vriil letore X stisfe
@onform teoremei limit entrl plit irului {Xi }i AX

X np
n p (1 p)

X
n

p (1 p)
n

pp
p (1 p)
n

N (0, 1).

e z estui rezulttD putem onstrui un intervl de nredere pentru pD de formX

p z1
2

p (1 p)
,
n

p + z1
2

p (1 p)
n

@TFQWA

heoree p nu este a priori unosutD p fost nlouit su rdil u estimtorul suF lore

E = z1
2

p (1 p)
n

@TFRHA

se numete eroarea standard a proporieiF E este erore re se fe prin estimre lui p prin intervlul de
nredere dt de @TFQWAF

152

Capitolul 6. Noiuni de teoria estimaiei

Observaia 6.34 eest intervl de nredere este vlil pentru seleie dintrEo populie in(nit @su
n

N D de regul n < 0.005N A su pentru selei u repetiie dintrEo populie (nitF h selei se

relizez fr repetiie dintrEo populie (nit @u N stfel nt n 0.05N AD tuni intervlul de nredere
esteX

p z1
2

p (1 p)
n

N n
,
N 1

p (1 p)
n

p + z1
2

N n
N 1

@TFRIA

Exemplu 6.35 ntrEun institut politehniD sE determint dintrEo seleie letore de 100 de studeni
nsriiD dor 67 u termint studiileD oinnd o diplomF qsii un intervl de nredere reD u o on(E
den de 95% s determine proentul de studeni solveni dintre toi studenii e u fost nsriiF

Soluie:

wi ntiD oservm = 0.05D n > 30D p =

= 0.67D np = 67 > 5 i n(1 p) = 33 > 5F

67
100

heoree nu ni se d vreo informie despre N @numrul totl de studeni nsriiAD putem presupune

n < 0.005N i putem pli formul @TFQWAF qsim intervlul de nredere utt esteX
0.67 z0.975

0.67 (1 0.67)
,
100

0.67 (1 0.67)
100

0.67 + z0.975

= (59.27%, 74.73%).

Exemplu 6.36 hintrEo seleie de 200 de elevi i unei oli u 1276 de eleviD 65% (rm dein el
puin un telefon moilF se gses un intervl de nredere pentru proentul de opii din respetiv
ol e dein el puin un telefon moilD l nivelul de semni(ie = 0.05F

Soluie:

evemX n = 200D N = 1276D p = 0.65F heoree n 0.05N D folosind @TFRIA i gsim un

intervl de nredere l nivelul de semni(ie 0.05 este

0.65 1.96

0.65 (1 0.65)
200

1276 200
,
1276 1

0.65 (1 0.65)
200

0.65 + 1.96

1276 200
1276 1

= (58.93%, 71.07%).

Observaia 6.37 h se dorete estimre volumului seleiei pentru re se oine estimre proporiei
p printrEun intervl de nredere u o erore mxim E D tuni folosim formul @TFRHAF h m pute
ghii propori populieiD pD tuni gsim urmtore estimre volumului seleieiX

n = p(1 p)

z1
2
E

@TFRPA

unde [ ] este prte ntregF h p nu pote ( ghiitD tuni folosim fptul p(1 p) este mxim
pentru p = 0.5 i estimm pe n prin

n=

1
4

z1
2
E

Exemplu 6.38 n studiu susine ntre 35% i 40% dintre elevii de lieu din r fumezF gt de
mre r treui s (e volumul unei seleii dintre elevii de lieu pentru estim proentul rel de elevi e
fumezD u o erore de estimre mxim de 0.5%F e v lege nivelul de semni(ie = 0.1F

Soluie:

polosim formul @TFRPAD pentru p = 0.4 @se lege vlore e mi propit de 50%F guntil

153

6.6. Metoda cu intervale de ncredere


este z0.95 = 1.28F qsim o estimie pentru n esteX

n = 0.4(1 0.4)

1.64
0.005

= 25820.

Dou populaii
pie X1 i X2 dou rteristii inomile independente le unei populiiD u volumele i proilitile
de sues n1 , p1 iD respetivD n2 , p2 F horim s )m un intervl de nredere pentru diferen proporiilorD

p1 p2 F entru reui estD vem nevoie de seleii mriD de ee utilizre testului Z este oportunF
gondiiile testului suntX n1 30, n2 30, n1 p1 > 5, n2 p2 > 5, n1 (1 p1 ) > 5, n2 (1 p2 ) > 5F v un
nivel de semni(ie D un intervl de nredere pentru p1 p2 esteX

p1 p2 z1
2

p1 (1 p1 ) p2 (1 p2 )
+
,
n1
n2

p1 p2 + z1
2

p1 (1 p1 ) p2 (1 p2 )
+
.
n1
n2

@TFRQA

Exemplu 6.39 hintrEo seleie de 45 de iei i unei oliD 21 u spus le ple wtemtiD ir dintrEo
seleie de 65 de fete le eleii oliD 37 u susinut le ple est disiplinF gonstruii un intervl
de nredere l nivelul de semni(ie = 0.02 pentru diferen proporiilor de iei i fete din respetiv
ol ror le ple wtemtiF

Soluie:

polosim formul @TFRQAF wi ntiD p1 =

21 37 2.33
45 65

21
45

24
45

45

37
65

28
65

65

23
45 D

p2 =

21 37

+ 2.33
45 65

i z0.99 2.33F sntervlul utt esteX

37
65
21
45

24
45

45

37
65

28
65

65

= (0.1990, 0.0061).

6.6.8 Interval de ncredere pentru selecii mari


presupunem um trstur X studit l o populie sttisti nu este neprt de tip normlF
notm u f (x, ) lege s de reprtiieD unde este un prmetru rel neunosutF entru El estim
printrEun intervl de nredereD vom onsider o seleie repettD (Xk )k=1, n D de volum n > 30D reltiv l
rteristi X F

Propoziia 6.40 resupunem vriilele letore


Yk =

ln f (Xk , )
, k = 1, 2, . . . , n,

not

dmit dispersie @diD exist d2 = D2 (Yk ), k = 1, nAF


etuniD sttisti

d n

Yk N (0, 1),

nd

n .

@TFRRA

k=1

Demonstraie. heoree (Xk )k sunt independente stohsti i identi reprtizteD urmez i vriilele
letore (Yk )k sunt independente stohsti i identi reprtizteF tiliznd eorem limit entrlD

154

Capitolul 6. Noiuni de teoria estimaiei

pentru un n su(ient de mreD putem srieX

d n

Yk E(Yk )

N (0, 1).

k=1

hr

E(Yk )

=
R

=
=

ln f (Xk , )

ln f (x, )
f (x, ) dx

f (x, ) dx

(1) = 0,

de unde rezult onluzi propoziieiF


h (xm un nivel de nredere D putem gsi un intervl de nredere pentru prmetrul F wi nti
utm un intervl letor (z, z) = (z1 , z1 )D stfel ntX
2
2

1
z <
d n

Yk < z

= 1 ,

k=1

de unde gsim intervlul de nredere pentru vlore lui D

(1 (X1 , X2 , . . . , Xn ),

2 (X1 , X2 , . . . , Xn )).

Exemplu 6.41 pie X P() o rteristi unei populiiF horim s determinm un intervl de
nredere pentru prmetrul D u nivelul de semni(ie F

x
, x NF tim E(X) =
x!
2
D (X) = F gonsiderm (Xk )k=1, n D n 30D vFF de seleie de volum nF etuniD vriilele letore Yk

Soluie:

vege de proilitte pentru X este dt de f (x, ) = e

sunt dte deX

Yk =

1
ln f (Xk , )
= Xk 1, k = 1, 2, . . . , n.

ividentD

E(Yk ) =
glulm dispersi lui Yk F

D2 (Yk ) =
de unde d =

1
F

1
E(Xk ) 1 = 0.

1 2
1
D (Xk ) = , k = 1, 2, . . . , n,
2

qsim stfel sttisti

d n

Yk =
k=1

1
n

Xk
k=1

n
X

N (0, 1).

utem stfel onstrui un intervl de nredere pentru F tiliznd est sttistiD vom ut un z stfel

155

6.7. Estimaii prin Matlab


nt s vemX

z <

n
X <s

= (z) (z) = 1 ,

suD

P (1 < < 2 ) = 1 .
heiD intervlul de nredere este (1 , 2 )D unde 1 i 2 sunt soluiile euieiX

2 (2 x +

6.7 Estimaii prin

s2
) + x2 = 0.
n

Matlab

istimre prmetrilor prin metod verosimilitii mxime pote ( relizt n

mleF pormtul generl l funiei esteX

Matlab folosind funi

[p, pCI] = mle(X,'distribution','lege','nume_1','val_1','nume_2','val_2',...)


undeX

p este prmetrul @su prmetriiA @su vetorul de prmetriA e urmez ( estimt puntulY

pCI este vriil de memorie pentru intervlul @intervleleA de nredere e v ( estimtY

X este un vetor e onine dtele e urmez ( nlizteY

distribution este prte din formtul omenzii ir lege pote ( orire dintre legile din elul
QFIY
nume_i/val_i sunt perehi opionle de rgumenteGvloriD dintre re mintimX

 alpha reprezint nivelul de on(den pentru intervlul de nredereF lore impliit n


Matlab este = 0.005Y

 ntrials @utilizt dor pentru reprtii inomilD reprezint numrul de repetiii le exE
perimentuluiF
h urmrim s estimm prmetrii unei rteristii gussieneD tuni putem folosi omnd simpli(E
tX

[p, pCI] = mle(X)


fr mi preiz lege de distriuieF
he exempluD s lum drept oiet de luru dtele din elul IFRF eeste sunt reprezentte prin re n
pigur IFQ2 F y estimre prmetrilor i prin metod verosimilitii mxime este

X=[7*rand(34,1)+18;10*rand(76,1)+25;10*rand(124,1)+35;10*rand(87,1)+45;10*rand(64,1)+55]
[p, pCI] = mle(X)
i oinem estimrileX

156

Capitolul 6. Noiuni de teoria estimaiei


p =
41.9716

12.0228

% estimari punctuale pentru si

11.2439
12.9547

% intervale de incredere

pCI =
40.7653
43.1779

unde prim olon reprezint estimre puntul i un intervl de nredere pentru D ir dou olon
estimre puntul i un intervl de nredere pentru F
istimri puntule i u intervle de nredere mi putem oine i utiliznd funi

LEGEfit(X,alpha)
undeD n loul uvntului LEGE punem o lege de proilitte n elul QFID X reprezint oserviile i

alpha este nivelul de on(denF @ixempleX normfitD binofitD poissfitD expfit etAF

Exemplu 6.42 untemD din nouD n drul ixeriiului TFPSD u meniune dispersi nu este unosut
a priori @vezi ixeriiu TFPUAF horim s oinem o estimie printrEun intervl de nredere pentru nd
nu este unosutF polosind funi de mi susD oinem hir mi mult det ne propunemD i numeX
estimii puntule pentru i i intervl de nredere pentru meleF ulnd funiD di

[m,s,mCI,sCI] = normfit(X,0.01)
yservm vlorile furnizte pentru intervlul de nredere pentru D @mCIAD sunt ext elei ele
oinute n ixeriiu TFPUF

m =
250.0667

s =
2.9704

mCI =
248.572
251.561

sCI =
2.2111
4.4159

Observaia 6.43 presupunem fem 50 de seleii repette de volum 30 @di legem n 50 de zile
o seleie de 30 de ngheteA i )m intervlele de nredere @tote u nivelul de on(den = 0.01A
pentru ms medie oninutuluiF pigur TFP reprezint gr( ele 50 de intervleF

hup um se oserv din (gurD se pote ntmpl un intervl de nredere genert s nu onin
vlore pe re est r treui s o estimezeF eest nu ontrzie teoriD deoree proilitte u
re vlore estimt este operit de intervlul de nredere este

P < < = 1 = 0.99,


dei exist nse de grei n estimreD n zul de f de 1%F

157

6.8. Paradox cu intervale de ncredere

Figura 6.2: 50 de realizri ale intervalului de ncredere pentru

6.8 Paradox cu intervale de ncredere


presupunem X N (, ) este o rteristi unei populii sttistieD {Xk }k=1, n o seleie
repett efetut supr lui X i X medi de seleieF
n eiune TFTFID m gsit un intervl de nredere pentru medi D nd dispersi 2 este unosutD
este dt deX

X z1 ,
2
n

(, ) =

X + z1
2
n

@TFRSA

(xm = 1 i s onsiderm nivelul de semni(ie este = 0.01F entru est D until orespunE
ztore este z1 2.58F
2
edrD pentru orie n (xt din N D proilitte evenimentului

2.58
2.58
X < < X+
n
n

An =

este 1 = 0.99 1F onsiderm evenimentele An D pentru (ere n N F

heoree P (An ) = 0.99D deduem

P (An ) = F etuniD utiliznd eorem forelEgntelli @eorem


n=1

PFIIAD oinem

lim sup An
n

=P

Am = 1.

n=1 mn

e de lt prteD proilitte ineglitte

2.58
2.58
X < < X+
n
n

158

Capitolul 6. Noiuni de teoria estimaiei

s i lo pentru orie n N este 0D diX

An

@TFRTA

= 0.

n=1

hup um este prezentt n ITAD prdoxul pre n urm fptului D dei pentru orie n N (xt vem
P (An ) = 0.99 1D reli @TFRTA este stisfutF

elul TFI onine iv estimtori uzuli i funiile

repartiia

Matlab orespunztoreF

Estimator uzual

Funcia

Matlab

X
n

csbinpar

Poisson B()

=X

cspoipar

exponenial exp()

=
X

csexpar

binomial B(n, p)

p=

Gamma (a, )

a=

normal N (, )

X
1
n

csgampar

2
Xk X

2
Xk
k=1

X
1
n

n
k=1

mean
var

=X

= d (X)

Tabela 6.1: Estimatori punctuali uzuali pentru parametri.

6.9 Exerciii rezolvate


Exerciiu 6.1 se rte medi de seleie X onstituie un estimtor solut oret i e(ient l
prmetrului din reprtii oisson P()F

Soluie:

heoree X P()D urmez E(X) = D2 (X) = F etuniD

1
E(X) = E
n
1
D (X) = 2 D2
n

Xi
i=1

Xi
i=1

1
= 2
n

1
=
n

E(Xi )
i=1

D (Xi )
i=1

1
= (
) = ,
n i=1

= 2(
) = 0,
n i=1
n

nd n .

159

6.9. Exerciii rezolvate

edrD onform de(niieiD medi de seleie este un estimtor solut oret pentru prmetrul F puni
de proilitte este

f (x, ) = e
de unde

x
, x N,
x!

x
ln f (x, )
= 1 + .

glulm e(ien estimtoruluiF evem

In ()

ln f (x, )

= nE

= nE 1 2

x x2
+
2

=n

12

1
+ 2 (2 + )

e oserv D2 (X) In () = 1D dei estimtorul X pentru este e(ientF

n
.

Exerciiu 6.44 pie Xi B(1, p), i = 1, n i


n

= nX =

numrul de suese n n inerri.

Xi ,
i=1

se rte este un estimtor su(ient pentru pF

Soluie:

entru veri(re su(ieneiD utilizm de(niiF evem suesivX


n

f (x, p)

pxi (1 p)1xi

i=1
n

xi
= p i=1

(1 p)

xi
i=1

= g(x) h((x), p),

unde g(x) 1 i h((x), p) = p(x) (1 p)n(x) F

Exerciiu 6.45 e onsider rteristi X e re densitte de reprtiie

1 e x , x > 0;

f (x, ) =
0,
x 0.
@iA qsii un estimtor pentru prmetrul neunosut > 0 @folosindD l legereD metod momentelor su
metod verosimilitii mximeAY
@iiA gluli medi i dispersi estimtoruluiF iste estimtorul deplstc

Soluie:

@iA Metoda momentelor:

heoree vem dor un prmetruD nume D metod momentelor

revine lX

X = E(X).

160

Capitolul 6. Noiuni de teoria estimaiei

hrD medi vFF X esteX

E(X) =

x f (x) dx =
R

x e dx =

x e

e dx = .

dx =
0

edrD estimtorul pentru este

=X=
n

(undeD (Xk )k vriilele letore de seleie).

Xk ,
k=1

@iiA Metoda verosimilitii maxime:

puni de verosimilitte esteX

L(x, ) =
k=1

1
1 xk
e = ne

ln L(x, )

iui

n ln

ln L(x, )
= 0 impli

1
=
n

e veri( poi

xk
k=1

1
x

1 n x/
e
.
n

n
n
+ 2 x.

xk = x.
k=1

2 ln L(x, )
n
|= = 2 < 0,

2
x

i stfelD este punt de mxim i X este estimtor de verosimilitte mxim pentru F


@iiA

evemX

E() = E(X) = E(X) = ,

= estimtor nedeplst.

1
2

D2 () = D2 (X) = 2 D2 (X) = 2 .
n
n

1
Observaia 6.46 e oserv X exp( )D de unde E(X) = , D2 (X) = 2 .

Exerciiu 6.47 pie X o rteristi e reprezint timpul de produere unei reii himieD msurt
n seundeF resupunem X N (m, 2 )F gonsiderm o seleie repett de volum n = 11D u vlorile
de seleie

4.21, 4.03, 3.99, 4.05, 3.89, 3.98, 4.01, 3.92, 4.23, 3.85, 4.20.
@iA se determine un intervl de nredere pentru 2 i unul pentru D u nivelul de semni(ie = 0.05F
@iiA e unote timpul mediu de reieD = 4F se determine un intervl de nredere pentru 2 i unul
pentru D u nivelul de semni(ie = 0.05F

Soluie:

@iA heoree medi nu este unosut i nu vem lt informie despre dispersieD folosim forE

mul @TFQHAF godul

Matlab este urmtorulX

x = [4.21; 4.03; 3.99; 4.05; 3.89; 3.98; 4.01; 3.92; 4.23; 3.85; 4.20];
n = 11; alpha = 0.05; s2 = var(x);

161

6.9. Exerciii rezolvate

h1 = icdf('chi2',1-alpha/2,n-1); h2 = icdf('chi2',alpha/2,n-1);
S1 = (n-1)*s2/h1; S2 = (n-1)*s2/h2;
s1 = sqrt(S1); s2 = sqrt(S2);
fprintf('
int. de incredere pt dispersie: (S1,S2) = (%6.3f,%6.3f)',S1,S2);
fprintf('int. de incredere pt deviatia standard: (s1,s2) = (%6.3f,%6.3f)\n',s1,s2);
yinem vlorileX

interval de incredere pt dispersie: (S1,S2) = ( 0.008, 0.052)


interval de incredere pt deviatia standard: (s1,s2) = ( 0.091, 0.229)
utem veri( rezulttele folosind funi

Matlab normfitF gomnd

[m,sigma,muCI,sigmaCI] = normfit(x,0.05)
returnez estimiile puntule pentru i i intervle de nredere pentru esteX

m =
4.0327

mCI =

sigma =
3.9451
4.1204

sigmaCI =
0.0912
0.2290

0.1305

e oserv vlorile furnizte de est funie pentru sigmaCI sunt ele gsite nteriorF
@iiA heoree medi este unosutD intervlul de nredere este dt de @TFPUAF godul

Matlab pentru

lulul estui intervl esteX

x = [4.21; 4.03; 3.99; 4.05; 3.89; 3.98; 4.01; 3.92; 4.23; 3.85; 4.20];
n = 11; alpha = 0.05; s2 = sum((x-4).^2)/11;
h1 = icdf('chi2',1-alpha/2,n); h2 = icdf('chi2',alpha/2,n);
S1 = n*s2/h1; S2 = n*s2/h2;
s1 = sqrt(S1); s2 = sqrt(S2);
fprintf('
int. de incredere pt dispersie: (S1,S2) = (%6.3f,%6.3f)\n',S1,S2);
fprintf('int. de incredere pt deviatia standard: (s1,s2) = (%6.3f,%6.3f)\n',s1,s2);
ulnd odulD oinem rezulttele eruteX

interval de incredere pt dispersie: (S1,S2)=( 0.008, 0.048)


interval de incredere pt deviatia standard: (s1,s2)=( 0.091, 0.218)

Exerciiu 6.48 en dtilogr(z un rtiol de 60 de pginiF v reitire rtioluluiD en desoperit


pe (ere pgin de rtiol urmtorele numere de greeliX

7
8

6
7

5
7

9
4

10
11

4
6

4
6

8
5

5
4

8
6

6
13

4
8

5
6

6
9

6
7

5
8

12
5

16
4

9
3

5
6

162

Capitolul 6. Noiuni de teoria estimaiei


8

10

10

12

14

10

presupunem numrul de greeli prute pe (ere pgin dtilogr(t de en este o vriil


letore reprtizt P oissonF
@IA se estimeze numrul mediu de greeli fute de en pe (ere pgin dtilogr(tY
@PA se estimeze numrul mediu de greeli fute de en l dtilogr(ere unei ri de 280 de pginiD
presupunnd r lur n ext elei ondiii i u eei ndemnreF
@QA gu e proilitte v ve en mi puin de 2000 de greeli pentru tot rtec

Soluie:

presupunem Y este vetorul e re drept omponente numerele din enunF h X

este vriil letore le rei vlori reprezint numrul de greeli prute l o pgin dtilogr(t i

X P(n)D tuni E(X) = D2 (X) = nF


h notm u Xk , k = 1, 280D vriilele letore le ror vlori reprezint numrul de greeli de
dtilogr(e fute pe (ere pgin rii @respetivAD tuni
280

Xk P(280 n),
k=1

deoree Xk sunt vFF independente stohsti i identi reprtizteF


roilitte este

280

Xk 2000) = F (2000),

P = P(
k=1

280

Xk D di unei vFF reprtizt P(280 n)F

unde F (x) este funi de reprtiie pentru


k=1

istimm prmetrul reprtiiei P oisson folosind omnd mle din

MatlabF

godul e rezolv prolem

este urmtorul

[n,nCI] = mle(Y,'distribution','exp','alpha',0.1)
N = 280*n;

% pentru (1)

ulnd odulD oinem rezultteleX

n =
7.1000
nCI =
5.8130
8.9024

% estimarea punctuala a lui n


% intervalul de incredere

edrD s onvenim en fe n medie n = 7 greeli pentru (ere pgin dtilogr(tF etuniD


pentru tot rte v fe n medie N = 7 280 = 1960 greeliF
roilitte esteX

P = poisscdf(2000,N)

6.9. Exerciii rezolvate

163

di P 0.82F

Observaia 6.49 heoree E(X) = D2 (X) = nD nsemn numrul n pute ( estimt n est z i
u medi vlorilor lui Y D di Y @mean(Y) n
n

MatlabF

MatlabA su u dispersi empiri pentru Y D di var(Y)

Exerciiu 6.50 presupunem runm o moned despre re nu tim d este su nu oret @diD
proilitte de priie feei u stem nu este neprt 0.5AF pie X vriil letore e reprezint
numrul de priii le feei u stem l runre repett unei monedeF xotm u p proilitte
evenimentului l o singur runre monedei pre stemF elizm 80 de runri le elei monede
i oinem vlorile @1 nsemn f u stem prut ir 0 d nu prutAX

0 1 0 0 1 0 1 1 0 1 0 0 1 0 1 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 1 1 0 1 0 1 1 0
1 0 1 0 1 0 0 0 1 1 0 0 1 0 1 1 0 1 1 0 0 0 1 1 0 1 0 1 1 0 1 1 1 0 0 0 1 0 1 0
@IA se gses un estimtor solut oret pentru p i se studieze e(ien estuiF
@PA se gses estimii puntule i intervle nredere pentru pD folosind funiile mle i binofit din

MatlabF
Soluie:

@IA eprtii lui X este fernoulliD B(1, p)F estfelD

E(X) = p,

D2 (X) = p(1 p).

gonsiderm vriilele de seleie repett de volumD (Xk )k=1 n F


n estimtor solut oret pentru medie este X D deoree
i D2 (X) =

E(X) = E(X)

p(1 p)
0.

n
n2

edrD pentru selei dtD vlore x =


@PA tiliznd funiile

Matlab stfelX

xk = 0.5125F
k=1

[p,pCI] = mle(Y,'distribution','bino','ntrials',1,'alpha',0.05)
u rezulttulX

p =
0.5125

pCI =
0.3981
0.6259

suD folosind omnd binofitD

[p,pCI] = binofit(sum(Y),length(Y),0.05)

164

Capitolul 6. Noiuni de teoria estimaiei

u rezulttulX

p =
0.5125

pCI =
0.3981
0.6259

Exerciiu 6.51 y seleie letore de volum n = 25 u medi se seleie x = 50 se i dintrEo populie


de volum N = 1000D e re devii stndrd = 2F
@A h presupunem populi este normlD gsii un intervl de nredere pentru medi populieiD
u = 0.05F
@A qsii un intervl de nredere pentru medi populiei @ = 0.05A n zul n re populi nu este
normlF

Soluie:

@A polosim formul @TFPIAF qsim intervlul de nredere

(, ) =

2
50 z0.975 ,
25

2
50 + z0.975
25

= (48.4, 51.6).

@A heoree populi nu este norml distriuit i nii volumul populiei nu este mre @n < 30AD vom
estim intervlul de nredere znduEne pe ineglitte lui geev @PFPVAF evem proilitte
vlorile lui X s (e proximte prin x u o erore de el mult k deviii stndrd esteX

P ({|X x| < k}) 1


vund 1

1
.
k2

1
= 0.95D gsim k = 20F estfelD un intervl de nredere pentru medi populiei v (
k2

(, ) =

x k , x + k
n
n

50

2
20 ,
25

50 +

2
20
25

= (46.42, 53.58).

yservm est intervl este mi mre det el gsit nteriorD de ee ineglitte lui geev este
rr folosit pentru determin intervle de nredereF otuiD n est z nu vem o lt lterntiv de
lulF h se dorete o preizie mi unD r ( indit volumul seleiei s (e de el puin 30D z n
re putem folosi proximre u reprtii normlF

elul TFP sumrizez intervlele de nredere prezentte pn umF n (ere zD nivelul de semni(E
ie este F

165

6.9. Exerciii rezolvate

rmF

eli prmF

sntervl de nredere u nivelul de semni(ie

X z1
2

,
n

X z1

unosut

,
n

X z1

neunosut

X t; n1

+
n d2 (X)
2
1; n

,
(n1) d2 (X)

,
2 ; n1
1

(n1) d2 (X)

2 ; n1

,
p
2
1

2
/2

p z1
2

n
mre

2
2
1 , 2
unosui

1 2

2
2
1 = 2
neunosui

1 2

2
2
1 = 2
neunosui

p1 p2

n1 , n2
mri

(n1) d2 (X)

2
1; n1

p (1p)
,
n

p + z1
2

p (1p)
n

d2
d2
1
1

2 fn1 1, n2 1; 2 , d2 fn1 1, n2 1; 1 2
d2
2

1 , 2
neunosui

1 2

(n1) d2 (X)

2 n1
;

neunosut

d (X)

n d2 (X)
2 ; n

n d2 (X)
2 n ,
;

unosut

d (X)

,
n

X + t1 ; n1
2

n d2 (X)
,
2 ; n
1

X + z1

d (X)

,
n

X t1 ; n1
2

X + z1
2

2
1
2
+ 2 , X1 X2 + z1
2
n1
n2

X1 X2 z1
2
X1 X2 t1 ; N
2

2
1
2
+ 2
n1
n2

d2
d2
1
+ 2 , X1 X2 + t1 ; N
2
n1
n2

d2
d2
1
+ 2
n1
n2

X1 X2 t1 ; n1 +n2 2 d(X1 , X2 ), X1 X2 + t1 ; n1 +n2 2 d(X1 , X2 )


2
2
p1 p2 z1
2

p1 (1p1 )
n1

p2 (1p2 )
,
n2

p1 p2 + z1
2

Tabela 6.2: Tabel cu intervale de ncredere.

p1 (1p1 )
n1

p2 (1p2 )
n2

166

Capitolul 6. Noiuni de teoria estimaiei

wi susD prin d(X1 , X2 ) m nottX

d(X1 , X2 ) =

(n1 1)d2 + (n2 1)d2


2
1

n1 + n2 2
1
1
n1 + n2

1
2

6.10 Concluzii
hin punt de vedere prtiD estimre unui prmetru l reprtiiei studite nsemn triuire unei
vlori numerie elui prmetru su onstruire unui intervl numeri e oper u o proilitte
mre vlore rel prmetruluiF lore numeri se numete estimie i este vlore unei sttistii
@numit estimtorA pentru o seleie dtF wetodele de estimre puntul prezentte n est pitol
suntX metod verosimilitii mximeD metod momentelorD metod minimului lui 2 i metod elor mi
mii ptrteF
iste de prefert un estimtor puntul un s ndeplines urmtorele ondiiiX

s (e nedeplstD iFeFD vlore medie s s (e hir prmetrul pe reEl estimezY


s (e onsistentD iFeFD odt u retere mrimii seleieiD vlorile estimtorului s se propie de vlore
estimtY

s (e UMVUED iFeFD dintre toi posiilii estimtori i prmetrului de estimtD s i vrin minimF
snonvenientul prinipl l unui estimtor puntul este nu putem ti t de prope se ) est de
prmetrul estimtF eest fpt pote ( determint u jutorul intervlelor de nredereF
sntervlul letor numeri se numete intervl de nredere su de on(den dD u o proilitte de
ris preizt a prioriD oper vlore rel prmetrului estimtF hei pre prdoxlD este posiil
vlore rel prmetrului estimt s nu prin intervlului de nredereF eest fpt se expli prin
fptul intervlul de nredere nu este determint u ertitudineD i exist o erore de ris n estimre
luiF irore de ris pote ( ontrolt u jutorul nivelului de on(denD re este proilitte
intervlul de on(den s onin vlore e o estimezF
h volumul seleiei este unul su(ient de mre @el puin 30AD tuni putem determin intervle de
nredere pentru orie tip de reprtiie seleieiF n englezD semene estimri sunt denumite large

sample estimationsF sntervle de nredere pot ( determinte i pentru seleii miiD dr numi n zul n
re selei provinde dintrEo reprtiie normlF
n zul n re reprtii studit re mi muli prmetriD putem onstrui @gsiA estimtori pentru (ere
prmetru n prteF
hup um m vzut n est pitolD exist funii

Matlab re determin estimri puntule su u

intervle de nredere pentru seturi de dte sttistieF e de lt prteD vem i vrint de folosi
onsideriile teoretie din text pentru lulul estimtorilorF

6.11 Exerciii propuse


Exerciiu 6.2 gonsiderm sttisti

wk Xk .
k=1

@TFRUA

167

6.11. Exerciii propuse


h dorim s (e estimtor nedeplst pentru D tuni imedit oinem

wk = 1.
k=1

evem

D2 () = E

wk (Xk )

= 2

k=1

2
wk .
k=1

erti X este UMVUE n ls tuturor estimtorilor liniri de form @TFRUAF

Exerciiu 6.3 erti momentul de seleie de ordin k este estimtor solut oret pentru k (X)F
Exerciiu 6.4 erti momentul de seleie entrt de ordin k este estimtor solut oret pentru
k (X)F n prtiulrD momentul de seleie entrt de ordin 2 este estimtor solut oret pentru dispersi
teoreti D2 (X)F

Exerciiu 6.5 erti n X este un estimtor su(ient pentru prmetrul din reprtii P oissonD
P()F

Exerciiu 6.6 erti n(1X) este un estimtor su(ient pentru prmetrul p din reprtii B(n, p)F
Exerciiu 6.7 erti informi pisher I1 () pentru o rteristi N (, ) este
I1 () =

1
.
2

@deiD ntitte de informie rete u desretere lui FA

Exerciiu 6.8 erti sttisti d2 (X) este un estimtor solut oret pentru 2 = D2 (X)D ir

sttisti d2 (X) este un estimtor oretD dr nu solut oretD pentru D2 (X)F

Exerciiu 6.9 istimi prin metod verosimilitii mxime prmetrul p l unei rteristii X
B(n, p)F

Exerciiu 6.10 pie selei


871 822 729 794 523 972 768 758 583 893 598 743 761 858 948
598 912 893 697 867 877 649 738 744 798 812 793 688 589 615 731
se estimeze solut oret dispersi populiei din re provine est seleieF

Exerciiu 6.11 istimi prin metod momentelor prmetrii unei rteristii X N (, )F


Exerciiu 6.12 hemonstri ropozii TFW i yservi TFIHF
Exerciiu 6.13 gonsiderm o seleie de volum n dintrEo oletivitte reprtizt (n, ), (n N). qsii
un estimtor pentru prmetrul prin metod verosimilitii mxime i unul prin metod momentelorF

168

Capitolul 6. Noiuni de teoria estimaiei

Exerciiu 6.14 gonsiderm funi f : R RD dt prin

2 x e xa2
f (x) = a
0

, x > 0;
, x 0.

@A entru e vlori le prmetrului aD funi f (x) este o densitte de reprtiiec


@ notm u X vriil letore e re est densitte de reprtiieAY
@A qsii un estimtor pentru prmetrul a @folosindD l legereD metod momentelor su metod verosimilE
itii mximeAY
@A gluli E(), D2 ()D P (X > 0)F
a
a

Exerciiu 6.15 e onsider urmtore seleie de note oinute de prtiipnii l un onursX


5 7 8 6 9 7 10 4 7 9 6 5 7 8 7 6 10 8 6 9 4 7 5 8 6
@A se estimeze solut oret medi i dispersi populiei din re provine est seleieD preiznd
formulele folositeF
@A se reprezinte gr( selei dt @prin histogrmeA i funi de reprtiie pentru est seleieY
@A notm u X vriil letore re guvernez populiF se proximeze proilitte

P (6 X 8) u jutorul seleiei de mi susF

Exerciiu 6.16 v un ontrol de litte se veri( ms tletelor de ioolt produse de o numit


minF entru se reliz est ontrol sE efetut o seleie de 50 tlete i sE oinut ms X l
iooltelor re urmtorele dimensiuni @n grmeAX
ws

99.98

99.99

100.00

100.01

100.02

preven

10

13

11

se determineX
@A o estimie solut oret pentru ms medie tletelor produseY
@A o estimie oret i un solut oret pentru dispersi vlorilor msei f de medieF

Exerciiu 6.17 gonsiderm rteristi X unei populii normleF polosind urmtorele oservii
le lui X D

-2,

-1,

0,

0,

1, 2,

1,

2,

s se gses un intervl de nredere pentru medi populieiD u nivelul de semni(ie = 0.1F

Exerciiu 6.18 gonsiderm o rteristi X B(n, p)D unde prmetrul n este unosutF
@A

qsii un estimtor puntul pentru prmetrul pD iEi determini E() i D2 ()F


p
p

@A

resupunnd n este su(ient de mre @n 30AD rti

p z1

p(1 p)

,
n

p + z1

p(1 p)

este un intervl de nredere l nivelul de semni(ie pentru prmetrul pF F

6.11. Exerciii propuse

169

Exerciiu 6.19 n urm unui sondj de opinie l re u prtiipt 1500 de elevi de lieuD 563 dintre
eti sunt n fvore noului mod de desfurre exmenului de fluretF qsii un intervl de
nredere u nivelul = 0.05 pentru propori de elevi de lieu e sunt n fvore noii modliti de
exmenre l fluretF

Exerciiu 6.20 pie X o vriil letore exponenil de prmetru F h r > 0D gsii un estimtor
prin metod verosimilitii mxime pentru P (X r)F

Exerciiu 6.21 @A ixplii de e un intervl de nredere nu onine ntotdeun vlore rel


prmetrului de estimtF
@A ge se ntmpl u lungime intervlului de nredere tuni nd volumul seleiei retec

Exerciiu 6.22 gonsiderm seturile de dte din elele IFT i IFVF


@A se determine un intervl de nredere pentru diferen mediilorD tiind dispersiile respetive sunt
egleD dr neunosuteY
@A se determine un intervl de nredere pentru diferen mediilorD tiind dispersiile respetive sunt
neunosute i diferiteF

Exerciiu 6.23 pie X1 , X2 , . . . , Xn o seleie repett de volum n mreD lut dintrEo rteristi e
re medi neunosut i dispersi 4F hetermini volumul seleiei pentru reD u o proilitte de

99% putem estim pe u o erore de o zeimeF

Exerciiu 6.24 v un ontrol de litteD dintrEun lot de 150 de pieseD 5 sEu gsit defeteF hetermini
un intervl de nredere u = 0.01 pentru proilitte o pies lut l ntmplre s (e defetF

Exerciiu 6.25 n ngjt l erviiu porelor de wun dorete s f un sondj prin re s determine
proentul de persone dintrEo regiune rii e lurez l negruF il dorete s (e 98% sigur rezulttul
gsit estimez proentul rel u o erore de el mult 2%F hintrEun sondj reentD l re u prtiipt

1500 de persone ngjteD 273 u delrt nu li sEu fut rte de munF


@A gt de mre r treui s (e volumul seleiei pentru reliz estimre doritc
@A h nu r ve es l el sondjul reentD t de mre r treui s (e volumul seleiei pentru
reliz estimre doritc

Exerciiu 6.26 n studiu reent rt dintre 120 de idente rutiere e sEu soldt u vitimeD 56
er dtorte onsumului de loolF qsii un intervl de nredere re s estimeze u o proilitte de
ris = 0.05 proentul rel l identelor rutiere uzte de onsumul de loolF

Exerciiu 6.27 gt de mre r treui s (e volumul seleieiD pentru estim propori de fumtori din
r u o erore de el mult 2%D i o proilitte de nredere de 0.95c

170

Capitolul 6. Noiuni de teoria estimaiei

Capitolul

Vericarea ipotezelor statistice


7.1 Punerea problemei
n est pitol sunt inluse tev noiuni introdutive i proedee generle e in de deizii sttistieF
estre ipotezelor sttistie este o metod prin re se iu deizii sttistieD utiliznd dtele experimentle
uleseF estele prezentte mi jos u l z noiuni din teori proilitilorF eeste teste ne permit
D plend de l un numit su numite seturi de dte ulese experimentlD s se putem vlid numite
estimri de prmetri i unei reprtiii su hir putem prezie form legii de reprtiie rteristiii
onsiderteF
resupunem X este rteristi studit unei populii sttistie i lege s de proilitte
este dt de f (x, )D unde Rp F hup um preizm n pitolul nteriorD est funie pote
( spei(t @di i unotem formD dr nu i prmetrul AD z n re putem fe numite ipoteze
supr estui prmetruD su f (x, ) este neunosutD z n re putem fe ipoteze supr formei sleF
presupunem (xk )k=1, n sunt dtele oservte reltiv l rteristi X F

Deniia 7.1 @IA xumim ipotez statistic o presupunere reltiv l vlorile prmetrilor e pr n
lege de proilitte rteristiii studite su hir referitore l tipul legii rteristiiiF
@PA y ipotez neparametric este o presupunere reltiv l form funionl lui f (x, )F he exempluD
o ipotez de genul X xormlF
@QA xumim ipotez parametric o presupunere fut supr vlorii prmetrilor unei reprtiiiF h
mulime l re se presupune prine prmetrul neunosut este formt dintrEun singur elementD
vem deE fe u o ipotez parametric simplF eltfelD vem o ipotez parametric compusF
@RA y ipotez nul este e ipotez pe re o intuim ( e mi propit de relitte i o presupunem a

priori ( devrtF gu lte uvinteD ipotez nul este ee e doreti s reziD n zul n re nu exist
su(iente evidene re s sugereze ontrriulF n exemplu de ipotez nul este urmtorulX 4presupus
nevinovtD pn se gses dovezi re s teste o vin4F y ipotez alternativ este orie lt ipotez
dmisiil u re pote ( onfruntt ipotez nulF
he exempluD n ixeriiul TFPSD putem presupune ipotez @prmetriA nul este

(H0 )

= 250 grme,

171

172

Capitolul 7. Vericarea ipotezelor statistice

ir o ipotez lterntiv @ilterlA pote (

(H1 )

= 250 grme.

n generlD pentru teste prmetrie onsiderm

A = A0

A1 , A 0

A1 =

i spunem

(H0 )

A0

este ipotez nul,

ir

(H1 )

A1

este ipotez lterntiv.

@SA e testa o ipotez statistic @en.D sttistil infereneA nsemn lu un dintre deiziileX

ipotez nul se respinge


ipotez nul se dmite @suD nu sunt motive pentru respingere eiA
@TA n ttistiD un rezultt se numete semnicativ din punct de vedere statistic d este improil
el s se ( relizt dtorit nseiF ntre dou vlori exist o diferen semnicativ d exist su(iente
dovezi sttistie pentru dovedi diferenD i nu dtorit fptului diferen r ( mreF xumim nivel de

semnicaie proilitte de respinge ipotez nul ndD de fptD est este devrtF n generlD
nivelul de semni(ie este les (ind un dintre vlorileX = 0.01, 0.02, 0.05 etF
om numi regiune critic mulime tuturor vlorilor re uzez respingere ipotezei nuleF wtemtiD
o sumulime U R se numete regiune critic u un nivel de semni(ie (0, 1) d

P ((x1 , x2 , . . . , xn ) U | H0 dmis) = .
h putem srie regiune riti su form

U = {(x1 , x2 , . . . , xn ) Rn | S(x1 , x2 , . . . , xn ) c},


tuni vlore c se numete valoare critic ir S(x1 , x2 , . . . , xn ) se numete statistic test su criteriuF
gonstruire unui test sttisti revine l onstruire unei stfel de mulimi ritieF polosind dtele oservte
i U determint mi susD putem ve dou zuriX

(i)
(ii)

(x1 , x2 , . . . , xn ) U, ee e impli fptul (H0 ) este eptt @pn l o lt testreA;


(x1 , x2 , . . . , xn ) U, ee e impli fptul (H0 ) este respins @di (H1 ) este epttA;

n urm unor stfel de deizii pot pre dou tipuri de eroriX

eroarea de spea (I) su risul furnizorului @enFD false positiveA este erore re se pote omite
respingnd o ipotez @n relitteA devrtF e mi numete i risc de genul (I)F roilitte
estei erori este nivelul de semni(ieD diX

= P ((x1 , x2 , . . . , xn ) U | H0 dmis).

7.1. Punerea problemei

173

eroarea de spea a (II)-a su risul ene(irului @enFD false negativeA este erore re se pote
omite eptnd o ipotez @n relitteA flsF e mi numete i risc de genul al (II)-leaF roE
ilitte estei erori este

= P ((x1 , x2 , . . . , xn ) U | H1 dmis).
qrvitte omiterii elor dou erori depinde de prolem studitF he exempluD risul de genul @sA este
mi grv det risul de genul l @ssAEle d veri(m litte unui rtiol de imrminteD ir risul
de genul l @ssAEle este mi grv det risul de genul @sA d veri(m onentri unui medimentF
pie X o rteristi e urmezu lege de proilitte f (x; )D u R i (x1 , x2 , . . . , xn ) vlori
de seleie de volum nF

Deniia 7.2 om numi puterea unui test proilitte respingerii unei ipoteze flse @suD proilitite
de nu omite erore de spe ssEAF xotm prin

= 1 = P ((x1 , x2 , . . . , xn ) U | H0 fls) .

@UFIA

Deniia 7.3 henumim valoare P su P valoare @en., EvlueA proilitte de oine un rezultt
el puin l fel de extrem el oservtD presupunnd ipotez nul este devrtF lore P este
e mi mi vlore nivelului de semni(ie pentru re ipotez (H0 ) r ( respinsD znduEne
pe oserviile uleseF h Pv D tuni respingem ipotez nul l nivelul de semni(ie D ir d

Pv > D tuni dmitem (H0 )F gu t Pv este mi miD u tt mi mri nse ipotez nul s (e
respinsF he exempluD d vlore P este Pv = 0.045 tuniD znduEne pe oserviile uleseD vom
respinge ipotez (H0 ) l un nivel de semni(ie = 0.05 su = 0.1D dr nu o putem respinge l un nivel
de semni(ie = 0.02F h ne rportm l P vloreD deizi ntrEun test sttisti pote ( fut
stfelX d est vlore este mi mi det nivelul de semni(ie D tuni ipotez nul este respinsD
ir d P vlue este mi mre det D tuni ipotez nul nu pote ( respinsF he reinut fptul D
u t vlore P este mi miD u tt mi semni(tiv este rezulttul testuluiF
n exemplu simplu de test este testul de srinF eest test esteD de fptD o proedur sttisti e ne
d dreptul s deidem d exist su nu su(iente evidene s onluzionm o srin este prezentF
spotez nul r ( lips sriniiF wjoritte omenilor n est z vor de de ord um un false

negative este mi grv det un false positiveF


presupunem suntem ntrEo sl de judet i judetorul treuie s deid d un inulpt este
su nu vinovtF ere stfel de testt urmtorele ipotezeX

(H0 )
(H )
1

inulptul este nevinovtY


inulptul este vinovtF

Posibilele stri @supr ror nu vem ontrolA suntX


[1] inulptul este nevinovt @H0 este devrt i H1 este flsAY
[2] inulptul este vinovt @H0 este fls i H1 este devrtA

174

Capitolul 7. Vericarea ipotezelor statistice

Deciziile posibile @supr ror vem ontrol putem lu o deizie oret su un flsA suntX
[i] H0 se respinge @dovezi su(iente pentru nrimin inulptulAY
[ii] H0 nu se respinge @dovezi insu(iente pentru nrimin inulptulAY
n relitteD vem urmtorele posiilitiD sumrizte n elul UFIX

Situaie real
Decizii
H0 - adevrat H0 - fals
Respinge H0
[1]&[i]
[2]&[i]
Accept H0
[1]&[ii]
[2]&[ii]
Tabela 7.1: Posibiliti decizionale.
snterpretrile dtelor din elul UFI se gses n elul UFPF

Situaie real

Decizii
H0 - adevrat
H0 - fals
Respinge H0
nchide o persoana nevinovat
nchide o persoana vinovat
Accepta H0 elibereaz o persoana nevinovat elibereaz o persoana vinovat
Tabela 7.2: Decizii posibile.
irorile posiile e pot pre sunt ele din elul UFQF

Decizii
Respinge H0
Accepta H0

Situaie real
H0 - adevrat
H0 - fals

judecat corect
judecat corect

Tabela 7.3: Erori decizionale.

7.2 Tipuri de teste statistice


ipul unui test sttisti este determint de ipotez lterntiv (H1 )F evem stfelX

test unilterl stngD tuni nd ipotez lterntiv este < 0


test unilterl dreptD tuni nd ipotez lterntiv este > 0
test ilterlD tuni nd ipotez lterntiv este = 0

@vezi pigur UFI (a)AY


@vezi pigur UFI (b)AY

@vezi pigur UFPAY

edrD pentru onstrui un test sttisti vom ve nevoie de o regiune ritiF entru onstrui est
regiune riti vom utiliz metod intervlelor de nredereF h vlore oservt se ) n regiune
riti @di n fr intervlului de nredereAD tuni respingem ipotez nulF

7.3. Testul cel mai puternic

175

Figura 7.1: Regiune critic pentru test (a) unilateral stnga, (b) unilateral dreapta.

Figura 7.2: Regiune critic pentru test bilateral.

7.3 Testul cel mai puternic


presupunem X este rteristi unei oletiviti sttistie e urmez o lege de proilitte

f (x; )D i vem de testt ipotez nul (H0 ) vsF ipotez lterntiv (H1 )D u proilitte de ris F

Deniia 7.4 punem testul zt pe regiune riti U este cel mai puternic test n rport u tote
testele zte pe regiune riti U D l nivelul de semni(ie D d sunt ndeplinite urmtorele ondiiiX

(a)

P ((x1 , x2 , . . . , xn ) U | (H0 ) se dmite) = ;

(b)

U U .

@diD dintre tote testele de nivel de semni(ie (xtD el mi puternit test este el pentru re putere
testului este mximAF egiune U se numete regiunea critic cea mai bunF

Observaia 7.5 xu ntotdeun exist un el mi puterni testF


n zul ipotezelor simpleD lem urmtore ne onfer un el mi un testF n zul generlD nu se pote
onstrui un stfel de riteriuF

176

Capitolul 7. Vericarea ipotezelor statistice

Lema 7.6 (Neyman1 -Pearson) resupunem vem de testt


(H0 ) :

= 0

vsF

(H1 ) :

= 1 ,

l nivelul de semni(ie F xotm u L(x; ) = L(x1 , x2 , . . . , xn ; ) funi de verosimilitte i (e

L(x; 1 )
.
L(x; 0 )

S(x) =
etuni regiune U de(nit prin

U = {x Rn | S(x) c},
u c stfel nt P (x U | (H0 ) devrt) = D este e mi un regiune riti l nivelul de
semni(ie F

Exemplu 7.7 pie x1 , x2 , . . . , xn vlori de seleie pentru o rteristi X N (, )D unde este


unosutF horim s testm ipotez nulX

(H0 ) :

= 0

(H1 ) :

= 1 .

versus ipotez lterntiv simpl

Soluie:

puni de verosimilitte soit seleiei esteX


n

1
L(x1 , x2 , . . . , xn ; ) = n
n e
(2) 2

(xk )2

1
22

k=1

glulnd S(x)D oinemX


n

L(x; 1 )
S(x) =
=
L(x; 0 )

0
1

1
2

1
2
1

(xk )2

1
2
0

k=1

.
n
2

tiliznd vem xeymnEersonD el mi puternit test este zt pe o regiune e depinde de


n

i=1
2

he semeneD oservm d 1 > 0 D tuni S(x) este o funie restore de

(xi ) F edrD
i=1

n
2

vom respinge ipotez (H0 ) d

(xi ) F

(xi ) este su(ient de mreF

i=1

7.4 Testarea tipului de date experimentale


entru pute efetu un test sttisti n mod oretD este neesr s tim re este tipul @tipurileA de dte
pe re le vem l dispoziieF entru numite teste sttistie @eFgFD testul Z su testul tD dtele testte
1

Jerzy Neyman (1894 1981), matematician polonez

7.4. Testarea tipului de date experimentale

177

treuie s (e norml distriuite i independenteF he multe oriD hir i ipotez dtele s (e norml
reprtizte treuie veri(tF he eeD se pune prolem relizrii unei legturi ntre funi de reprtii
empiri i e teoreti @teste de onordnAF om disut mi pe lrg este teste de onordn n
seiune UFTF
n

Matlab sunt dej implementte unele funii e testez d dtele sunt norml reprtizteF puni

normplot(X) reprezint gr( dtele din vetorul X versus o reprtiie normlF opul estei funii
este de determin gr( d dtele din oservte sunt norml distriuiteF h este dte sunt seleE
tte dintrEo reprtiie normlD tuni est gr( v ( linirD d nuD tuni v ( un gr( urtF he
exempluD s reprezentem u normplot vetorii X i Y de mi josF qr(ele sunt ele din pigur UFQF
X = normrnd(100,2,200,1);
subplot(1,2,1); normplot(X)
Y = exprnd(5,200,1);
subplot(1,2,2); normplot(Y)

Figura 7.3: Reprezentarea normal a datelor.


yservm primul gr( este prope linirD pe nd l doile nu esteF utem stfel s onluzionm
dtele dte de X sunt norml reprtizte @fpt on(rmt i de modul um leEm genertAD ir dtele din

Y nu sunt norml reprtizteF


puni chi2gof determinD n urm unui test 2 D d dtele oservte sunt norml reprtizteD l un
nivel de semni(ie = 0.05F estfelD omnd

h = chi2gof(x)
ne v furniz rezulttul h = 1D d dtele nu sunt norml reprtizteD su h = 0D d nu putem respinge
ipotez dtele oservte sunt norml distriuiteF eplind testul pentru X i Y de mi susD oinem

h = 0D respetivD h = 1F
he semeneD putem veri( d dtele sttistie r pute proveni i din lte reprtiii det e normlF
he exempluD funi

178

Capitolul 7. Vericarea ipotezelor statistice

probplot(distribution,Y)
rez un gr( e ompr reprtii dtelor din vetorul Y u reprtii dt de distributionF rintre
reprtiiile e pot ( omprte folosind est omnd menionmX 'normal'D 'exponential'D 'weibull'
i 'lognormal'F reuie vut grij vlorile vetorului Y s (e pozitive pentru omprre u orire
dintre ultimele trei reprtiiiF gomnd simpli(t este probplot(Y)D re presupune n mod impliit

distribution = 'normal'F y lt omnd util este


wblplot(Y)
re este ehivlent u omnd probplot(weibull,Y)F
n ontinureD prezentm un exemplu de utilizre estor omenziF pigur UFRD veri(m d (ere
dintre ele dou seleii generteD un exponenil i ellt normlD r pute proveni dintrEo reprtiie
exponenilF

x = exprnd(0.5, 250,1);
% selectie exponentiala
y = normrnd(3, 1, 250,1);
% selectie normala
probplot('exponential',[x y])
legend('Selectie exponentiala','Selectie normala','Location','SE')

Figura 7.4: Reprezentarea exponenial a datelor.


rmtore funie

Matlab ompr un set de dte u o reprtiie preiztF puni

histfit(X, n, 'tip_repartitie')
reprezint dtele din vetorul X printrEo histogrm e re numrul de re egl u nF h opiune

'tip_repartitie' pre @vlil dor pentru lurul u ttistis oolox3AD tuni peste histogrm se

7.5. Teste parametrice

179

v desen densitte de reprtiie reprtiiei preizte @eFgFD exponentialD gammaD lognormal etAF n z
n re opiune nu preD se onsider impliit reprtii u re se ompr dtele este e normlF
ixemplul de mi jos produe gr(ul din pigur UFSF

X = binornd(1e3, 0.1, 1e4, 1); histfit(X, 100)

Figura 7.5: Compararea prin histograme.

7.5 Teste parametrice


presupunem dtele sttistie olette provin dintrEo reprtiie proilisti dtD ns nu unotem
prmetrul su prmetrii estei reprtiiiF he multe oriD vem numite intuiii supr vlorilor prmetrilor
e intr n formul densitii de reprtiieD pe re dorim s le veri(m ntrEun dru rigurosF estfel de
testeD e u l z testre prmetrilor unor reprtiii unosuteD se numes teste parametriceF n onE
tinureD vom prezent ele mi folosite teste prmetrieF nepem prin prezent pii re pr ntrEo
testre prmetriF

7.5.1 Etapele unei testri parametrice


goletm o seleie ntmpltore x1 , x2 , . . . , xn F he multe oriD est seleie provine dintrEo
reprtiie normlF n z ontrrD v treui volumul seleiei s (e mreD de regul n 30F pie

X1 , X2 , . . . , Xn vriile letore de seleieY


elegem o sttisti @riteriuA S(X1 , X2 , . . . , Xn ) reD dup eptre ipotezei (H0 )D est re
o reprtiie unosutD independent de prmetrul testtY

elegem un nivel de semni(ie propit de 0F he regulD = 0.01, 0.02, 0.05F


qsim regiune riti U Y
glulm vlore s0 sttistiii S(X1 , X2 , . . . , Xn ) pentru selei onsidertY

180

Capitolul 7. Vericarea ipotezelor statistice


vum deiziX

 h s0 U D tuni ipotez nulD (H0 )D se respingeY


 h s0 U D tuni ipotez nulD (H0 )D se dmite @mi ine zisD nu vem motive s o respingem
i o dmitem pn l efeture eventul unui test mi puterniAF

Observaia 7.8 y lt modlitte de testre unei ipoteze sttistie prmetrie este prin intermediul
vlorii P @su P vloreAF emintimD P vlore este proilitte de oine un rezultt el puin
l fel de extrem el oservtD presupunnd ipotez nul este devrtF entru testul ilterlD

P vlore se pote lul dup formulX


Pv = P (|S| > |s0 |) = P (S > |s0 |) + P (S < |s0 |),

@UFPA

unde S este sttisti folosit n testre i s0 este vlore estei sttistii pentru selei dt @respetivD
seleiile dteD n zul testrii u dou seleiiAF
entru testul unilterl stngD P vlore se pote lul dup formulX

Pv = P (S < s0 ),

@UFQA

ir pentru testul unilterl dreptD P vlore este dt deX

Pv = P (S > s0 ),

@UFRA

tiliznd P vloreD testre se fe stfelX


spotez nul v ( respins d Pv < i v ( dmis d Pv F edrD u t Pv este mi miD u
tt mi multe dovezi de respingere ipotezei nuleF

7.5.2 Testul Z pentru medie (o selecie)


Testul Z bilateral
estul Z pentru medie se folosete pentru seleii de volum mre @n 30A din orie tip de vriile
letoreD tuni nd dispersi populiei este unosut a prioriF
pie rteristi X e urmez lege norml N (, ) u neunosut i > 0 unosutF resupunem
vem dej ulese dtele de seleie @oserviileA supr lui X X

x1 , x2 , . . . , xn .
horim s veri(m ipotez nul

(H0 ) :

= 0

(H1 ) :

= 0 ,

vsF ipotez lterntiv

181

7.5. Teste parametrice


u proilitte de ris F entru efetu est testD onsiderm sttisti @vezi TFTFIA

Z=

X
.

@UFSA

h ipotez (H0 ) se dmiteD tuni Z N (0, 1), @onform ropoziiei 5.25)F gutm un intervl (z1 , z2 )
stfel nt
@UFTA

P (z1 < Z < z2 ) = 1 .


qsim est intervl este intervlul de nredere oinut n eiune TFTFID diX

z1 ,
2

z1 ,
2

unde z este until de ordin pentru reprtii N (0, 1)F


he(nim regiune rii pentru ipotez nul @reltiv l vlorile sttistiii Z A (ind e regiune re
respinge ipotez (H0 ) d medi prine elui intervlF tim un intervl de nredere pentru v
onine vlore rel 0 u o proilitte destul de mreD 1 F iste de teptt regiune riti s
(e omplementr estui intervlD di

U = z R;

@UFUA

= {z; |z| > z1 }.


2

z z1 , z1
2
2

estfelD U este e regiune n reX

X > 0 + z1
2
n

X < 0 z1 .
2
n

xotm u z0 vlore sttistiii Z pentru oservi onsidertF


heizi (nl se fe stfelX

d z0 z1 ,
2

z1 D @ehivlentD z0 U AD tuni dmitem (H0 ) @pentru nu sunt su(iente


2

dovezi s o respingemAF

d z0 z1 ,
2

z1 D @ehivlentD z0 U AD tuni respingem (H0 ) @exist su(iente dovezi


2

s o respingemAF

Etapele testul Z bilateral


@IA

e duX

{x1 , x2 , . . . , xn } @dte reprtizte normlAD

@PA

heterminm vlore z1 stfel nt


2

0 ,

z1 = z1 .
2
2
@QA

glulez vlore

z0 =
@RA

x 0

hX
@iA

|z0 | < z1 D tuni (H0 ) este dmis @nu pote ( respinsAY


2

182

Capitolul 7. Vericarea ipotezelor statistice


@iiA

|z0 | z1 D tuni (H0 ) este respins @di (H1 ) este dmisAY


2

Testul Z unilateral
n ondiiile din seiune nteriorD dorim s veri(m ipotez nul

(H0 ) :

= 0

vsF ipotez lterntiv

(H1 )s :

< 0 ,

@unilterl stngA

(H1 )d :

> 0 ,

@unilterl dreptA

su ipotez lterntiv

u proilitte de ris F
entru reliz testeleD vem nevoie de de(nire unor regiuni ritie orespunztoreF eeste vor ( hir
intervlele de nredere pentru ondiiile din ipotezele lterntive @oinute n eiune TFTFIAF gu lte
uvinteD o regiune riti pentru ipotez nul @ee e semni( o regiune n reD d ne )mD tuni
respingem ipotez nul l prgul de semni(ie A este o regiune n re relizre ipotezei lterntive
este fvoriztF h ipotez nul este veri(t vsF ipotez lterntiv (H1 )s D tuni regiune riti v (
regiune elor posiile vlori le sttistiii Z pentru re (H1 )s se relizez u proilitte 1 1D
diX

U = (, z1 ).

@UFVA

ntrEdevrD se oserv u uurin X

P (z U) = P ( < Z < z1 ) = (z1 ) = 1 .


n mod similrD d vem ipotez lterntiv (H1 )d D tuni legem regiune ritiX

U = (z1 , +).

@UFWA

v fel mi susD deizi se determin stfel @n mele zuriAX


x 0
U D tuni dmitem (H0 )F
d z0 =

d z0 =

x 0

U D tuni respingem (H0 )F

Observaia 7.9 estul Z @ilterl su unilterlA pote ( plit u sues i pentru populii nonE
normleD d volumul seleiei oservte este n 30F

Exemplu 7.10 gonsiderm dtele din elul IFRD e reprezint un sondj letor printre omerii dintrEo
numit regiune riiF se testeze l nivelul de semni(ie = 0.05 d vrst medie omerilor
din respetiv regiune erett este = 42 su mi mreF resupunem tere medie stndrd este
unosutD = 10F

183

7.5. Teste parametrice


Soluie:

tilizm testul Z ilterl pentru o seleieF eri(m ipotez


versus

(H0 ) = 41

(H1 ) > 41.

histriui empiri de seleie esteX

21.5

30

40

50

60

34

X:

76

124

87

64

entru = 0.05D determinm z1 = 1.6449F lore z0 =

x0

.
= 1.9163D n = 385 i x = 41.9766F

heoree z0 = 1.9163 > 1.6449 = z1 D vlore z0 se ) n regiune riti U = (1.6449, +)D


dr deidem ipotez nul se respinge l est nivel de semni(ieF
utem junge l eei onluzie prin eretre vlorii P F eest este

Pv = P (Z > z0 ) = 1 P (Z z0 ) = 1 (z0 ) = 1 (0.0459) = 0.0277 < 0.05 = .

7.5.3 Testul Z pentru diferena mediilor a dou selecii


estul Z pentru diferen mediilor se folosete pentru seleii independente de volum mre @n 30A din
orie tip de vriile letoreD tuni nd dispersiile populiilor onsiderte sunt unosute a prioriF
pie X1 i X2 rteristiile @independenteA dou populii normleD N (1 , 1 )D respetivD N (2 , 2 )D
pentru re nu se unos mediile teoretieF elegem din prim populie o seleie repett de volum n1 D

x1 = {x1 1 , x1 2 , . . . , x1 n1 }D e urmez reprtii lui X1 D ir din dou populie legem o seleie repett
de volum n2 D x2 = {x2 1 , x2 2 , . . . , x2 n2 }D e urmez reprtii lui X2 F pie (X1i )i=1, n1 i (X2j )j=1, n2
vriilele letore de seleie orespunztore (erei seleiiF pixm prgul de semni(ie F horim
s testm ipotez nul mediile sunt egle

(H0 ) :

1 = 2

(H1 ) :

1 = 2 .

vsF ipotez lterntiv

entru test est ipotezD legem sttisti

Z=

(X1 X2 ) (1 2 )

@UFIHA

2
1
2
+ 2
n1
n2

h (H0 ) este dmis @di dmitem 1 = 2 AD tuni @vezi @TFQSAAX


@onform ropoziiei 5.30).

Z N (0, 1).
pie z0 =

(u1 u2 )
2
1
n1

2
2
n2

@UFIIA

F egiune riti pentru ipotez nulD exprimt n vlori le sttistiii Z esteX

U =

z;

z z1 , z1
2
2

184

Capitolul 7. Vericarea ipotezelor statistice


h vlore sttistiii Z pentru seleiile dte nu se ) n U D tuni dmitem (H0 )F
h vlore sttistiii Z pentru seleiile dte se ) n U D tuni respingem (H0 )F

Etapele testul Z pentru diferena mediilor


@IA

e du dtele normle {x1 1 , x1 2 , . . . , x1 n1 }D

{x2 1 , x2 2 , . . . , x2 n2 } i 0 D

@PA

heterminm vlore z1 stfel ntD funi lui vpleD


2

z1 = z1 .
2
2
@QA

glulez vlore

z0 =
@RA

x1 x2
2
1
n1

2
2
n2

hX
@iA

|z0 | < z1 D tuni 1 = 2 Y


2

@iiA

|z0 | z1 D tuni 1 = 2 F
2

Observaia 7.11 @IA n zul n re 1 , 2 sunt neunosuteD tuni utilizm testul t pentru dou
seleiiD prezentt mi josF
@PA egiunile ritie pentru testele unilterle sunt prezentte n elul UFSF
@QA estul Z pentru dou seleiiD ilterl su unilterlD pote ( plit u sues i pentru populii
nonEnormleD d volumele seleiilor oservte sunt n1 30, n2 30F
@RA entru testul Z D P vlore se pote lul dup urmtorele formuleX

Pv

= P (|Z| > |z0 |) = 1 (|z0 |) + (|z0 |)

Pv

= P (Z < z0 ) = (z0 )

Pv

= P (Z > z0 ) = 1 (z0 )

7.5.4 Testul Z n

@pentru testul Z ilterlA;

@pentru testul Z unilterl stngA;

Matlab

estul Z pentru o seleie pote ( simult n

@pentru testul Z unilterl dreptA.

@UFIPA
@UFIQA
@UFIRA

Matlab utiliznd omnd

[h, p, ci, zval] = ztest(X,m0,sigma,alpha,tail)


undeX

h este rezulttul testuluiF h h = 1D tuni ipotez nul se respingeD d h = 0D tuni ipotez


nul nu pote ( respins pe z oserviilor fute @diD se dmiteD pn l un test mi puterniAY

p este vlore P @P vlueAY


ci este un intervl de nredere pentru D l nivelul de semni(ie Y
zval este vlore sttistiii Z pentru oservi onsidertY
X este un vetor su o mtrieD oninnd oserviile uleseF h X este mtrieD tuni mi multe
teste Z sunt efetuteD deElungul (erei olone lui XY

185

7.5. Teste parametrice


m0 = 0 D vlore testtY
sigma este devii stndrd teoreti lui X D a priori unosutY
alpha este nivelul de semni(ieY
tail pote ( unul dintre urmtorele iruri de rtereX

 'both'D pentru un test ilterl @pote s nu (e spei(tD se sunelege impliitAY


 'left'D pentru un test unilterl stng @ < 0 AY
 'right'D pentru un test unilterl drept @ > 0 AY
Exemplu 7.12 pre exempli(reD s presupunem dtele disrete din elul IFI sunt oinute n
urm unui sondj re ontilizez notele l wtemti oinute de elevii unei numite oliF horim
s testmD l nivelul de semni(ie = 0.05D d medi tuturor notelor l wtemti elevilor olii
este = 6.8 su mi mreF e tie devii stndrd este = 2.5F

Soluie:

edrD vem de testt

(H0 )

= 6.8

vsF

(H1 )

> 6.8.

etorul X de mi jos uprinde tote notele oinute n urm sondjuluiF

X = [2*ones(2,1); 3*ones(4,1); 4*ones(8,1); 5*ones(15,1); 6*ones(18,1); ...


7*ones(17,1); 8*ones(15,1); 9*ones(7,1); 10*ones(4,1)];
[h, p, ci, zval] = ztest(X, 6.8, 2.5, 0.05, 'right')
eest od (ez

h =
0

p =

ci =
0.9500

5.9332
Inf

stats =
-1.6444

eest nsemn fptul ipotez nul este dmis l est nivel de semni(ieF

Observaia 7.13 @IA h ipotez lterntiv este ilterl @(H1 ) : = 6.8AD tuni omnd r (X
[h, p, ci, zval] = ztest(X, 6.8, 2.5)
n est zD gsim ipotez nul este respins @iFeFD rezulttul este h = 1AF
@PA heizi testului pute ( lut i pe z P vloriiF eest esteX

Pv = P (Z > z0 ) = 1 P (Z z0 ) = 1 (z0 ) = 0.95 > 0.05 = .


n

MatlabD est vlore pote ( lult stfelX

186

Capitolul 7. Vericarea ipotezelor statistice


m0 = 6.8; sigma = 2.5; n = 90; z0 = (mean(X) - m0)/(sigma/sqrt(n));
Pv = 1 - normcdf(z0, 0, 1)

@QA entru efeture testuluiD nu este neprt neesr s (m tote ele ptru vriile din memrul
stngF utem (D dup preferinD dor treiD douD su numi o vriilD dr dor n ordine preiztF
he exempluD omnd

h = ztest(X, m0, sigma, alpha, tail)


ne v furniz dor rezulttul testului @h = 0 su h = 1AD fr ( lte vriileF
@RA xu exist o funie n

Matlab re s simuleze testul Z pentru dou seleiiF

7.5.5 Testul t pentru medie (o selecie)


estul t pentru medie se folosete pentru seleii normle de volum miD de regul n < 30D nd dispersi
populiei este neunosut a prioriF
pie rteristi X e urmez lege norml N (, ) u neunosut i > 0 neunosutF gonsiderm
dtele de seleie @oserviileA supr lui X X

x1 , x2 , . . . , xn .
rem s veri(m ipotez nul

(H0 ) :

= 0

(H1 ) :

= 0 ,

vsF ipotez lterntiv

u proilitte de ris F entru efetu est testD onsiderm sttisti @vezi TFTFIA

T =

X
.
d (X)

@UFISA

h ipotez (H0 ) se dmite @di i vlore 0 AD tuni T t(n 1), @onform ropoziiei 5.40)F
gutm un intervl (t1 , t2 ) stfel int

P (t1 < T < t2 ) = 1 .


qsim est intervl este intervlul de nredere oinut n eiune TFTFPD diX

t1 ; n1 , t1 ; n1 ,
2
2
unde t; n reprezint until de ordin pentru reprtii t(n)F
egiune riti este omplementr intervlului de nredereF heizi se i stfelX

d t0 =

x 0
d (X)

t1 ; n1 , t1 ; n1 @ehivlentD t0 U AD tuni dmitem (H0 )F


2
2

@UFITA

187

7.5. Teste parametrice


d t0 =

x 0
d (X)

t1 ; n1 , t1 ; n1 @ehivlentD t0 U AD tuni respingem (H0 )F


2
2

Etapele testul t bilateral


@IA

e duX

{x1 , x2 , . . . , xn } @dte normleAD

@PA

heterminm vlore t1 ; n1 stfel nt funi de reprtiie pentru t(n 1)D


2

0 ,

Fn1 t1 ; n1 = t1 ; n1 .
2
2
@QA

glulez vlore

t0 =
@RA

x 0
d (X)

undeD d (X) =

1
n1

(xi x)2 .
k=1

hX
@iA

|t0 | < t1 ; n1 D tuni (H0 ) este dmis @nu pote ( respinsAY


2

@iiA

|t0 | t1 ; n1 D tuni (H0 ) este respins @di (H1 ) este dmisAY


2

Testul t unilateral
n ondiiile de mi susD dorim s veri(m ipotez nul

(H0 ) :

= 0

vsF ipotez lterntiv

(H1 )s :

< 0 ,

@unilterl stngA

(H1 )d :

> 0 ,

@unilterl dreptA

su ipotez lterntiv

u proilitte de ris F
entru reliz testeleD vem nevoie de regiuni ritie orespunztoreF
egiune riti pentru ipotez nul v treui s (e mulime vlorilor fvorile relizrii ipotezei lterE
ntiveD di este el intervl e onine dor vlori le sttistiii T e vor due l respingere ipotezei
nule i eptre ipotezei lterntiveF edrD d legem ipotez lterntiv (H1 )s D tuni regiune
riti pentru ipotez nul v ( mulime vlorilor fvorile relizrii ipotezei lterntive (H1 )s D di
intervlulX

U = (, t1; n1 ).

@UFIUA

h legem ipotez lterntiv (H1 )d D tuni regiune riti pentru ipotez nul v (X

U = (t; n1 , +).
v fel mi susD testre este @n mele zuriAX

@UFIVA

188

Capitolul 7. Vericarea ipotezelor statistice


d t0 =

x 0

d t0 =

x 0

d (X)

d (X)

U D tuni dmitem (H0 )F


U D tuni respingem (H0 )F

Observaia 7.14 estul t @ilterl su unilterlA pote ( plit u sues i pentru populii nonE
normleD d volumul seleiei oservte este n 30F

(H0 ) :

eli prmetri

(H1 )

= 0

ipul testului

egiune riti

, z1
2

estul Z ilterl

z1 , +
2

= 0

unosut

< 0

(, z1 )

estul Z unilterl stng

> 0

(z1 , +)

estul Z unilterl drept

, t1 ; n1
2

estul t ilterl

= 0

t1 ; n1 , +
2

neunosut

< 0

(, t1; n1 )

estul t unilterl stng

> 0

(t1; n1 , +)

estul t unilterl drept

Tabela 7.4: Teste pentru valoarea medie a unei colectiviti.

7.5.6 Testul t pentru diferena mediilor a dou selecii


estul t pentru diferen mediilor se folosete pentru seleii normle independente de volum mi @n < 30AD
tuni nd dispersiile populiilor onsiderte sunt neunosute a prioriF
pie X1 i X2 rteristiile @independenteA dou populii normleD N (1 , 1 )D respetivD N (2 , 2 )D
pentru re nu se unos mediile teoretieF elegem din prim populie o seleie repett de volum n1 D

x1 = {x1 1 , x1 2 , . . . , x1 n1 }D e urmez reprtii lui X1 D ir din dou populie legem o seleie repett
de volum n2 D x2 = {x2 1 , x2 2 , . . . , x2 n2 }D e urmez reprtii lui X2 F pie (X1i )i=1, n1 i (X2j )j=1, n2
vriilele letore de seleie orespunztore (erei seleiiF pixm prgul de semni(ie F horim
s testm ipotez nul mediile sunt egle

(H0 ) :

1 = 2

(H1 ) :

1 = 2 .

vsF ipotez lterntiv

Cazul I

resupunem 1 = 2 sunt neunosuteF entru test est ipotezD legem sttisti

T =

(X1 X2 ) (1 2 )
d2
d2
1
+ 2
n1
n2

@UFIWA

eiiD d2 i d2 sunt dispersiile de seleie @modi(teAF h (H0 ) este dmis @di dmitem 1 = 2 AD
1
1
tuni @vezi reli @TFQSAAX

T t(N ),

@UFPHA

189

7.5. Teste parametrice

u N n reli @TFQTAF egiune riti este omplementr intervlului de nredere pentru diferen
mediilorD diX

U = R \ t1 ; N , t1 ; N .
2
2

Cazul II

resupunem 1 = 2 i sunt neunosuteF entru test est ipotezD legem sttisti

(X1 X2 ) (1 2 )

T =

(n1 1)d2 + (n2 1)d2


1
2

n1 + n2 2
.
1
1
n1 + n2

@UFPIA

h (H0 ) este dmis @di dmitem 1 = 2 AD tuni @vezi reli @TFQRAAX

T t (n1 + n2 2).

@UFPPA

egiune riti este omplementr intervlului de nredere pentru diferen mediilorD diX

U = R \ t1 ; n1 +n2 2 , t1 ; n1 +n2 2 .
2
2

Etapele testul t pentru diferena mediilor


@IA

e duX

@PA

heterminm vlore t

{x1 1 , x1 2 , . . . , x1 n1 }D
1 ;
2

{x2 1 , x2 2 , . . . , x2 n2 } @dte normleAD

0 D

@unde m = N su m = n1 + n2 2D dup zA stfel nt

funi de reprtiie pentru reprtii tudent t(m)D

Fm t1 ; m = t1 ; m .
2
2
@QA

glulez vlore

t0 =

@RA

x1 x2
d2
1
n1

D d 1 = 2

d2
2
n2

x1 x2
(n1

1)d2
1

+ (n2

1)d2
2

n1 + n2 2
1
1
n1 + n2

D d 1 = 2

hX
@iA

|t0 | < t1 ; m D tuni 1 = 2 Y


2

@iiA

|t0 | t1 ; m D tuni 1 = 2 F
2

Observaia 7.15 @IA n zul n re 1 = 2 i sunt neunosuteD tuni utilizm sttisti dt de


reli @TFQRAD u jutorul rei onstruim regiune riti i poi deidem re ipotez se respingeF
@PA n prtiD nu putem ti a priori d dispersiile teoretie elor dou populii e urmez (
testte sunt egle su nuF he eeD pentru ti e test s folosimD v treui s testm mi nti ipotez
ele dou dispersii sunt egleD vsF ipotez ele diferF entru estD v treui s utilizm un test
pentru rportul dispersiilor @vezi eiune UFSFIHAF hup e est prim test fost reliztD putem deide
d n testre eglitii mediilor folosim sttisti @UFIWA su sttisti @UFPIAF
@QA n zul n re dispersiile sunt unosuteD tuni se utilizez testul Z pentru diferen mediilorD re
urmez pii testului t pentru diferen mediilorD u diferen sttisti e se onsider este dt de

190

Capitolul 7. Vericarea ipotezelor statistice

reli @TFQQA reD dup eptre ipotezei nuleD urmez reprtii N (, )F


@RA estul t pentru dou seleiiD ilterl su unilterlD pote ( plit u sues i pentru populii
nonEnormleD d volumele seleiilor oservte sunt n1 30, n2 30F
@SA entru testul Z D P vlore se pote lul dup urmtorele formuleX

Pv
Pv

= P (T < t0 ) = Fm (t0 )

Pv

= P (T > t0 ) = 1 Fm (t0 )

@pentru testul T ilterlA;

= P (|T | > |t0 |) = 1 Fm (|t0 |) + Fm (|t0 |)

@pentru testul T unilterl stngA;


@pentru testul T unilterl dreptA.

@UFPQA
@UFPRA
@UFPSA

unde m = N su m = n1 + n2 2D dup zF

eli prmetri

(H0 ) :

1 = 2

ipul testului

egiune riti

(H1 )

1 , 2

1 = 2

unosute

1 < 2

X1 X2 < z1

1 > 2

2
2
2
1
n1 + n2
2
2
1
2
n1 + n2
2
2
1
2
n1 + n2

|X1 X2 | > z1
2
X1 X2 > z1

1 = 2

1 = 2

|X1 X2 | > t1 ; N
2

neunosute

1 < 2

X1 X2 < t1; N

1 > 2

X1 X2 > t1; N

d2 (X1 )

estul Z ilterl
estul Z unilterl stng
estul Z unilterl drept

d2 (X2 )

+ n2
n1
d2 (X1 )
d2 (X )

+ n2 2
n1
d2 (X )
d2 (X1 )

+ n2 2
n1

estul t ilterl
estul t unilterl stng
estul t unilterl drept

Tabela 7.5: Teste pentru egalitatea a dou medii.

7.5.7 Testul t n

Matlab

Testul t pentru o selecie


estul t pote ( simult n

Matlab utiliznd omnd generl

[h, p, ci, stats] = ttest(X,m0,alpha,tail)


undeX

hD pD ciD m0D alphaD tail sunt l fel n funi ztest @eiune UFSFRAY
vriil stats nmgzinez urmtorele dteX

 tstat E este vlore sttistiii T pentru oservi onsidertY


 df E numrul grdelor de liertte le testuluiY
 sd E devii stndrd de seleieY
Exemplu 7.16 horim s testm d o numit moned este oretD di nsele (erei fee de
pre l orie runre sunt 50% 50%F erunm moned n z de 100 de ori i oinem f u stem

7.5. Teste parametrice

191

de ext 59 de oriF e z estei experieneD utm s testm ipotez nul

(H0 ) :

zrul este oret

vsF ipotez lterntiv

(H1 ) :

zrul este msluit,

l un prg de semni(ie = 0.05F

Soluie:

pie X vriil letore e reprezint f e pre l o singur runre monedeiF spunem

X = 1D d pre f u stem i X = 0D d pre f u nulF eoretiD X B(1, 0.5)D de unde

E(X) = D2 (X) = 0.5F


rin ipotezD ni se d o seleie de volum n = 100 i sriem oserviile fute ntrEun vetor x e onine

59 de vlori 1 i 41 de vlori 0F heoree n = 100 > 30D putem utiliz testul t pentru o seleieF esriem
ipotezele (H0 ) i (H1 ) stfelX

(H0 ) :

= 0.5

(H1 ) :

= 0.5.

h {X1 , X2 , . . . , Xn } sunt vriilele letore de seleieD tuni legem sttisti

T =

X
d (X)

h ipotez (H0 ) se dmiteD tuni este (xtD = 0.5 i sttisti T t(n 1)F lore estei
sttistii pentru selei dt esteX

t0 =

x
d (X)

= 1.8207.

hin t1 ; n1 = t0.975; 99 = 1.9842D rezult |t0 | < t1 ; n1 D i deidem ipotez (H0 ) este dmis @nu
2
2
pote ( respins l nivelul de semni(ie AF

P vlore este
Pv = 1 Fn1 (t0 ) + Fn1 (t0 ) = 1 F99 (1.8207) + F99 (1.8207) = 0.0717.
godul

Matlab pentru lulul nliti de mi sus este urmtorulX


n=100; mu = 0.5; alpha = 0.05; x = [ones(59,1); zeros(41,1)];
t0 = (mean(x) - mu)/(std(x)/sqrt(n));
tc = tinv(1-alpha/2, n-1);
% cuantila
if (abs(t0) < tc)
disp('moneda este corecta')
else disp('moneda este masluita')
end
Pv= 1 - tcdf(t0,n-1) + tcdf(-t0,n-1)
% P-valoarea

ulnd odulD oinem rezulttulX

192

Capitolul 7. Vericarea ipotezelor statistice

moneda este corecta


n lo s folosim odul de mi susD m pute folosi funi ttest din

MatlabD dup um urmezX

[h, p, ci, stats] = ttest(X,0.5,0.05,'both')


i oinem

h =

p =
0.0717

ci =
0.4919
0.6881

stats =
tstat: 1.8207
df: 99
sd: 0.4943

Observaia 7.17 @IA heoree P vlore este p = 0.0717D deduem l un prg de semni(ie
0.08D ipotez nul r ( fost respinsF
@PA h dintre ele 100 de oservri vem o priie n plus stemeiD tuni ipotez nul r ( respinsD
di moned r ( tlogt ( msluitF

Testul t pentru dou selecii


estul t pentru eglitte dou medii pote ( simult n

Matlab utiliznd omnd

[h, p, ci, stats] = ttest2(X, Y, alpha, tail, vartype)


undeX

hD pD ciD alphaD stats i tail sunt l fel n eiune UFSFUY


X i Y sunt vetori su o mtrieD oninnd oserviile uleseF h ele sunt mtrieD tuni mi
multe teste Z sunt efetuteD deElungul (erei oloneY

vartype i vlore equal d dispersiile teoretie sunt egle su unequal pentru dispersii inegleF

Exemplu 7.18 grteristiile X1 i X2 reprezint notele oinute de studenii de l wster M F 08D


respetivD M F 09 l exmenul de ttisti eplitF gonduere universitii reomnd este note s
urmeze reprtii norml i exmintorul se onformez dorinei de susF resupunem X1 N (1 , 1 )
i X2 N (2 , 2 )D u 1 = 2 D neunosute a prioriF entru veri( modul um sEu prezentt studenii
l est exmen n doi ni onseutiviD seletm letor notele 25 de studeni din prim grup i 30 de
note din dou grupF distriutii de frevene le notelor sunt ele din elul UFTF

(i) eri(i d mele seturi de dte provin dintrEo reprtiie normlY


(ii) qsii un intervl de nredere pentru diferen mediilorD l nivelul de semni(ie = 0.05Y
(ii) se testeze @u = 0.01A ipotez nul
(H0 ) :

1 = 2 ,

(n medie, studenii sunt la fel de buni)

193

7.5. Teste parametrice


versus ipotez lterntiv

(H1 ) :

Soluie:

@iiA

(n medie, studenii au note din ce n ce mai mari)

1 < 2 ,

h = chi2gof(u)
k = chi2gof(v)

@iA

%
%

h = 0D dei u N
k = 0D dei v N

n intervl de nredere l est nivel de semni(ie se oine pelnd funi

Matlab

[h, p, ci, stats] = ttest2(u, v, 0.05, 'both', 'unequal')


eest esteX

(-0.7294,

0.6760)

xot oinut

preven solut
qrup M F 08

qrup M F 09

10

Tabela 7.6: Tabel cu note.


eltfelD se lulez intervlul de nredere @vezi elul TFPA

x1 x2 t1 ; N
2
godul

d2
d2
1
+ 2 ,
n1
n2

x1 x2 + t1 ; N
2

d2
d2
1
+ 2
n1
n2

MatlabX

n1=25; n2=30; alpha = 0.05;


u = [5*ones(3,1);6*ones(4,1);7*ones(9,1);8*ones(7,1);9*ones(2,1)];
v = [5*ones(5,1);6*ones(6,1);7*ones(8,1);8*ones(6,1);9*ones(3,1);10*ones(2,1)];
d1 = var(u); d2 = var(v); N = (d1/n1+d2/n2)^2/((d1/n1)^2/(n1-1)+(d2/n2)^2/(n2-1))-2;
t = tinv(1-alpha/2,N);
m1 = mean(u)-mean(v)-t*sqrt(d1/n1+d2/n2); m2 = mean(u)-mean(v)+t*sqrt(d1/n1+d2/n2);
fprintf('(m1,m2)=(%6.3f,%6.3f)\n',m1,m2);
@iiiA

gomnd

Matlab esteX

[h,p,ci,stats] = ttest2(u, v, 0.01, 'left', 'unequal')

194

Capitolul 7. Vericarea ipotezelor statistice

n urm rulrii omenziiD oinemX

h =
0

p =

ci =
-Inf
0.8137

0.4698

stats =
tstat: -0.0761
df: 52.7774
sd: 2x1 double

Observaia 7.19 lore P pote ( lult i u formulX


Pv = P (T < t0 ) = FN 1 (t0 ) = 0.4698.
n

MatlabD
t0 = (mean(u)-mean(v))/sqrt(d1/n1+d2/n2);

Pv = tcdf(t0, N-1)

7.5.8 Testul 2 pentru dispersie


pie rteristi X e urmez lege norml N (, ) u i > 0 neunosuteF gonsiderm dtele de
seleie @oserviileA supr lui X D x1 , x2 , . . . , xn F
rem s veri(m

(H0 ) :

2
2 = 0

vsF ipotez lterntiv

(H1 ) :

2
2 = 0 ,

u proilitte de ris F entru efetu est testD onsiderm sttisti @vezi eiune TFTFRA

2 =

n1 2
d (X),
2

@UFPTA

2
reD dup eptre ipotezei (H0 ) @di 2 i vlore 0 AD tuni 2 2 (n 1)D @onform ropoziiei

@SFQUAF sntervlului de nredere pentru 2 @oinut n eiune TFTFRA este

2 ; n1 , 2 ; n1 ,
1 2
2

unde 2 n1 este until de ordin pentru reprtii 2 (n)F


;
egiune riti U v ( omplementr estui intervlul de nredereF
n1 2
2
notm prin 2 =
0
2 d (x)D vlore sttistiii pentru selei dtF etuniD regul de deizie este
0
urmtoreX
2

d 2 2 ; n1 , 2 ; n1 D tuni dmitem (H0 ) @iFeFD 2 = 0 AY


0
1 2
2
2

d 2 2 ; n1 , 2 ; n1 D tuni respingem (H0 ) @iFeFD 2 = 0 AF


0
1 2
2

Observaia 7.20 e pot onsiderD dup zD i ipotezele lterntive unilterle


(H1 )s :

2
2 < 0

(H1 )d :

2
2 > 0 .

egiunile ritie @pe z ror se pot fe deiziiA pentru este se gses n elul UFUF

195

7.5. Teste parametrice


2
2 = 0

(H0 ) :

ipul testului

egiune riti

(H1 )

, 2 ; n1

estul 2 ilterl

2 ; n1 , +
1

2
2 = 0

neunosut

2
2 < 0

, 2
1; n1

estul 2 unilterl stng

2
2 > 0

2 n1 , +
;

estul 2 unilterl drept

Tabela 7.7: Teste pentru dispersie.


Exemplu 7.21 e eretez rteristi D e reprezint dimetrul pieselor @n mmA produse de un
strungF tim X urmez lege norml N (, )F elegem o seleie de volum n = 11 i oinem
distriui empiriX
IHFSH

IHFSS

IHFTH

IHFTS

se testeze @u = 0.1A ipotez nul

(H0 ) :

2 = 0.003,

(H1 ) :

2 = 0.003.

versus ipotez lterntiv

Soluie:

sntervlul de nredere pentru este (3.9403, 18.3070) ir vlore riti este 2 = 7.2727F
0

heoree est prine intervlului de nredereD onluzionm ipotez nul nu pote ( respins l
est nivel de semni(ieF
eeei onluzie pote ( lut n urm inspeiei vlorii P D re este mi mre det nivelul F evemX

Pv = P (|2 | > |2 |) = P (2 > 2 ) = 1 Fn1 (7.2727) = 0.6995.


0
0

7.5.9 Testul 2 pentru dispersie n


estul 2 pote ( simult n

Matlab

Matlab utiliznd omnd

[h, p, ci, stats] = vartest(X,var,alpha,tail)


undeX

hD pD ciD m0D alphaD statsD tail sunt l fel n funi ttest @eiune UFSFUAY
var este vlore testt dispersieiY
pre exempli(reD odul

Matlab pentru exeriiul nterior esteX

X = [10.50*ones(2,1); 10.55*ones(3,1); 10.60*ones(5,1); 10.65];


[h, p, ci, stats] = vartest(X,0.003,0.1,'both')
ulre estui ne dX

196

Capitolul 7. Vericarea ipotezelor statistice


h =
0

p =

ci =
0.6011

stats =
chisqstat: 7.2727
df: 10

0.0012
0.0055

di ipotez nul este eptt l est nivel de semni(ieF


polosind

MatlabD putem lul P vlore stfelX


c0 = (n-1)/0.003*var(X);

Pv = 1 - chi2cdf(c0,10)

7.5.10 Testul F pentru raportului dispersiilor


pie X1 i X2 rteristiile @independenteA dou populii normleD N (1 , 1 )D respetivD N (2 , 2 )D
pentru re nu se unos mediile teoretieF elegem din prim populie o seleie repett de volum n1 D

x1 = {x1 1 , x1 2 , . . . , x1 n1 }D e urmez reprtii lui X1 D ir din dou populie legem o seleie repett
de volum n2 D x2 = {x2 1 , x2 2 , . . . , x2 n2 }D e urmez reprtii lui X2 F pie (X1i )i=1, n1 i (X2j )j=1, n2
vriilele letore de seleie orespunztore (erei seleiiF pixm prgul de semni(ie F horim
s testm ipotez nul dispersiile sunt egle

(H0 ) :

2
2
1 = 2

(H1 ) :

2
2
1 = 2 .

vsF ipotez lterntiv

entru test est ipotezD legem sttisti

F =

2
2 d2 (X1 )

2 d2 (X ) .
1 2

@UFPUA

2
2
h (H0 ) este dmis @di 1 = 2 AD tuniX

(reprtii pisher).

F F(n1 1, n2 1)

@UFPVA

sntervlul de nredere pentru rportul dispersiilor este

f ; n1 1, n2 1 ,
2

f1 ; n1 1, n2 1
2

i se determin stfel nt

P f ; n1 1, n2 1 F f1 ; n1 1, n2 1 = 1 .
2
2
ixtremitile intervlului se determin din reliile

Fn1 1; n2 1 f ; n1 1, n2 1 =
2

Fn1 1; n2 1 f1 ; n1 1, n2 1 = 1
2

.
2

@f; n1 1, n2 1 este until de ordin pentru reprtii pisher F(n1 1, n2 1)AF


egiune riti U este omplementr intervlului de nredere pentru rportul dispersiilorF

197

7.5. Teste parametrice


xotm prin f0 vlore lui F pentru oserviile dteD x1 i x2 F evemX

f0 =

d2 (x1 )

.
d2 (x2 )

egul de deizie esteX

d f0 f ; n1 1, n2 1 , f1 ; n1 1, n2 1 D tuni dmitem (H0 ) @iFeFD 1 = 2 AY


2
2
d f0 f ; n1 1, n2 1 , f1 ; n1 1, n2 1 D tuni respingem (H0 ) @iFeFD 1 = 2 AF
2
2

Observaia 7.22 e pot onsiderD dup zD i ipotezele lterntive unilterle


(H1 )s :

2
2
1 < 2 ,

2
2
1 > 2 .

(H1 )d :

egiunile ritie @pe z ror se pot fe deiziiA pentru este se gses n elul UFVF

(H0 ) :
2
2
1 = 2

neunosute

2
1
2
1

<
>

ipul testului

egiune riti

(H1 )
1 , 2

2
2
1 = 2

, f ; n1 1, n2 1
2

estul F ilterl

f1 ; n1 1, n2 1 , +
2

(, f1; n1 1, n2 1 )

estul F unilterl stng

(f1; n1 1, n2 1 , +)

2
2
2
2

estul F unilterl drept

Tabela 7.8: Teste pentru raportul dispersiilor.

7.5.11 Testul F n

Matlab

estul rportului dispersiilor pote ( simult n

Matlab utiliznd omnd

[h, p, ci, stats] = vartest2(X, Y, alpha, tail)


unde vriilele sunt l fel n funi ttest2 @eiune UFSFUAF

Exemplu 7.23 evenim l ixeriiul UFIV i veri(m d ele dou seleii de note @elul UFTA provin
din populii u dispersii egleF edrD vem de testt @l nivelul de semni(ie = 0.01A

(H0 )

Soluie:

2
2
1 = 2

vsF

tiliznd notiile din ixeriiul UFIVD omnd

(H1 )

2
2
1 = 2 .

Matlab re rezolv est test esteX

[h, p, CI, stats] = vartest2(u, v , 0.01 , 'both')


@pentru teste unilterleD folosim 'left' su 'right' n loul lui 'both'FA
ezulttul omenzii nteriore esteX

198

Capitolul 7. Vericarea ipotezelor statistice


h =
0

p =

CI =
0.2191
1.7426

0.2119

stats =
fstat: 0.6047
df1: 24
df2: 29

heoree h = 0D deidem dispersiile teoretie le elor dou populii pot ( onsiderte ( egle l
nivelul de semni(ie = 0.01F

Observaia 7.24 heizi testului pote ( lut i pe z inspeiei vlorii P D oservnd est este
mi mre det F eest esteX

Pv = 1 Fn1 1, n2 1 (|f0 |) + Fn1 1, n2 1 (|f0 |) = 1 Fn1 1, n2 1 (|f0 |).


n

MatlabD lulm stfelX


f0 = var(u)/var(v); Pv = 1 - fcdf(abs(f0),n1-1,n2-1)

n elul UFWD sumrizm tipurile de teste prmetrie prezentte pn umF


xume test
testul Z
@o seleieA
testul Z
@2 seleiiA

ttisti

Z=

testul t

+
X

@o seleieA

2
2
n2

d (X)

testul t
@2 seleiiA
testul 2
@o seleieA
testul F
@2 seleiiA

N (0, 1)

(X1 X2 ) (1 2 )
2
1
n1

hesriere

N (0, 1)

t(n 1)

(X1 X2 ) (1 2 )
d2 (X1 )

n1

d2 (X2 )

n2

t(N )

n1 2
d (X) 2 (n 1)
2
2
2 d2
1
Fn1 1, n2 1
2
1 d2
2

est pentru D nd unosut

X N (, )D su X orere @n 30A
est pt 1 2 D nd 1 , 2 unosute

X1 , X2 N (, )D independente
est pentru D nd neunosut

X N (, )D su X orere @n 30A
est pt 1 2 Y 1 = 2 neunosute

X1 , X2 N (, )D independente
est pentru 2 D nd neunosut

X N (, )D su X orere @n 30A
est pt 1 /2 D 1 , 2 neunosute

X1 , X2 N (, )D independente

Tabela 7.9: Tabel cu teste parametrice.

puni

Matlab
ztest

ttest
ttest2
vartest
vartest2

7.5. Teste parametrice

199

7.5.12 Teste pentru proporii ntr-o populaie binomial


O singur populaie
pie X o rteristi inomil unei oletivitiD u proilitte de sues pF e z unor seleii
le populieiD dorim s test urmtore ipotez supr lui pX
vsF

(H0 ) : p = p0

(H1 ) : p = p0 .

he semeneD putem onsider i ipoteze lterntive unilterleX

(H1 )s : p < p0

su

(H1 )d : p > p0 .

entru pute test est ipotezD ne vom folosi de rezulttele din eiune TFTFUF presupunem
volumul populiei @N A este mult mi mre posiil in(nitA det volumul n l seleiilor onsiderteF
pixm un nivel de semni(ie F om onstrui testul pentru propori populiei pe z intervlului de
nredere @TFQWAF

Etapele testului suntX


e z seleieiD lulm propori de seleie pD re este o estimre proporiei populieiD pY
glulm vlore

p p0

P0 =

p0 (1 p0 )
n

glulm until z1 Y
2
h
P0 z1 , z1 ,
2
2
tuni dmitem ipotez nul l est nivel de semni(ieF eltfelD o respingemF egiune riti
este omplementr intervlului de nredereF

Observaia 7.25 entru testul unilterl stngD regiune riti pentru P0 este (, z1 ]D ir rentru
testul unilterl dreptD este [z1 , )F

Exemplu 7.26 ntrEun sondj nionl de opinieD 5000 de persone u fost rugte s rspund l o ntreE
re legt de prtenen religiosF v ntrere 4untei retinic4D n 4893 dintre zuri rspunsul
fost (rmtivF ezulttul estui sondj este utilizt n estimre proentului de retini din rF
notm u p est proentF v nivelul de semni(ie = 0.05D testi d p este de 95% su mi mreF

Soluie:

evem de testt ipotez

(H0 ) : p = 0.95

vsF

(H1 ) : p > 0.95.

200

Capitolul 7. Vericarea ipotezelor statistice

roentul de seleie este p =

4893
5000

P0 =

= 0.9786D until este z1 = 1.6449 i vlore sttistiii este


0.9786 0.95

= 9.2791 [1.6449, ),

0.95 (1 0.95)
5000

dr ipotez nul este respins l est nivel de semni(ieF edmitem p > 0.95F
eeei onluzie pote ( dedus i prin inspei P vloriiF eest este

Pv = P (Z > P0 ) = 1 P (Z P0 ) = 1 (9.2791) 0 < = 0.05.


edrD ipotez nul v ( respins l tote nivele de semni(ie prtieF

Testul proporiilor pentru dou populaii


pie X1 i X2 dou rteristii inomile independente le unei populiiD u volumele i proilitile
de sues n1 , p1 iD respetivD n2 , p2 F e z unor seleiiD dorim s testm ipotezeleX

(H0 ) : p1 = p2

vsF

(H1 ) : p1 = p2 .

he semeneD putem onsider i ipoteze lterntive unilterleX

(H1 )s : p1 < p2

su

(H1 )d : p1 > p2 .

entru pute test est ipotezD ne vom folosi de rezulttele din eiune TFTFUF presupunem
volumul populiei @N A este mult mi mre @posiil in(nitA det volumele seleiilor onsiderteF pixm
un nivel de semni(ie F h ipotez nul este dmisD tuni p1 = p2 = pF n estimtor pentru p este
freven reltiv numrului de suese umulte n ele dou seleiiD iFeFD

p =

n1 p 1 + n2 p 2
.
n1 + n2

Etapele testului suntX


glulm proporiile de seleie p1 i p2 D re sunt estimri pentru p1 D respetivD p2 Y
glulm vlore

p1 p2

P0 =

p (1 p )

1
n1

;
+

1
n2

glulm until z1 Y
2
h
P0 z1 , z1 ,
2
2
tuni dmitem ipotez nul l est nivel de semni(ieF eltfelD o respingemF egiune riti
este omplementr intervlului de nredereF

Exemplu 7.27 evenim l ixemplul TFQWF se testezeD l nivelul de semni(ie = 0.02 d exist

201

7.5. Teste parametrice

diferene semni(tive ntre proporiile de iei i fete din respetiv ol ror le ple wtemtiF

Soluie:

evemX p1 =

23
45 D

37
65 D

P0 =

p =

23+37
45+65

23
45

p2 =

37
65

p (1 p )

i z0.99 2.33F lore sttistiii esteX

6
11

= 0.6019 [2.3263, 2.3263],

1
n1

2
n2

dei ipotez nul nu pote ( respins l est nivel de semni(ieF


eeei onluzie o putem lu d veri(m P vloreF eest esteX

Pv = P (|Z| > |P0 |) = 1 P (Z < |P0 |) + P (Z < |P0 |) = 0.5472 > 0.02 = .

7.5.13 Testul raportului verosimilitilor


estul rportului verosimilitilor @en., likelihoodErtio testA este un test sttisti e v deide ntre dou
ipotezeD znduEse pe rportul verosimilitilorF
presupunem X este rteristi unei oletiviti sttistie e urmez o lege de proilitte

f (x; )D u prmetru neunosut i (e A0 A mulimi msurileF horim s testm ipotez nul


(H0 ) : A0 ,
vsF ipotez lterntiv

(H1 ) : A \ A0 ,
l un nivel de semni(ie F he nott distriui f (x, ) este omplet spei(t n mele ipotezeF
gonsiderm o seleie repett de volum n supr rteristiii X i (e X1 , X2 , . . . , Xn vFF de seleieF
gonstruim sttistiX

sup L(X1 , X2 , . . . , Xn ; )
= (X1 , X2 , . . . , Xn ; ) =

A0

sup L(X1 , X2 , . . . , Xn ; )

ividentD (0, 1)F he nott testul pote ( efetut i d este de(nit prin fri nterior
inverstF u form de iiD rportul verosimilitilor este mre d ipotez nul este mi un det
ipotez lterntiv ir testul rportului verosimilitilor respinge ipotez nul d depete o numit
vloreF he(nim regiune riti U stfel nt

P ( ; H0 dmis) = .
@lore reprezint until de ordin pentru sttisti FA
egul de deizie este urmtoreX

h < D tuni ipotez (H0 ) se respingeY


h > D tuni ipotez (H0 ) se dmite @suD nu pote ( respins l est nuvel de semni(ieAY

202

Capitolul 7. Vericarea ipotezelor statistice

7.6 Teste de concordan


Testele de concordan @en.D goodnessEofE(t testsA relizez onordn ntre reprtii empiri @reprE
tii dtelor oservteA i reprtii teoretiF rezentm mi jos dou teste de onordn des ntlnite
n pliiiD i numeD testul 2 de onordn i testul uolmogorovEmirnovF

7.6.1 Testul 2 de concordan


eest test de onordn pote ( utilizt un riteriu de veri(re ipotezei potrivit rei un nsmlu
de oservii urmez o reprtiie dtF e pli l veri(re normlitiiD exponenilitiiD rE
terului oissonD rterului eiull etF estul mi este numit i testul 2 al lui Pearson su testul 2

al celei mai bune potriviri @en., goodness of (t testAF eest test pote ( plit pentru orie tip de dte
pentru re funi de reprtiie empiri pote ( lultF

Cazul neparametric
onsiderm o rteristi X unei populii sttistie F eprtii vriilei letore X este neE
unosut a prioriD ns intuim @su vem numite informiiA um est r ( dt de lege de proilE
itte omplet spei(t f (x, ) @eFgFD f (x) =

e2 2x
x! ,

x N ( X P(2) ) su f (x) =

3 2

(x5)2
18

(X

N (5, 3) AAF
heoree lege de proilitte ipoteti este omplet spei(tD este unosut i vom omite s mi
punem n eviden dependen lui f de est n deursul este seiuniF
entru veri( ipotez fut supr reprtiiei lui X D onsiderm un set de oservii supr lui X
i testm onordn dintre reprtii empiri dtelor oservte u lege teoreti dt de f (x)F pie

x1 , x2 , . . . , xn setul de dte oservteF notm u F (x) funi de reprtiie teoretiD iFeFD F = f F n


ele e urmezD urmrim s plim testul 2 de onordnD le rui etpe suntX

hesompunem n lse mulime oserviilor fute supr lui X D stfel nt (ere element l
mulimii prine unei singure lseF riem drD
k

{x1 , x2 , . . . , xn } =

Oi ,

Oi

Oj = , i = j.

i=1

heterminm frevenele empirie soluteD iFeFD numerele ni de oservii e prin (erei lse
k

Oi F n mod evidentD v treui s vem

ni = nF
i=1

n generlD se dorete n 30 i ni 5D pentru testul s (e onludentF n zul n re numrul


de priii ntrEo numit ls nu depete vlore 5D tuni se vor umul dou su mi multe
lseD stfel nt n nou ls s (e respett ondiiF heiD d vem el puin 5 lseD tuni
sunt su(iente el puin 3 vlori n (ere lsF n mele zuriD treuie inut ont de modi(re
numrului de lseD ir numrul k treuie modi(t orespunztor @l nlouim u noul numrD nott
ii tot u k AF

entru (ere i {1, 2, . . . , n}D determinm proilitte teoreti pi un element l populiei


s se )e n ls Oi F eest proilitte este oinut u jutorul funiei f (x)F estfelD frevenele
teoretie solute sunt n pi D i {1, 2, . . . , n}F eltfel spusD n pi este numrul estimt de vlori le

203

7.6. Teste de concordan


reprtiiei erette e r de n ls Oi F

pormulm ipotez nulD


puni de reprtiie lui X este F (x).

(H0 ) :
eest este ehivlent u

(H0 ) :

proilitte unei oservii de prine lsei Oi este pi .

(i = 1, 2, . . . , k).

spotez lterntiv este negi ipotezei nuleF


hevii ntre ele dou situii @empiri i teoretiA este msurt de sttisti
k

2 =
i=1

@piere dintre termenii

(ni npi )2
npi

(ni n pi )2
.
n pi

@UFPWA

pote ( privit (ind o erore reltiv de proximre vlorilor

teptte le reprtiiei u vlorile oservteFA


ttisti 2 urmez reprtii 2 (k 1)F neoriD sttisti =

2 se numete discrepanF

elegem nivelul de semni(ie D de regulD forte propit de zeroF


elegem regiune ritiD (ind regiune pentru re vlore 2 estei sttistii pentru oserE
0
viile dte stisfe

2 > 2
0
1; k1 ,
2
unde 2
1; k1 este until de ordin 1 pentru reprtii (k 1)F

h ne )m n regiune ritiD tuni ipotez nul (H0 ) se respinge l nivelul de semni(ie F


eltfelD nu sunt dovezi sttistie su(iente s se respingF

Exemplu 7.28 e run un zr de 60 de ori i se oin rezulttele din elul UFIHF se deidD l
nivelul de semni(ie = 0.02D d zrul este oret su flsF
p @ls Oi A
1
2
3
4
5
6

preven solut @ni A


15
7
4
11
6
17

Tabela 7.10: Tabel cu numrul de puncte obinute la aruncarea zarului.

Soluie:

@plim testul 2 de onordnD zul neprmetriA

rul este oret dor d (ere f s re eei ns de preD di proilitile (ere


f n prte s pr suntX

(H0 ) :

pi =

1
,
6

(i = 1, 2, . . . , 6).

204

Capitolul 7. Vericarea ipotezelor statistice

eltfelD notm u X vriil letore e re vlori numrul puntelor e pr l runre zruluiF n


zr oret r nsemn X urmez reprtii uniform disret U(6)F
ote ele 60 de rezultte oinute n urm runrii zrului pot ( mprite n se lseF eeste lse
suntX Oi = {i},

i {1, 2, . . . , 6}F spotez nul este (H0 ) suD ehivlentD


(H0 ) :

puni de reprtiie lui X este U(6).

spotez lterntiv este 4(H0 ) nu re lo4D diX

(H1 ) : ixist un j, u pj =

1
,
6

(j {1, 2, . . . , 6}).

glulez vlore sttistiii 2 dt de @UFPWA pentru oserviile dteX

2
0

=
=

(7 10)2
(4 10)2
(11 10)2
(6 10)2
(17 10)2
(15 10)2
+
+
+
+
+
10
10
10
10
10
10
13.6.

eprtii sttistiii 2 dt de @UFPWA este 2 u k 1 = 5 grde de liertteF egiune riti esteX

U = (2 5 ; +) = (13.3882, +).
0.98;
heoree 2 se ) n regiune ritiD ipotez nul se respinge l nivelul = 0.02D dr zrul este flsF
0
godul

MatlabX

n = 60; k=6; alpha = 0.02; x = 1:6;


chi2 = sum((f-n*p).^2)./(n*p));
val = chi2inv(1-alpha,k-1);
H = (chi2 > val)

f
%
%
%

= [15,7,4,11,6,17]; p = 1/6*ones(1,6);
valoarea 2
0
cuantila 2 5
0.99;
afiseaza 1 daca zarul e corect si 0 daca nu

Observaia 7.29 h nivelul de semni(ie este les = 0.01D tuni 2 5 = 15.0863D ee e deterE
0.99;
min eptre ipotezei nule @di zrul este oretA l est nivelF

Cazul parametric
gnd proilitile teoretie pi nu sunt a priori unosuteD tuni ele vor treui estimteF eest z pre
tuni nd lege de proilitte f (x, ) nu este omplet spei(tD i dor spei(t @tim form lui

f D dr nu tim unul suD eventulD mi muli prmetri i siAF polosind dtele oservteD v treui s
estimm prmetrii neunosui i reprtiiei ipotetieF piere estimre ne v ost un grd de liertteF
gu lte uvinteD d vem de estimt un singur prmetruD tuni pierdem un grd de liertteD pentru
doi prmetriD pierdem dou grde etF
presupunem lege de proilitte lui X de mi sus este f (x, ), unde = (1 D 2 D . . . D p ) Rp
sunt prmetri neunosuiF entru proxim eti prmetriD folosim oserviile ulese supr lui X F
y metod l ndemn pentru estimri prmetrie este metod verosimilitii mximeF
hup e m estimt prmetrii reprtiiei teoretie ipotetieD determinm proilitile estimteF tE

205

7.6. Teste de concordan


ilim poi ipotez nulX

(H0 ) :

pi = pi ,

(i = 1, 2, . . . , k),

unde pi este proilitte unei oservii de prine lsei i i pi sunt vlorile estimteF

hin est momentD etpele testului 2 cazul parametric sunt semntore u ele din zul neprmetE
riD u deoseire sttisti 2 dt prin @UFPWA urmez reprtii 2 u (k p 1) grde de liertteF
eest este urmre fptului se pierd p grde de liertte din uz folosirii oserviilor dte pentru
estimre elor p prmetri neunosuiF

Etapele aplicrii testului 2 de concordan (neparametric sau parametric)


e duX ,

x1 , x2 , . . . , xn .

sntuim F (x; 1 , 2 , . . . , p )Y

pormulm ipotezele sttistieX


(H0 )

funi de reprtiie teoreti vriilei letore X este F (x)

(H1 )

ipotez nul nu este devrtF

h 1 , 2 , . . . , k @k pA nu sunt prmetri unosuiD tuni determinm estimrile de verosimilE


itte mxim 1 , 2 , . . . , k pentru eti @dor n cazul parametricY ltfel srim peste est psAY
riem distriui empiri de seleie @tloul de freveneAD

ls Oi

ni

ni = n, ni

,
i=1, n

i=1

5;
e lulez proilitte pi D un element lut l ntmplre s se )e n ls Oi F h Oi =

[ai1 , ai )D tuni pi = F (ai ; ) F (ai1 ; )D n zul prmetri i pi = F (ai ; ) F (ai1 ; )D


n zul neprmetriF
k

e lulez 2 =
0
i=1

(ni n pi )2
Y
n pi

heterminm vlore D re este


D n zul neprmetriD

D n zul prmetriD

1; k1
1; kp1

unde 2 n este until de ordin pentru reprtii 2 (n)Y


;

h 2 < D tuni eptm (H0 )D ltfel o respingemF


0

Exemplu 7.30 @din QA v mpiontul mondil de fotl din 2006 u fost jute n totl 64 de meiE
uriD ir reprtii numrului de goluri nsrise ntrEun mei re telul de distriuie n elul UFIIF
hetermini @l nivelul de semni(ie = 0.05A d numrul de goluri pe mei urmez o distriuie
oissonF

Soluie:

@plim testul de onordn 2 prmetriA

pie X vriil letore e reprezint numrul

de goluri nsrise ntrEun meiF eoretiD X pote lu orie vlore din mulime NF wulime oserviilor
fute supr lui X este {1, 2, 3, 4, 5, 6}D u frevenele respetive din telF n tott u fost insrise 144

206

Capitolul 7. Vericarea ipotezelor statistice


xrF de goluri pe mei
0
1
2
3
4
5
6

xrF de meiuri
8
13
18
11
10
2
2

Tabela 7.11: Tabel cu numrul de goluri pe meci la FIFA WC 2006.

de goluriF istimm numrul de goluri pe mei prin medi lorD di = x =


oservteD dorim s testm d X urmez o reprtiie oissonF

(H0 ) :

144
64

= 2.25F e z dtelor

evem stfel de testt ipotez nulX

X urmez o lege oisson P().

vsF ipotez lterntiv

(H1 ) :

X nu urmez o lege oisson P().

h dmitem ipotez (H0 ) @di X P(2.25)D tuni pi = pi () i distriui vlorilor vriilei este
gls

ni

pi

n pi

0
1
2
3
4
5
6
5

8
13
18
11
10
2
2
4

0.1054
0.2371
0.2668
0.2001
0.1126
0.0506
0.0274
0.0780

6.7456
15.1775
17.0747
12.8060
7.2034
3.2415
1.7514
4.9926

n1 n pi
n pi
0.2333
0.3124
0.0501
0.2547
1.0857

0.1973

Tabela 7.12: Tablou de distribuie pentru P(2.25).

dt de elul UFIPF lore pi este P (X = i)D di proilitte vriil letore X P(2.25)


s i vlore i @i = 0, 1, 2, 3, 4AF

em pute form 7 lseF heoree pentru ultimele dou lse din

elul UFIPD nume {X = 5} i {X 6}D numerele ni nu depe vlore 3D le tergem din tel i le
unim ntrEo singur lsD n re {X 5}D u ni = 4 > 3F om not prin p5 proilitte
4

p5 = P (X 5) = 1 P (X < 5) = 1 P (X 4) = 1

P (X = i).
i=0

mnem dr u 6 lseF spotez nul (H0 ) se pote resrie stfelX

(H0 ) :

p0 = 0.1054, p1 = 0.2371, p2 = 0.2668, p3 = 0.2001, p4 = 0.1126, p5 = 0.0780.

spotez lterntiv este

(H1 ) :

ipotez (H0 ) nu este devrtF

207

7.6. Teste de concordan


glulm um vlore sttistiii @UFPWA pentru oserviile dteX

2
0

=
+

(8 6.7456)2
(13 15.1775)2
(18 17.0747)2
(11 12.8060)2
+
+
+
+ ...
6.7456
15.1775
17.0747
12.8060
(10 7.2034)2
(4 4.9926)2
+
= 2.1337.
7.2034
4.9926

heoree vem 6 lse i m estimt prmetrul D deduem numrul grdelor de liertte este

6 1 1 = 4F guntil de referin @vlore ritiA este 2 4 = 9.4877F egiune riti pentru


0.95;
2 este intervlul (2 4 , +)F heoree 2 < 2 4 D urmez ipotez nul (H0 ) nu pote (
0.95;
0
0.95;
respins l nivelul de semni(ie F edrD este rezonil s (rmm numrul de goluri mrte
urmez o reprtiie oissonF

rezentm mi jos un od

Matlab e rezolv est prolemF

X = [0*ones(8,1);1*ones(13,1);2*ones(18,1);3*ones(11,1);4*ones(10,1);...
5*ones(2,1);6*ones(2,1)];
f = [8 13 18 11 10 4];
% vectorul de frecvente absolute
n = 64;
alpha = 0.05; lambda = mean(X);
for i=1:5
% probabilitatile P(X=i), i=0,1,2,3,4
p(i) = poisspdf(i-1,lambda);
end
p(6)= 1 - poisscdf(4,lambda);
% probabilitatea P(X5)
H2 = sum((f-n*p).^2./(n*p)); Hstar = chi2inv(1-alpha,4);
if (H2 < Hstar)
disp('X urmeaza repartitia Poisson');
else
disp('X nu urmeaza repartitia Poisson');

end

Observaia 7.31 h ipotez nul este respinsD tuni motivul pote ( el unele vlori oservte
u devit pre mult de l vlorile teptteF n est zD este interesnt de oservt re vlori sunt
extremeD uznd respingere ipotezei nuleF utem de(ni stfel reziduurile standardizateX

ri =

Oi n pi
n pi (1 pi )

Oi Ei
Ei (1 pi )

unde prin Oi m nott vlorile oservte i prin Ei vlorile teptteF h ipotez nul r ( devrtD
tuni ri N (0, 1)F n generlD reziduuri stndrdizte mi mri 2 sunt semne pentru numere oservte
extremeF

Exemplu 7.32 ntrEo numit zi de luruD urmrim timpii de teptre ntrEo stie de trmviD pn l
nheiere zilei de luru @diD pn tree ultimul trmviAF pie T rteristi e reprezint numrul
de minute teptte n stieD pn sosete trmviulF ezulttele oserviilor sunt sumrizte n elul
UFIQF e ere s se ereteze @ = 0.05A d timpii de teptre sunt reprtizi exponenilF

Soluie:

@folosim testul 2 de onordnD prmetriA

(H0 )

evem de testt ipotez nul

F (x) F0 (x) = 1 e x , x > 0


=

208

Capitolul 7. Vericarea ipotezelor statistice


hurt
ni

05
39

5 10
35

10 15
14

15 20
7

20 25
5

Tabela 7.13: Timpi de ateptare n staia de tramvai.

vsF ipotez lterntiv


ipotez (H0 ) este fls.

(H1 )

heoree prmetrul este neunosutD v treui estimt pe z seleiei dteF entru estD folosim
metod verosimilitii mximeF puni de verosimilitte pentru exp() este
n

e ti = n e n t .

L(t1 , t2 , . . . , tn ; ) =
k=1

wi susD m nott prin t1 , t2 , . . . , tn vlorile de seleie pentru vriil letore T F


untele ritie pentru L() sunt dte de eui

ln L
= 0 =
n ln n t

e oserv u uurin

1
= = .
t

2 ln L
2
| = n t < 0,
2 =

de unde onluzionm este punt de mxim pentru funi de verosimilitteF


elul de distriuie pentru rteristi T esteX

2.5

12.5

17.5

22.5

39
glulm medi de seleieD t =

7.5
35

14

1
100 (2.5 39 + 7.5 35 + 12.5 14 + 17.5 7 + 22.4 5)

= 7.7D di = 0.1299F

h vriil T r urm reprtii exponenil exp()D tuni proilitile T s i vlori n (ere


ls suntD n mod orespunztorX

pi = pi () = P (X (ai , ai+1 ] | F = F0 ) = F0 (ai+1 ; ) F0 (ai ; ),

i = 1, 2, 3, 4, 5.

unde a6 = +F
n elul UFIR m nregistrt urmtorele dteX clasele @de nott ultim ls este (20, +)D deoree
se dorete o onordn dtelor oservte u dte reprtizte exponenilD ir mulime vlorilor pentru
reprtii exponenil este R+ AD extremitile din stng le lselor @ai AD frecvenele absolute ni @su
vlorile oservte n (ere lsAD proilitile pi D valorile ateptate n (ere ls @n pi A i erorile

relative de proximre le dtelor teptte u ele oservteF xumrul grdelor de liertte este kp1 =
3F glulm vlore riti 2 3 = 7.8147 iD de semeneD vlore
0.95;
k

H0 =
i=1

(ni n pi )2
= 6.5365.
n pi

heoree 2 < 2 3 D ipotez (H0 ) nu pote ( respins l est nivel de semni(ieF godul
0
0.95;

Matlab

209

7.6. Teste de concordan


gls

ai

ni

pi

n pi

(0, 5]
(5, 10]
(10, 15]
(15, 20]
(20, +)
(0, +)

0
5
10
15
20

39
35
14
7
5
100

0.4776
0.2495
0.1303
0.0681
0.0745
1

47.7615
24.9499
13.0334
6.8085
7.4467
100

ni n pi
n pi
1.6072
4.0483
0.0717
0.0054
0.8039
6.5365

Tabela 7.14: Tabel de distribuie pentru timpii de ateptare.

este urmtorulX

T =
n =
a =
for

[2.5*ones(39,1);7.5*ones(35,1);12.5*ones(14,1);17.5*ones(7,1);22.5*ones(5,1)];
100; alpha = 0.05; m = mean(T); lambda = 1/m;
[0, 5, 10, 15, 20, Inf]; f = [39, 35, 14, 7, 5];
i =1:5
p(i) = expcdf(a(i+1),m)-expcdf(a(i),m);

end
H2 = sum((f-n*p).^2./(n*p)); cuant = chi2inv(0.95,3);
if (H2 < cuant)
disp('Timpii de asteptare sunt exponential repartizati');
else
disp('ipoteza (H0) se respinge');
end

7.6.2 Testul de concordan Kolmogorov-Smirnov


estul de onordn uolmogorovEmirnov pote ( utilizt n omprre unor oservii dte u o
reprtiie unosut @testul uE u o seleieA su n omprre dou seleii @testul uE pentru dou
seleiiAF pre deoseire de riteriul 2 l lui ersonD re folosete densitte de reprtiieD riteriul

uolmogorovEmirnov utilizez funi de reprtiie empiriD Fn (x)F n zul unei singure seleiiD este

lult distn dintre funi de reprtiie empiri seleiei i funi de reprtiie pentru reprtii
testtD ir pentru dou seleii este msurt distn ntre dou funii empirie de reprtiieF n (ere
zD reprtiiile onsiderte n ipotez nul sunt reprtiii de tip ontinuuF
estul uolmogorovEmirnov este zt pe rezulttul eoremei SFPHF

Testul K-S pentru o selecie


n zul n re ipotezele testului sunt stisfuteD est test este mi puterni det testul 2 F
presupunem ne sunt dte un set de dte sttistie independenteD pe re le ordonm n form

x1 < x2 < < xn F eeste oservii independente provin din eei populie rterizt de vriil
letore X D pentru re urmrim s i stilim reprtiiF wi ntiD utm s stilim ipotez nulF he
exempluD d intuim funi de reprtiie teoreti lui X r ( F (x)D tuni stilimX

210

Capitolul 7. Vericarea ipotezelor statistice


funi de reprtiie teoreti vriilei letore X este F (x)F

(H0 ) :

spotez lterntiv (H1 ) esteD de regulD ipotez e (rm (H0 ) nu este devrtF elegem un nivel de
semni(ie

1F

n riteriul uE pentru o singur seleieD se ompr funi F (x) intuit a priori u funi de reprtiie

empiriD Fn (x)F emintimD

Fn (x) =

rd{i; xi x}
.
n

tudiind funi empiri de reprtiie estui set de dteD uolmogorov gsit @vezi reli @SFIHAA

distn dn = sup |Fn (x) F (x)| stisfe reli


xR

lim P ( n dn < ) = K(),

unde K() =

(1)k e2 k

> 0D este funi lui uolmogorov @teltAF n testul uED msur

k=

dn rterizez onordn dintre F (x) i Fn (x)F h ipotez (H0 ) este devrtD tuni diferenele

dn nu vor depi numite vloriD d; n F iste (resD drD s onsiderm regiune riti @olo unde (H0 )
nu re loA (ind e regiune unde

P (dn > d; n | (H0 ) devrt) = .


hrD pentru orie n (xtD su(ient de mreD vem X

P (dn d; n | (H0 ) devrt) = 1 P (dn > d; n | (H0 ) devrt) = 1 ,


de unde legem d; n = 1; n @until de ordin 1 pentru funi lui uolmogorov u n grde de
liertteAF eest until pote ( )t din tele speile pentru invers funiei lui uolmogorovD dr
sunt i numite oduri

Matlab disponiile pe www e pot lul untilele lui K()F

rinipiul de deizie este urmtorulX

h dn stisfe ineglitte
h dn stisfe ineglitte

n dn < 1; n D tuni dmitem ipotez (H0 )Y


n dn 1; n D tuni respingem ipotez (H0 )F

Etapele aplicrii testului lui Kolmogorov-Smirnov pentru o selecieX


e du i x1 < x2 < < xn F gonsiderm unosut @intuimA F (x)Y
spotezele sttistie suntX
(H0 )

funi de reprtiie teoreti vriilei letore X este F (x)

(H1 )

ipotez nul nu este devrtF

glulm 1; n stfel nt K(1; n ) = 1 Y

e lulez dn = max |Fn (x) F (x)|Y


x

h dn stisfe ineglitte n dn < 1; n D tuni dmitem ipotez (H0 )D ltfel o respingemF

211

7.6. Teste de concordan


Exemplu 7.33 (test de vericare a normalitii)

gonsiderm selei {2; 0.5; 0; 1; 1; 2; 2; 3}D extrs dintrEo numit oletivitteF v nivelul de semE
ni(ie = 0.1D s se deid d populi din re provine selei este norml de medie 1 i dispersie

2 @iFeFD X N (1, 2)AF

Soluie:

@folosim testul uolmogorovEmirnovA

evemX

wi ntiD lulm funi de reprtiie empiriF

0,

2,
8

3
Fn (x) = P (X x) = 8 ,

5
,
8

8,

1,

d x < 2;
d x [2, 0.5);
d x [0.5, 0);
d x [0, 1);
d x [1, 2);
d x [2, 3);
d x 3.

entru = 0.1 i n = 8D utm n telul pentru invers funiei lui uolmogorov el x1; 8 = x0.9; 8
stfel nt K(x1; 8 ) = 1 F qsim x0.9; 8 = 0.411F

e de lt prteD F (x) = ( x1 )D unde (x) este dt prin formul @PFRRA @funi de reprtiie pentru
2

lege norml N (0, 1)AF


spotez X urmez reprtii norml N (1,

2) este eptt d

n dn < x1 F glulele pentru

determinre vlorii dn sunt dte de telul UFISF n pigur UFTD putem oserv reprezentrile estor dou
funii pentru setul de dte oservteF

xi
F (xi )

Fn (xi 0)

Fn (xi )

|Fn (xi 0) F (xi )|

|Fn (xi ) F (xi )|

0
0
0
0
0

2
0.0169
0
0.125
0.0169
0.1081

0.5
0.1444
0.125
0.25
0.0194
0.1056

0
0.2398
0.25
0.375
0.0102
HFIQSP

1
0.5
0.375
0.625
0.125
0.125

2
0.7602
0.625
0.875
HFIQSP
0.1148

3
0.9214
0.875
1
0.0464
0.0786

1
1
1
0
0

Tabela 7.15: Tabel de valori pentru testul Kolmogorov-Smirnov.

entru lul dn D notm fptul e mi mre diferen ntre F (x) i Fn (x) pote ( relizt ori

ninte de slturile funiei Fn D ori dup esteD iFeFD

|F (xi ) F (xi 0)|,


n

sup |F (x) Fn (x)| = max


i
xR
|F (x ) F (x + 0)|,
i

hin telD oservm dn = 0.1352F heoree

n dn =

ninte de sltul i;
dup sltul i.

8 0.1352 = 0.3824 < 0.411D onluzionm

putem ept ipotez (H0 ) l prgul de semni(ie = 0.1F

Observaia 7.34 n zul n re vem de omprt dou reprtiiiD proedm stfelF presupunem

Fm (x) este funi de reprtiie empiri pentru o seleie de volum m dintrEo populie e re funi

teoreti de reprtiie F (xA i G (x) este funi de reprtiie empiri pentru o seleie de volum n
n

212

Capitolul 7. Vericarea ipotezelor statistice

Figura 7.6: Fn (x) i F (x) din tabelul 7.15.

dintrEo populie e re funi teoreti de reprtiie G(x)F horim s testm


versus

(H0 ) : F = G

(H1 ) : F = G.

@eventulD n (H1 ) putem onsider F > G su F < GFA gonsiderm sttisti

dm,n = sup |Fm (x) G (x)|,


n
x

e reprezint diferen mxim ntre ele dou funii @vezi pigur UFUAF itpele testului urmez nE
deprope pe ele din testul uE u o singur seleieF heizi se fe pe z riteriului

mn
dm,n < 1 .
m+n
estul uolmogorovEmirnov pentru dou seleii este unul dintre ele mi utile teste de ontingen pentru
omprre dou seleiiF eest test nu pote spei( ntur elor dou reprtiiiF

Etapele aplicrii testului lui Kolmogorov-Smirnov pentru dou seleciiX

e du D x1 < x2 < < xm i y1 < y2 < < yn F gonsiderm unosute @intuimA F (x) i G(x)Y
spotezele sttistie suntX
(H0 )

F =G

vsF

(H1 )

glulm 1 stfel nt K(1 ) = 1 Y

e lulez dm,n = sup |Fm (x) G (x)|F


n
x

F = GF

213

7.6. Teste de concordan


h dm,n stisfe ineglitte

mn
m+n

dm,n < 1 D tuni dmitem ipotez (H0 )D ltfel ipotez

nul este respins l est prg de semni(ieF

Observaia 7.35 entru ipotez lterntiv F > G @su F < GAD se v onsider sttisti dm,n =

sup[Fm (x) G (x)] @respetivD dm,n = sup[G (x) Fm (x)]AF


n
n
x

7.6.3 Test de independen folosind tabele de contingen


n est seiuneD vom prezent un test de independen ntre dou riterii dup re se fe mprire
dtelor oservteF presupunem vem un set de oservii e sunt mprite n tegorii determinte
de dou riterii diferiteF he exempluD onduere unui lieu este indeis n e privete legere unui urs
de limi strine potrivit pentru introduere n progrm olrF entru estD sE relizt un sondj
de opinie l re u prtiipt 350 de eleviiD n re eti u vut de preizt ursul de limi strine
prefert i nivelul de studiu e onsider li sEr potriviF sdenti(m ii dou rteristii @triuteAX

X este lim strin @eFgFD inglezD prnezD qermnD stlinD pniol i usA i Y reprezint nivelul
de studiu @eFgFD neptorD mediu i vnstAF xumrul de elevi e intr n (ere tegorie este (t n
elul UFITF
Nivel @ Limba
@

Englez

Francez

German

Italian

Spaniol

Rus

Total

33
65
43
141

19
37
15
71

11
10
7
28

12
14
17
43

11
24
12
47

6
7
7
20

92
157
101
350

nceptor
mediu
avansat
Total

Tabela 7.16: Tabel cu repartizarea elevilor la cursurile de limbi strine.


n generlD d dtele oservte sunt lsi(te n tegorii e depind de dou triute diferiteD tuni
putem form un tel de genul elului UFIUD numit tabel de contingenF eii X i Y sunt triutele i

Xi , i = 1, rD Yj , j = 1, s sunt diverse tegorii n re (ere triut n prte pote ( mpritF

X @Y
@
X1
X2
.
.
.

Y1
n11
n21
.
.
.

Y2
n12
n22

...
...
...

.
.
.

Xi

ni1

ni2

.
.
...

.
.
.

.
.
.

Xr

nr1
n1

nr2
n2

...
...

.
.
.

Suma pe coloan

.
.
.

Yj
n1j
n2j

...
...
...

nij

.
.
...

.
.
.

.
.
.

nrj
nj

...
...

.
.
.

Ys
n1s
n2s

Suma pe linie

nis

ni

nrs
ns

nn

n1
n2

.
.
.

.
.
.

.
.
.

.
.
.

(suma total)

Tabela 7.17: Tabel de contingen.


n elul UFIU m folosit urmtorele notiiX nij pentru numrul @freven solutA de oservii e
u vlore Xi pentru triutul X i vlore Yj pentru triutul Y (i = 1, r, j = 1, s)D ir nj D ni i n

214

Capitolul 7. Vericarea ipotezelor statistice

sunt

nj =

nij ,

ni =

i=1

nij ,

n=

nij .

j=1

i=1 j=1

piere individ din selei les prine unei singure tegorii rterizte de triutul X i unei sinE
gure tegorii rterizt de triutul Y F n onluzieD (ere individ pote prine dor unei dintre
ele r s eluleF
horim um s testm d triutele X i Y sunt independente @n exemplul de mi susD est r
nsemn determinre fptului d legere ursului de lim strin este independent de nivelul de
studiuAF
notm prin pij proilitte o dt oservt s d n tegoriile Xi D Yj D i prin pi i pj
proilitile mrginleD

pi =

pij ,

pj =

j=1

evem

pij .
i=1

i=1

i=1 j=1

pj = 1.

pi =

pij =

j=1

n generlD vlorile rele pentru pij , pi i pj nu sunt unosute @spei(teA a priori i se vor estim
folosind dtele din telul de ontingenF om not prin pij , pi iD respetivD pj estimiile lorF lorile
proilitilor mrginle le estimm prinX

pi =

ni
n

(i = 1, r)

pj =

nj
n

(j = 1, s).

@UFQHA

spotez nul esteX

(H0 ) :

pij = pi pj ,

i = 1, r, j = 1, s

(H1 ) :

(iFeFD nu exist niio soiere ntre triutele X i Y ).

(H0 ) nu este devrt.

estfelD pentru i i j (xiD vlore teptt n elul (i, j) este

Eij = n pij =
glulm numrul

H2 =
i, j

ni nj
,
n

ni nj
nij
n
ni nj
n

i = 1, r, j = 1, s.

=
i, j

2
(Oij Eij )
,
Eij

@UFQIA

@UFQPA

undeD n prntezD Oij = nij este numrul de vlori oservte n elul (i, j) ir Eij numrul de vlori
teptte @en., expetedA n elul (i, j)F
h n (ere elul numrul de vlori e i pin este de el puin 5D tuni sttisti H 2 urmez
reprtii 2 u (r 1)(s 1) grde de liertteF

Etapele testului de independen sunt urmtoarele:


e du nij ,

i = 1, r, j = 1, s i prgul de semni(ie Y

215

7.6. Teste de concordan


e z oserviilor nij D lulm estimiile @UFQHAY
glulm H 2 u formul @UFQPAY
h Eij 5, i, j i H 2 2 (r1)(s1) D tuni se dmite (H0 ) l prgul de semni(ie F
;
eltfelD respingem (H0 ) l est prg de semni(ieF

Exemplu 7.36 evenim l dtele din elul UFITF entru stili dD l un nivel de semni(ie
= 0.05D legere ursului de lim strin este independent de nivelul de studiuD lulm mi nti
estimiile Eij F eeste sunt srise n prnteze n elul UFIVF
glulm H 2 X
3

H2

=
i=1 j=1

(nij Eij )
(33 37.06)
(7 5.77)
=
+ +
Eij
37.06
5.77

10.1228 > 3.9403 = 2 10


0.05,

dei respingem ipotez nul onform rei tipul ursului i nivelul su sunt triute independenteF
entru lulul estor vlori n

MatlabD putem proed stfelX

n = [33 19 11 12 11 6; 65 37 10 14 24 7; 43 15 7 17 12 7]Y
E = [37.06 18.66 7.36 11.30 12.35 5.26; 63.25 31.85 12.56...
19.29 21.08 8.97; 40.69 20.49 8.08 12.41 13.56 5.77];
H2 = sum(sum((n-E).^2./E)); crit = chi2inv(0.05,2*5);
Nivel @ Limba
@
nceptor
mediu
avansat
Total

Englez

Francez

German

Italian

Spaniol

Rus

33
(37.06)
65
(63.25)
43
(40.69)
141

19
(18.66)
37
(31.85)
15
(20.49)
71

11
(7.36)
10
(12.56)
7
(8.08)
28

12
(11.30)
14
(19.29)
17
(12.41)
43

11
(12.35)
24
(21.08)
12
(13.56)
47

6
(5.26)
7
(8.97)
7
(5.77)
20

Total

92
157
101
350

Tabela 7.18: Tabel cu repartizarea i estimaia elevilor la cursurile de limbi strine.

Cazul tabelelor de contingen 2 2. Testul exact al lui Fisher


n zul prtiulr n re r = s = 2D telul de ontingen este de formX
unde a, b, c, d sunt vlorile oservte pentru (ere elul n prteF lorile teptte Eij @vezi formul
@UFQIAA suntX

E11 =

(a + b)(a + c)
,
n

E12 =

(a + b)(b + d)
,
n

E21 =

(c + d)(a + c)
,
n

E22 =

(c + d)(b + d)
,
n

216

Capitolul 7. Vericarea ipotezelor statistice


X @Y
@
X1
X2

Y1
Y2
a
b
c
d
a+c b+d

Suma pe coloan

Suma pe linie

a+b
c+d
a+b+c+d

Tabela 7.19: Tabel de contingen 2 2.

unde n = a + b + c + dF ttisti H 2 dt de reli @UFQPA devineX

H2 =

ad bc
n

1
1
1
1
+
+
+
E11
E12
E21
E22

i urmez reprtii 2 (1)F hin fptul H 2 2 (1)D rezult sttisti H =

H 2 N (0, 1)D i se

pote utiliz H pentru testul sttisti de independenF


hei est test pote ( reliztD n zul telelor de ontingen 2 2 se utilizez testul exact al lui

FisherF eest test pote ( utilizt hir i n zul n re vlorile oserviilor sunt mi mii det 5F
legem un prg de semni(ie F
estm ipotez nul

(H0 ) :

nu exist niio soiere ntre triutele X i Y.

versus ipotez lterntiv

(H1 ) :

(H0 ) nu este devrtF

@test ilterlA

ezulttele oinute pentru stre de sntte voluntrilor le putem srie su form unei mtrieD pe
re o vom numi matricea conguraieiF eest esteX

M=

presupunem um D pentru o mtrie 2 2D sumele vlorilor pe linii i pe olone sunt (xte a

prioriF etuniD putem lege elementele mtriei e stisfe este ondiii n mi multe moduri @este
greu de preizt n te moduriD n zul el mi generlAF n zul prolemei de fD s presupunem

a + b, c + d, a + c i b + d sunt (xteF etuniD d ipotez nul este devrtD proilitte de oine


ext vlorile din elul UFIW esteX

P =

a
c
Ca+b Cc+d
a+c
Cn

@UFQQA

eest proilitte se oine prin utilizre shemei hipergeometrieF


ixist ns mi multe mtrie de tip 22 re u o on(gurie (xt sumelor pe (ere linie i pe (ere
olon @iFeFD a + b, c + d, a + c i b + d sunt (xteAF entru (ere mtrie de est tipD putem lul o
proilitte @ondiiont de relizre ipotezei nuleA de genul elei de mi susF n zul testului ilterlD

P vlore testului @nott prin Pv A este sum tuturor proilitilor ondiionte stfel lulteD re
sunt mi mii su egle u proilitte oinut pentru on(guri dtF
h P vlore este mi mre det D tuni ipotez nul este dmis l est prg de semni(ieF

217

7.6. Teste de concordan


h Pv D tuni respingem (H0 )F

n zul n re ipotez lterntiv este un spei( @eFgFD unul dintre triute este prefert eluilltAD
tuni P vlore este dor jumtte din sum nteriorF punem n est z vem un test unilterlF

Exemplu 7.37 ifetele unui numit tip de medimente este testt pe un grup de voluntri e prezint
simptome de relF eeti sunt n numr de 14 i u fost mprii n dou grupuri de 7 personeF
ienilor din primul grupD G1 D li sEu dministrt medimentul ir pienilor din grupul G2 nu li sEu
dministrt nimiF hup o sptmnD sE testt stre sntii elor 14 pieniD rezulttele (ind ele
din elul UFPHF se determine d dministrre medimentului re vreun efet supr strii de
sntos

X @Y
@
G1
G2

bolnav

Suma pe linie

6
4
10

1
3
4

7
7
14

Suma pe coloan

Tabela 7.20: Tabel de contingen pentru testarea unui medicament.


sntte voluntrilorF e v folosi nivelul de semni(ie = 0.05F
spotez nul esteX

tre de sntte voluntrilor este independent de dministrre medimentului.

(H0 ) :

spotez lterntiv @ilterlA esteX


spotez (H0 ) este fls.

(H1 ) :

wtrie on(guriei este

M1 =

polosind reli @UFQQAD proilitte priiei estei on(guriiD tiind sumele pe linii i pe olone
sunt (xteD este

P1 =

6 4
C7 C7
10 = 0.2448.
C14

elte on(gurii u sum 7 pe (ere linie i sumele 10 pe prim olon i 4 pe dou olon suntX

M2 =

, M3 =

M4 =

M5 =

roilitile ondiionte orespunztore estor suntX

P2 = 0.2448;

P3 = 0.4404,

P4 = 0.0350,

P5 = 0.0350.

P vlore este sum tuturor proilitilor mi mii su egle u P1 X


Pv = P1 + P2 + P4 + P5 = 0.2448 + 0.2448 + 0.0350 + 0.0350 = 0.5596 > 0.05 = .

218

Capitolul 7. Vericarea ipotezelor statistice

edrD l est prg de semni(ie dmitem ipotez nulF

Observaia 7.38 @IA e se oserv sum P1 + P2 + P3 + P4 + P5 = 1D ee e er de tepttF


@PA h rezulttul experimentului r ( mtrie M5 i ipotez lterntiv este

(H1 ) :

exist evidene medimentul re efete ene(e,

tuni vem un test unilterlF n est zD P vlore este Pv = P5 = 0.0305 < D ee e ondue l
respingere ipotezei nule iD deiD exist evidene medimentul re efete ene(eF

7.6.4 Teste de concordan n


@IA

Matlab

em vzut dej funi chi2gof(x) testez @folosind testul 2 l lui ersonA d vetorul x

provine dintrEo reprtiie normlD u medi i dispersi estimte folosind xF


entru testul 2 D form generl funiei

Matlab esteX

[h,p,stats] = chi2gof(X,name1,val1,name2,val2,...)
undeX

h, p sunt l fel n exemplele nteriore @eFgFD vezi eiune UFSFRAY


perehile namei/valuei sunt opionleF riilele namei pot (X numrul de lseD 'nbins'D un vetor
de vlori entrle le intervlelor e de(nes lseleD 'ctrs'D su un vetor u petele lselorD 'edges'F
elte vriile e pot ( utilizteX 'cdf'D 'expected'D 'nparams'D 'emin'D 'frequency'D 'alpha'F
vriil de memorie stats (ezX chi2stat E sttisti 2 D df E grdele de liertteD edges E un
vetor u petele intervlelor lselor dup triereD O E numrul de vlori oservte n (ere lsD E E
numrul de vlori teptte n (ere lsF

Exemplu 7.39 pre exempli(reD revenim l ixeriiul UFPVD dr u vlore nivelului de nredere din
yservi UFPWF godul

Matlab e folosete funi de mi sus esteX

x = 1:6; f = [15,7,4,11,6,17]; p = 1/6*ones(1,6); e = N*p; alpha = 0.01;


[h, p, stats] = chi2gof(x,'ctrs', x,'frequency', f,'expected',e, 'alpha',alpha)
eest od returnezX

h =
0

p =
0.0184

stats =
chi2stat:
df:
edges:
O:
E:

13.6000
5
[0.5000 1.5000 2.5000 3.5000 4.5000 5.5000 6.5000]
[15 7 4 11 6 17]
[10 10 10 10 10 10]

eest rezultt on(rm ipotez nul @zrul este oretA este eptt l nivelul = 0.01F
@PA

entru testul uolmogorovEmirnov pentru o seleieD funi

Matlab esteX

219

7.6. Teste de concordan


[h, p, ksstat] = kstest(x, F, alpha, type)

n plusD f de funiile nterioreD vem opiune 'type'F eest se refer l um se ompr ele dou
funii de reprtiieD i pote ( un dintre urmtoreleX 'unequal'D 'larger'D 'smaller'F

Exemplu 7.40 evenind l ixeriiul UFQQD odul Matlab e rezolv prolem esteX
X = [-2; -0.5; 0; 1; 1; 2; 2; 3];
F = normcdf(X, 1, sqrt(2));
[h, p, ksstat] = kstest(X, [X,F], 0.1, 'unequal')
undeD X este vetorul de dte oservte i F este vetorul e onine vlorile funiei de reprtiie F (x)
pentru omponentele lui X F
ulnd est odD oinemX

h =
0

p =

ksstat =
0.9968

0.1352

yservm vlore ksstat este hir dn gsit nteriorF


@QA

entru testul uolmogorovEmirnov pentru dou seleiiD funi

Matlab esteX

[h, p, ksstat] = kstest2(x, y, alpha, tail)


eiiD tail se refer l ipotez lterntiv (H1 )D i pote ( un dintre urmtoreleX

'unequal' @pentru F1 (x) = F2 (x)AD 'larger' @pentru F1 (x) > F2 (x)A su


'smaller' @pentru F1 (x) < F2 (x)AF

Exemplu 7.41 onsiderm dtele din elul UFT i s testm @ = 0.05A d seturile de note oinute
n ei doi ni provin dintrEo eei reprtiieF n

Matlab vom srie stfelX

u = [5*ones(3,1);6*ones(4,1);7*ones(9,1);8*ones(7,1);9*ones(2,1)];
v = [5*ones(5,1);6*ones(6,1);7*ones(8,1);8*ones(6,1);9*ones(3,1);10*ones(2,1)];
[h, p, ksstat] = kstest2(u, v, 0.05)
ezulttul esteX

h =
0

p =

ksstat =
0.9999

0.0867

diD ele dou seturi de dte provin dintrEo eei reprtiieD l nivelul = 0.05F

220

Capitolul 7. Vericarea ipotezelor statistice

Figura 7.7: Funiile empirice de repartiie n testul K-S cu dou selecii.

7.7 Teste neparametrice


wulte dintre testele disutte nterior u erin dtele selette s urmeze o reprtiie norml
@d selei este miAF e pune prolem urmtoreX ge se ntmpl d est erin @posiil
i lteleA nu este veri(t i nu tim nimi despre reprtii dtelor su despre prmetrii vriileic
estele neprmetrie sunt ele n drul ror nu se f presupuneri supr formei reprtiieiF eeste
teste nu estimez prmetrii neunosuiD de ee mi sunt unosute i su titultur de metode fr
parametri @en., prmeterEfree methodsA su metode fr repartiie @en., distriutionEfree methodsAF e
pot onstrui teste neprmetrie orespunztore (erui test prmetri studit mi susD ns este teste
neprmetrie suntD n generlD grupte n urmtorele tegoriiX

teste pentru diferen dintre grupuri @pentru seleii independenteAF iste zul omprrii mediilor
dou seleii e provin din populii independenteF he regulD se utilizez testul t d ipotezele
estui sunt ndepliniteF rinte neprmetrie le estui test suntX testul ldEolfowitzD testul
wnnEhitney su testul uolmogorovEmirnov pentru dou seleiiY

teste pentru diferen dintre vriile @pentru seleii dependenteAF tilizt l omprre dou
vriile e rterizez populi din re sE lut seleiF este neprmetrie utilizteX testul
semnelorD testul iloxonF

teste pentru relii ntre vriileF entru gsi oreli ntre vriileD se utilizez oe(ientul de
orelieF ixist vrinte neprmetrie le oe(ientului de orelie stndrdD eFgFD oe(ientul R
@permnAD oe(ientul @uendllA su oe(ientul GammaF ixistD de semeneD i teste privind
oe(ientul de orelieX 2 su testul pisher extF

7.7.1 Testul semnelor


iste un test neprmetri zt pe semnele numitor rteristii i nu pe vlorile lorF iste unul dintre
ele mi simple teste sttistie neprmetrieF

221

7.7. Teste neparametrice

Exemplu 7.42 horim s testm preferinele lienilor dintrEo numit pizzerie pentru pizz u lt suE
ire su grosF spunem este preferine sunt reprezentte n elul UFPIF n est telD (erei
mrime
semn

sutire

gros
+

gros
+

gros
+

sutire

gros
+

gros
+

sutire

gros
+

gros
+

Tabela 7.21: Tabel cu preferine pentru blatul de pizza.


preferine i se triuie un semnD + pentru 4lt gros4 i pentru 4lt sutire4F hintrEo privire n telD
se pre mre prte @70%A lienilor prefer ltul grosF horim s testm semni(i estor dteF
gu lte uvinteD re este ns estor rezultte dD de fptD nu exist vreo diferen ntre preferinec
uD d m presupune preferinele pentru ele dou tipuri sunt mprite n mod eglD re sunt
nsele de oine un rezultt de genul prezentt n telul de mi susc

Soluie:

tilim ipotez nul

(H0 ) :

preferinele pentru ele dou lturi sunt 50 50;

versus ipotez lterntiv ilterl

(H1 ) :

exist diferene semni(tive n preferinele pentru ele dou lturi;

ot ( onsiderte i teste unilterle @stng su dreptAF elegem prgul de semni(ie = 0.5F


g de oieiD presupunem ipotez nul este devrt iD tuniD ns inev s leg un lt
suire este p = 0.5F h notm u X vriil letore e reprezint legere ltuluiD fut de
lienii re u omndt pizzD tuni X B(10, 0.5) @ii vem o seleie de n = 10AF glulm

P vloreD di vlore mxim pentru prgul de semni(ie pentru re ipotez nul nu pote
( respinsF eest vlore este de dou ori proilitte P (X 3) @de dou oriD pentru testul
este ilterlAD di proilitte de oine un rezultt el din telF qsim P vlore este

Pv = 2 P (X 3) = 0.3438F heoree < Pv D onluzionm ipotez nul nu pote ( respins l est


nivel de semni(ieF

7.7.2 Testul semnelor n Matlab


n

MatlabD testul semnelor pote ( relizt u jutorul funiei


[p, h] = signtest(x, m)

undeX

m este un numr relY


x este un ir de rtere su vetorD supr rui fem testul semnelorY
vriil de memorie h este rezulttul testuluiF h rezulttul (t este h = 0D tuni ipotez
nulD (H0 )X setul de date x provine dintr-o distribuie continu de median egal cu mD este dmis
l est nivel de semni(ieF h rezulttul (t este h = 1D tuni ipotez nul este respinsF

222

Capitolul 7. Vericarea ipotezelor statistice


e v dmite stfel ipotez lterntiv (H1 )X setul de date x provine dintr-o distribuie continu

care nu are median egal cu mF h m nu preD tuni se sunelege m = 0F


vriil de memorie p este P- valoareaD di vlore mxim pentru prgul de semni(ie
pentru re ipotez nul este dmisF heoree ii = 0.05 este sunelesD pentru un p > 0.05 se
(ez h = 0F eltfelD se (ez h = 1F
y vrint muntit omenzii nteriore este urmtoreX

[p, h, stats] = signtest(x, y,'alpha',alpha,'method',method)


eiiD n plus f de preizrile de mi susD mi dugm X

spotez nul este (H0 )X setul de dte x y provine dintr-o distribuie continu de median egal cu
0D u ipotez lterntiv mediana lui x y nu este 0Y
vriil stats nmgzinez urmtorele dteX

 zval E este vlore sttistiii Z pentru oservi onsidert @pre dor pentru seleii de
volum mreD n 30AY

 sign E este vlore sttistiii testY


alpha este nivelul de semni(ieY
method este metod folosit n testreF utem ve o metod extD nd method este 'exact'D
su proximtiv pentru 'approximate'Y

Exemplu 7.43 entru prolem u pizzD de mi susD odul Matlab e generez testul semnelor esteX
x = [-1 1 1 1 -1 1 1 -1 1 1];
[p, h, stats] = signtest(x, 0)
ezulttul testului esteX

p =
0.3438

h =

stats =
0

sign: 3

Observaia 7.44 evenim l ixeriiul UFPV i urmrim testre ipotezei nule folosind funi signtestF
Soluie:

godul

Matlab este simpluX


x = [ones(59,1); zeros(41,1)];
[p, h, stats] = signtest(x,.5)

yinem rezultteleX

223

7.7. Teste neparametrice


p =

h =
0

0.0891

stats =
zval: 1.7000
sign: 41

ee e on(rm ipotez nul este dmis l nivelul de semni(ie = 0.05F

7.7.3 Testul seriilor (runs test) pentru caracterul aleator


n litertur sttistiD un proess u devrt independent este el proes e pote produe seleii
independente i identi reprtizteF h o numit vlore n est ir este in)uent de pozii s su
de vlorile e o preedD tuni selei genert nu pote ( letoreF
he(nim noiune de serie su faz @en., runA (ind o suesiune unui su mi multe simoluri de
eli tipD re sunt preedte i urmte de simoluri de lt tip su niiun simolF he exempluX

001111010010

su

MFFFFFMMMF

su

++-+---++++--+--++-

xumrul de fze i lungime lor pot ( folosite n determinre grdului de stohstiitte unui ir de
simoluriF re puine su pre multe fzeD su de lungimi exesiv de mri sunt rre n serii u devrt
letoreD de ee ele pot servi drept riterii sttistie pentru testre stohstiitiiF eeste riterii sunt
dienteX pre puine fze impli fptul unele fze sunt pre lungiD pre multe fze impli pre multe
seveneF edrD ne vom preoup dor de numrul totl de fzeF piere numr din ir este omprt u
medin su vlore medie iruluiD sriind stfel + pentru numere mi mri det medin i pentru
ele mi miiF xumerele egle u medin nu sunt onsiderte n lulF pie n1 i n2 numrul de semne +D
respetivD din irD i (e n = n1 + n2 F pie R1 i R2 numrul de fze e orespund semnului +D respetivD

din irF xumrul totl de fze este R = R1 + R2 F


elegem ipotez nulX

(H0 ) :

irul este letor @(ere rnjment de + i este ehiproil).

vsF ipotez lterntiv

(H1 ) :

irul nu este letor.

utem gsi reprtiiile vetorilor letori (R1 , R2 )D R1 D R2 su RF entru R vem densitte de reprtiieX
D d r = pr;

(r1)/2 (r3)/2

(r3)/2 (r1)/2
C
n1 1 Cn2 1 + Cn1 1 Cn2 1

n
Cn 1

f (r) =

r/21 r/21
Cn1 1 Cn2 1

Cn 1

D d r = impr.

gnd n1 i n2 sunt mriD tuni R N (, )D unde

=2

n1 n2
+ 1,
n

2 n1 n2 (2 n1 n2 n)
.
n2 (n 1)

224

Capitolul 7. Vericarea ipotezelor statistice

edrD

R
N (0, 1).

7.7.4 Testul serilor (runs test) n Matlab


puni

Matlab e simulez testul de veri(re stohstiitii unui ir de rtere este


[h, p, stats] = runstest(x)

eest este un test e veri( d vlorile e ompun irul de rtere x pr n ordine letoreF riE
ilele hD p i x sunt n testul signtestF eiiD vriil stats (ez urmtoreleX numrul de fzeD
lungimile (erei fze i vlore sttistiii pentru selei onsidertF
n urm rulrii omenziiD se v ( vlore h = 0 d ipotez vlorile pr n ordin letore nu
pote ( respins @este eptt l nivelul de semni(ie = 0.05A i h = 1 n z ontrrF he exempluD
rulre odului

x = '011010100010001001010101110010101001010101010010111';
[h, p, stats] = runstest(x)
(ez

h =
1

p =

stats =
0.0014

nruns:
n1:
n0:
z:

38
24
27
3.2899

eest rezultt se trdue stfelX ipotez irul onsidert este letor genert este respins l nivelul
de semni(ie = 0.05 @sunelesAD P vlore este Pv = 0.0014 @st nsemnnd dor pentru un
nivel de semni(ie mi mi de Pv irul pote ( onsidert letorAF riil de memorie stats (ez
dtele folosite n plire testuluiF
gomnd urmtore

[h, p, stats] = runstest(x, v, alpha, tail)


(ez

deizi testuluiD ori h = 0 ori h = 1D u semni(i de mi susY


v este vlore de referin irului de rtereF unt numrte vlorile e sunt mi mii su mi
mri det vD ele re sunt ext egl u v nu sunt ontilizteY

alpha este nivelul de semni(ieY


tail pote ( un dintre urm torele ipoteze lterntiveX

7.8. Concluzii

225

 'both'D irul nu este letor @test ilterlAF eest opiune pote s nu (e spei(tD
deoree se sunelege impliitF

 'left'D d vlorile tind s se dune n iorhine @test unilterl stngAY


 'right'D d vlorile tind s se sepre @test unilterl dreptAY
he exempluD s onsiderm urmtorele omenziX

y = 0:10;
y = 0:10;
y = 0:10;

[h, p] = runstest(y,median(y),0.02,'left')
[h, p] = runstest(y,median(y),0.02,'right')
[h, p] = runstest(y,median(y),0.02,'both')

ezulttele rulrii lor sunt @n ordineAX

h = 1
h = 0
h = 1

p = 0.0043
p = 1
p = 0.0087

spotez nul este e vlorile din irul [0 1 2 3 4 5 6 7 8 9 10] sunt letore n jurul vlorii medineD

median(y) = 5F
yservm mi sus testul unilterl stng respinge ipotez nul i dmite ipotez vlorile irului se
strng iorhine n jurul estei vloriF estul unilterl drept dmite ipotez nulD ir testul ilterl o
respingeD dmind ipotez numerele nu vin n ordine letoreD rportt l vlore medinF

7.8 Concluzii
he multe ori n prti se urmrete trge onluzii despre rteristiile @prmetriiA unei populiiD
plend de l o seleie @sumulimeA sF eeste rteristii @su prmetriA nu pot (D n generlD erE
ette folosind memrii ntregii oletivitiD deoree est pote ( un forte mreD ir un reensmnt
re s determine vlorile rele le prmetrilor este ori pre sumpD ori imposiil de reliztF eest
proedur de extrpolre unei proprieti de l o simpl seleie l ntreg populie ine de ttisti
snferenilF entru deide d o numit propriette pe re o prezint selei les se pstrez i
pentru oletivitte din re est fost oinutD vem nevoie de teste sttistieF n vedere onstruirii
unui test sttistiD v treui s preizm urmtoreleX

ipotez nul i ipotez lterntivF reuie preizt ii d vem un test unilterl su ilterlY
nivelul de on(den e se dorete ( utiliztY
oletre unei seleii de dte din populi de interesY
sttisti folosit n testreY
numrul grdelor de liertteY
vlore sttistiii utilizte pentru selei dtY
vlore riti sttistiii @su vlore P AY

226

Capitolul 7. Vericarea ipotezelor statistice


onluzi re rezult n urm folosirii testuluiF

n generlD intervlele de nredere sunt preferte unui test sttistiD deoree este ne spun diret re
dintre prmetrii testi sunt n onordn u dtele experimentleF yriumD plend de l intervlul
de nredere putem onstrui un test prmetriF h vlore din ipotez nul de n intervlul de
nredereD tuni eptm est ipotez suD mi ine zisD nu vem su(iente dovezi s o respingemF
spotez nul v ( eptt pnD eventulD l o testre mi puterniF h vlore prmetrului din
omponen ipotezei nule nu se ) n intervlul de nredereD tuni ipotez lterntiv este e epttF
heizi n zul testelor prmetrie pote ( lut i pe z P vloriiF h est este mi mre det
prgul de semni(ieD tuni dmitem ipotez nulY n z ontrrD o respingemF

7.9 Exerciii propuse


Exerciiu 7.1 e run o moned de 250 de oriD oinnduEse 138 de priii le stemeiF v un prg de
semni(ie = 0.05D s se deid d vem su(iente dovezi de (rm est moned este flsF

Exerciiu 7.2 ntrEun spitl sE nregistrt deElungul timpului sexul opiilor 564 mme re u te 4
opiiF ezulttele sunt ele din elul UFPPF
preven
38
138
213
141
34

xumr de opii
4 fete
3 fete i un it
2 fete i 2 ieti
o ft i 3 ieti
4 ieti

Tabela 7.22: Distribuia copiilor ntr-o familie cu 4 copii.


esti ipotez D n (ere fmilieD proilitte de pre l ntere un it este eei u e de
pre o ftF

Exerciiu 7.3 grteristi X reprezint heltuielile lunre pentru onvoririle telefonie le unei fmiliiF
n urm unui sondj l re u prtiipt 100 de fmiliiD m oinut dtele @reprtii de freveneAX
SHD USA

USD IHHA

IHHD IPSA

IPSD ISHA

ISHD IUSA

IUSD PHHA

PHHD PSHA

PSHD QHHA

II

IQ

IV

PH

IR

II

@A se veri(eD u nivelul de semni(ie = 0.02D ipotez medi estor heltuieli lunre pentru o
singur fmilie este de 140 RON D tiind tere stndrd este 35 RON F
@A se veri(e eei ipotezD n zul n re tere stndrd nu este unosut a prioriF

Exerciiu 7.4 v un exmen nionlD se ontilizez not x oinut de (ere exmint n prteF
entru o nliz sttistiD se leg l ntmplre 200 de ndidiF E gsit sum notelor lese este
200

200

xi = 1345.37 i sum ptrtelor estor note este


i=1

= 10128.65F e erX
i=1

@A qsii un intervl de nredere pentru medi tuturor notelor prtiipnilor l exmenD l nivelul
de semni(ie = 0.05F

227

7.9. Exerciii propuse

@A esti ipotez nul (H0 ) : = 6.75D vsF ipotez lterntiv (H1 ) : = 6.75D l nivelul = 0.05F
ergumenti sttisti folosit n testreF

Exerciiu 7.5 entru o seleie dtD de volum n = 196D m oinut x = 0.25 i s = 4F xu unotem
nii vlore medie i nii dispersi vriilei letore e rterizez populiF eri(i l nivelul de
semni(ie = 0.05 ipotez = 0D u lterntiv = 0F

Exerciiu 7.6 n ptron susine (rm s nu fe disriminre sexul l ngjre @iFeFD tt riiD
t i femeile u eesi ns de se ngj n respetiv (rmAF e leg 500 de ngji i se gses 267

de riF esti l nivelul de semni(ie 0.05 d ptronul (rmei spune devrul su nuF

Exerciiu 7.7 ntrEo fri de mltD sunt mlte ou n utii de te 6 uiF e dorete s se
veri(e numrul oulelor sprte oninute n (ere phetF e leg 250 de utii de eli tipD l intervle
regulteD deE lungul unei sptmni i se ontilizez te ou sprte sunt n (ere utieF ezulttele
sunt ele din elul UFPQF polosind testul 2 D testi d numrul oulelor sprte gsite ntrEo utie
les l ntmplre urmez lege inomil @nivelul de semni(ie este = 0.05AF

x nrF de ou sprte
ntrEun phet
nrF de phete
orespF lui x

93

95

45

12

Tabela 7.23: Numrul de ou sparte n ecare cutie i frecvena

Exerciiu 7.8 e fe un experimentD n urm rui este testt timpul de funionre l unor terii de
eli tipF histriui timpului de funionre @msurt n luniA se rede urm o reprtiie exponenilF
unt testte 100 de terii i dtele sunt nregistrte n telul de frevene el UFPRF
polosind testul 2 D testi d timpul de vi l teriilor urmez lege exponenilD de un prmetru
potrivitF @se v lege nivelul de semni(ie = 0.05AF
timp de funionre
freven

01
36

12
30

23
15

34
5

45
5

56
5

67
4

7+
0

Tabela 7.24: Timpul de funcionare i frecvena

Exerciiu 7.9 hintre tote nregistrrile vitezelor vehiulelor e tre prin dreptul rdrului (x ezt n
f universitiiD se leg 10 dte l ntmplreF eeste sunt @n km/hAX

48

44

55

45

47

41

39

49

55

52

resupunem selei fe prte dintrEo populie normlF


@A qsii un intervl de nredere u nredere de 98% pentru vitez medie vehiulelor e tre prin
dreptul rdruluiF
@A esti d vitez medie u re se irul prin f estui rdr este de 45km/h su nuD onsidernduE
se un nivel de semni(ie = 0.02 Y

228

Capitolul 7. Vericarea ipotezelor statistice

@A istimi proilitte vitez legl de 50km/h s ( fost depitD folosind dtele seleiei onsidE
erteF

Exerciiu 7.10 esti d funiile Matlab rand i randn generez numere @pseudoEAletoreF
Exerciiu 7.11 esti d irul de numere din progresi geometri
2

8 16

32

64

128

256

512

1024

...

sunt numere letor generteF

Exerciiu 7.12 n o(il l serviiului de muln (rm timpul mediu de rspuns l un pel 112
este de 20 de minuteF hintre tote pelurile primite n 2008D se lege o seleie ntmpltore de 300 de
peluri l 112D dintre reD pentru 178 dintre este timpul de rspuns depit 20 de minuteD restul
(ind su est vloreF lend de l est seleieD putem (rm su in(rm delri o(iluluic
@ = 0.05A

Exerciiu 7.13 (de vericare a normalitii) e onsider rteristi X e reprezint nlime rE


ilor @n entimetriA dintrEo numit regiune unei riF E fut o seleie de volum n = 200D ir dtele
de seleie u fost grupte n elul UFPSF e ere s se veri(e normlitte lui X
@A

utiliznd testul de onordn 2 D u nivelul de semni(ie = 0.05Y

@A

utiliznd testul de onordn uolmogorovEmirnovD u nivelul de semni(ie = 0.05F


gls
ni

(, 165]

(165, 170]

(170, 175]

(175, 180]

(180, 185]

(185, 190]

(190, 195]

(195, 200]

(200, +)

12

23

31

43

35

27

17

Tabela 7.25: Frecvena nlimii brbailor dintr-o anumit regiune.

Exerciiu 7.14 ntrEun or AD 325 de louitori din 1500 interogi delr nu dein un omputerF
ntrEun lt orD B D 412 din 1800 delr eli luruF se testeze d propori de louitori re nu
dein un omputer este eei n mele oreF @ = 0.05A pem presupunere numrul etenilor
dintrEun or e nu dein nu omputer re o reprtiie uniform ontinuF

Exerciiu 7.15 y numit (rm dorete s ngjeze personl msulin i feminin respetnd riteriul
eglitii n drepturi pentru mele sexeF tiind sexele ultimelor 50 de persone ngjte sunt dup
um urmez

MFFMMFMFMFMFMMFFFMMMFMFMFMFMFMMMFFMFMFFFMFMFMFMMMFMF
s se determine d ngjrile n est (rm u rter preferenil pentru o numit tegorie de sexe
@diD s se veri(e d prii de M su de F n irul de mi sus este letorieAF e v lu = 0.05F

Exerciiu 7.16 evem urmtore seleie letore de volum n = 10X


0.621; 0.503; 0.203; 0.477; 0.710; 0.581; 0.329; 0.480; 0.554; 0.382.

229

7.9. Exerciii propuse

esti l nivelul de semni(ie = 0.05 d selei provine dintrEo reprtiie uniform ontinu U(0, 1)F
eprezenti gr( funi de reprtiie empiri e orespunde seleieiF

Exerciiu 7.17 y seleie de volum n = 50 este folosit pentru veri( urmtore ipotez
(H0 ) :

= 15

vsF

(H1 ) :

= 15,

l nivelul de semni(ie = 0.05F heterminiX vlore ritiD regiune ritiD vlore sttistiii
pentru selei dt i onluzi testriiD pentru

(a)

x = 17.5 i s = 4.5 @ este neunosutAY

(b)

x = 17.5 i = 4F

Exerciiu 7.18 n sondj eletorl gsit 273 din 500 intervievi intenionez s voteze u ndiE
dtul X pentru preedinieF esti @l nivelul de semni(ie = 0.05A ipotez

(H0 ) :

p = 0.5

vsF

(H1 ) :

p = 0.5,

unde p este propori dintre votni e intenionez s voteze u ndidtul X F polosii P vlore
pentru reliz testulF

Exerciiu 7.19 ntrEun sondj de opinieD 5 ri i 5 femei u fost ntrete d urmres meiuri de
fotl l n mod regultF oi rtii i dor dou femei u rspuns (rmtivD eilli spunnd
nuF se testeze l nivelul de semni(ie = 0.05 d diferen este semni(tiv din punt de vedere
sttisti @iFeFD d femeile se uit l fotl l ot l ot u riiAF

Exerciiu 7.20 rmrim preul X l eluii rtiol n 20 mgzineD lese l ntmplreF eeste suntX
9.6
9.9

9.9
9.8

10.3
10.1

10.0
10.4

10.5
9.7 9.9 10.2 10.0
9.9 10.2 10.3 10.1 10.0

10.4
9.7

gonsiderm preul estui rtiol urmez o reprtiie gussinF


@iA e pote dmite ipotez E(X) = 10.0D l nivelul de semni(ie = 0.05c
@iiA e pote dmite ipotez D2 (X) = 0.2D l nivelul de semni(ie = 0.05c

Exerciiu 7.21 snformiile din telul de mi jos sunt dte despre dou seleii independente e u fost
extrse din dou populii sttistieF
elei

olumul seleiei

medi de seleie

devii stndrd de seleie

50

9.75

1.5

75

9.5

0.95

e erX
@A istimi puntul i printrEun intervl de nredere @ = 0.01A vlore 1 2 Y
@A esti @ = 0.01A ipotez

(H0 ) :

1 = 2

vsF

(H1 ) :

1 = 2

230

Capitolul 7. Vericarea ipotezelor statistice

Exerciiu 7.22 @RA resupunem propori indivizilor prinnd l un dintre ele ptru grupe de
snge este dt deX q 2 , p2 + 2 p q, r2 + 2 q, r, 2 p rD unde p + q + r = 1F n urm unor teste l re u
prtiipt 450 de personeD sEu oinut urmtorele rezultteX
qrup de snge

AB

preven

83

217

82

68

eri(iD l nivelul de semni(ie = 0.05D omptiilitte dtelor u rezulttul teoretiD n re

p = q = 0.4 i r = 0.2F

Exerciiu 7.23 esti normlitte dtelor din elul IFP l nivelul de semni(ie = 0.1F
Exerciiu 7.24 e prezie reprtii literelor re pr el mi des n lim englez r ( urmtoreX
viter

preven

16

17

17

21

29

eest semni( urmtoreX de (ere dt nd ele 5 litere pr ntrEun textD n 16% dintre zuri
pre liter OD n 21% dintre zuri pre liter T etF presupunem un riptologist nlizez un
text i numr priiile elor 5 litereF eest gsit urmtore distriuieX
viter

preven

18

14

18

19

31

polosind testul 2 de onordnD s se veri(e d este priii sunt n not disordnt u predii
iniilF

Exerciiu 7.25 ntrEun sondj de opinieD o seleie de studeni de mele sexe u fost rugi sEi expun
prere n legtur u triul prtenerilor n omun ninte de storieF ezulttele sunt ele din telul
urmtorX

@Y
@
it

pro

ontr

34

12

ft

39

21

snvestigi d exist diferene semni(tive de opinie ntre iei i fete referitor l triul n omun
ninte de storieF e v onsider = 0.05F

Exerciiu 7.26 entru o seleie de persone de mele sexe sE determint grdul de folosin l minilor
l sriereF ezulttele sunt ele din telul urmtorX

@Y
@
it
ft

drepti

stngi

midextru

43

12

36

se determineD l un nivel e semni(ie = 0.05D d folosire minilor l sris este semni(tiv diferit
l iei f de feteF

Exerciiu 7.27 y seleie de 700 de slrii pe or din omni rt medi slriului pe or este
x = 11.42RON i s = 9.3F utem deideD pe z estui sondjD medi slriului pe or esteD de fptD
> 9.78ROND vlore stilit de guvernul romnc e v folosi = 0.05F

Capitolul

Corelaie i regresie
8.1 Introducere
sn est pitol vom disut msuri i tehnii de determinre legturii ntre dou su mi multe vriile
letoreF entru leturi suplimentreD se pot onsult mterilele IQD IRD ISF
rimele metode utilizte n studiul reliilor dintre dou su mi multe vriile u prut de l neputul
seolului l sEleD n lurrile lui vegendre1 i quss2 D n e privete metod elor mi mii ptrte
pentru proximre oritelor strelor n jurul oreluiF n lt mre om de tiin l timpuluiD prnis
qlton3 D studit grdul de semnre ntre opii i priniD tt l omeniD t i l plnteD oservnd
nlime medie desendenilor este legt linir de nlime sendenilorF iste primul re utilizt
oneptele de corelaie i regresie @

@ltFA regressio E ntorereAF estfelD desoperit din prini

ror nlime este mi mi det medi oletivitii provin opii u o nlime superior lor i vieE
versF estfelD onluziont D nlime opiilor e provin din prini nli tinde s 4regreseze4 spre
nlime medie populieiF hin lurrile lui qlton sE inspirt un student deEl suD url ersonD re
ontinut ideile lui qlton i introdus oe(ientul @empiriA de orelie e i port numeleF eest
oe(ient fost prim msur importnt introdus e unti( tri legturii dintre dou vriile le
unei populii sttistieF
n ingredient fundmentl n studiul estor dou onepte este digrm prin punteD Enumit scatter

plotF n proleme de regresie n re pre o singur vriil rspuns i o singur vriil oservtD
digrm stter plot @rspuns vsF preditorA este puntul de plere pentru studiul regrsieiF y digrm

scatter plot r treui reprezentt pentru orie prolem de nliz regresionlD deoree est ne v
d o prim idee despre e tip de regresie vom folosiF n exemplu de stfel de digrm este reprezentt
n pigur VFID n re m reprezentt oe(ientul de inteligen @sA 200 de perehi soEsoieF piere
ruiuli din digrm reprezint sEul pentru o perehe soEsoieF

Adrien-Marie Legendre (1752 1833), matematician francez


Johann Carl Friedrich Gauss (1777 1855), matematician i zician german
3
Sir Francis Galton (1822 1911), om de tiin britanic
2

231

232

Capitolul 8. Corelaie i regresie

Figura 8.1: Scatter plot pentru IQ n familie.

8.2 Corelaie
8.2.1 Corelaie i coecient de corelaie
Corelaia este un termen sttisti folosit pentru de(ni interdependen su legtur ntre dou su mi
multe vriile letoreF otodtD oreli este i o metod sttisti de desriere i nliz legturilor
de tip sttisti ntre dou su mi multe vriileF
h X, Y sunt dou vriile letore e dmit medieD tuni corelaia su covariana @teoretiA dintre

X i Y se de(nete prinX
ov(X, Y ) = E [(X E(X)) (Y E(Y ))] = E(X Y ) E(X) E(Y ).

Observaia 8.1 @iA hin punt de vedere teoretiD d X i Y sunt vriile letore independenteD
tuni ov(X, Y ) = 0F
eipro nu esteD n generlD devrtF he exempluD d X U(1, 1) i Y = X 2 D tuni ov(X, Y ) =

0D ns X i Y sunt dependenteF @se pote veri(D de semeneD E(X Y ) = E(X) E(Y ))F
@iiA n zul n re X i Y suntD n plusD vriile letore norml reprtizteD tuni independen vriE
ilelor letore X i Y este ehivlent u ov(X, Y ) = 0F

y relaie liniar ntre dou vriile este e relie e pote ( reprezentt el mi ine printrEo linieF
goreli detetez dor dependene linire ntre dou vriile letoreF utem ve o corelaie pozitivD
nsemnnd X i Y res su desres mpreunD su o corelaie negativD nsemnnd X i Y se modi(
n direii opuseF
y msur oreliei dintre dou vriile este oe(ientul de orelieF eest este forte utilizt n
tiine (ind o msur dependenei linire ntre dou vriileF hin punt de vedere teoretiD de(nim

233

8.2. Corelaie
coecientul de corelaie dou vriile letore X i Y
X,Y =

ov(X, Y )
= ov(X, Y ),
X Y

unde X i Y sunt vriilele letore stndrdizte ir X = E(X X)2

1/2

i Y = E(Y Y )2

1/2

sunt deviiile stndrd orespunztore vriilelor letore X D respetiv Y F roprietile oe(ientului


de orelie sunt prezentte n seiune PFIIF
n prtiD pentru stili d exist su nu vreo legtur ntre dou vriile letoreD se f oservii
supr estorD urmnd poi unti( reli dintre oserviiF
pie (xk , yk )D k {1, 2, . . . , n} un set de dte idimensionleD e reprezint oservii supr vetorului
letor (X, Y )F y msur legturii dintre {xk }k i {yk }k este coecientul de corelaie empiric introdus
de uF erson @n litertur de speilitte mi este unosut i su denumire de coecientul rAX
n

(xk x)(yk y)
r

k=1

=
n

(xk x)2

(yk y)2

k=1

@VFIA

k=1

ove (x, y)
,
sX sY

@VFPA

unde
ove (x, y) =

1
n1

(xk x)(yk y),

sX =

k=1

1
n1

(xk x)2 ,
k=1

sY =

1
n1

(yk y)2
k=1

sunt covariana empiricD i deviiile stndrd empirie pentru X i Y F


pre exempluD pentru seleiile

x = [0.49
y = [1.31

-0.45
1.20

0.39
-2.58

0.05
-2.09

-0.49
0.39

0.24
-0.86

0.72
-1.23

0.15
0.13 -1.01];
2.64 -0.90 -1.22];

oe(ientul r l lui erson este

r = 0.0905.
esemeni oe(ientului de orelie teoretiD X,Y D oe(ientul r l lui erson i vlori dor n intervlul

[1, 1]F gzurile limit pentru r sunt r = 1 su r = 1D zuri n re putem trge onluzi vriilele
X i Y sunt pozitivD respetivD negativA perfect corelate @vezi pigur VFPAF entru vlori le lui r ntre
1 i 1D nu putem vori de grdul de orelre ntre X i Y fr efetu un test sttisti supr vlorii
oe(ientulul teoreti de orelieD F he multe ori nsD putem (rm vem o orelie pozitiv d

r este propit de vlore 1 @eFgFD r = 0.85D z n re norul de dte re pnt sendentA i vem o
orelie negtiv d r este propit de vlore 1 @eFgFD r = 0.98D z n re norul de dte re pnt
desendentAF
ezulttul r = 0.0905 de mi sus r pute suger fptul ele dou seleii u fost oinute independent
un f de ellt @iFeFD = 0AD fpt e v treui on(rmt folosind un test sttisti n re testm ipotez

234

Capitolul 8. Corelaie i regresie

nul = 0D u ipotez lterntiv = 0F

Figura 8.2: Coecient de corelaie.

8.2.2 Test statistic pentru coecientul de corelaie


resupunem vem un set de dte idimensionle (xk , yk )D k {1, 2, . . . , n} supr vriilelor letore

X, Y D i m lult rD oinnd o vlore r0 propit de 0F lend dor de l est informieD nu


putem extrpol i deide grdul de orelre ntre X i Y F entru estD vom onstrui un test sttistiD
re v deide d vlore rel lui r este 0 su semni(tiv diferit de 0F
gonsiderm ipotez nul

(H0 )

@vriilele letore nu sunt orelteA

X,Y = 0

vsF ipotez lterntiv

(H1 )

@vriilele letore sunt orelteA

X,Y = 0

elegem un nivel de semni(ie << 1 @eFgFD = 0.05A i onsiderm sttisti

T =r

n2
1 r2

t(n 2).

glulez vlore sttistiii T pentru r = r0 @o notm u T0 A iD de semeneD lulm until t1 ; n2 D


2
de ordin 1

reprtiiei t u (n 2) grde de liertteF

heizi (nl este urmtoreX

|T0 | < t1 ; n2
2

, tuni ipotez (H0 ) este eptt;

|T0 | t1 ; n2
2

, tuni ipotez (H0 ) este respins.

8.2. Corelaie

235

Observaia 8.2 @iA goe(ientul lui ersonD rD este un numr dimensionl e stilete dor d exist
o legtur linir ntre dou seturi de dte sttistieF otodtD n de(nire estul oe(ient se presupune
dtele sttistie urmez o reprtiie normlF he multe oriD n prtiD dor oe(ientul r sigur
nu pote ( edi(tor supr triei legturii ntre dou seturi de dte sttistieD hir pote gener
informii flse n zul n re ele dou seturi dte nu depind linir unul de ellltF he eeD i lti
oe(ieni sunt lui n onsiderieD um r (X

r2 D coecientul de determinare @nott n ttisti prin R2 AD re stilete re este proentul din


vrii unei dintre dtele sttistie e determin @su expliA pe elellte dteF he exempluD un
oe(ient de determinre R2 = 0.42 semni( fptul vriil independent expli dor 42% din
vrii vriilei dependenteF n ttistiD est oe(ient este de(nit n mi multe moduri @vezi
i @VFPSAAD unele nu tomi ntrEun mod ehivlentY

coecientul lui Spearman4 D coecientul lui Kendall5 etF @este nu presupun dtele sttistie
sunt normleA
@iiA e pote testD de semeneD ipotez nul

(H0 ) :

X, Y = 0 , u 0 = 0,

ns est nu este forte des ntlnit n prtiF


@iiiA goreli dou vriile letore nu impli o uzreF gu lte uvinteD exist o orelie ntre
vrst i nlime l opiiD ns niiun dintre este nu o uzez pe elltF goreli pote ( lut
n evident pentru o posiil relie uzlD ns nu este determinnt i nu pote preiz reli uzlD
d est existF
@ivA olumul seleiei este un ftor forte importnt n testre ipotezei dou vriile letore
sunt neorelteF pre exempluD o relie pote ( puterni @vnd un r nu forte prope de 0AD ns nu
semni(tivD d vlore lui n nu este su(ient de mreF snversD o relie pote ( sl @un r prope
de 0AD dr semni(tivF
rmtorul exemplu pote ( edi(torF

Exemplu 8.3 presupunem dorim s stilim d exist vreo legtur ntre vrst unei persone i
oe(ientul su de inteligenF gulegem stfel dou seturi de dtele supr estor rteristiiD de volum

n = 10D i s presupunem m gsit un oe(ient de orelie empiri r = 0.62F e ereX


@A iste est legtur puternic
@A iste est legtur semni(tivc

Soluie:

@A glulm oe(ientul de determinreD R2 D i gsim R2 = 0.3844F est semni( fptul

dor 38.44% din vrii oe(ientului de inteligen este explit de vrstF


@A eplim testul nterior l un nivel de semni(ie = 0.05F ttisti onsidert v ve 8 grde de
liertteD T0 = 0.62

8
0.3844

= 2.2351 < 2.3060 = t0.975; 8 D de unde onluzionm ipotez nul = 0 este

dmis @iFeFD nu sunt dovezi pentru ipotez s pote ( respins l est nivel de semni(ieAF
4
5

Charles Edward Spearman (1863 1945), psiholog britanic


Sir Maurice George Kendall (1907 1983), statistician britanic

236

Capitolul 8. Corelaie i regresie

8.2.3 Coecientul de corelaie Spearman


n zul dtelor littiveD unde nu se pot soi vlori numerie pentru rteristi de interesD oe(ientul
de orelie erson nu mi pote ( lultF entru este dteD este util de lult coecientul de

corelaie SpearmanD su coecientul de corelaie al rangurilorF eest oe(ient pote ( lult tt pentru
dte littiveD t i pentru dte ntittiveF entru lul est oe(ientD (erui triut su (erei
vlori rteristiii i se desemnez un rngF goe(ientul de orelie permn este oe(ientul de
orelie erson pentru este rnguriF
n generlD d (xi , yi )i=1, n este un set de dte idimensionleD reprezentnd rngurile orespunztore
vriilei eretteD i notm u S oe(ientul de orelie permnD tuni
n

(xk x)(yk y)
rS = rD1, D2 =

k=1

@VFQA

(xk x)2
k=1

(yk y)2
k=1

v fel i oe(ientul lui ersonD oe(ientul permn i vlori rele n intervlul [1, 1]Y vlore 1
nsemnnd orelie pozitiv perfet rngurilorD ir vlore 1 nsemnnd orelie negtiv perfet
rngurilorF
n zul n re vem n perehi de oserviiD tuni formul lterntiv pentru lului lui rS esteX
n

d2
i

6
rS = 1

i=1

n(n2 1)

@VFRA

unde di = xi yi D iFeFD diferen dintre rngurile orespunztore pentru pozii iF

Exemplu 8.4 hoi degusttori de vinuri @denumii D1 i D2A u fost rugi s testeze 9 soiuri de vin i
s le lseze n ordine preferinelorF notm mostrele testte u AD B D C D DD E D F i GF referinele
estor sunt ele din elul VFID n ordine desrestore preferinelorF elul VFP onine rngurile
preferinelor elor doi degusttoriD ir pigur VFQ reprezint gr( rngurile @digrm scatter plotAF

Mostra A B C D E F G H I
D1
E B A G C H F D I
D2
B E C G A H D I F
Tabela 8.1: Preferinele degusttorilor de vin.

wostr
e
f
g
h
i
p
q
r
s

rng D1
Q
P
S
V
I
U
R
T
W

rng D2
S
I
Q
U
P
W
R
T
V

Tabela 8.2: Tabel cu rangurile preferinelor.


hin digrm scatter plot se oserv o orelie pozitiv ntre rnguriD ee e impli o orere onE
ordn ntre preferinele elor doi degusttoriF goe(ientul de orelie permn v triui o vlore
numeri estei onordneD est (ind rS = 0.8667F ixist zuri @n speil pentru dte ntittiveA

237

8.2. Corelaie

Figura 8.3: Scatter plot pentru ranguri.

nd vlorile rteristiii se repetD nt pentru vlori egle desemnm eli rngF n este zuri
nu mi putem utiliz formul @VFRA pentru lulul oe(ientului permnD i v treui s utilizm formul
@VFQA @vezi exemplul urmtorAF

Exemplu 8.5 htele din elul VFQ reprezint numrul de idente rutiere @AA i numrul de deese
@DA nregistrte ntrEun numit orD n primele 6 luni le nuluiF ngurile orespunztore vlorilor sunt
prezentte n elul VFRF htele u fost introduse n tel n ordine invers numrului de identeF he
nott D deoree numrul de deese nregistrte n lun wi este egl u numrul de deese din eprilieD
rngul pentru (ere dintre ele dou luni este medi elor dou poziii n re sEr )F polosind formul
@VFQAD lulm oe(ientul de orelie permnF eest este rS = 0.8117F

Luna Ian. Feb. Mar. Apr. Mai Iun.


A
D

27
8

24
6

15
5

11
3

17
3

12
2

Tabela 8.3: Evenimente rutiere n primele 6 luni.

vun
snF
peF
wi
wrF
sunF
eprF

A
27
24
17
15
12
11

rng A
6
5
4
3
2
1

D
8
6
3
5
2
3

rng D
6
5
2+3
2 = 2.5
4
1
2+3
2 = 2.5

Tabela 8.4: Tabel cu rangurile pentru accidente.

8.2.4 Autocorelaie
ermenul de autocorelaie pre des n proesre semnlelorD n speil n studiul seriilor de timpiF eutoE
oreli desrie fenomenul prin re erore prut l proximre ntrEo numit period de timp este
orelt u erore de proximre prut ntrEo lt period de timpF h periodele de timp sunt
onseutiveD tuni vorim despre utoorelie de ordinul ntiF h erorile onseutive sunt propite
vloriD tuni spunem vem o utoorelie pozitiv @eFgFD pro(t ntrEo lun este urmt de pro(t n
lun imedit urmtoreAF entru vlori le erorilor suesive mriD vem o utoorelie negtiv @eFgFD
pro(t ntrEo lun este urmt de de(it n lun imedit urmtoreAF rezen utooreliei de ordinul

238

Capitolul 8. Corelaie i regresie

nti pote ( testt folosind statistica Durbin6 -Watson7 F ntrEo serie de timpiD s notm u et erore de
soit u oservi l momentul tF gonsiderm sttisti
n

(et et1 )2
d=

k=2

e2
t
k=1

lorile ritie @dm minime i dM mximeA le estei sttistii pentru nivelele de semni(ie = 0.05
i = 0.01 sunt telteF heizi unei utoorelii de ordinul ntiD pozitiv su negtivD se i pe z
vlorii lui d pentru seri de timpi dt i le vlorilor ritie dm i dM F
he exempluD pentru testre utoorelrii pozitive de ordinul ntiD d vlore lult pentru d
stisfe d < dm D tuni ipotez existenei unei utoorelii de ordinul nti se eptD ir pentru d > dM
nu exist evidene su(iente pentru utoorelie de ordinul ntiF n zul n re dn d dM D nu putem
trge niio onluzie reltiv l utooreli de ordinul ntiF

8.3 Regresie
8.3.1 Punerea problemei
egresi este o metod sttisti utilizt pentru desriere nturii reliei ntre vriileF he fptD regresi
stilete modul prin re o vriil depinde de lt vriilD su su lte vriileF Analiza regresional
uprinde tehnii de modelre i nliz reliei dintre o vriil dependent @vriil rspunsA i
un su mi multe vriile independenteF he semeneD rspunde l ntreri legte de predii vlorilor
viitore le vriilei rspuns pornind de l o vriil dt su mi multeF n unele zuri se pote preiz
re dintre vriilele de plere sunt importnte n preziere vriilei rspunsF e numete variabil

independent o vriil e pote ( mnipult @numit i vriil preditorD stimul su omndtAD ir


o variabil dependent @su variabila prezisA este vriil re dorim s o preziemD di o vriil
rei rezultt depinde de oserviile fute supr vriilelor independenteF lum exemplul unei utii
negre @black boxA @vezi pigur VFRAF n est utie intr @sunt nregistrteA informiile x1 , x2 , . . . , xm D
re sunt prelurte @n timpul prelurrii pr numii prmetriD 1 , 2 , . . . , k AD ir rezulttul (nl este
nregistrt ntrEo singur vriil rspunsD y F he exempluD se dorete se stili o relie ntre vlore
pensiei @y A n funie de numrul de ni luri @x1 A i slriul vut deElungul rierei @x2 AF riilele
independente sunt msurte extD fr eroriF n timpul prelurrii dtelor su dup est pot pr
distorsiuni n sistemD de re putem ine ont d introduem un prmetru e s unti(e erore e
pote pre l oservre vriilei y F e stilete stfel o legtur ntre o vriil dependentD y D
i un su mi multe vriile independenteD x1 , x2 , . . . , xm D reD n ele mi multe zuriD re form
mtemti generl

y = f (x1 , x2 , . . . , xm ; 1 , 2 , . . . , k ) + ,

@VFSA

unde 1 , 2 , . . . , k sunt prmetri reli neunosui a priori @denumii parametri de regresieA i este o
perturie letoreF n ele mi multe pliiiD este o erore de msurD onsidert modelt printrEo
vriil letore norml de medie zeroF puni f se numete funcie de regresieF h est nu este
6
7

James Durbin, (1923 ), statistician i econometrist britanic


Georey Stuart Watson, (1921 1998), statistician australian

8.3. Regresie

239

unosut a prioriD tuni pote ( greu de determint ir utiliztorul nlizei regresionle v treui s o
intuis su s o proximeze utiliznd metode de tip trial and error @prin nerriAF h vem dor
on vriil independent @un singur xAD tuni spunem vem o regresie simplF Regresia multipl fe
referire l situi n re vem multe vriile independenteF

Figura 8.4: Black box.


h oservre vriilei dependente sEr fe fr vreo eroreD tuni reli @VFSA r deveni @zul idelAX

y = f (x1 , x2 , . . . .., xm ; 1 , 2 , . . . , k ).

@VFTA

porm vetoril dependenei @VFSA esteX

y = f (x; ) + .

@VFUA

entru o nliz omplet regresiei @VFSAD v treui s intuim form funiei f i poi s determinm
@proximmA vlorile prmetrilor de regresieF n est sopD un experimentlist v fe un numr su(ient
de oservii @experimente sttistieAD n urm ror v proxim este vloriF h notm u n numrul
de experimente efetuteD tuni le putem ontiliz pe este n urmtorul sistem stohsti de euiiX

yi = f (x, ) + i ,

i = 1, 2, . . . , n.

@VFVA

n ipoteze uzuleD erorile i sunt vriile letore identi reprtizte N (0, )D independente stohsti
dou te dou @ > 0AF estfelD sistemul @VFVA u n euii stohstie lgerie re neunosutele {j }j
i F
n zul n re numul de experimente este mi mi det numrul prmetrilor e treuie proximi
r
@n < k AD tuni nu vem su(iente informii pentru determin proximrileF h n = k D tuni
prolem se redue l rezolv n euii u n neunosuteF n el deEl treile z posiilD n > k D tuni
vem un sistem u nedeterminteF
n funie de form funiei de regresie f D putem veX

regresie liniar simplD n zul n re vem dor o vriil independent i


f (x; ) = 0 + 1 x.
regresie liniar multiplD d
f (x; ) = 0 + 1 x1 + 2 x2 + + m xm .

240

Capitolul 8. Corelaie i regresie


regresie ptratic multipl @u dou vriileAD d
f (x; ) = 0 + 1 x1 + 2 x2 + 11 x2 + 12 x1 x2 + 22 x2 .
1
2
regresie polinomialD d
f (x; ) = 0 + 1 x + 2 x2 + 3 x3 + + k xk .
om ve regresie ptratic pentru k = 2D regresie cubic pentru k = 3 etF

regresie exponenialD nd
f (x; ) = 0 e1 x .
regresie logaritmicD d
f (x; ) = 0 log1 x.
he remrt fptul primele ptru modele sunt linire n prmetriD pe nd ultimele dou nu sunt linire
n prmetriF wodelele determinte de este funii se vor numi modele de regresie @ureD suprfee etAF
n drul nlizei regresionleD se unos dtele de intrreD {xi }i D i utm s estimm prmetrii de
regresie {j }j i devii stndrd erorilorD F h funi de regresie f este unosut @intuitAD
tuni metode sttistie folosite pentru estimre neunosutelor suntX metoda verosimilitii maximeD

metoda celor mai mici ptrate i metoda lui BayesF h f este neunosutD metode e du l estimre
neunosutelor suntX metoda celor mai mici ptrate su metoda minimaxF

8.3.2 Regresie liniar simpl


iste el mi simplu tip de regresieD n re vem o singur vriil independentD xD i vriil dependent

y F presupunem ni se d fmili de dte idimensionle {(xi , yi )}i=1, n F eprezentm gr( este


dte ntrEun sistem x0y @de exempluD vezi pigur VFS (a)A i oservm o dependen prope linir lui

y de xF h vlore oe(ientului de orelie linirD rD este prope de 1 su 1 @indind o orelie


linir strnsAD tuni se pune prolem stilirii unei relii numerie exte ntre x i y de form

y = 0 + 1 x.

@VFWA

y stfel de drept o vom numi dreapta de regresie a lui y n raport cu xF entru dtele de mi susD m
reprezent est drept n pigur VFS (b)F

Exemplu 8.6 e hotrti s umperi min fvoritD e se vinde um l preul de 12500EURF v


semnre ontrtului de vnzreEumprreD plteti sum iniil de 10000RON i poi rte lunre de

850ROND timp de 5 niF h notm u X numrul lunilor pn l ultim rt i u Y sum totl pltit
pe minD tuni ntre X i Y exist reliX

Y = 10000 + 850 X.
n est exempluD reli ntre X i Y este un perfet linirF y relie perfet linir ntre dtele
idimensionle {(xi , yi )}i=1, n reprezentte n pigur VFS r nsemn tote este sEr ) pe drept

241

8.3. Regresie

Figura 8.5: Aproximarea unui nor de date prin dreapta de regresie.

de regresieD ee e nu se ntmplF he ele mi multe oriD dtele rele nu urmez o stfel de relie
perfet @spre exempluD rt lunr pote ( un vriilD n funie de rt de shim EUR-RONAD z n
re prmetrii din dependen linir treuie ( estimiF

edrD v treui s inem ont i de eventulele perturii din sistemF utem presupune stfel
dependen lui y de x este de form

y = 0 + 1 x + ,

@VFIHA

u o vriil letore reprtit N (0, )F


lend de l {xi , yi }i D elul nostru este s gsim o drept e se propie el mi mult @ntrEun sens ine
preiztA de este dte sttistieF gu lte uvinteD v treui s estimm vlorile prmetrilor de regresie

0 i 1 F roedm dup um urmezF


nlouind dtele idimensionle n @VFIHAD vem urmtorul sistemX

yi = 0 + 1 xi + i ,

i = 1, n,

@VFIIA

unde

i N (0, ), i i i sunt independente stohsti.


heoree

i = yi (0 + 1 xi ),

i = 1, n,

putem interpret i (ind erorile de proximre vlorilor oservte @yi A u ele prezise de drept de
regresie @di de vlorile 0 + 1 xi AF
innd ont i N (0, ) i 0 , 1 sunt vlori deterministeD din @VFIIA rezult X

yi N (0 + 1 xi , ),

pentru (ere i,

242

Capitolul 8. Corelaie i regresie

de undeD proilitte ntrEo singur msurtore xi s oinem rspunsul yi este

Pi =

1
(y 0 1 xi )2
exp i
2 2
2

heoree {i }i sunt independente stohstiD proilitte n ele n oservii independente s oinem


vetorul de vlori (y1 , y2 , , . . . , yn ) este @funi de verosimilitteAX
n

L(0 , 1 , ) =

(yi 0 1 xi )2
1
exp
2 2
n (2)n/2

Pi =
i=1

evem de estimt urmtorele ntitiX 0 , 1 i F entru estD vom folosi metoda verosimilitii

maximeF rmrim s gsim ele vlori le prmetrilor 0 , 1 i re mximizez funi de verosimilE


itteF edrD prolem de mximizre este urmtoreX

max L(0 , 1 , ).

0 , 1 ,

gondiiile de extrem suntX

L
0

L
1

1
2 2

(yi 0 1 xi )

1
2 2

0;

i=1
n

xi (yi 0 1 xi )

0;

i=1

n
1
+ 2

(yi 0 1 xi )2

0.

i=1

ezolvnd primele dou euii n rport u 0 i 1 D oinem estimiileX

sxy
s2
x

1 =

@VFIPA

0 = y 1 x,

undeD

x=

1
n

xi ,
i=1

y=

1
n

yi ,

s2 =
x

i=1

1
n1

(xi x)2 ,

sxy =

i=1

1
n1

(xi x)(yi y).


i=1

estfelD gsim drept de regresie lui y n rport u x este proximt de dreptX

sxy
x,
s2
x

@VFIQA

sxy
(x x).
s2
x

@VFIRA

y = y 1 x +
suD ltfel srisD

y=y+

hin ultim ondiie de extremD gsim o estimie pentru dispersi 2 esteX

2 =

1
n

(yi 0 1 xi )2 .
i=1

@VFISA

8.3. Regresie

243

Figura 8.6: Estimarea dreptei de regresie.

nsD estimi pentru 2 dt prin formul @VFISA este un deplstF n prtiD n loul estei estimii
se utilizez urmtore estimie nedeplstX

2 =

1
n2

(yi 0 1 xi )2 .

@VFITA

i=1

Observaia 8.7 @IA erminologieX


dreapta de regresieD y = 0 + 1 x D este drept e determin dependen linir lui y de vlorile
lui xD pentru ntreg populie de dteY

dreapta de tare @(tting lineAD y = 0 + 1 xD este drept re se propie el mi mult @n sensul


metodei elor mi mii ptrteA de dtele experimentle @de seleieA {xi , yi }i F eest drept este
o proximre dreptei de regresieY

lorile yi se numes valori observateD ir vlorile yi = 0 + 1 xi , i = 1, n se numes valori prezise


@i = 1, nAY

vlorile i = yi yi se numes reziduuriF n reziduu msor devii unui un punt oservt de l


vlore prezis de estimre dreptei de regresie @drept de (treAY
n

suma ptratelor erorilorD

2 D se notez de oiei prin SSE @sum of squared errorsAY


i
i=1

eroarea medie ptratic su rezidual este

SSE
D nott MSE @mean squared errorAY
n2

rdin ptrt MSE se numete eroarea standard a regresieiY


se pote demonstr
2
SSE
= (n 2) 2 2 (n 2).
2

244

Capitolul 8. Corelaie i regresie


u utorul estei relii se pot gsi intervle de nredere pentru vlore rel lui 2 F
n formul @VFITAD (n 2) reprezint numrul grdelor de liertte le vriilei SSEF

@PA istimi dispersiei este o msur grdului de mprtiere puntelor (x, y) n jurul dreptei de
regresieF wi suliniem fptul vlorile din formulele @VFIPA i @VFITA sunt dor estimii le prmetrilor
neunosuiD i nu vlorile lor exteF pormul pentru 1 mi pote ( sris su formX

1 = xy

s2
y
.
s2
x

@QA h devii stndrd r ( unosut a prioriD tuni putem estim prmetrii 0 i 1 n urmtorul
modF istimm eti doi prmetri prin ele vlori e relizez minimumul sumei ptrtelor erorilor

SSEF om ve stfel prolem de minimizre @metoda celor mai mici ptrateAX


n

(yi 0 1 xi )2 .

min

0 , 1

i=1

xotnd u F (0 , 1 ) =

(yi 0 1 xi )2 D ondiiile de extrem suntX


i=1
n

F
0

= 2

F
1

= 2

(yi 0 1 xi )

0;

i=1
n

xi (yi 0 1 xi )

0.

i=1

ezolvnd est sistem de euii lgerie n rport u 0 i 1 D gsim soluiile 0 iD respetivD 1 de


mi susF eest dovedete D n zul n re erorile sunt identi norml reprtizte i independente
stohstiD metod verosimilitii mxime esteD n fptD totun u metod elor mi mii ptrteF

8.3.3 Caracteristici ale parametrilor de regresie


istimiile pentru prmetrii de regresie 0 i 1 depind de oserviile folositeF entru deide d
vlorile lulte pe z dtelor experimentle {xi , yi }i pot ( onsiderte vlorile potrivite pentru ntreg
populieD se vor utiliz testri sttistieF wi josD vom onstrui teste sttistie u privire l testre
vlorilor milor prmetriD 0 i 1 D ns el mi uzul test este testul pentru veri(re vlorii pntei
dreptei de regresieD 1 F
wi ntiD vom lul medi i dispersi pentru (ere dintre 1 i 0 F
evem suesivD

E(1 ) = E

sxy
s2
x

(xi x)(yi y)

i=1
.
= E
n

2
(xi x)
i=1

eiiD xi sunt vlori deterministeD ir yi vriile letoreF heoree

1
y = 0 + 1 x +
n

i ,
i=1

245

8.3. Regresie
oinem E(y) = 0 + 1 xF nsD

E(yi y) = 0 + 1 xi (0 + 1 x) = 1 (x1 x),


edrD

(xi x)E[yi y]
E(1 ) =

i.

i=1

i=1
n

(xi x)

(xi x)2

= 1 .
2

(xi x)

i=1

i=1

entru 0 vemX

E(0 ) = E(y) x E(1 ) = 0 + 1 x x1 = 0 .


rin urmreD tt 0 D t i 1 D sunt stimtori nedeplsi pentru 0 iD respetivD 1 F

glulm um dispersiile D2 1 i D2 0 F evemX

D 2 1

(xi x)2 D2 (yi )

(xi x)yi

2 i=1
=
=D n

(xi x)2

i=1
2

(xi x)2

i=1

2 s2
2
x
= 2.
s4
sx
x

@VFIUA

i=1

tiliznd urmtore proprietteD

D2 (X + Y ) = D2 (X) + 2 ov(X, Y ) + D2 (Y ),
putem srieX

D2 0 = D2 (y 1 x) = D2 (y) 2 x ov(y, 1 ) + x2 D2 1 .
hrD

D2 (y) = D2

1
n

i=1

1
2
n 2 =
n2
n

ov y, 1

ov
n

(xi x)(0 + 1 xi + i )

i , i=1

i=1

2
(xi x)
n

i=1
n

1
ov
n

i ,
i=1

i=1
n

(xi x)i

(xi x)2

i=1

@VFIVA

246

Capitolul 8. Corelaie i regresie


=

ov

n
2

i=1

(xi x)

(xi x)i

i ,
i=1

i=1
n

(xi x) 2
=

i=1
n

= 0.
(xi x)

i=1

nlouind n @VFIVAD gsim

D 2 0 =

2
2
+
= 2
2
sx
n

x2
1
+ 2
n sx

@VFIWA

innd ont estimtorii 0 i 1 sunt nedeplsiD de reliile @VFIWA i @VFIUAD i de estimtorul 2 pentru

2 D se pote demonstr X
0 0

1
n

x2
s2
x

@VFPHA

t(n 2)

1 1

sx

@VFPIA

t(n 2).

eiiD m nott prin ntitteX

1
n2

1
2

(yi 0 1 xi )2

i=1

utem folosi este sttistii pentru determin intervle de nredere pentru 0 i 1 F n intervl de
nredere pentru 0 l nivelul de semni(ie esteX

0 t1 ; n2
2

1
x2
+ 2,
n sx

1
x2
+
.
n s2
x

0 + t1 ; n2
2

@VFPPA

n intervl de nredere pentru 1 l nivelul de semni(ie esteX

1 t1 ; n2
2

,
sx

1 + t1 ; n2
2

.
sx

@VFPQA

Observaia 8.8 @IA n generlD dispersi 2 erorilor de regresie nu este unosut a prioriF n zul n
re est este unosutD tuni n lo de @VFPHA i @VFPIA m veX

0 0

1
n

x2
s2
x

N (0, 1),

1 1

sx

N (0, 1).

@VFPRA

n est zD intervlele de nredere pentru 0 i 1 vor ( similre u ele din reliile @VFPPA i @VFPQAD u
diferen t1 ; n2 este nlouit prin z1 F yriumD pentru n su(ient de mreD vlorile t1 ; n2 i
2
2
2

z1 sunt forte propiteF


2

247

8.3. Regresie
@PA goe(ientul de determinre R2 @= r2 A se pote lul i folosind urmtore formulX

R2 = 1
unde

s2 =
y/x

1
n1

s2
y/x

@VFPSA

s2
y

(yi 0 1 xi )2 ,

s2 =
y

i=1

1
n1

(yi y)2 .
i=1

n nliz regresionlD oe(ientul R este folosit pentru determin t de ine pote ( onstruit o
2

vlore prezis pe z vlorilor independenteF

8.3.4 Test statistic pentru 1


wi jos prezentm testul e veri( d 1 i o vlore dt 10 su nuD l un nivel de semni(ie F
hispersi erorilor de regresie este neunosutF
estm

(H0 ) :

versus

1 = 10

(H1 ) :

1 = 10 .

gonsiderm sttisti

T =

1 1

sx

re urmez reprtii t(n 2)F itpele testului sunt urmtoreleX

glulm vlore riti


T0 =
glulm until de ordin 1

1 10

sx

pentru reprtii t u (n 2) grde de liertteD t1 ; n2 Y


2

h
|T0 | < t1 ; n2 ,
2

tuni eptm ipotez (H0 );

|T0 | t1 ; n2 ,
2

tuni eptm ipotez (H1 );

Observaia 8.9 @IA y ipotez lterntiv pote ( onsidert i un dintre urmtoreleX


(H1 )s :

1 < 10 ,

(H1 )d :

1 > 10 .

@PA h 10 = 0D tuni ipotez lterntiv 1 = 0 este ipotez ntre x i y exist o dependen linirF

8.3.5 Test statistic pentru 0

wi jos prezentm testul e veri( d 0 i o vlore dt 0 su nuD l un nivel de semni(ie F

hispersi erorilor de regresie este neunosutF


estm

(H0 ) :

0 = 0

versus

(H1 ) :

0 = 0 .

248

Capitolul 8. Corelaie i regresie

gonsiderm sttisti

0 0

T =

1
n

x2
s2
x

t(n 2),

re urmez reprtii t(n 2)F itpele testului sunt urmtoreleX

glulm vlore riti

0 0

T0 =

glulm until de ordin 1

1
n

x2
s2
x

t(n 2).

pentru reprtii t u (n 2) grde de liertteD t1 ; n2 Y


2

h
|T0 | < t1 ; n2 ,
2

tuni eptm ipotez (H0 );

|T0 | t1 ; n2 ,
2

tuni eptm ipotez (H1 );

Observaia 8.10 he semeneD teste unilterle pot ( onsiderte i n zul testrii vlorii lui 0 F
n zul n re 2 este unosut a priori tuniD grie reliilor @VFPRAD putem utiliz testul Z pentru
testre ipotezelor de mi susD tt pentru 0 D t i pentru 1 F

8.3.6 Predicie prin regresie


n numite zuriD putem folosi regresi n predii unor vlori le vriilei dependenteF he exempluD
putem prezie tempertur ntrEun numit or plend de l oserviile temperturilor din orele nveE
inteF egresi pote ( utilizt pentru prediie dup um urmezF presupunem dtele pe re le
deinemD {(xi , yi }i=1, n D pot ( modelte de o drept de regresie de form @VFWAF ht (ind o vlore xp e
nu se ) printre vlorile xi D dr este o vlore uprins ntre vlorile extreme le vriilei independenteD

xmin i xmax D dorim s preziem vlore rspunsD


yp = 0 + 1 xp + p .
h 0 i 1 sunt estimiile pentru prmetrii de regresie 0 D respetivD 1 D tuni valoarea prezis pentru

yp pentru un xp oservt v ( o vlore yp de pe drept de regresieD dt de formulX


@VFPTA

yp = 0 + 1 xp .
n intervl de nredere pentru y pentru un xp dt @xp [xmin , xmax ]A esteX

yp t1 ; n2
2

1+

1
(xp x)2
+
,
n
s2
x

yp + t1 ; n2
2

1+

1
(xp x)2
+
.
n
s2
x

@VFPUA

Observaia 8.11 @IA he nott fptul este forte importnt xp s (e o vlore uprins ntre xmin
i xmax F h se folosete formul @VFPTA i pentru vlori le lui x n fr rngeEului vlorilor preditor
pentru xD tuni erorile de de proximre lui y u yp pot ( forte mriF he exempluD d n pigur

?? @A m folosi dor primele 9 pentru onstrui un model de regresieD tuni est pote ( utilizt dor
pentru predii vlorilor vriilei y pentru orie x n est rngeD iFeF x [0, 10]F hD folosind drept

249

8.3. Regresie

de regresie g sit nteriorD m ner o prediie pentru x = 19D tuni m gsi y(19) 10D pe nd
vlore oservt este y(19) 6.5D ee e determin o erore forte mre de proximreF wi multD
d inem ont i de urmtorele vlori oservte @vezi pigur VFU@AAD tuni ur de regresie pre s nu
(e o dreptF entru estimre de vlori viitore le vriilei dependente folosind vlori le vriilelor

Figura 8.7: Predicie prin extrapolare.


independente e ies din rnge se utilizez termenul de prognoz @en., forecastingAF eest este folosit
des n nliz seriitor de timpF
@PA lore prezis yp nu este un stilit u extitteD i este dor o medie teptt vlorilor
lui y pentru un xp dtF n zul n re R2 = 1 @oe(ientul de determinreAD tuni vlore pentru

y v ( prezis fr eroreD deoree tote puntele se ) pe drept de regresieF n generlD puntele


idimensionle (x, y) se ) mprtite n jurul dreptei de regresieF
@QA lore yp este determint dor pe z seleiei dte de eeD pentru veri( d est vlore
pote ( extrpolt l ntreg populie este nevoie de inferen sttisti @test sttistiAF rezentmD n
ontinureD un test e ompr vlore yp u o onstnt dtF
estm

(H0 )

versus

yp = y0

(H1 )

yp = y0 .

itpele testului sunt urmtoreleX

istimm yp utiliznd formul @VFPTAF


gonsiderm sttisti
T =

glulez vlore T0 =

yp y

yp y0
1
MSE( n

(xp x)2
2)
i (xi x)

1
MSE( n +

(xp x)2
2)
i (xi x)

t(n 2);

h
|T0 | < t1 ; n2 ,
2

tuni eptm ipotez (H0 );

250

Capitolul 8. Corelaie i regresie


h

|T0 | t1 ; n2 ,
2

tuni eptm ipotez (H1 );

Exerciiu 8.1 n intervl de nredere pentru yp l nivelul de semni(ie 1 esteX


yp S t1 ; n2 ,
2

yp + S t1 ; n2 ,
2

@VFPVA

unde

S=

MSE 1 +

(xp x)2
1
.
+
2
n
i (xi x)

(de vericat!)

Observaia 8.12 n um m vzut um putem estim vlore lui y folosind pe xF n unele zuriD
putem invers rolurile lui x i y D i putem vori stfel de regresie a lui x n raport cu y F he exempluD n
ixeriiul VFIU m pute estim notele l roiliti n funie de notele l ttistiF pormulele oinute
pentru drept de regresie lui x n rport u y sunt ele gsite nterior pentru drept de regresie lui

y n rport u xD n re rolurile lui x i y sunt inversteF

8.3.7 Regresie liniar multipl


egresie linir multipl este regresi e impli el puin dou vriile independente @el puin dou
seturi de oserviiAF he exempluD n studiul demogr(eiD dorim s estimm spern de vi populiei
innd ont de vriileleX vrstD sexD dietD exeriii (zieD motenire genetiF
onsiderm vriil de ieire y din @VFSA depinde de m vriile de intrre independenteD x1 , x2 , . . . , xm F
ifetum n msurtoriD n urm ror oinem rezultteleX xi1 , xi2 , . . . , xim , yi ; i = 1, . . . , nF rmrim
s estimm vriil y u jutorul unei ominii de form

y = 0 + 1 x1 + 2 x2 + + m xm .

@VFPWA

n generlD nu se f reprezentri gr(e n zul regresiilor multipleD det pote dor pentru dou vriile
independenteD z n re m ve o reprezentre plnului de regresieF snterpretm oe(ienii i stfelX
pentru un i (xtD i este vlore teptt modi(rii n y pentru o modi(re lui xi u o unitteD
innd tote elellte vriile independente nemodi(teF
y lege de dependen lui y de vriilele x1 , x2 , . . . , xm de est form se numete regresie liniar

multiplF viniritte ii se refer l dependen linir n prmetrii de regresieD i nu n vriilele


independenteF edrD pot pre i termeni de ordin superior n vriilele de intrreD dr nu putem ve
termeni de ordin superior n vreun oe(ient F he exempluD pot pre termeni de genul xk su xi xj xk D
i
z n re renotm eti termeni i ei vor deveni vriile independente noiF polosind este noi notiiD
revenim l un model de form @VFPWAD u un numr suplimentr de vriile independenteF
h inem ont de dtele experimentle i de fptul D inevitilD pr erori de proximreD tuni putem
srie sistemul de euiiX

yi = 0 + 1 xi1 + 2 xi2 + + m xim + i , i = 1, 2, . . . , n.

@VFQHA

251

8.3. Regresie
spotezele supr erorilor de proximre i suntX

i N (0, 2 ), i = 1, 2, . . . , n, i i sunt independente stohsti.

@VFQIA

utem resrie @VFQHA su form mtrielD


@VFQPA

Y = X + ,
unde

y1

Y =

y2
F
F
F

yn

1
F
F
F

x11

x12

...

x1m

1
X=
...

x21

x22

...

...

...

...

xn1

xn2

...

x2m
,

xnm

2
F
F
F

entru estim oe(ienii de regresie 0 , 1 , 2 , . . . , m D utilizm metod verosimilitii mximeF em


vzut nterior est metod este ehivlent u metod elor mi mii ptrteD d i sunt n
@VFQIAF estfelD vem de rezolvt prolem de minimX
n
2

[yi (0 + 1 xi1 + 2 xi2 + + m xim )]

min

@VFQQA

i=1

eest prolem de optim pote ( resris n form mtriel stfelX


n

(Y X)T (Y X).

min

i=1

h notm prin
n
2

[yi (0 + 1 xi1 + 2 xi2 + + m xim )] = (Y X)T (Y X),

G(0 , 1 , 2 , . . . , m ) =
i=1

tuni ondiiile de extrem suntX

G
= 2 X T Y + 2 X T X = 0,
j

j = 0, 1, 2, . . . , m.

h mtrie X r ve rngul m+1D tuni sistemul de euii linire n neunosutele 0 , 1 , 2 , . . . , m


re soluie uniD

= XT X

@VFQRA

X T y.

hispersi estui estimtor este

D2 () = 2 X T X

@VFQSA

egresi lui y f de vriilele x1 , x2 , . . . , xm este

y = 0 + 1 x 1 + 2 x 2 + + m x m ,

@VFQTA

252

Capitolul 8. Corelaie i regresie

unde i sunt ele din @VFQRAF utem srie est relie i su form mtrielX

y = X .
entru (ere vlore oservtD yi D putem determin reziduul

i = yi yi

(i = 1, 2, . . . , n).

eziduul i este diferen dintre vlore oservt yi i e estimt prin regresie linir multiplD yi F
he ndt e estimrile pentru prmetrii i sunt gsiteD putem estim devii stndrd erorilor fute
folosind metod elor mi mii ptrteD numeX

1
nm1

[yi (0 + 1 xi1 + 2 xi2 + + m xim )]2 .


i=1

g i n zul simplu linirD putem oine prediii pentru vriil dependent y D stfel

yi = 0 + 1 xi1 + 2 xi2 + + m xim .

Exemplu 8.13 presupunem modelul de regresie oinut pentru preul y l unui numit produs
limentrD n funie de vriiile preurilor trei ingrediente este dt deX

y = 1.5 0.3 x1 + 0.7 x2 + 0.5 x3 .


h vlorile pentru (ere vriil independent suntX

x1 = 15,

x2 = 5,

x3 = 10,

tuni vlore prezis pentru preul produsului studit este

y = 1.5 0.3 15 + 0.7 5 + 0.5 10 = 5.5.

goe(ientul de determinre pentru regresi linir multipl esteX


n

(yi yi )2
R2 = 1

i=1
n

[0, 1].
(yi y)2

i=1

emintim i = yi yi D i putem fe nlouire n formul lui R2 F eest oe(ient rt t de ine se


propie modelul ret de vlorile rele pentru vriil oservtF wi extD R2 reprezint propori din
vriil dependent e pote ( explit de regresi multiplF n lt oe(ient spei( pentru regresi
linir multipl @dei mi rr folositA este coecientul de determinare ajustat @su coecientul de multiplei

determinriAD de(nit prinX

n1
2
Rmod = 1 (1 R2 )
,
nm

253

8.3. Regresie

reprezentnd propori din vriil dependent e pote ( explit de regresi multipl estei f
de vriilele independenteD innd ont de numrul de vriile independente din modelF eest oe(ient
pote deveni i negtiv i este ntotdeun mi mi su egl u R2 F h m = 1D tuni oinem oe(ientul
de determinre R2 F
pr intr n detliiD mintim dor D l fel n zul regresiei linire simpleD se pot determin i pentru
regresi multipl intervle de nredere pentru (ere dintre prmetrii de regresie suD putem determin
@prin inferenA d vlorile prmetrilor de regresie pot ( extrpoli l ntreg populieF he semeneD
se pote test ipotez sttisti vriil dependent i o vlore dtF entru mi multe detliiD putei
onsult IQF

Observaia 8.14 emni(i oe(ienilor de regresie re nu sunt lieri este urmtoreX pentru un
indie i (xtD oe(ientul de regresie orespunztor vriilei independente xi reprezint vrii n vriE
il independent pentru o vriie de o unitte n vriil independent xi F

Corelaii pariale
Corelaiile pariale se foloses n regresi linir multiplD tuni nd dorim s studiem in)uen seprt
unei vriile independente supr vriilei dependenteF eeste msor oreli net ntre vriil
dependent @vriil rspunsA i o vriil independent @o vriil oservtAD dup exuldere elorE
llte vriile independente din modelF om onsider ii dor zul dou vriile independenteD X1
i X2 F xotm u Y vriil dependent i prin rXY oe(ientul de orelie empiri @ersonA dintre
vFF X i Y F he(nim oe(ienii rY X1 X2 @oe(ientul pril de orelie dintre Y i X1 D dup exludere
in)uenei lui X2 supr lui Y A i rY X2 X1 @oe(ientul pril de orelie dintre Y i X2 D dup exludere
in)uenei lui X1 supr lui Y A prinX

rY X1 X2 =

rY,X1 rY,X2 rX1 ,X2


2
1 rY,X2

2
1 rX1 ,X2

rY X2 X1 =

rY,X2 rY,X1 rX1 ,X2


2
1 rY,X1

2
1 rX1 ,X2

@VFQUA

v fel i oe(ienii de orelie oinuiiD eti oe(iei pot lu vlori dor n intervlul [1, 1]F h

rY X1 X2 = 1D tuni vem o orelie linir perfet pozitiv ntre Y i X1 D dup exludere in)uenei
lui X2 D ir pentru rY X1 X2 = 1D tuni vem o orelie linir perfet negtiv ntre Y i X1 D dup
exludere in)uenei lui X2 F n exemplu n est sens este ixeriiul VFIWF

8.3.8 Regresie neliniar


egresi nelinir se refer l zul n re dependen vriilei dependente y de vriilele independente
din vetorul x este de form

y = f (x; ),

@VFQVA

ir f este o funie nelinir n prmetrii de regresie = (0 , 1 , 2 , . . . , m )F eest tip de regresie este


des ntlnit n proleme din fiologi wtemtiF

Exemplu 8.15 gonform teoriei wihelis8 Ewenten9 din fiohimieD vitez de reie ntrEo reie tlE
8
9

Leonor Michaelis, 1975 1949, biochimist german


Maud Leonora Menten, 1879 1960, cercettor n Medicin, Canada, doctorand al Leonorei Michaelis

254

Capitolul 8. Corelaie i regresie

izt de enzime este dt de formul

v=

k2 [E0 ] [S]
,
KM + [S]

unde [E0 ] ste onentri totl de enzim @e o onstntAD [S] este onentri de sustrt din reieD

k2 este un prmetru de reie i KM este onstnt wihelisEwentenF h renotm


k2 [E0 ] = 0 ,

KM = 1 ,

putem resrie vitez stfelX

y=

v = y,

[S] = x,

0 x
.
1 + x

@VFQWA

eli @VFQWA este un exemplu de regresie nelinirF


he ndt e modelul nelinir de regresie fost formultD dtori sttistiinului este de estim prmetrii
de regresieF n zul exemplului de mi susD est pre ( ext ee e iEr dori iohimistulD tiinduE
se fptul prmetrii de reie sunt di(il de estimt n prtiF nsD tre sttistiinului este
mult ngreunt n zul regresiei nelinireD omprtiv u regresi linirF entru estim prmetrii de
regresie vem nevoie de ndejuns de multe dte experimentleD ee e este greu de oinut n prtiD
innd ont de fptul este dte treuie s (e tote oinute n ext elei ondiiiF n numite
zuriD se pot oper linirizri le funiei nelinire f n jurul unor vlori dte pentru prmetrii de regresieD
stfel redund modelul de regresie nelinir l unul proximtivD de regresie linirF

8.4 Corelaie i regresie n Matlab


n e privete nliz oreliei i regresieiD

Matlab re implementte urmtorele funii uzuleX scatterD

covD corrcoefD regressD polyfitD polyvalF


pie X i Y doi vetori de eli tipF etuniX

scatter(X,Y) reprezint gr( vlorile lui Y vsF vlorile lui XY


R = corrcoef(X,Y) lulez oe(ientul de orelie ntre X i YF ezulttul este (t su formX

>> ans =

1.0000

1.0000

unde 1.0000 este oe(ientul de orelie dintre X i XD respetiv Y i YD ir este oe(ientul uttF

cov(X,Y) pentru mtrie de ovrin empiri dintre X i Y @formul @RFIAAY


puni cov(X,Y,1) este tot mtrie de ovrinD ns n est z formul folosit este @RFPAF

b = regress(Y,X) (ez estimre oe(ienilor pentru re Y = b X F eiiD X este o mtrie


n k i Y un vetor olon n 1F golonele vetorului X orespund oserviilor @iFeFD vriilelor
independenteAF
h X este un vetor olon de eei dimensiune u YD tuni b este dor un slrF
h X este mtrieD tuni putem folosi est omnd pentru estim oe(ienii de regresie
linir multiplF pre exempluD s presupunem se dorete estimre oe(ienilor de regresie
linir simplD iFeFD 0 i 1 pentru re y = 0 + 1 xD unde pentru (ere dintre x i y vem n
oserviiF n est zD k = 2F pie XD respetivD Y vetorii e onin este oserviiF gomnd

255

8.4. Corelaie i regresie n Matlab

Matlab re estimez ei doi oe(ieni este


B = regress(Y', [ones(n,1)'; X]')
gomnd furnizez proximri pentru prmetrii 0 i 1 e f urmtore proximre t mi
unX

y1

y2
F
F
F

1
F
F
F

yn

x1

x2

+ 1 F
F

xn
1

p = polyfit(X,Y,n) gsete oe(ienii unui polinom p(x) de grd n le rui vlori p(xi ) se propie
el mi mult de dtele oservte yi D n sensul elor mi mii ptrteF

Matlab v ( n est z un

vetor linie de lungime n + 1D oninnd oe(ienii polinomili n ordine desrestore puterilorF


pre exempluD d

p(x) = 0 + 1 x + 2 x2 + + n xn ,
tuni

Matlab v (
n , . . . , 1 , 0 .

Y = polyval(p,X) (ez vlorile unui polinom p(x) pentru vlorile din vetorul X F olinomul
p(x) este dt prin oe(ienii siD ordoni n ordine desres tore puterilorF he exempluD d
p(x) = 3x2 + 2x + 4 i dorim s evlum est polinom pentru trei vloriD 1, 5 i 7D tuni sriem n

MatlabX

p = [3 -2 4];

polyval(p,[-3 1 5])

oinnd rezulttulX

ans =
rmtorul od

37

69

Matlab reprezint o funie ret pentru nliz regresiei multipleD oferindD printre lte
MatlabA pentru lulul oE

vntjeD o lt vrint @pe lng funi regressD dej implementt n

e(ienilor de regresie multiplF xumele funiei este regresie i lulez oe(ienii de regresie @i AD
vlorile prezise @yi AD reziduurile @i A i oe(ientul de determinre @R2 AF

function [beta, rez, yprez, R2] = regresie(Y,X)


%%% Y este vectorul de raspunsuri (variabila dependenta)
%%% X este matricea ale carei coloane sunt variabilele independente
beta = inv(X'*X)*(X'*Y);
% coeficientii de regresie, i
yprez = X*beta;
% valori prezise, yi
rez = Y - yprez;
% reziduuri, i
R2 = corrcoef(Y,yprez).^2;
% coeficientul de determinare, R2

256

Capitolul 8. Corelaie i regresie

h se dorete dor lulul oe(ienilor de regresieD tuni rezulttul pelrii funiei regresie prin
omnd beta = regresie(Y,X) este eli u rezulttul omenzii

Matlab regress(Y,X)F

8.5 Exerciii rezolvate


Exerciiu 8.16 pie irul de dteX
x =
y =

0.3
3.52

0.8
4.53

1.2
5.58

1.6
6.62

2.1
8.27

2.4
10.18

2.7
11.80

se studieze existen unei dependene ntre x i y de form y = a eb x F

Soluie:

glulm ln y F yinemX

ln y =

1.2585

1.5107

1.7192

1.8901

2.1126

2.3204

2.4681

e oserv r = 0.9988 1 @oe(ientul de orelie ntre x i ln y AD de unde nuim e posiil s vem


o regresie linir ntre vriilele x i ln y F istimm oe(ienii de regresie i lui ln y f de x i gsimX

0 = 1.1074, 1 = 0.4980F eest pote ( relizt n


prin omnd

Matlab

regress(log(y), x)
edrD ln y = 0.4980 x + 1.1074D de unde y = e1.1074 e0.4980 x 3 ex/2 F n pigur VFV m reprezentt gr(
dtele oservte i proximrile lorF

Figura 8.8: Aproximarea datelor din Exerciiul 8.16

Exerciiu 8.17 e dorete s deid d exist vreo orelie ntre notele l exmenul de roiliti
i ele de l ttisti oinute de studenii unui n de studiuF n est sensD u fost oservte notele
oinute de 10 studeni l este dou disipline i u fost treute n elul VFS de mi josF e ereX

257

8.5. Exerciii rezolvate


@A tilii d exist o legtur puterni ntre este note @r i r2 AY

@A hetermini drept de regresie notelor de l ttisti n rport u notele l roiliti i deseniE


o n eli sistem de xe i notele oinute @scatter plotAF
@A esti d exist su nu vreo orelie ntre notele de l ttisti i roilitiF

tudent
roiliti
ttisti

e
82
84

f
36
42

g
72
50

h
58
64

i
70
68

p
48
54

q
44
46

r
94
80

s
60
60

t
40
32

Tabela 8.5: Notele la Statistic i Probabiliti.


Soluie:
n odul

@A glulm r u formul @VFIAF puni

Mtl pentru oe(ientul erson este corrcoefF

Matlab de mi jos lEm lult pe r folosind est funieD dr i n dou lte modlitiD

folosind formul @VFPA su sriind desfurt expresi lui rF


@A goe(ienii de regresie se pot oine n 3 moduriD (e folosind funi

Matlab polyfitD re relizez

(tre dtelor u un polinomD n zul linir (ind un polinom de form S(P ) = 0 + 1 P F y lt vrint
de lul oe(ienilor 0 i 1 este simpl implementre n
vrint este folosire funiei regress din

MatlabF

Matlab formulelor pentru etiF e trei

eprezentre gr( dtelor pote ( relizt folosind ori funi plotD ori funi 4stter4D mele
funii prede(nite din

MatlabF qr(ul este el din pigur VFWF

P = [82,36,72,58,70,48,44,94,60,40]; S = [84,42,50,64,68,54,46,80,40,32];
mp = mean(P); ms = mean(S);
%%%~~~~~~~~~~~~~~ Calculez coeficientul de corelatie empiric ~~~~~~~~~~~~~~~~~~~~~~~~~~
CC = corrcoef(P,S); r = CC(1,2)
%%%~~~~~~~~~~~~~~~~~~~~ Alte variante de calcul pentru r ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
% C = cov(P,S)/(std(P)*std(S)); r = C(1,2);
% r = sum((P-mp).*(S-ms))/sqrt(sum((P-mp).^2)*sum((S-ms).^2));
%%%~~~~~~~~~~~~~~~~~~~~~~~~ Calculez coeficientii de regresie ~~~~~~~~~~~~~~~~~~~~~~~
B = polyfit(P,S,1)
%%%~~~~~~~~~~~~~~~~~~~~ Alte variante de calcul pentru B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
% b1 = sum((P-mp).*(S-ms))/sum((P-mp).^2); b0 = ms - b1*mp;
% B = regress(S',[P;ones(10,1)']');
%%%~~~~~~~~~~~~~~~~ Scatter plot si dreapta de regresie ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
x=0:100; plot(P,S,'*',x,B(2) + B(1)*x,'r-')
% scatter{P,S)
% varianta pentru scatter plot
%%%~~~~~~~~~~~~~~~~~~~~~~~ Testul pentru = 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
alpha = 0.05; n = 10; T0 = r*sqrt((n-2)/(1-r^2)); quant = tinv(1-alpha/2,n-2);
if (abs(T0) < quant)
disp('P si S nu sunt corelate')
else
disp('P si S sunt corelate')
end

258

Capitolul 8. Corelaie i regresie

ulnd odul de mi susD oinemX

r =
0.8247

B =

P si S sunt corelate
0.7553

10.3816

Figura 8.9: Notele i dreapta de regresie.

Exerciiu 8.18 rognoz spune tempertur ntrEo numit zon muntos desrete u F 6 g
l (ere 1km tigt n nlimeF entru o veri(reD u fost msurte simultn temperturile n 10
loliti diferite din e zonD este (ind nregistrte n elul VFTF h tempertur se presupune

hi
Ti

500
15

1000
14

1500
11

2000
6

2500
1

3000
2

3500
0

4000
4

4500
8

5000
14

Tabela 8.6: Tabel cu temperaturi (Ti ) la diverse altitudini (hi ).


( o funie linir @regresie linirA de ltitudineD se ereX
@iA se estimeze prmetrii 0 i 1 Y
@iiA se testeze @ = 0.05A d prognoz din enun este devrt @iFeFD 1 = 0.006AY
@iiiA se gses un intervl de nredere pentru pnt dreptei de regresieD 1 Y
@ivA gt de un este proximre temperturii u o funie linir de ltitudinec
@vA istimi tempertur l ltitudine h = 2544F qsiiD de semeneD un intervl de nredere pentru
est temperturF

Soluie:

@iA istimm prmetrii neunosui folosind formulele @VFIPA su folosind funi

Matlab

polyfit @vezi odul de mi josAF


@iiA entru testre ipotezei nule (H0 ) : 1 = 0.006 utilizm testul din eiune VFQFQF
@iiiA n intervl de nredere pentru 1 se pote lul folosind formul @VFPQAF
@ivA entru deide t de un este proximreD lulm oe(ientul de determinreD R2 F eest este
R2 = 94.83D ee e nsemn tempertur rel este forte prope de e prognoztF

8.5. Exerciii rezolvate

259

@vA tilizm formulele @VFPTA i @VFPUAD pentru xp = 2544F @vezi rezulttele generte de odul de mi josA
godul

Matlab este urmtorulX

h = [500 1000 1500 2000 2500 3000 3500 4000 4500 5000];
T = [15 14 11 6 -1 2 0 -4 -8 -14]; mh = mean(h); mT = mean(T);
%%%~~~~~~ Calculez coeficientul de corelatie empiric si coeficientul de determinare ~~~
CC = corrcoef(h,T); r = CC(1,2)
R2 = r^2
%%%~~~~~~~~~~~~~~~~~~~ Calculez coeficientii de regresie ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
B = polyfit(h,T,1)
%%%~~~~~~~~~~~~~~~~~~~~ Alte variante de calcul pentru B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
% B = regress(T',[h;ones(10,1)']');
% b1 = sum((h-mh).*(T-mT))/sum((h-mh).^2); b0 = mT - b1*mh;
%%%~~~~~~~~~~~~~~~~~~~~ Scatter plot si dreapta de regresie ~~~~~~~~~~~~~~~~~~~~~~~~~
x=0:5600; plot(h,T,'*',x,B(2) + B(1)*x,'r-')
%%%~~~~~~
Testul pentru panta dreptei de regresieD (H0 ) : 1 = 0.006 ~~~~~~~~~~~~~~~~
alpha = 0.05; n = 10;
sigmahat = sqrt(sum((T-B(2) - B(1)*h).^2)/(n-2));
sigmax = std(h);
T0 = (B(1)+0.006)*sigmax/sigmahat; quant = tinv(1-alpha/2,n-2);
if (abs(T0) < quant)
disp('ipoteza (H0 ) se accepta')
else
disp('ipoteza (H0 ) se respinge')
end
%%%~~~~~~~~~~~~~~~
Interval de incredere pentru 1 ~~~~~~~~~~~~~~~~~~~~~~~
CI = [B(1) - quant*sigmahat/sigmax,\;B(1) + quant*sigmahat/sigmax]
hp = 2544; Tp = B(2) + B(1)*hp
CI_T = [Tp - quant*sigmahat*sqrt{1 + 1/n + (hp-mh)^2/sigmax^2}, ...
Tp + quant*sigmahat*sqrt{1 + 1/n + (hp-mh)^2/sigmax^2}]
ulnd odul de mi susD oinemX

r =
-0.9738

R2 =
94.83
Tp =
3.3610

B =
CI =
[-0.0061, 18.9333]
[-0.0096, -0.0026]
CI_T =
[-2.2335, 8.9555]

ipoteza nula se accepta

Exerciiu 8.19 elul VFU onine dte despre o seleie letore 10 slrii dintrEo numit friF
eeste dte suntX slriul net @n yxAD studii @n niA i vehime n mun @n niAF
@A e dorete se studi dependen slriului n funie de elellte dou rteristiiD printrEo regresie
linir multiplY

260

Capitolul 8. Corelaie i regresie

Figura 8.10: Diagrama de temperaturi n funcie de altitudine, i dreapta de regresie.


@A istimi slriul unui ngjt u 8 ni de studii i vehime n mun de 10 niY
2
@A gluli oe(ienii R2 i Rmod Y
@dA glulie oe(ienii de orelie prilD stilind re dintre vriilele Studii i Vechime re o

in)uen mi mre n stilire slriuluiD folosind modelul de regresie retF


engjt
lriul @yxA
tudii @niA
ehime @niA

M1
IISU
IP
T

M2
IHRW
W
Q

M3
IPQS
U
II

M4
IIUV
IH
W

M5
IIRS
W
R

M6
IQIH
IP
IQ

M7
IPPS
IP
IH

M8
IPTV
IH
IP

M9
IIWS
V
U

M10
IQRS
IP
IR

Tabela 8.7: Salariul n funcie de studii i vechime


@A rmtorul od lulez oe(ienii de regresie multiplF he remrt introduere

vetorului ones(1,10) re sop oinere termenului lier din regresi multipl @re v (D de fptD
oe(ientul lui 1AF

W
S
V
B

=
=
=
=

[1157 1049 1235 1178 1145 1310 1225


[12 9 7 10 9 12 12 10 8 12];
[6 3 11 9
4 13 10 12 7 14];
regress(W', [S; V; ones(1,10)]');

1268

1195 1345];

yinemX

B = 2.7453

21.1892

994.3887

estfelD ur de regresie multipl esteX

W = 994.3887 + 2.7453 S + 21.1892 V.

% W = Salariul
% S = studii
% V = vechimea

261

8.5. Exerciii rezolvate


@A lriul pentru S = 8 i V = 10 este estimt prinX

W (8, 10) = 994.3887 + 2.7453 8 + 21.1892 10 1228.


@A

2
i
R2 = 1

[yi (994.3887 + 2.7453 Si + 21.1892 Vi )]2

i=1

=1

i=1

= 0.9123.

(yi y)2

(Wi W )2

i=1

i=1

eest semni( fptul 91.23% din vrii totl n lriu este explit de regresi linir multipl
gsit mi susF
2
Rmod = 1 (1 R2 )

9
n1
= 1 (1 0.9996) = 0.9013.
nm
8

MatlabD
e2 = sum((W-(994.3887 + 2.7453* S + 21.1892*V)).^2);
R2 = 1 - e2/sum((W -mean(W)).^2);
n = 10; m = 2; R2mod = 1-(1-R2)*(n-1)/(n-m);

% reziduurile
% coeficientul R2
2
% coeficientul Rmod

@dA glulm mi nti oe(ienii de orelie dintre orire dou vriileF evemX

rW,S = 0.4002;

rW,V = 0.9536;

rS,V = 0.3660.

goe(ienii de orelie pril suntX

rW SV =

rW V S =

rW,S rW,V rS,V


2
1 rW,V

rW,V rW,S rS,V


2
1 rW,S

= 0.1826,

2
1 rS,V

= 0.9463.

2
1 rS,V

edrD oservm tt vehimeD t i nivelul de studiiD u o in)uen pozitiv supr slriuluiF otuiD
vehime re o in)uen mult mi mreD prope determinntD supr slriului det o re nivelul de
studiiF
n

MatlabD sriem stfelX

RWS = corrcoef(W,S); RWV = corrcoef(W,V); RSV = corrcoef(S,V); % matrici coef. corelatie


rWS = RWS(1,2); rWV = RWV(1,2); rSV = RSV(1,2);
% coef. de corelatie
rWSv = (rWS-rWV*rSV)/(sqrt(1-rWV^2)*sqrt(1-rSV^2));
% coeficientul RW SV

rWVs = (rWV-rWS*rSV)/(sqrt(1-rWS^2)*sqrt(1-rSV^2));
% coeficientul RW V S

Exerciiu 8.20 n model des utilizt n prmologie pentru studiul inetiii medimentelor u edre
ontrolt este modelul riguhiF entru un mediment )t ntrEun mediu @soluieA e i sigur o
dispersie omogenD se msor ntitte de sustn edt n funie de timpF h notm u q(t)

262

Capitolul 8. Corelaie i regresie

est funie de timpD tuni modelul riguhi prezie

q(t) = q0 + k

@VFRHA

t 0,

t,

unde q0 ntitte iniil de mediment din soluieD k este o onstnt de difuzie rteristi mediE
mentuluiF
n experimentlist studiz n lortor proprietile de edre le unui numit medimentF n est
sopD el ontilizez vlorile pentru vriil de edre @vlori msurte n proente din ntitte totlA
l 12 timpi @msuri n oreAD oinnd urmtorele dte experimentleX

10

11

12

q(t)

PTFRI

QSFVS

RSFRH

SRFTI

TIFIS

TWFQT

UTFSV

VPFRV

VUFQI

WPFHV

WTFVS

WVFPT

gerineX
@IA ejuti experimentlistul n deide d modelul riguhi este pliil n est zF
n zul n re modelul este pliilD re este grdul de propiere estui model de dtele oservtec
@est se pote oine lulnd oe(ientul de determinreD R2 AF
@PA istimi ntitte de mediment edt dup numi o jumtte de orD nott prin q(0.5)F
@QA esti

(H0 ) :

versus

q(0.5) = 17.5

(H1 ) :

q(0.5) = 17.5

l un nivel de semni(ie = 0.05F

Soluie:

@IA riil dependent este q D e depinde de vriil independent tF eli @VFRHA este

linir n funie de prmetriD dr nu este linir n tF entru simplitte lulelorD renotm prmetrii

i vriilele din model @0 = q0 , 1 = k, y = q i x = tAD i sriem

y = 0 + 1 x.
estfelD m juns l un model de regresie linir simpl n noile vriileF istimm oe(ienii de regresie 0
i 1 folosind dtele experimentleF utem fe est n mi dou moduriX ori estimm eti oe(ieni
folosind formulele @VFIPAD ori folosim funi polyfit din

0 = 3.4249

MatlabF n mele zuri gsim

1 = 29.7741.

estfelD d dorim s proximm dtele experimentle u modelul riguhiD oinem ur proximtiv


@vezi pigur VFII (a)AX

q(t) = 3.4249 + 29.7741


glulm oe(ientul lui erson r folosind funi

t.

Matlab corrcoefF

goe(ientul de determinre este

R = r = 0.9957 1D ee e semni( fptul putem folosi modelul riguhi pentru estimre ntitii
2

de mediment edteF

8.5. Exerciii rezolvate


@PA entru prediie utilizm formul

q(t0 ) = 0 + 1

t0 .

entru t0 = 0.5D vem

q(0.5) = 17.6286.

Figura 8.11: Regresie tip Higuchi


@QA polosim testul din seiune VFQFTF evem xp = 0.5, y0 = 17.5, MSE = 4.2045 i

T0 =

yp y0
1
MSE( n

(xp x)2
2)
i (xi x)

= 0.1095 < 2.2010 = t1 ; n2 .


2

utem stfel deide ipotez nul nu pote ( respinsF


rezentm mi jos odul

Matlab e neE jutt l rezolvre prolemeiF

263

264

Capitolul 8. Corelaie i regresie

clear all; clf;


% sterge variabilele si graficele deja existente
q=[0; 26.41; 35.85; 45.40; 54.61; 61.15; 69.36; 76.58; 82.48; 87.31; 92.08; 96.85; 98.26];
t = (0:12)'; x = sqrt(t); y = q; n = 13;
Beta = polyfit(x,q,1);
T = corrcoef(y,Beta(2) + Beta(1)*x);
R2 = T(1,2)^2;
subplot(1,2,1); plot(t,y,'*g-', t, Beta(2) + Beta(1)*x,'b-o');
xlabel('timp (h^{1/2})'); ylabel('Cedarea dozei (% w/w)');
title('Cedare in raport cu timpul')
subplot(1,2,2); plot(x,y,'-r*',sqrt(t),Beta(2) + Beta(1)*x,'b-o');
axis([0 3.5 0 100]);
xlabel('radacina patrata din timp (h^{1/2})'); ylabel('Cedarea dozei (% w/w)')
title('Cedare in modelul Higuchi')
disp('R2 = '); disp(R2)
% coeficientul de determinare
%%% ~~~~~~~~ Calculez coeficientii de corelatie folosind formulele ~~~~~~~~~~~~~~~~
sxy = sum((x-mean(x)).*(y-mean(y)))/(n-1); sx2 = sum((x-mean(x)).^2)/(n-1);
beta1 = sxy/sx2; beta0 = mean(y) - beta1*mean(x);
disp('hatq(0.5) = '); disp(Beta(2) + Beta(1)*sqrt(0.5))
% predictia
%%% ~~~~~~~~~~~~~~~~~~~~~ Testarea ipotezei (H0 ) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
xp = 0.5; yp = Beta(2) + Beta(1)*sqrt(0.5); alpha = 0.05
SSE = sum((y- Beta(2)-Beta(1)*x).^2); MSE = SSE/(n-2);
frac = (xp-mean(x))^2/sum((x-mean(x)).^2); T0 = (yp-17.5)/sqrt(MSE*(1/n+frac))
cuant = tinv(1-alpha/2,n-2);
if abs(T0) < cuant
disp('valoarea la t=0.5 este 17.5')
else
disp('valoarea la t=0.5 nu este 17.5')
end
ulnd odul de mi susD oinemX

R2 =
0.9957

beta1 =
29.7741
valoarea la t=0.5 este 17.5

beta0 =
-3.4249

hatq(0.5) =
17.6286

265

8.6. Concluzii

8.6 Concluzii
y digrm scatter plot este reprezentre prin punte n pln vlorilor idimensionle @independente
i dependenteA oservteF iste o unelt folositore n determinre reliilor ntre vriile @d sunt
pozitivD negtiv orelte su neorlteAD ns est reprezentre gr( nu ne d niiun indiiu ntittiv
supr nturii relieiD d est existF enliz oreliei dtelor este o tehni menit s deid d
dou vriile sunt legte ntre eleF goe(ientul de orelie r l lui erson este e mi simpl msur
ntittiv legturii ntre dou vriileF y vlore lui r propit de vlorile 1 su 1 nsemn
o legtur puterni ntre vriilele erette @legtur negtivD respetivD pozitivAF eest oe(ient
unti( dor legtur linir ntre vriile i nu pote determin d exist vreo ltfel de legturF
he semeneD unotere lui r nu pote determin d exist vreo reli de uzlitte ntre vriileD
n sensul nu putem prezie un dintre vriile pe z unoterii eleillteF entru o mi un idee
supr grdului legturii dintre dou vriileD n prti se utilizez oe(ientul de determinreD r2 F
hendt e m determint r pentru o numit seleieD ne punem ntrere d m pute extrpol
est rezultt i pentru ntreg populie @iFeFD pentru D oe(ientul de orelie l populieiAF entru
rezolv est prolemD v treui s utilizm un test sttisti pentru oe(ientul de orelieF
egresi este o metod sttisti e ne permite stilire unei relii funionle ntre dou vriileF riE
il su vriilele e sunt folosite n estimre se numes vriile independenteD ir vriil e urmez
( prezis se numete vriil dependentF estfelD u jutorul regresieiD putem s estimm vlore
unei numite vriile @numit vriil dependentAD folosinduEne de vlore ltei @su vlorile ltorA
vriile @numite vriile independenteAF h vem dor o vriil independentD tuni suntem n
zul regresiei simpleF entru mi multe vriile independenteD vorim despre regresie multiplF egresi
linir simpl presupune existen unei legturi proximtiv linire ntre vriil independent i e deE
pendentY n est zD n digrm scatter plot vlorile d pe o linie su sunt forte prope de estF
gu jutorul nlizei regresionle se oine o euie lgeri e de(nete vriil dependent o funie
de vlorile vriilelor independenteD de form y = f (x, )F eest euie onine numii prmetri
@prmetri de regresieD A e urmez ( estimi pe z seleiei dte @diD u jutorul dtelor

{xi , yi }i AF gu jutorul estimiilor pentru eti prmetriD onstruim modelul de regresieD y = f (x, )F

eest este ur e se propie el mi mult de norul de dte experimentleD n sensul sum sum
ptrtelor diferenelor dintre vlorile oservte i vlorile prezise de modelul de regresie este minimF otoE
dtD ne punem prolem d estimiile oinute pot ( extrpolte l ntreg populie de vlori pentru

xF entru rspunde l est ntrereD v treui s utilizm inferen sttisti @teste sttistieAF wi
multD u jutorul estor teste putem oine intervle de nredere pentru prmetrii eretiF gur
e proximez ur de regresie pote ( utilizt i n predii i prognoz dtei dependente n funie

pentru noi vlori le dtelor independente @eFgFD yp = f (xp , )D pentru un xp dtAF ett pentru orelieD

t i pentru regresieD exist funii spei(e implementte n

MatlabF

266

Capitolul 8. Corelaie i regresie

8.7 Exerciii propuse


Exerciiu 8.2 ypini generl este rt mxim tilor inimii unei personeD RD se pote determin
dup formul R = 0 + 1 V D unde V este vrst personeiD lult n niF gerettorii rdiologi (rm
eti oe(ieni r (X 0 = 220 i 1 = 1F entru o veri(re empiri estei (rmiiD sunt lese
l ntmplre 15 persone de diverse vrsteD re sunt supuse unui test pentru determinre rtei mxime
le tilor inimiiF eeste rezultte sunt ontilizte n elul VFVF
@A gluli oe(ientul de orelie erson dintre vrst i rt mxim tilor inimiiF gre este
semni(i estei vloric
@A hetermini drept de regresie lui R f de V i deseniEo n eli sistem de xe u dtele din
telF
@A esti ipotez (H0 ) : 1 = 1D vsF ipotez lterntiv (H1 ) : 1 = 1D l nivelul de semni(ie

= 0.05F
rst
t mx

15
207

23
186

25
187

35
180

17
200

34
175

54
169

50
183

45
156

42
183

19
199

42
174

20
198

39
183

37
178

Tabela 8.8: Tabel cu rata maxim a batilor inimii n funcie de vrst.

Exerciiu 8.3 hrept de regresie vriilei y f de vriil x este y = 2 x6F hetermini ondiiile
n re drept de regresie lui x f de y este x = 0.5 y + 3F

Exerciiu 8.4 elul VFW onine numrul de sene @AA l ttisti i notele orespunztore @N A
15 studeniF
@A gluli oe(ientul de orelie ersonF gre este semni(i estei vlori referitor l reli
dintre sene i notec
@A hetermini drept de regresie lui N f de A i deseniEo n eli sistem de xe u dtele din
telF
@A estiD l un nivel de semni(ie = 0.05D d exist dovezi su(iente pentru (rm ntre
numrul de sene i notele oinute exist o orelieF

A
N

3
9.00

1
9.50

4
8.75

12
4.75

11
5.50

3
8.50

5
6.75

2
8.25

9
5.50

6
6.75

4
8.00

6
7.75

7
6.00

6
7.00

14
3.50

Tabela 8.9: Tabel cu absene i note la Statistic.

Exerciiu 8.5 n telul VFIH dtele reprezint nlimile @H A i msele orporle @M A 10 fete dintrEo
ls unui lieuF untem interesi n preziere msei orporleD tiind nlime unei eleveF

H
M

179.6
61.2

166.8
48.2

163.1
46

180.0
64.4

158.4
46.3

166.5
54.7

165.8
51.4

168.1
55.3

175.9
65.3

160.7
47.9

Tabela 8.10: nalimea i masa corporal a 10 eleve dintr-o clas.


@A heseni digrm scatter plot lui H versus M F fznduEv pe est digrmD onsideri

267

8.7. Exerciii propuse


metod regresiei linire este potrivit n est zc

@A gluli estimii le prmetrilor @0 i 1 A de regresie linir i reprezenti gr( drept de


regresie linirF
@A yinei o estimre nedeplst pentru 2 F
@dA esti ipotez nul (H0 ) :

1 = 0.9F

Exerciiu 8.6 e msor vitez unei miniD v D n primele 10 seunde dup est neput s elE
erezeF eeste dte sunt nregistrte n telul VFIIF e ereX

t
v

0
0

1
3.1

2
6.9

3
9.9

4
12.7

5
16.1

6
19.8

7
21.2

8
22.8

9
24.3

10
25.9

Tabela 8.11: Viteza unei maini n primele 10 secunde dup plecarea de pe loc
@A heseni digrm scatter plotY
@A hetermini drept de regresie lui v f de tY
@A gluli oe(ientul de orelie empiri i omenti supr vliditii proximrii dtelor u drept
de regresieF

Exerciiu 8.7 qsii vlore de devr (erei dintre urmtorele propoziii i explii legere
futF
@A h r = 0.98 @oe(ientul lui ersonAD tuni exist o dependen linir ntre vriileF
@A h r = 0.03 @oe(ientul lui ersonAD tuni nu exist niio legtur ntre vriileF
@A h r = 1 @oe(ientul lui ersonAD tuni vriilele sunt proporionleF

Exerciiu 8.8 gluli drept de regresie lui y f de x pentru dtele din elul UFTD unde x
reprezint notele oinute de qrup wp 08 i x reprezint notele oinute de qrup wp 09F unt este
note puterni oreltec heseni digrm scatter plot pentru este dteF

Exerciiu 8.9 pie irul de dteX


u =
v =

1.0
1.5

1.5
4.5

2.0
7.5

2.5
12.5

3.0
17.5

3.5
24.5

4.0
32.5

se studieze existen unei dependene ntre u i v de form v = a u2 + bF

Exerciiu 8.10 n telul urmtorD se du te 5 vlori pentru dou vriile x i y D unde y este vriil
independentF hetermini o drept de regresie potrivit pentru lul

(i) vlore lui x nd y = 2.5Y


(ii) vlore lui y nd x = 50Y
(iii) utem prezie vlore lui y pentru x = 75c

x
y

46
1.7

55
2.1

41
1.5

58
2.9

53
1.9

268

Capitolul 8. Corelaie i regresie

Exerciiu 8.11 n student i u mprumut o rte de l iliote i oserv pgin de interes este
rupt pe louriF otuiD pote iti textul din pigur VFIPF e ere s se reonstruis psjul de text
@iFeFD determini y i drept de regresie lui x f de y AF he semeneD luli oe(ientul empiri de
orelie r i omenti supr proximrii dtelor de seleie prin dreptele de seleieF

Figura 8.12: Fragment incomplet dintr-un text

Exerciiu 8.12 e du urmtorele dteX


x
y

3
9

2
4

1
1

0
0

1
1

2
4

@A erti r = 0 @oe(ientul de orelie empiriAF


@A iste fptul x i y sunt legte prin reli y = x2 n ontrdiie u rezulttul de l puntul @A
@dtele sunt perfet neorelteAc
@A gluli oe(ientul de orelie permnF

Exerciiu 8.13 elul VFIP onine li(tivele oinute de un elev de ls s l ele 9 disiplineD n
(ere dintre ele dou semestreF se gses o msur legturii dintre ele dou seturi de li(tive
@eFgFD oe(ientul de orelie permnAF
hisipline
Sem. I
Sem. II

e
pf
f

f
pf
f

g
f
f

h
pf
pf

i
f
pf

p
f

q
f
f

s
pf
pf

Tabela 8.12: Calicativele din anul I de studiu

Glosar

mplitudineD WWD IIS


utoorelieD PQU
mp de proilitteD QQD QR
rteristiD IU
el mi puterni testD IUS
ls medinD IHP
ls modlD IHI
lopotul lui qussD SI
oe(ient de pltizreD IHI
oe(ient de simetrieD IHH
oe(ient de orelie empiriD WWD PQQ
oe(ient de orelie teoretiD RSD PQQ
oe(ientul de orelie permnD PQT
oe(ientul de determinreD PQS
oe(ientul de determinre justtD PSP
oletivitte normlD IIT

distriuie empiri de seleieD IW


e(ienD IQP
erore n medie ptrtiD IQH
estimieD IQH
estimtorD IPW
estimtor solut oretD IQI
estimtor onsistentD IQI
estimtor de verosimilitte mximD IQQ
estimtor e(ientD IQPD IQQ
estimtor prin metod momentelorD IQS
estimtor su(ientD IQQ
eveniment letorD QI
evenimente dependenteD RS
evenimente independenteD RS
experien letoreD QI

oletivitte sttistiD IU

fzD PPQ

onvergen n proilitteD ST

formul de trnsportD RI

onvergen FsFD ST

freven umultD PI

oreli empiriD WWD PQQ

freven solutD IWD QP

orelii prileD PSQ

freven reltivD IWD UUD IHH

oreli teoretiD RSD PQP

frontierele unei lseD PU

orpuri independenteD RT

funi rteristiD QW

untileD RP

funi de proilitte @de frevenAD RH

dte ontinueD IV
dte disreteD IV
densiti de frevenD PS
devii empiri stndrdD WW
dispersi de seleieD IIQ
dispersi empiriD WVD IIQ
dispersi teoretiD III
dispersi teoretiD RI
dispersie de seleie modi(tD IIQ

funi lui uolmogorovD IIS


funie de reprtiieD III
funie de reprtiie @umultAD QV
funie de reprtiie omplementrD QW
funie de reprtiie de seleieD IIR
funie de reprtiie empiriD WW
histogrmD PS
ineglitte lui geevD RR

269

informie pisherD IQP

skewnessD IHH

intervl de nredereD IQW

ttistiD IS

ipotez sttistiD IUID IUP

sttistiD IIH

kurtosisD IHI
lege sl numerelor mriD SU
lege tre numerelor mriD SU
medi de seleieD III
medi empiriD WUD III
medi teoretiD III
medi teoretiD RHD RI
metod elor mi mii ptrteD IQU
metod minimului lui 2 D IQV
metod wonte grloD UT
modulD RQ
momente de seleieD IIP
momente empirieD WV
momentele unei vFFD RP

sttisti testD IUP


sttistiD IIH
sttisti hurinEtsonD PQV
sttistii de ordineD IIS
stemEndElefD PP
tel de ontingenD PIQ
tlou de freveneD IW
teorem limit entrlD SWD VTD VU
test ilterlD IUR
test de onordnD PHP
test de independenD PIQ
test neprmetriD PPH
test prmetriD IUW
test sttistiD IUPD IURD IUT
test unilterl dreptD IUR

mulime orelinD QQ

test unilterl stngD IUR

nivel de semni(ieD IRHD IUP

testul ext l lui pisherD PIT

EvloreD IUQD IVH

wiD IQI

populie sttistiD IU
prediieD PRV
proilitteD QID QQ
proilitte de risD IRH
prognozD PRW

testre stohstiitiiD PPQ

vFF identi reprtizteD SU


vFF independenteD RU
vlore ritiD IUP
vlori de seleieD IIH

putere unui testD IUQ

vriil letoreD QT

reensmntD IUD WU

vriile letore de seleieD IIH

regiune ritiD IUP

verosimilitteD IQQD ITH

regresieD PQID PSRD PSU


regul elor 3 D RR
reprtii mediei de seleieD IIU
reprtii 2 D SQ
reprtii norml stndrdD SI
reprtii unei vFFD QV
risul ene(iruluiD IUQ
risul furnizoruluiD IUP
stter plotD PQI
seleieD IU
serie de timpD PI

vriil letore stndrdiztD RR

Bibliograe

I etru flgD Statistic. . . prin Matlab, res universitr lujenD glujExpoD 2002F
P hvid frinkD Statistics compendium, hvid frink & entus ulishing epD 2008F
Q hvid frinkD Statistics exercises, hvid frink & entus ulishing epD 2008F
R qheorghe giuuD irgil griuD Teoria estimaiei i vericarea ipotezelor statistice, iditur hidti
i edgogiD fuuretiD 1968F
S teve hosD tne willerD Statistics 1, gmridge niversity ressD gmridge 200F
T ty vF heoreD uenneth xF ferkD Modern Mathematical Statistics with Applications (with CD-ROM),
huxury ressD 2006D sfxX HSQRRHRUQIF
U oert F roggD ellen grigD toseph F wuenD Introduction to Mathematical Statistics, rentie
rllD Tth editionD 2004D sfxX 0130085073F
V wrius sosifesuD gosthe woineguD ldimir reiiD imilin rsinuD Mic enciclopedie de statis-

tic, iditur tiini( i enilopediD fuuretiD 1985F


W http://www.mathworks.com
IH qheorghe wihoD xF wiuD Teoria probabilitilor i statistica matematic, fuurestiD 1980F
II ilen xeniuD Lecii de statistic matematic, niversitte eFsFguzD ssiD 1976F
IP ytvin etruD Probabiliti i Statistica matematic - Computer Applications, siD 2000F
IQ nford eisergD Applied Linear Regression, iley series in roility nd ttistisD 3rd edFD 2005D
sfx 0471663794F
IR vrry tF tephensD Theory and problems of Beginning Statistics, hum9s yutline eriesD 2nd edFD
he wqrwErill gompniesD snFD 1998F
IS hominik lvtoreD herrik egleD Theory and problems of Statistics and Econometrics, hum9s
yutline eriesD 2nd edFD he wqrwErill gompniesD snFD 2002F
IT qor zkelyD Paradoxes in Probability Theory and Mathematical Statistics, @wthemtis nd its
epplitionsAD pringer erlgD 1987F
IU hvid illimsD Weighing the Odds: A Course in Probability and Statistics, gmridge niversity
ressD 2001F

271

You might also like