0% found this document useful (0 votes)
180 views

Stat Matlab PDF

This document provides an introduction to using Matlab. It discusses topics like launching and closing Matlab sessions, help commands, constants and variables, arithmetic expressions, assignment statements, input/output instructions, relational and logical operators, script files, two-dimensional and three-dimensional plotting commands, control flow statements like if/else, while loops and for loops, function definitions and calls, and commands for evaluating efficiency. It also provides overviews of probability theory, descriptive statistics, and other statistical concepts relevant for data analysis in Matlab.

Uploaded by

Maria Bothaza
Copyright
© © All Rights Reserved
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
180 views

Stat Matlab PDF

This document provides an introduction to using Matlab. It discusses topics like launching and closing Matlab sessions, help commands, constants and variables, arithmetic expressions, assignment statements, input/output instructions, relational and logical operators, script files, two-dimensional and three-dimensional plotting commands, control flow statements like if/else, while loops and for loops, function definitions and calls, and commands for evaluating efficiency. It also provides overviews of probability theory, descriptive statistics, and other statistical concepts relevant for data analysis in Matlab.

Uploaded by

Maria Bothaza
Copyright
© © All Rights Reserved
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 402

Cuprins

Prefata
1

vii

Introducere n Matlab
1.1 Gestionarea unei sesiuni Matlab . . . . . . . . . . . . . . . . . . .
1.1.1 Lansarea si nchiderea unei sesiuni Matlab . . . . . . . . .
1.1.2 Comenzi help . . . . . . . . . . . . . . . . . . . . . . . .
1.1.3 Comenzi sistem . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Constante. Variabile. Expresii aritmetice . . . . . . . . . . . . . . .
1.2.1 Constante . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Instructiunea format . . . . . . . . . . . . . . . . . . . .
1.2.3 Constante speciale . . . . . . . . . . . . . . . . . . . . . .
1.2.4 Variabile . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.5 Operatori aritmetici . . . . . . . . . . . . . . . . . . . . . .
1.2.6 Functii predefinite . . . . . . . . . . . . . . . . . . . . . .
1.2.7 Comenzi pentru gestiunea variabilelor si a spatiului de lucru
1.3 Instructiuni de atribuire . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Instructiuni de citire si scriere . . . . . . . . . . . . . . . . . . . . .
1.4.1 Instructiunea input . . . . . . . . . . . . . . . . . . . . .
1.4.2 Instructiunea ginput . . . . . . . . . . . . . . . . . . . .
1.4.3 Instructiunea fprintf . . . . . . . . . . . . . . . . . . .
1.5 Operatori relationali si operatori logici . . . . . . . . . . . . . . . .
1.5.1 Operatori relationali . . . . . . . . . . . . . . . . . . . . .
1.5.2 Operatori logici . . . . . . . . . . . . . . . . . . . . . . . .
1.6 Fisiere script (mfile) . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.1 Comenzi pentru gestionarea fisierelor . . . . . . . . . . . .
1.7 Grafica bidimensionala . . . . . . . . . . . . . . . . . . . . . . . .
1.7.1 Instructiunea plot . . . . . . . . . . . . . . . . . . . . . .
1.7.2 Comenzi si instructiuni de gestionare a graficelor . . . . . .
1.7.3 Instructiunile polar si ezpolar . . . . . . . . . . . . . .
i

1
2
2
2
4
4
5
5
6
7
8
9
10
12
13
13
13
13
14
14
14
15
17
17
17
22
25

ii

Cuprins
1.7.4 Instructiunea stairs . . . . . . . . . . . . . . . . . . .
1.7.5 Instructiunile bar si barh . . . . . . . . . . . . . . . . .
1.7.6 Instructiunea subplot . . . . . . . . . . . . . . . . . .
1.7.7 Instructiunea fplot . . . . . . . . . . . . . . . . . . . .
1.7.8 Instructiunea ezplot . . . . . . . . . . . . . . . . . . .
1.7.9 Instructiunea fill . . . . . . . . . . . . . . . . . . . . .
1.8 Instructiuni de ciclare si control . . . . . . . . . . . . . . . . . .
1.8.1 Instructiunea if . . . . . . . . . . . . . . . . . . . . . .
1.8.2 Instructiunea switch . . . . . . . . . . . . . . . . . . .
1.8.3 Instructiunea while . . . . . . . . . . . . . . . . . . . .
1.8.4 Instructiunea for . . . . . . . . . . . . . . . . . . . . .
1.9 Instructiuni de ntrerupere . . . . . . . . . . . . . . . . . . . . . .
1.9.1 Instructiunea try. . . catch . . . . . . . . . . . . . . . .
1.9.2 Instructiunea pause . . . . . . . . . . . . . . . . . . . .
1.9.3 Instructiunea return . . . . . . . . . . . . . . . . . . .
1.9.4 Instructiunea break . . . . . . . . . . . . . . . . . . . .
1.9.5 Instructiunea error . . . . . . . . . . . . . . . . . . . .
1.10 Functii (proceduri) n Matlab . . . . . . . . . . . . . . . . . . . .
1.10.1 Definirea si structura unei functii Matlab . . . . . . . . .
1.10.2 Apelul unei functii (proceduri) Matlab . . . . . . . . . . .
1.10.3 Subfunctii . . . . . . . . . . . . . . . . . . . . . . . . . .
1.10.4 Functia feval . . . . . . . . . . . . . . . . . . . . . . .
1.10.5 Comanda echo . . . . . . . . . . . . . . . . . . . . . . .
1.11 Instructiuni de evaluare a eficientei . . . . . . . . . . . . . . . . .
1.11.1 Instructiunea flops . . . . . . . . . . . . . . . . . . . .
1.11.2 Instructiunile tic si toc . . . . . . . . . . . . . . . . .
1.12 Grafica tridimensionala . . . . . . . . . . . . . . . . . . . . . . .
1.12.1 Instructiunea plot3 . . . . . . . . . . . . . . . . . . . .
1.12.2 Instructiunea ezplot3 . . . . . . . . . . . . . . . . . .
1.12.3 Instructiunile meshgrid, mesh si surf . . . . . . . . .
1.12.4 Instructiunile contour si contourf . . . . . . . . . .
1.12.5 Instructiunile ezcontour si ezcontourf . . . . . . .
1.12.6 Instructiunile ezmesh, ezsurf, ezmeshc si ezsurfc
1.12.7 Instructiunile bar3 si bar3h . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

28
31
32
33
35
35
36
37
38
39
40
41
41
42
42
42
43
43
44
45
45
47
48
48
48
49
49
49
51
51
54
56
57
58

Elemente de teoria probabilitatilor


2.1 Camp de probabilitate . . . . . . .
2.2 Variabile aleatoare . . . . . . . .
2.3 Functie de repartitie . . . . . . . .
2.4 Legi de probabilitate de tip discret

.
.
.
.

61
62
62
63
64

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

Cuprins

2.5

2.6

2.7

iii
2.4.1 Functiile Matlab pdf si cdf . . . . . . . . . . . . . . . . .
2.4.2 Legi de probabilitate de tip discret clasice . . . . . . . . . .
Legi de probabilitate continue . . . . . . . . . . . . . . . . . . . .
2.5.1 Legi de probabilitate continue clasice . . . . . . . . . . . .
2.5.2 Legi de probabilitate continue statistice . . . . . . . . . . .
2.5.3 Functia Matlab normspec . . . . . . . . . . . . . . . . .
2.5.4 Distributie marginala . . . . . . . . . . . . . . . . . . . . .
2.5.5 Functie de repartitie conditionata . . . . . . . . . . . . . . .
2.5.6 Functie de supravietuire. Functie hazard . . . . . . . . . . .
Caracteristici numerice . . . . . . . . . . . . . . . . . . . . . . . .
2.6.1 Valoare medie. Dispersie (varianta ). Covarianta . . . . . . .
2.6.2 Functii Matlab pentru valoare medie si dispersie . . . . . .
2.6.3 Valoare medie conditionata. Dispersie (varianta ) conditionata
2.6.4 Functie caracteristica . . . . . . . . . . . . . . . . . . . . .
2.6.5 Momente . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.6 Mediana. Cuartile. Cuantile . . . . . . . . . . . . . . . . .
2.6.7 Functia Matlab icdf . . . . . . . . . . . . . . . . . . . . .
2.6.8 Functia Matlab disttool . . . . . . . . . . . . . . . . .
Siruri de variabile aleatoare . . . . . . . . . . . . . . . . . . . . . .
2.7.1 Inegalitatea lui Cebsev . . . . . . . . . . . . . . . . . . . .
2.7.2 Tipuri de convergenta . . . . . . . . . . . . . . . . . . . . .
2.7.3 Legea numerelor mari . . . . . . . . . . . . . . . . . . . .
2.7.4 Teoreme limita . . . . . . . . . . . . . . . . . . . . . . . .

65
67
73
74
81
87
88
89
92
94
94
99
99
103
103
104
104
107
107
107
108
109
109

Statistica descriptiva
113
3.1 Concepte de baza ale statisticii . . . . . . . . . . . . . . . . . . . . 114
3.2 Culegerea, prezentarea si prelucrarea datelor statistice . . . . . . . . 115
3.2.1 Generarea numerelor aleatoare n Matlab . . . . . . . . . . 115
3.2.2 Tabele statistice . . . . . . . . . . . . . . . . . . . . . . . . 119
3.2.3 Functiile tabulate si crosstab . . . . . . . . . . . . . 125
3.2.4 Functiile caseread, casewrite, tblread si tblwrite 127
3.2.5 Reprezentari grafice . . . . . . . . . . . . . . . . . . . . . 129
3.2.6 Functii Matlab pentru reprezentarea grafica a datelor statistice 134
3.2.7 Functia randtool . . . . . . . . . . . . . . . . . . . . . 147
3.2.8 Functiile pie si pie3 . . . . . . . . . . . . . . . . . . . . 147
3.3 Parametrii distributiilor statistice . . . . . . . . . . . . . . . . . . . 148
3.3.1 Parametri statistici ce masoara tendinta . . . . . . . . . . . 148
3.3.2 Functiile mean, geomean si harmean . . . . . . . . . . 149
3.3.3 Functia trimmean . . . . . . . . . . . . . . . . . . . . . 149
3.3.4 Functia median . . . . . . . . . . . . . . . . . . . . . . . 150

iv

Cuprins
3.3.5
3.3.6
3.3.7
3.3.8
3.3.9
3.3.10
3.3.11
3.3.12
3.3.13
3.3.14

3.4

Parametri statistici ce masoara dispersarea . . . . . . . . . .


Functia prctile . . . . . . . . . . . . . . . . . . . . . .
Functia moment . . . . . . . . . . . . . . . . . . . . . . .
Functiile var si std . . . . . . . . . . . . . . . . . . . . .
Functiile range, iqr, mad, skewness si kurtosis . .
Functiile max si min . . . . . . . . . . . . . . . . . . . . .
Functiile sort si sortrows . . . . . . . . . . . . . . . .
Functiile sum, prod, cumsum si cumprod . . . . . . . .
Functia diff . . . . . . . . . . . . . . . . . . . . . . . . .
Functiile nanmean, nanmedian, nanstd, nanmin,
nanmax si nansum . . . . . . . . . . . . . . . . . . . . .
3.3.15 Corectiile lui Sheppard . . . . . . . . . . . . . . . . . . . .
3.3.16 Functia grpstats . . . . . . . . . . . . . . . . . . . . .
3.3.17 Functia boxplot . . . . . . . . . . . . . . . . . . . . . .
Corelatie si regresie . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Functiile cov si corrcoef . . . . . . . . . . . . . . . . .
3.4.2 Functiile lsline, refline si gline . . . . . . . . . .
3.4.3 Functiile polyfit si refcurve . . . . . . . . . . . . . .
3.4.4 Functiile polyval, polyvalm, poly si roots . . . . .
3.4.5 Functia polytool . . . . . . . . . . . . . . . . . . . . .
3.4.6 Functia nlinfit . . . . . . . . . . . . . . . . . . . . . .
3.4.7 Functia nlintool . . . . . . . . . . . . . . . . . . . . .
3.4.8 Coeficientii Spearman si Kendall . . . . . . . . . . . . . . .

Teoria selectiei
4.1 Tipuri de selectie . . . . . . . . . . . . .
4.2 Functii de selectie . . . . . . . . . . . . .
4.2.1 Media de selectie . . . . . . . . .
4.2.2 Momente de selectie . . . . . . .
4.2.3 Coeficient de corelatie de selectie
4.2.4 Functie de repartitie de selectie . .
4.2.5 Functia cdfplot . . . . . . . .

.
.
.
.
.
.
.

Teoria estimatiei
5.1 Functie de verosimilitate . . . . . . . . . .
5.2 Functii de estimatie . . . . . . . . . . . . .
5.2.1 Functii de estimatie absolut corecte
5.2.2 Functii de estimatie corecte . . . .
5.2.3 Functii de estimatie eficiente . . . .
5.2.4 Estimatori optimali . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

150
151
155
155
155
156
156
157
157
158
158
163
164
165
179
181
182
183
184
185
186
187

.
.
.
.
.
.
.

197
197
198
199
201
207
216
223

.
.
.
.
.
.

229
229
236
237
239
241
247

Cuprins
5.3

v
Metode pentru estimarea parametrilor . . . . . . . . . . . .
5.3.1 Metoda momentelor . . . . . . . . . . . . . . . . .
5.3.2 Metoda verosimilitatii maxime . . . . . . . . . . . .
5.3.3 Metoda minimului  . . . . . . . . . . . . . . . .
5.3.4 Metoda intervalelor de ncredere . . . . . . . . . . .
5.3.5 Metoda intervalelor de ncredere pentru selectii mari
5.3.6 Functii Matlab privind estimatia . . . . . . . . . . .

Verificarea ipotezelor statistice


6.1 Concepte de baza . . . . . . . . . . . . . . . . . . . . . .
6.2 Testul  privind media teoretica . . . . . . . . . . . . . .
6.2.1 Functiile zscore si ztest . . . . . . . . . . . .
6.3 Puterea unui test . . . . . . . . . . . . . . . . . . . . . . .
6.4 Testul  (Student) privind media teoretica . . . . . . . . .
6.4.1 Functia ttest . . . . . . . . . . . . . . . . . . .
6.5 Testul raportului verosimilitatilor . . . . . . . . . . . . . .
6.6 Testul  privind dispersia teoretica . . . . . . . . . . . .
6.7 Testul  (FisherSnedecor) pentru compararea dispersiilor
6.8 Teste pentru compararea mediilor . . . . . . . . . . . . .
6.8.1 Dispersii cunoscute . . . . . . . . . . . . . . . . .
6.8.2 Dispersii egale necunoscute . . . . . . . . . . . .
6.8.3 Functia ttest2 . . . . . . . . . . . . . . . . . .
6.8.4 Dispersii diferite necunoscute . . . . . . . . . . .
6.8.5 Observatii perechi . . . . . . . . . . . . . . . . .
6.9 Testul  pentru concordanta . . . . . . . . . . . . . . . .
6.10 Testul  pentru compararea mai multor caracteristici . . .
6.11 Testul  pentru tabele de contingenta . . . . . . . . . . .
6.12 Testul de concordanta al lui Kolmogorov . . . . . . . . . .
6.12.1 Functia kstest . . . . . . . . . . . . . . . . . .
6.12.2 Functia lillietest . . . . . . . . . . . . . . .
6.13 Testul KolmogorovSmirnov . . . . . . . . . . . . . . . .
6.13.1 Functia kstest2 . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

251
251
252
256
257
275
277

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

285
285
286
290
291
304
307
308
312
318
322
323
325
327
328
332
334
346
349
353
360
362
363
366

Anexa I

369

Anexa II

370

Anexa III

371

Anexa IV

372

vi

Cuprins
Anexa V

376

Bibliografie

377

Index

383

Prefata
Aspecte primare ale statisticii se pierd n negura timpului. Astazi, putem spune, fara
a gresi, ca statistica facem fiecare dintre noi, cu stiinta sau fara. Gandul la ziua de
maine, cum ne organizam si cum folosim timpul si mijloacele materiale de care dispunem, are la baza date (statistice) retinute (culese) si prelucrate n mod simplu sau
mai complex. Ne dam seama, prin urmare, ca statistica are o larga raspandire, de la
utilizarea ei n mod empiric, pana la apelarea la metodele fundamentate matematic.
Statistica faceau chinezii antici, care dispuneau de date relative la populatie,
pamanturi si recolte, dar si egiptenii, care efectuau cadastrari (operatii de determinare a unor proprietat i agricole si imobiliare cu toate caracteristicile lor) si numarari
de populatie. Numararea populatiei era cunoscuta si la evrei, de exemplu, n texte
biblice sunt mentionate numarari de populatie, ca cea efectuata de Moise, privind
barbatii buni de oaste. La grecii antici erau, de asemenea, efectuate numarari de
populatie, ale bunurilor necesare pentru scopuri militare, pentru asezarea impozitelor si evaluarea bogatiilor. Toate acestea au culminat cu recensamintele si anchetele
romane .
Culegerea de date privind resursele umane si materiale aveau la baza o gandire
practica, folosirea acestora n scopuri fiscale, militare sau administrative. Putem
spune ca toate acestea erau utilizate n descrierea statului.
Tratarea stiintifica a datelor relative la descrierea statului se ntalneste n Germania (sec. XVIIXVIII), iar denumirea de statistica apare n cursul lui Martin Schmeitzel (16791757), intitulat Collegium politico-statisticum (Universitatea din Halle). Unii istorici atribuie ntaietate privind aceasta denumire lui Gottfried Achenwall
(1719-1772), care a introdus nvata mantul Staatskunde la Universitatea din Gottingen.
In Anglia, n aceeasi perioada, n afara universitatilor, exista ca disciplina descriptiva a statului ceea ce se numea aritmetica politica. Aritmetica politica se ocupa n
special de cercetarea fenomenelor demografice.
Un moment important n dezvoltarea statisticii l reprezinta cristalizarea calculului probabilitat ilor.
Calculul probabilitat ilor si fundamentarea riguroasa din punct de vedere matemavii

viii

Prefata

tic a teoriei probabilitat ilor reprezinta o problema fundamentala n stabilirea locului


si rolului acestei discipline matematice n evantaiul larg al matematicii, precum si al
fundamentarii teoretice a statisticii matematice.
Desigur, faptul ca cineva, cu diferite ocazii, foloseste cuvantul probabil, nu
nseamna ca este o persoana initiata n calculul probabilitat ilor. Am putea, eventual,
accepta ca sunt percepute anumite aspecte empirice ale calculului probabilitat ilor,
cand, relativ la un anumit fenomen care prezinta un anumit grad de nedeterminare,
se emit afirmatii de forma: este putin probabil ca..., este foarte probabil ca..., este
improbabil ca.... De la astfel de afirmatii si pana la cunoasterea si ntelegerea n profunzime a teoriei probabilitat ilor este un drum lung, care este de un larg interes atat
din punct practic cat si teoretic, si care prezinta o atractie deosebita, nu numai pentru
matematicieni, dar si pentru specialisti din alte discipline ale cunoasterii umane: fizica, chimie, biologie, economie, medicina, inginerie etc. Aceste aspecte, de-a lungul
timpului, se regasesc n aparitia, dezvoltarea si fundamentarea axiomatica a teoriei
probabilitat ilor, care se mbina si se continua cu diferite domenii de aplicabilitate,
dintre care statistica ocupa un rol privilegiat.
Este unanim acceptat ca notiunea de probabilitate si are originea n jocurile de
noroc. In antichitate, la egipteni, greci si romani erau cunoscute jocuri de noroc cu
zaruri, care s-au perpetuat pana n zilele de astazi. Se pare ca cel mai vechi zar dateaza

din jurul anilor  .e.n. si avea fetele numerotate la ntamplare de la  la , fata de
zarul actual, care are fetele numerotate astfel ca suma numerelor de pe fetele opuse
sa fie . Proliferarea jocurilor de noroc s-a produs nu numai prin aria de raspndire,
dar si prin diversitatea acestora. Ajunge sa amintim doar jocurile de ruleta care sunt
instalate n marile metropole ale lumii.
Problemele teoretice relative la jocurile de noroc, n special privind sansele partenerilor, au atras atentia savantilor timpului. Astfel, fundamentarea elementara a
calculului probabilitat ilor poate fi atribuita francezilor P. de Fermat (16011665) si
B. Pascal (16231662). Corespondenta din anul 1654, purtata de cei doi, contine primele aspecte privind calculul sanselor n jocurile de noroc. O parte din problemele
considerate au fost formulate si prezentate lui Pascal de catre Cavalerul de Mere, un
renumit amator al jocurilor de noroc din acea vreme.
Prima carte de introducere n calculul probabilitat ilor este De Ratiociniis in Aleae
Ludo (Cum se rationeaza n jocurile cu zarul), aparuta n anul  si are ca autor pe
olandezul Ch. Huygens (16291695).
Totusi, se remarca faptul ca italianului G. Cardano (15011576) i se datoreaza
lucrarea intitulata Liber de Ludo Aleae (Cartea despre jocurile cu zarul), care a fost
cunoscuta si publicata la mai bine de o suta de ani de la disparitia sa.
Un destin asemanator a avut si lucrarea lui James Bernoulli (16541705), Ars
Conjectandi (Arta de a face presupuneri), care a fost publicata de catre fratele sau

Prefata

ix

John Bernoulli n anul  . Se remarca n continutul cartii, ceea ce se numeste azi
legea numerelor mari, unul din rezultatele stralucitoare ale teoriei probabilitat ilor.
Un alt rezultat de aceeasi dimensiune, teorema limita centrala, se gaseste n cartea
Doctrine of Chances, aparuta n anul  si care este opera lui A. de Moivre (1667
1754), ceea ce, se cunoaste, este strans legata de legea normala de probabilitate.
Descoperirea legii normale de probabilitate este atribuita, de cele mai multe ori,
lui K. F. Gauss (17771855), si care este considerata ca fiind specifica erorilor de
masurare. Trebuie remarcat faptul ca n anul 1808, cu un an nainte de descoperirea
lui Gauss, topograful american Robert Adrain (17751843) publicase o lucrare n
care a sugerat utilizarea legii normale pentru descrierea erorilor de masurare.
Rezultatele lui Moivre, privind teorema limita centrala, sunt extinse de catre P. S. de Laplace (17701820), stabilind de asemenea legatura cu legea normala de probabilitate, n cartea Theorie Analytique des Probabilites (Teoria analitica a probabi
litatilor), aparuta n anul   .
Un statistician belgian de seama al sec. XIX, unanim recunoscut pentru rezultatele de pionerat n domeniul statisticii matematice este A. Quetelet (17961874). De
numele lui se leaga notiuni ale statisticii ca: repartitie, medie, dispersie, observare de
masa, regularitate. Pentru el, statistica reprezenta singura metoda ce se poate aplica
fenomenelor de masa.
Un salt remarcabil n dezvoltarea teoria probabilitat ilor a fost facut prin contributia matematicienilor rusi L. P. Cebsev (18211884), A. A. Markov (18561922)
si A. M. Leapunov (18571918). Primul a introdus notiunea de variabila aleatoare,
reformuland si generalizand legea numerelor mari n limbajul variabilelor aleatoare.
Folosind notiunea de variabila aleatoare, A. A. Markov si A. M. Leapunov au obtinut
apoi alte rezultate privind legea numerelor mari si teorema limita centrala.
Pasul decisiv privind fundamentarea moderna a teoriei probabilitat ilor este facut
prin lucrarea matematicianului rus A. N. Kolmogorov (19031989), aparuta n anul
1933. A. N. Kolmogorov, folosind teoria masurii, reuseste sa construiasca modelul
axiomatic al teoriei probabilitat ilor.
Se remarca de asemenea preocupari si rezultate importante obtinute de alti ma Borel (18711956), S. N. Bernstein
tematicieni ca: S. D. Poisson (17811840), E.
(18801968), R. von Mises (18831953), A. I. Hincin (18941959).
Sfarsitul sec. XIX si nceputul sec. XX se considera a fi nceputul statisticii moderne. Este momentul cand se trece de la etapa descriptiva, la interpretarea analitica a
fenomenelor de masa si obtinerea de concluzii inductive pe baza observatiilor empirice. Statisticieni de renume, care au pus bazele statisticii matematice sunt considerati
a fi englezii F. Galton (18221911) si K. Pearson (18571936). Opera acestora este
continuata de celebrul statistician R. A. Fisher (18901962). Dintre reprezentantii
scolii engleze de statistica amintim pe G. U. Yule (18711951), W. S. Gosset (1876

Prefata

1937), C. E. Spearman (18831945), M. Kendall (19071983).


Pentru detalii privind istoricul statisticii recomandam lucrarea [38].
Astazi, statistica matematica, avand un suport teoretic al teoriei probabilitat ilor,
are o dezvoltare si aplicabilitate deosebita. Care este motivul aplicarii statisticii matematice pe o scara larga si n atatea domenii ale cunoasterii umane? Am putea da
doua raspunsuri principale. In primul rand, fiecare cercetator sau persoana care analizeaza fenomene ale lumii reale, modeleaza astfel de fenomene, cauta sa puna la baza
metodelor sale de cercetare stiintifica, de evaluare a fenomenelor reale, un instrument
de investigare obiectiv. Si este cvasiunanim recunoscut ca matematica are astfel de
instrumente de investigare, inclusiv prin metodele statisticii matematice. In al doilea
rand, metodele statisticii matematice sunt usor de aplicat. Greutatea consta numai
n fundamentarea riguroasa din punct de vedere matematic a acestora. Acest aspect
este ascuns celui care aplica statistica matematica. In materialul pe care l prezentam,
consideram notiunile (conceptele) de baza n initierea studiului si aplicarii statisticii
matematice. Se considera partea ascunsa a statisticii matematice, adica fundamentarea teoretica, cat de cat riguroasa, a statisticii matematice, dar si partea care prezinta
modul de aplicare a metodelor statisticii matematice.
Daca n tot acest demers avem la dispozitie si mijlocul modern de lucru, reprezentat astazi printrun calculator performant sau mai putin performant, atunci statistica
devine foarte atractiva. De aceea au fost elaborate o serie de produse soft, care prezinta ntro conceptie unitara reprezentarea, prelucrarea si studiul datelor statistice.
Amintim aici cateva astfel de produse soft: Statgraphics, Statistica, SPlus, SAS, StatXact, SPSS, Stata, GraphPad, ViSta etc. Remarcam de asemenea ca unele produse
soft elaborate n alte scopuri decat cel al prelucrarii datelor statistice, contin proceduri
privind prelucrarea mai elementara sau mai complexa a datelor statistice. In aceasta
categorie se ncadreaza si produsul Matlab, care va fi invocat n prezenta lucrare, dar
tot n aceasta categorie putem aminti si Mathematica, Maple etc.

Capitolul 1

Introducere n Matlab
MATLAB (MATrix LABoratory) este un sistem interactiv de nivel si performanta
nalte pentru efectuarea de calcule stiintifice si tehnice, precum si de analiza si vizualizare a datelor si care dispune de un limbaj propriu de programare.

Prima versiune a fost realizata n anii  de catre Cleve Moler, iar versiunea
utilizata n cele ce urmeaza este Matlab 6.0.
Se pare ca acest produs are o larga raspandire din mai multe motive:
interactivitatea sistemului;
elementele de baza sunt matricele, dupa cum spune si denumirea, ale caror
tipuri si dimensiuni nu se declara;
grafica puternica si foarte usor de utilizat;
posibilitatea integrarii unor proceduri proprii n limbaje de programare cum ar
fi Fortran, C;
arhitectura modulara, care permite adaugarea unor proceduri si functii proprii,
ceea ce a permis deja elaborarea unor pachete de proceduri si functii, numite
toolboxuri, orientate pe anumite domenii, cum ar fi
Statistica Statistics Toolbox;
Functii spline Spline Toolbox;
Analiza wavelet Wavelet Toolbox;
Procesarea semnalelor Signal Processing Toolbox;
Procesarea imaginilor Image Processing Toolbox;
Modelare, simulare si analiza sistemelor dinamice Simulink;
1

Introducere n Matlab
Calcul simbolic Symbolic/Extended Symbolic Math Toolbox;
Ecuatii cu derivate partiale PDE Toolbox;
Optimizare Optimization Toolbox.

1.1 Gestionarea unei sesiuni Matlab


1.1.1 Lansarea si nchiderea unei sesiuni Matlab
Trebuie sa remarcam de la nceput ca sistemul Matlab dispune de o puternica baza de
helpuri, dar care poate fi activata doar dupa ce sistemul Matlab a fost lansat.
Lansarea sistemului Matlab se efectueaza prin comenzi ce sunt specifice sistemului de operare pe care este instalat. Vom considera n continuare sistemul de operare
Windows, caz n care lansarea se face prin activarea
icon-ului Matlab sau
aplicatiei Matlab din directorul n care a fost instalat sistemul Matlab.
In urma efectuarii acestei comenzi se deschide o fereastra n care apare prompterul
specific sistemului Matlab
>>

Sistemul Matlab devine n acest fel interactiv, adica la fiecare comanda sau functie
tastata si acceptata de Matlab (editarea comenzii sau functiei ncheinduse prin
Enter), sistemul o executa si afiseaza pe ecran rezultatul, daca este cazul.
Exista posibilitatea de trecere de la modul interactiv la cel programat, prin tastarea numelui unui fisier (cu extensia m), care contine un program n sistemul Matlab
(succesiune de instructiuni Matlab) si care mod se ncheie odata cu terminarea executarii programului respectiv, dupa care se revenie la modul interactiv.
Incheierea unei sesiuni Matlab se poate face, fie prin comenzi specifice sistemului
de operare Windows, fie prin tastarea uneia din comenzile
>>quit
>>exit

1.1.2 Comenzi help


Comanda help permite utilizatorilor sa aiba acces la o mare cantitate de informatie
(n limba engleza) relativa la ntreg sistemul Matlab.
Exista diferite variante pentru lansarea comenzii help, anume prin:
tastarea comenzii help urmata de domeniul (topic) n care suntem interesati, adica

1.1. Gestionarea unei sesiuni Matlab

>>help topic

Remarcam faptul ca parametrul topic poate lipsi. Astfel, lansarea comenzii


>>help

are ca efect afisarea pe ecran a unei liste ce cuprinde domeniile care opereaza n
versiunea curenta Matlab
HELP topics:
matlab\general
matlab\ops
matlab\lang
matlab\elmat
matlab\elfun
matlab\specfun
matlab\matfun
matlab\datafun
matlab\audio
matlab\polyfun
matlab\funfun
matlab\sparfun
matlab\graph2d
matlab\graph3d
matlab\specgraph
matlab\graphics
matlab\uitools
matlab\strfun
matlab\iofun
matlab\timefun
matlab\datatypes
matlab\verctrl
matlab\winfun

matlab\demos
toolbox\local
toolbox\stats

General purpose commands.


Operators and special characters.
Programming language constructs.
Elementary matrices and matrix manipulation.
Elementary math functions.
Specialized math functions.
Matrix functions - numerical linear algebra.
Data analysis and Fourier transforms.
Audio support.
Interpolation and polynomials.
Function functions and ODE solvers.
Sparse matrices.
Two dimensional graphs.
Three dimensional graphs.
Specialized graphs.
Handle Graphics.
Graphical user interface tools.
Character strings.
File input/output.
Time and dates.
Data types and structures.
Version control.
Windows Operating System Interface Files
(DDE/ActiveX)
Examples and demonstrations.
Preferences.
Statistics Toolbox.

For more help on directory/topic, type "help topic".

tastarea comenzii lookfor urmata de un cuvant cheie (key), n care suntem


interesati, adica
>>lookfor key

va lista prima linie de comentariu din fiecare fisier cu extensia .m, care contine
cuvantul cheie key, precedata de numele fisierului.

Introducere n Matlab
tastarea comenzii helpwin urmata de un domeniu (topic) n care suntem
interesati, adica
>>helpwin topic

produce deschiderea unei ferestre cu informatii relative la domeniul precizat.


tastarea comenzii helpdesk, adica
>>helpdesk

produce deschiderea unei ferestre prin care se permite cautarea n baza helpului
Matlab.

1.1.3 Comenzi sistem


Sistemul Matlab opereaza cu o multime de comenzi pe care le ntalnim si n alte
sisteme. Enumeram o parte dintre acestea:
mkdir deschiderea unui subdirector nou n directorul curent;
cd schimarea directorului curent;
dir lista continutului directorului curent;
version afisarea versiunii sistemului Matlab instalat;
!com iesire temporara din sistemului Matlab instalat si executia comenzii
Windows precizata prin com;
demo lansarea executiei de programe demonstrative.
Inainte de nceperea unei sesiuni este de dorit sa se creeze un director prin comanda mkdir, pentru salvarea fisierelor, iar apoi trecerea n acest director prin comanda cd.

1.2 Constante. Variabile. Expresii aritmetice


Avand n vedere ca sistemul Matlab opereaza numai cu un singur tip de obiect, matrice numerica, care ar putea avea elemente numere complexe, rezulta ca orice scalar
este considerat ca o matrice cu o linie si o coloana. In plus, reprezentarea interna
a elementelor matricelor si operatiile cu acestea se fac n dubla precizie. Deoarece
reprezentarea interna este prestabilita, avem doar posibilitatea de precizare a tipului
(formatului) de afisare (iesire) respectiv de intrare a datelor.

1.2. Constante. Variabile. Expresii aritmetice

1.2.1 Constante
Introducerea constantelor se poate face:
de la tastatura;
prin generarea cu ajutorul unor instructiuni Matlab;
dintrun fisier creat cu ajutorul unui editor.
La intrare constantele numerice pot fi de tipul:
ntreg: 2002, -2002;
real: 3.14159, 0.314e1, -.314e+01, 31.4e-1, 31.4e-01;
complex: a+bi, unde a si b sunt
doua constante ntregi sau reale, iar i reprezinta unitatea imaginara (i
).

1.2.2 Instructiunea format


Sistemul Matlab dispune de cateva sabloane (formatari) standard pentru afisarea (extragera) datelor numerice. Instructiunea format prin care se precizeaza formatul
standard are sintaxa
>>format tip

unde tip poate lua una din valorile short, long, short e, long e, short g,
long g, hex, +, bank, rat, loose, compact.
Formatele short si long afiseaza pe ecran datele numerice n virgula fixa,
respectiv cu 5 cifre zecimale si 15 cifre zecimale (precedate de semnul minus, daca
sunt negative).
Formatele short e si long e afiseaza pe ecran datele numerice n virgula flotanta, respectiv cu 5 cifre zecimale si 15 cifre zecimale (precedate de semnul minus,
daca sunt negative).
Formatele short g si long g afiseaza pe ecran datele numerice cu cea mai
potrivita reprezentare, virgula fixa sau virgula flotanta, respectiv cu 5 cifre zecimale
si 15 cifre zecimale (precedate de semnul minus, daca sunt negative).
Formatele rat, bank, hex si + afiseaza pe ecran respectiv datele numerice sub
forma de fractie ordinara, sub forma bancara (cu doua zecimale), sub forma hexazecimala, iar n ultimul caz, prin + daca numarul este pozitiv, respectiv -, daca numarul
este negativ si spat
iu daca este zero.
Formatele loose si compact permite afisare datelor la doua randuri (format
implicit), respectiv la un rand n cazul al doilea.
Pentru a afla la un moment dat, care format este n functie se poate apela la
comanda
>>get(0,Format)

Introducere n Matlab

1.2.3 Constante speciale


Sistemul Matlab are cateva constante speciale, care au denumiri specifice (identificatori specifici):
inf rezultatul mpartirii la 0;
NaN (Not a Number) rezultatul operatiei de tipul

 
;

realmax cel mai mare numar real pozitiv reprezentat pe dublu cuvant
(1.7977e+308);
realmin cel mai mic numar real pozitiv reprezentat pe dublu cuvant
(2.2251e-308);
pi =3.14159... (valoarea reprezentata pe dublu cuvant);
eps epsilonul masinii (eps=2.2204e-16=254 );
date data curenta;
clock timpul curent;
calendar calendarul lunii curente;
i, j unitatea imaginara (i,j=



 );

zeros(n) si zeros(m,n) genereaza matricea patratica de ordin n, respectiv matricea cu m linii si n coloane, avand toate elementele nule;
ones(n) si ones(m,n) genereaza matricea patratica de ordin n, respectiv
matricea cu m linii si n coloane, avand toate elementele 1;
eye(n) si eye(m,n) genereaza matricea patratica de ordin n, respectiv
matricea cu m linii si n coloane, avand pe diagonala principala 1 si 0 n rest
(cand matricea este patratica avem matricea unitate);
magic(n) genereaza matrice magica patratica de ordin n.
Pentru introducerea elementelor unei matrice, linie cu linie, elemente ce pot fi exprimate si prin expresii aritmetice, acestea sunt incluse ntre paranteze drepte. Elementele fiecarei linii sunt separate prin spatiu sau virgula, iar liniile sunt separate prin
punctvirgula (;) sau prin trecerea la randul urmator.
Astfel matricea




  
se poate introduce de la tastatura prin

1.2. Constante. Variabile. Expresii aritmetice

>>[3 5 2;9 1 4]

sau
>>[3,5,2;9,1,4]

Daca elementele matricei prezinta regularitatea, ca elementele unei linii sunt date
printro progresie aritmetica, atunci avem o introducere prescurtata. De exemplu,
introducerea matricei


 




se poate face de la tastatura prin
>>[3:2:9;9:-3:0]

1.2.4 Variabile
Variabilele sunt matrice ce sunt utilizate ntrun program Matlab sau n mod interactiv si ale caror valori pot fi modificate. Numele lor fiind precizate prin identificatori,
care sunt dati de orice combinatie de litere, cifre zecimale si liniuta de subliniere, din
care primul caracter este litera: Matrice1, mat, Cluj Napoca.
Apelarea si vizualizarea unui element al unei variabile (matrice) se face prin specificarea numelui variabilei urmat de lista indicilor corespunzatori, separati prin virgula, nchisa ntre paranteze. De exemplu, A(i,j ) pune n evidenta elementul din
linia i si coloana j al matricei A.
Facem observatia ca matricele n sistemul Matlab nu accepta decat indici strict
pozitivi.
Utilizand operatorul doua puncte (:) se pot obtine submatrice ale unei matrice.
De exemplu, A(1:3,4:5) extrage submatricea formata din primele trei linii si coloanele 4 si 5 ale matricei A, iar A(:,4) si A(1,:) extrag respectiv coloana a patra
a matricei A si prima linie a matricei A. O forma mai generala de obtinere a unei
submatrice se realizeaza prin apelul de forma A([l],[c]), unde l si c reprezinta
liste de indici de linie si indici de coloane, separati prin virgula sau spatiu. Astfel va fi
obtinuta submatricea formata din liniile si coloanele precizate prin l, respectiv c ale
matricei A. Daca se introduce comanda A(:), atunci matricea A este transformata
ntrun vector coloana, ce contine coloanele matricei.
Alte combinatii ale acestor tipuri de specificare ale elementelor unei matrice pot
fi considerate.
Mai remarcam aici comanda
>>reshape(A,m,n)

care transforma matricea A ntro matrice cu m linii si n coloane. Daca A nu are m n


elemente, atunci apare eroare la executare.

Introducere n Matlab

1.2.5 Operatori aritmetici


Expresiile aritmetice se construiesc dupa cunoscutele reguli ale limbajelor de programare evoluate, folosind operatorii aritmetici cunoscuti, desigur cu unele operatii
speciale specifice sistemului Matlab.
Ordinea executiilor operatiilor aritmetice este de asemenea cea cunoscuta si pe
care o reamintim aici, ncepand cu cel mai nalt nivel :
prima data sunt executate operatiile aritmetice dintre paranteze;
urmeaza ridicarea la putere, iar daca sunt mai multe operatii consecutive de
acest tip, atunci ordinea executiei este de la dreapta la stanga;
urmatorul nivel de prioritate include operatiile de nmultire si mpartire, iar
daca sunt mai multe operatii consecutive de acest tip, atunci ordinea executiei
este de la stanga la dreapta;
ultimul nivel de prioritate contine operatiile de adunare si scadere, iar daca sunt
mai multe operatii consecutive de acest tip, atunci ordinea executiei este de la
stanga la dreapta.
Operatorii aritmetici matriceali de care dispune sistemul de baza Matlab sunt:
A+B, A-B sau plus(A,B), minus(A,B) aduna, respectiv face diferenta matricelor A si B de aceleasi dimensiuni, iar daca unul dintre operanzi e
un scalar, acesta este extins la matricea constanta data prin scalarul respectiv,
avand dimensiunile celeilalte matrice, dupa care se efectueaza operatia;
A*B sau mtimes(A,B) nmulteste matricele A si B, pentru care numarul
coloanelor matricei A este acelasi cu numarul liniilor matricei B, iar daca una
din matrice e un scalar, acesta va nmulti toate elementele celeilalte matrice;
AB sau mpower(A,B) daca B este un scalar p ntreg pozitiv, atunci se obtine puterea p a matricei patratice A, iar daca A este un scalar , atunci se ridica
scalarul la puterea B, matricea
  BB fiind patratica, adica, pentru exemplificare,

B
  
daca
e, atunci e

A
B, A B, A B, A /B, sau formele echivalente, respectiv times(A,B),
power(A,B), ldivide(A,B), rdivide(A,B) efectueaza operatiile
de nmultire, de ridicare la putere, mpartire inversa, mpartire directa, toate de
tipul element cu element (ca la operatiile de adunare si scadere), pentru matricele de aceleasi dimensiuni, iar daca una dintre matrice e un scalar, aceasta este
extinsa la matricea constanta data prin scalarul respectiv, avand dimensiunile
celeilalte matrice, dupa care este efectuata operatia;

1.2. Constante. Variabile. Expresii aritmetice

A B sau mldivide(A,B) are ca rezultat matricea ce reprezinta solutia


ecuatiei matriceale A*X=B, cand matricea patratica A este inversabila, iar daca
B este un vector coloana se obtine solutia sistemului liniar corespunzator;
A/B sau mrdivide(A,B) are ca rezultat matricea ce reprezinta solutia
ecuatiei matriceale X*B=A, cand matricea patratica B este inversabila;
[A B], [A;B] (concatenarea) produce concatenarea matricelor A si B pe
orizontala, respectiv pe verticala, cu conditia ca la concatenarea pe orizontala
trebuie ca numarul liniilor celor doua matrice sa fie acelasi, iar la concatenarea
pe verticala se impune ca numarul coloanelor celor doua matrice sa fie acelasi.

1.2.6 Functii predefinite


Sistemul Matlab dispune de numeroase functii matematice. Remarcam faptul ca toate
acestea, avand n vedere ca matricele sunt obiectele de baza n Matlab, actioneaza
asupra matricelor.
Incercam o clasificare a acestora:
abs (modul), sqrt (radical), sign (semn), conj (conjugat), angle (argument al numarului complex), imag (parte imaginara), real (parte reala);
sin (sinus), cos (cosinus), tan (tangenta), cot (cotangenta), csc (cosecanta), sec (secanta);
asin (arcsinus), acos (arccosinus), atan (arctangenta), acot (arccotangenta), acsc (arccosecanta), asec (arcsecanta), sinh (sinus hiperbolic),
cosh (cosinus hiperbolic), tanh (tangenta hiperbolica), coth (cotangenta hiperbolica), csch (cosecanta hiperbolica), sech (secanta hiperbolica), asinh
(arcsinus hiperbolic), acosh (arccosinus hiperbolic), atanh (arctangenta hiperbolica), acoth (arccotangenta hiperbolica), acsch (arccosecanta hiperbolica), asech (arcsecanta hiperbolica);
exp (exponentiala), log (logaritm natural), log10 (logaritm zecimal), log2
(logaritm n baza doi);

round (rotunjire la cel mai apropiat ntreg), floor (rotunjire spre


(rotunjire spre zero), ceil (rotunjire spre
).

), fix

Facem observatia ca pentru functiile trigonometrice se impune ca argumentele sa fie


date n radiani.
Daca argumentul functiilor predefinite este matrice, atunci functia se aplica
fiecarui element al matricei.

10

Introducere n Matlab

atan2(A,B) (are acelasi efect cu atan(A. B)), rem(A,B) (restul mpartirii lui A la B).
Daca A si B sunt matrice, atunci trebuie sa fie de aceeasi dimensiune, iar functia se
aplica element cu element.
size(A) (dimensiunea matricei A), length(A) (lungimea vectorului A),
ndims(A) (numarul dimensiunilor matricei A), disp(A) (afiseaza elementele matricei A fara numele matricei), det(A) (determinantul matricei
patratice A), inv(A) (inversa matricei patratice A), rank(A) (rangul matricei A), A sau transpose(A) (transpusa matricei A, daca matricea este cu
elemente numere reale, daca are elemente numere complexe, atunci se efectueaza matricea transpusa a conjugatelor elementelor), A (transpusa matricei
A), diag(A) (diagonala matricei patratice A, iar daca A este vector, genereaza matricea patratica diagonala cu elementele diagonalei date de vector),
trace(A) (urma matricei patratice A, adica   ).


Trebuie sa remarcam ca daca A este un vector linie,


atunci A este un vector coloana

si invers, daca A este un vector coloana, atunci A este un vector linie.
factorial(n) (factorialul lui n), perms(1:n) sau perms(v) (genereaza toate pemutarile primelor n numere naturale, respectiv genereaza toate
permutarile componentelor vectorului v), nchoosek(n,k) sau varianta
nchoosek(v,k) (calculeaza numarul combinarilor de n elemente luate cate
k, respectiv genereaza toate combinarile elementelor vectorului v luate cate k),
combnk(v,k) (genereaza toate combinarile elementelor vectorului v luate
cate k), factor(n) (factorii primi ai lui n repetati de atatea ori cat reprezinta puterea acestora), primes(n) (numerele prime mai mici decat n), gcd
(cmmdc), lcm (cmmmc).

1.2.7 Comenzi pentru gestiunea variabilelor si a spatiului de lucru


Sistemul Matlab se poate lansa din orice director, acesta devenind directorul curent.
Desigur este de dorit ca utilizatorul sa lucreze ntrun director propriu. Asa cum am
vazut, un astfel de director poate fi creat pana nu se intra n sistemul Matlab, ca apoi
acesta sa fie lansat din acest director sau se poate lansa la nceput sistemul Matlab,
iar apoi prin comenzile cd si mkdir sa se ajunga ntrun director al utilizatorului
sau sa se creeze un director propriu nou.
Toate operatiile sunt executate n directorul curent.
Daca se doresc informatii relative la variabilele existente la un moment dat n
directorul curent se pot lansa una din comenzile:

1.2. Constante. Variabile. Expresii aritmetice

11

who produce lista variabilelor curente;


whos produce lista variabilelor curente, mpreuna cu informatii privind
aceste variabile (dimensiune, numar de elemente, memorie ocupata, tipul);
clear sterge variabilele si functiile temporare din directorul curent (stergerea unei singure variabile se realizeaza prin comanda clear urmata de numele
variabilei);
diary file salveaza toate informatiile aparute pe ecran n timpul derularii unei sesiuni n fisierul file, cu exceptia graficelor;
save salveaza variabilele de lucru pe disc;
load ncarca variabilele de lucru de pe disc.
Comenzile
>>save file
>>save file x y z

vor salva n fsierul file.mat toate variabilele din sesiune curenta, respectiv numai
variabilele x, y, z.
Diferenta dintre comanda diary si comanda save este ca fisierul obtinut prin
diary se poate modifica (edita) cu ajutorul unui editor, pe cand celalalt nu se poate
edita.
De asemenea, remarcam faptul ca n fisierul creat prin comanda diary contine
toate informatiile pana la ntalnirea comenzii
>>diary off

Daca nainte de nchiderea unei sesiuni Matlab nu se executa o comanda save, atunci
toate variabilele mpreuna cu continutul lor se pierd.
Intro alta sesiune Matlab, se pot recupera variabilele din sesiunea precedenta,
daca au fost salvate prin comanda save, prin lansarea comenzii load. Anume, daca
fisierul salvat este file.mat atunci comanda
>>load file

va ncarca varaibilele cu continutul lor pentru sesiunea curenta.


Comanda load poate fi utilizata si pentru ncarcarea unui fisier ASCII creat cu
alt editor. Astfel comanda
>>load A.dat -ascii

va avea ca efect pentru sesiunea curenta a generarii unei variabile cu numele A si care
contine ca valori datele din fisierul A.dat.

12

Introducere n Matlab

1.3 Instructiuni de atribuire


Sistemul Matlab dispune de trei tipuri de instructiuni de atribuire:
expresie
variabila = expresie
[lista de variabile] = func

Expresia se compune, dupa reguli cunoscute n programare, cu ajutorul operatiilor


aritmetice si al functiilor, prin operarea asupra constantelor si asupra variabilelor.
Daca se considera prima forma a instructiunii de atribuire, atunci rezultatul este
pastrat ntro variabila de lucru numita ans si care ramane nemodificata pana la
executia unei alte instructiuni de atribuire de aceasta forma. Forma a doua face
aceasta atribuire, variabilei din partea stanga a semnului de egalitate.
Forma a treia este specifica pentru cazul n care se apeleaza o procedura (functie
Matlab), care returneaza mai mult de o valoare.
Exista expresii specifice sistemului Matlab, care nu au corespondent n alte limbaje evoluate. Daca vrem sa atribuim unei variabile valori care sunt obtinute ca si
elemente ale unei progresii aritmetice, atunci putem folosi una din instructiunile de
atribuire
>>vi:pas:vf
>>x = vi:pas:vf

unde vi, pas, vf sunt expresii aritmetice, care pot fi evaluate la momentul executarii instructiunii. In urma executarii acestor instructiuni variabila ans respectiv x
va contine valorile numerice ncepand cu vi pana la vf cu pasul pas.
Daca valoarea lui vf este mai mica decat cea a lui vi si pas are valaore negativa,
atunci rezultatul instructiunii de atribuire este matricea vida, avand sintaxa [].
Daca pas=1, atunci se pot considera formele echivalente
>>vi:vf
>>x = vi:vf

Un alt tip specific de instructiune de atribuire a sistemului Matlab este acela cand
variabila primeste valoarea unei submatrice. De exemplu, instructiunile de atribuire
>>x = A(:,2)
>>y = A(end,1:10)

au ca efect obtinerea n x a vectorului coloana format din coloana a doua a matricei A,


iar y va fi un vector linie format din primele 10 elemente ale ultimei linii a matricei A.
Orice instructiune poate fi continuata pe linia urmatoare prin trei puncte (. . . ) .
O linie poate sa contina mai multe instructiuni separate prin virgula sau prin
punct-virgula (;).
Daca o instructiune este urmata de punct-virgula (;), atunci valoarea variabilei nu
este afisata dupa executarea instructiunii, n caz contrar valoarea curenta a variabilei
va fi afisata.

1.4. Instructiuni de citire si scriere

13

1.4 Instructiuni de citire si scriere


1.4.1 Instructiunea input
Sintaxa comenzii input este:
>>v = input(s)

Prin executarea acestei instructiuni se afiseaza pe ecran sirul de caractere dat prin s,
asteptanduse tastarea datelor ce se doresc a fi atribuite pentru variabila v. Cand
se ncheie operatiunea de tastarea datelor, se tasteaza Enter, drept consecinta se
efectueaza operatia de atribuire.

1.4.2 Instructiunea ginput


Instructiunea ginput permite introducerea de date cu ajutorul mouse-ului dintr-o
fereastra ce are trasate axele de coordonate.
Exista urmatoarele forme ale instructiunii ginput:
>>[x,y] = ginput(n)
>>[x,y] = ginput
>>[x,y,buton] = ginput(n)

Executarea unei astfel de instructiuni produce introducerea coordonatelor unor


puncte din figura curenta, n cand se folosesc prima si ultima varianta, respectiv un
numar nedefinit, cand se foloseste varianta a doua. La nceput apare pe ecran n fereastra figurii curente cursorul realizat prin doua drepte verticale. Prin pozitionari
succesive, cu ajutorul mouse-ului, ale cursorului pe anumite puncte, urmate de clickuri, coordonatele acestora sunt introduse respectiv n vectorii x si y. Pentru prima si
ultima forma trebuie efectuate astfel de operatii succesive n numar de n, iar pentru a
doua succesiunea de operatii se ncheie prin tastarea comenzii Enter. Forma a treia
va returna si vectorul buton, care specifica ce buton al mouselui a fost folosit la
fiecare operatie (1, 2 sau 3, ncepand de la stanga).

1.4.3 Instructiunea fprintf


Afisarea pe ecran si nu numai, folosind un format propriu, se face cu ajutorul
instructiunii fprintf. Vom prezenta n continuare numai modul de afisare pe ecran
folosind aceasta instructiune.
Cea mai simpla sintaxa a acestei instructiuni este
>>fprintf(f,x)

prin care valoarea variabilei x este afisata pe ecran conform formatului f.



Formatul
f poate fi, de exemplu: %md, %md n, %m.zf, %m.zf n, %m.ze,

%m.ze n, unde md, m.zf si m.ze exprima respectiv faptul ca valoarea lui x se
afiseaza pe m pozitii ca un ntreg, ca un real cu z cifre zecimale, ca un real normalizat

14

Introducere n Matlab

cu z cifre zecimale. Parametrul n specifica faptul ca dupa afisare se trece la randul


urmator (tine locul comenzii Enter).

1.5 Operatori relationali si operatori logici


1.5.1 Operatori relationali
A==B sau eq(A,B), A=B sau ne(A,B), A<B sau lt(A,B), A>B sau
gt(A,B), A<B sau lt(A,B), A>B sau gt(A,B), A<=B sau le(A,B),
A>=B sau ge(A,B) compara element cu element matricele de aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, cand conditia este
adevarata respectiv falsa, iar daca unul din operanzi este un scalar, acesta este
extins la matricea constanta data prin scalarul respectiv, avand dimensiunile
celeilalte matrice, dupa care se efectueaza operatia relationala.

1.5.2 Operatori logici


A B sau and(A,B) (conjunctia) compara element cu element matricele de
aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, cand
ambele elemente sunt diferite de zero, respectiv cel putin unul din cele doua
elemente este zero;
A B sau or(A,B) (disjunctia) compara element cu element matricele de
aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, cand cel
putin unul din cele doua elemente este zero, respectiv ambele elemente sunt
zero;
xor(A,B) (disjunctia exclusiva) compara element cu element matricele de
aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, cand unul
si numai unul din cele doua elemente este zero, respectiv ambele elemente sunt
zero sau ambele sunt diferite de zero;
Daca unul din operanzi este un scalar, acesta este extins la matricea constanta data
prin scalarul respectiv, avand dimensiunile celeilalte matrice, dupa care se efectueaza
operatia logica.
A sau not(A) (negatia) produce o matrice de aceleasi dimensiuni cu cele
ale matricei A avand valorile 1 si 0, cand elementul corespunzator al matricei
A este zero, respectiv cand este diferit de zero.
any(A) daca A este vector, returneza valoarea 1, daca exista componente ale
vectorului diferite de zero si 0 n caz contrar, iar daca A este o matrice, opereaza

1.6. Fisiere script (mfile)

15

asupra fiecarei coloane a matricei si returneaza corespunzator un vector de 1 si


0 cu lungimea egala cu cea a numarului coloanelor matrcei A;
all(A) daca A este vector, returneza valoarea 1, daca toate componentele
vectorului sunt diferite de zero si 0 n caz contrar, iar daca A este o matrice, opereaza asupra fiecarei coloane a matricei si returneaza corespunzator un vector
de 1 si 0 cu lungimea egala cu cea a numarului coloanelor matrcei A.

1.6 Fisiere script (mfile)


Pentru a executa o secventa de instructiuni Matlab (program), fara interventia utilizatorului, se editeaza un fisier ASCII cu extensia .m, numit (fisier script) sau mfile,
care sa contina instructiunile programului. Lansarea executiei programului se face
prin tastarea numelui (fara extensia .m), dupa care se tasteaza Enter. Astfel, daca
utilizatorul sia creat un fisier script cu numele exemplu.m, atunci linia de comanda
prin care se lanseaza executia este
>>exemplu

Fsierul exemplu.m ar putea avea urmatorul continut


m = input(m (nr. natural > 0):);
A = magic(m);
d = ndims(A)
[l c] = size(A)
B = A*ones(m,1);
C = B

In urma lansarii executiei acestui program, fara a putea interveni pana la ncheierea
executiei, se produc urmatoarele operatii:
executa instructiunea din prima linie, prin afisarea pe ecran a mesajului
m (nr. natural > 0):

si se asteapa tastarea unui numar ntreg pozitiv, dupa care prin comanda Enter
se trece la instructiunea din linia urmatoare;
instructiunea din linia a doua va genera matricea magica patratica A de ordin
m, care nu va fi afisata pe ecran deoarece instructiunea se termina cu simbolul
punctvirgula;
se executa functia ndim, iar rezultatul este atribuit variabilei d, care va avea
valoarea 2 si va fi afisat pe ecran, deoarece instructiunea nu se termina cu
punctvirgula, pe doua randuri
d =
2

16

Introducere n Matlab
urmatoarea instructiune atribuie variabilelor l si c numarul liniilor si coloanelor matricei A, care n cazul de fata coincid cu valoarea lui m, iar valorile lui l
si c vor fi afisate pe ecran;
B va fi un vector coloana cu m componente si contine produsul dintre matricea
A si vectorul coloana de m componente, toate avand valoarea 1, iar daca avem
n vedere ca A este o matrice magica, toate componentele lui B vor fi egale;
ultima instructiune ajuta la afisarea pe ecran a componentelor vectorului linie
C, care este vectorul transpus al vectorului coloana B.

Editarea unui fisier script se poate face cu orice editor de text, dar sistemul Matlab
dispune de un editor propriu.
Editorul Matlab se poate lansa din fereastra de lucru Matlab prin comenzi specifice sistemului Windows, alegand din meniul File optiunea New sau Open, daca
se doreste crearea uni nou fisier, respectiv se doreste editare unui fisier deja existent.
Acelasi rezultat se obtine prin comanda
edit file.m

n care file.m este optional. Daca lipseste acest argument atunci urmeaza crearea
(editarea) unui fisier nou, iar daca acest argument este prezent, fisierul cu acest nume
urmeaza sa fie reactualizat (editat).
Editorul sistemului Matlab poate fi lansat din orice alta parte prin activarea unui
fisier cu extensia .m.
Editorul Matlab are capacitatea de a efectua unele verificari sintactice, de exemplu corespondent a paranteza deschisa paranteza nchisa, dar este prevazut si cu un
set de comenzi (debuger) pentru depanarea programului prin evaluarea si modificarea
unor variabile si expresii, crearea si stergerea unor puncte de ntrerupere etc.
Comenzile specifice sistemului de depanare Matlab sunt:
dbstop crearea unui punct de ntrerupere (breakpoint);
dbclear stergerea unui punct de ntrerupere;
dbstatus listeaza punctele de ntrerupere;
dbstack listeaza stiva apelurilor;
dbcont reluarea executiei programului;
dbstep executia uneia sau mai multe instructiuni;
dbtype genereaza lista fisierelor cu extensia .m, mpreuna cu numarul liniilor acestora;

1.7. Grafica bidimensionala

17

dbup schimba spatiul de lucru curent, cu cel al unui fisier cu extensia .m,
care a fost apelat;
dbdown efectueaza operatia inversa comenzii dbup;
dbmex execua depanarea unui fisier cu extensia .mex (creat cu unul din
limbajele Fortran si C);
dbquit ncheierea depanarii.

1.6.1 Comenzi pentru gestionarea fisierelor


type file listeaza continutul fisierului file din directorul curent;
delete file sterge fisierului file din directorul curent;
what listeaza fisierele cu extensiile .m din directorul curent;
which numef listeaza calea directorului n care se afla functia numef;
Comanda
>>what director

extrage lista fisierelor directorului specificat ... toolbox matlab director


Lista acestor directoare poat fi vizualizata prin comanda help fara nici un parametru.

1.7 Grafica bidimensionala


Sistemul Matlab dispune de o larga gama de instructiuni sau proceduri (functii) pentru reprezentarea grafica a datelor, care permit o apelare simpla si eficienta.

1.7.1 Instructiunea plot


Formele acceptate de sistemul Matlab pentru instructiunea plot, privind reprezentarea grafica n plan sunt
plot(y)
plot(x,y)
plot(x1,y1,x2,y2,...)
plot(y,s)
plot(x,y,s)
plot(y1,s1,y2,s2,...)
plot(x1,y1,s1,x2,y2,s2,...)

In cazul primei forme, daca y este un vector de lungime m, se reprezinta grafic


   

linia poligonala ce trece prin punctele de coordonate
,
 m.

18

Introducere n Matlab

Programul 1.7.1. Sa consideram programul,


care
reprezinta grafic linia poligonala
   

ce uneste punctele de coordonate
,
 m, unde y reprezinta elementele diagonalei unei matrice magice de ordin m:
m = input(m:);
y = diag(magic(m));
plot(y)

In urma executiei programului, pentru m=10, se obtine graficul din Figura 1.1.
100

90

80

70

60

50

40

30

20

10

10

Figura 1.1: Linie poligonala


Daca y este o matrice de tipul (m,n), atunci se reprezinta grafic n linii poligo  m

nale, corespunzand celor n coloane ale matricei y, anume
,   n.
Programul 1.7.2. Sa consideram programul,
care reprezinta grafic liniile poligonale
  
ce unesc respectiv punctele de coordonate
, pentru fiecare   n, unde y
este o matrice magica de ordin m, iar n este un numar ntreg pozitiv cel mult m:
m = input(m:);
n = input(n (n<=m):);
y = magic(m);
plot(y(:,1:n))

In urma executiei programului, pentru m=10 si n=2, se obtine graficul din Figura 1.2.
Daca y este de tip complex, atunci prima forma este echivalenta cu a doua forma
a instructiunii plot, adica cu
plot(real(y),imag(y))

1.7. Grafica bidimensionala

19

100

90

80

70

60

50

40

30

20

10

10

Figura 1.2: Linii poligonale

Programul 1.7.3. Saconsider


am programul, care reprezinta grafic functia cu valori
               
complexe
m = input(m:);
h =1/m; x = 0:h:1;
z = x.*cos(2*pi*x)+i*x.2.*sin(2*pi*x);
plot(z)

In urma executiei programului, pentru m=100, se obtine graficul din Figura 1.3.
Remarcam faptul ca pentru toate celelalte forme, daca avem parametri complecsi,
partea imaginara este ignorata.
Daca se utilizeaza a doua forma, iar x si y sunt vectori de aceasi lungime m, atunci
 
se reprezinta grafic linia poligonala ce trece prin punctele de coordonate 
,


 m.

Programul
1.7.4. Fie programul care reprezinta grafic functia    pe intervalul
   :
m = input(m:);
h = 1/m; x = 0:h:1;
plot(x,sin(2*pi*x))

Executia programului, pentru m=200, genereaza graficul din Figura 1.4.


In cazul n care x si y sunt matrice avand acelasi tip (m,n), se reprezinta grafic
  m
n linii poligonale, corespunzand celor n coloane ale matricelor, adica 
,

pentru fiecare 
 n. Daca x este un vector de lungime m, iar y este un vector de
lungime m sau matrice de tipul (m,n), se reprezinta grafic liniile poligonale ce trec

20

Introducere n Matlab
2

4
2

1.5

0.5

Figura 1.3:

0.5

1.5

    

    

0.4

0.6

0.8

0.6

0.4

0.2

0.2

0.4

0.6

0.8

0.1

0.2

0.3

Figura 1.4:

0.5

  

0.7

0.8

0.9

1.7. Grafica bidimensionala

21


m, respectiv n linii poligonale ce trec respectiv


prin punctele de coordonate 



m, pentru fiecare 
prin punctele date prin 
 n.
Forma a treia a instructiunii plot implica reprezentarea grafica pe aceeasi figura,
conform formei precedente, a grupelor de date (x1,y1), (x2,y2) s.a.m.d.

Programul 1.7.5. Vom prezenta dou


a pe
 programe, care reprezint

a variante de
aceeasi figura graficele functiilor    si    pe intervalul   :
m = input(m:);
h = 1/m; x = 0:h:1;
y = 2*pi*x;
plot(x,sin(y),x,cos(y))

respectiv
m = input(m:);
h = 1/m; x = 0:h:1;
y = 2*pi*x;
y = [sin(y) cos(y)]; x=[x x];
plot(x,y)

Executand una din cele doua variante, cu m=200, se genereaza graficul din Figura 1.5.
Remarcam faptul ca prima varianta ar fi potrivita daca cele doua functii se reprezinta grafic pe acelasi domeniu, iar a doua varianta cand cele doua functii sunt
reprezentate grafic pe domenii diferite.
1

0.8

0.6

0.4

0.2

0.2

0.4

0.6

0.8

0.1

0.2

0.3

Figura 1.5:

0.4

0.5

0.6

  , 


0.7

0.8

0.9

  

Pentru o reprezentare neteda este de dorit ca numarul punctelor ce genereaza


liniile poligonale sa fie suficient de mare.

22

Introducere n Matlab

Pe de alta parte, observam ca prin primele trei tipuri de instructiune plot nu


se specifica nici o caracteristica a liniilor reprezentate grafic. Sistemul Matlab face o
alegere implicita a acestor caracteristici.
Ultimele patru forme ale instructiunii plot permit utilizatorului specificarea
unor caracteristici ale liniilor reprezentate grafic cu ajutorul parametrului s.
Parametrul de tipul s este un sir de cel mult trei caractere, prin care se precizeaza
culoarea, tipul de marcaj al punctelor si tipul de linie.
Culoarea este specificata cu unul din simbolurile urmatoare: y galben (yellow),
m violet (magenta), c ciclamen (cyan), r rosu (red), g verde (green), b
albastru (blue), w alb (white), k negru (black).
Tipul de marcaj este dat prin unul din simbolurile: punct (point), o cerculet
(circle), x cruciulita diagonala (xmark), + cruciulita (plus),
steluta (star), s
patratel (square), d romb (diamond), v triunghi cu varf n jos (triangle down),

triunghi cu varf n sus (triangle up), triunghi cu varf spre stanga (triangle
left),  triunghi cu varf spre dreapta (triangle right), p steluta n cinci colturi
(pentagram), h steluta n sase colturi (hexagram).
Urmatoarele patru tipuri de linie sunt disponibile: continua (solid) (-), punctata
(dotted) (:), ntrerupta (dashed) (--), linie-punct (dashdot) (-.).
De exemplu, daca s=c:, graficul este trasat cu linie punctata ciclamen, iar
daca s=bd punctele sunt marcate prin semnul romb de culoare albastra, dar nu
sunt unite ntre ele.


Programul
1.7.6. Vom reprezenta grafic functiile    si    pe interva

 , prima functie prin linie continua, iar a doua prin
lul
linie ntrerupa, iar punctele


de pe cele doua curbe, care au abscisele multipli de , sa fie marcate prin cerculete,
respectiv prin stelute.
m = input(m:);
h = 1/m; x = 0:h:1; y = 2*pi*x;
y = [sin(y) cos(y)];
h = 1/m; p = 0:1/6:1; pp = 2*pi*p;
plot(x,y,p,sin(pp),o,p,cos(pp),*)

Pentru m=200, graficul este cel din Figura 1.6.

1.7.2 Comenzi si instructiuni de gestionare a graficelor


Sistemul Matlab dispune de comenzi si instructiuni prin care sunt gestionate si specificate anumite caracteristici ale graficelor produse privind titlul, etichetarea axelor,
inserarea unor texte, marcarea unor retele, delimitarea graficului etc:
hold on pastreaza graficul curent, un nou grafic va fi supraimprimat;
hold off graficul curent este abandonat, fara a fi sters;

1.7. Grafica bidimensionala

23

0.8

0.6

0.4

0.2

0.2

0.4

0.6

0.8

0.1

0.2

0.3

Figura 1.6:

0.4

0.5

0.6

   si 

0.7

0.8

0.9

  

hold trece la modul off, daca sistemul se afla n modul on, respectiv la
modul on, cand sistemul se afla n modul off;
clf sterge graficul curent;
cla sterge graficul curent, pastrand axele;
figure(n) activeaza fereastra cu graficul n anterior obtinut;
axis([xmin xmax ymin ymax]) fixeaza limitele pentru axele absciselor si ordonatelor pentru figura curenta;
v = axis ntoarce un vector linie ce contine cele patru limite pentru axele
de coordonate, care pot fi si -Inf, Inf;
axis auto considera forma implicita a limitelor axelor de coordonate;
axis manual pastreaza limitele curente, astfel daca este utilizata instructiunea hold, figurile urmatoare vor avea aceleasi limite pentru axele de coordonate;
axis tight atribuie pentru limitele axelor cele mai apropiate valori ce
rezulta din datele ce se reprezinta grafic;
axis ij configureaza axele n modul matrix, adica originea axelor de
coordonate este coltul din stanga sus, axa i fiind verticala si marcata de sus n
jos, iar axa j este orizontala si este marcata de la stanga la dreapta;

24

Introducere n Matlab
axis xy configureaza axele n modul cartezian, mod implicit;
axis equal unitatile de masura pe cele doua axe au aceeasi marime;
axis image la fel cu axis equal, cu exceptia ca figura este restransa
la domeniul datelor;
axis square pune unitatile de masura pe cele doua axe de coordoante
astfel ncat figura sa fie prezentata ntrun patrat;
axis normal rearanjeaza axele n forma implicita;
axis off elimina axele de coordoante;
axis on insereaza axele de coordoante;
title(text) afiseaza textul specificat n partea de sus a graficului;
legend(str1,str2,...) afiseaza legenda prin care se efectueaza corespondenta dintre fiecare tip de curba a graficului si textele specificate
prin str1, str2 etc.;
legend(str1,str2,...,p) afiseaza legenda de tipul precizat
n pozitiile respectiv nafara axelor (p=-1), n interiorul axelor, dar pe cat e
posibil sa nu acopere figurile trasate (p=0), n partea dreapta sus (p=1), care
este pozitia implicita, n partea stanga sus (p=2), n partea stanga jos (p=3), n
partea dreapta jos (p=4);
legend off elimina legenda;
xlabel(text) eticheteaza axa abscielor cu textul precizat;
ylabel(text) eticheteaza axa ordonatelor cu textul precizat;
text(x,y,text) insereaza textul precizat prin text, n punctul de
coordonate (x,y), iar daca x si y sunt vectori (de aceeasi lungime), atunci
  
 
insereaza textul respectiv n toate punctele de coordoante 
,

,
pe cand daca textul este dat printr-o matrice cu acelasi numar de linii cu cel al
lungimilor vectorilor x si y, atunci textul din linia i este inserat n punctul de
 
  
coordonate 
,

gtext(text) afiseaza graficul, mpreuna cu cursorul plus, unde urmeaza sa fie inserat textul, cursorul putand fi pozitionat cu ajutorul mouse-ului sau
tastele cu sageti, dupa care prin apasarea oricarei taste (mouse sau keyboard),
se obtine inserarea textului;

1.7. Grafica bidimensionala

25

grid adauga pe grafic o retea rectangulara;


grid off grafic fara retea rectangulara;
zoom permite marirea unei parti a figurii pentru urmarirea anumitor detalii.
Se fixeaza cursorul mouse-ului pe pozitia n care suntem interesati a fi marita. Prin
dubluclick pe butonul din stanga se produce o marire a zonei de doua ori, iar prin
dubluclick pe butonul din dreapta se produce o micsorare a zonei de doua ori. Daca
se pastreaza apasat butonul din dreapta si se deplaseaza cursorul, se obtine un dreptunghi, care prin eliberarea butonului mouseului, va umple ntreaga figura.
Prin instructiunile
zoom off
zoom out

se dezactiveaza instructiunea zoom, respectiv se revine la dimensiunile initiale ale


figurii.
Comenzile de tip axis se impun a fi inserate dupa instructiunea plot.
Mentionam ca textele introduse pe grafic admit sintaxa sistemului LATEX simplificat.
Programul 1.7.7. Vom considera un exemplu de reprezentare grafica prin mascarea
unor parti a graficului. Sa reprezentam grafic cu linie continua pe intervalul [0,6]
functia care coincide cu   , cand valorile acestei functii sunt pozitive, iar n rest
sa fie zero. Pe aceasi figura, sa reprezentam prin linie ntrerupa si   .
m = input(m:);
h = 1/m; x = 0:h:6;
y = sin(pi*x); Y=ge(y,0).*y;
plot(x,y,k--,x,Y,k-)

Pentru m=200, graficul este cel din Figura 1.7.

1.7.3 Instructiunile polar si ezpolar


Instructiunea polar este analoga cu instructiunea plot, numai ca este considerata
reprezentarea curbei n coordoante polare, iar instructiunea ezpolar are sintaxa
ezpolar(f,[a,b])

si are ca efect reprezentarea grafica a functiei n coordonate polare, data prin expresia algebrica f, pe intervalul [a,b]. Al doilea parametru este optional. Valoarea
implicita este [0,2 ].
De exemplu, comanda
ezpolar(1+cos(theta))

va produce graficul din Figura 1.8. Mai remarcam faptul ca parametrul f poate fi
numele unei functii Matlab predefinite sau a utilizatorului.

26

Introducere n Matlab

0.8

0.6

0.4

0.2

0.2

0.4

0.6

0.8

Figura 1.7:

  

90

120

60
1.5

150

30

0.5

180

330

210

300

240
270
r = 1+cos()

Figura 1.8:

  



    


1.7. Grafica bidimensionala

27

Programul 1.7.8. Urmatorul program


clf; t=0:0.01:pi;
r=sin(3*t).*exp(-0.3*t);
polar(t,r,k-), grid

are ca efect graficul din Figura 1.9.


90
1
120

60
0.8
0.6

150

30
0.4
0.2

180

330

210

300

240
270

Figura 1.9:





 e

Instructiunea colormap
Sistemul Matlab dispune de un set de gestiune a culorilor n reprezentarile grafice.
Intructiunea colormap permite definirea unui set propriu pentru gestiunea culorilor.
Lansarea unei instructiunii se face prin comanda
colormap(map)
colormap(default)

A doua comanda seteaza setul de culori la forma standard (implicita).


Parametrul map este o matrice cu trei coloane, fiecare linie continand elemente
numere din intervalul [0,1], prin care se defineste cate o culoare. Modul de definire a culorii, dupa aceasta regula, se numeste RGB (Red-Green-Blue), si specifica n
cadrul culorii, respectiv intensitatile culorilor rosu, verde si albastru.
Sistemul Matlab dispune de asemenea de unele seturi de culori, care pot fi selectate si specificate de utilizator. O parte din acestea sunt obtinute prin:

28

Introducere n Matlab
colormap spring

genereaza nuante de culori ntre violet (magenta) si galben;


colormap summer

genereaza nuante de culori ntre verde si galben;


colormap autumn

genereaza nuante de culori ntre rosu, trecand prin portocaliu spre galben;
colormap winter

genereaza nuante de culori ntre albastru si verde;


colormap gray

genereaza nuante de culori gri.

1.7.4 Instructiunea stairs


Sistemul Matlab dispune de procedura stairs pentru reprezentarea grafica a
functiilor n scara si care accepta formele instructiunii plot.
Instructiunea de forma
stairs(y)

reprezinta grafic functia n scara cu valorile precizate prin vectorul y de lungime m,


iar abscisele sunt considerate numerele de la 1 la m. Daca y este o matrice de tipul
(m,n) vor fi reprezentate grafic n functii n scara, cate una pentru fiecare coloana a
matricei y.
Daca se considera instructiunea de forma
stairs(x,y)

se va reprezenta grafic functia n scara cu valorile precizate prin vectorul y si cu


abscisele corespunzatoare date prin vectorul x (componentele lui x trebuie sa fie
crescatoare).
Daca y si x sunt matrice de acelasi tip (m,n), atunci se vor reprezenta grafic n
functii n scara, cate una pentru fiecare din coloanele celor doua matrice (elementele
coloanelor matricei x trebuie sa fie crescatoare). Daca matricea x este un vector coloana cu m componente crescatoare, atunci functiile n scara corespunzatoare celor n
coloane ale matricei y se considera ca au aceleasi abscise precizate prin vectorul x.
Instructiunea de tipul
stairs(x,y,s)

permite prezentarea tipului liniei cu care se traseaza graficul cu ajutorul parametrului


s si care are sintaxa cea precizata la instructiunea plot.
Prin urmare, putem spune ca toate variantele folosite n cadrul instructiunii plot
au corespondente pentru instructiunea stairs.

1.7. Grafica bidimensionala

29

Programul 1.7.9. Fie functia lui Haar, numita n analiza wavelet functie wavelet
mama


    


daca













 



Folosind functia


daca 

 

n rest

se defineste familia de functii wavelet





 

unde  si se numesc indice de dilatare, respectiv indice de translatare. Daca se are


n vedere formula de definitie pentru functia , putem scrie






  






  





 


daca 

daca 

 

  




  

 




 

n rest

Vom scrie un program


definita segementar cu aju care sa reprezinte grafic
 functia  

torul functiilor ,
, unde  , si sunt fixati (
).

Functia  este o functie n scara, avand punctele de discontinuitate  , pen    

 
tru
corespunzatoare acestor puncte,
, pentru par,
  , cu valorile

, pentru impar.
respectiv
Cu aceste precizari, avem urmatorul program Matlab pentru reprezentarea grafica
a functiei  :

j = input(j=);
r = input(r=);
s = input(s (>r)=);
rs = 2*s-2*r+3;
fprintf(rs=2s-2r+3=%2d\n,rs);
y = input(rs valori alternative [1, -1 ... 1]:);
y = 2(j/2)*y;
x = 1/2j*[r:1/2:s+1];
stairs(x,y)

Executia programului, pentru j=1, s=1, r=-2, produce graficul din Figura 1.10.
Singurul inconvenient la executia acestui program este legat de instructiunea
input prin care se initializeaza vectorul y. Cand numarul functiilor  prin care
se defineste functia  este mare, atunci rs este mare si introducerea listei lui y este
anevoioasa.

30

Introducere n Matlab
1.5

0.5

0.5

1.5
1

0.8

0.6

0.4

Figura 1.10:

0.2

0.2

0.4

0.6

0.8

           





O varianta a programului precedent, pentru care nu este necesara initializarea lui


y de la tastatura, ar putea fi urmatorul program:
j = input(j=);
r = input(r=);
s = input(s (>r)=);
rs = 2*s-2*r+3;
y = (-ones(1,rs)).[2*r:2*s+2];
y = 2(j/2)*y;
x = 1/2j*[r:1/2:s+1];
stairs(x,y)

Programul 1.7.10. Sa reluam reprezentarea grafica a functiilor wavelet Haar si sa


scriem un program care sa reprezinte pe aceeasi figura doua secvente de functii wavelet, pentru doua valori
ale indicelui de dilatare
  consecutive
 j, iar secvent

 ele alese sa

acopere intervalul   . Pentru aceasta trebuie ca r=
, iar s=
. Totodata
sa trasam graficul primei secvente cu linie continua si punctele sa le marcam prin
cerculete, iar pentru a doua secventa sa alegem linie punctata pentru reprezentarea
grafica, iar punctele sa fie marcate cu stelute n cinci colturi:
clf, hold on, axis off
plot([-1.2 1.2],[0 0],k:)
j = input(j=);
r = -2\{}j; s=-r-1;
rs = 2*s-2*r+3;
y = (-ones(1,rs)).[2*r:2*s+2];
y = 2(j/2)*y;
x = 1/2j*[r:1/2:s+1];
stairs(x,y,ko-)

1.7. Grafica bidimensionala

31

j = j+1; r = -2j; s=-r-1;


rs = 2*s-2*r+3;
y = (-ones(1,rs)).[2*r:2*s+2];
y = 2(j/2)*y;
x = 1/2j*[r:1/2:s+1];
stairs(x,y,kp--)

Executia programului, pentru j=0, produce graficele din Figura 1.11. Se observa

Figura 1.11:



 ,

         



ca programul mai elimina axele sistemului Matlab, dar adauga axa absciselor trasata
punctat.

1.7.5 Instructiunile bar si barh


Aceste doua instructiuni, dupa cum spun si denumirile, reprezinta anumite date numerice cu ajutorul barelor (batoanelor) verticale si respectiv orizontale.
Forme ale acestor instructiuni sunt:
bar(y,w,tip,color)
bar(x,y,w,tip,color)
barh(y,w,tip,color)
barh(x,y,w,tip,color)

argumentele w, tip si color sunt optionale, dar cand sunt specificate, trebuie
sa pastreze aceasta ordine.
Parametrul x este un vector de lungime m.
Daca y este un vector de aceeasi lungime ca si x, atunci vor fi reprezentate grafic


n fiecare din punctele de abscise x ,
 m, cate o bara de naltimile date prin y ,

32


Introducere n Matlab


 m, care pot sa fie si negative. Daca parametrul x lipseste, atunci se considera


implicit ca x are componentele ca fiind primele m numere naturale.
Daca y este o matrice de tipul (m,n), reprezentarile sunt efectuate pentru fie

care din cele n coloane ale matricei, adica n fiecare punct x ,
 , de pe axa
absciselor vor fi reprezentate cate n bare (batoane).

Parametrul w specifica latimea barelor, implicit fiind w
, iar pentru w  
barele se suprapun.
Daca parametrul tip=grouped, care este valoarea implicita, atunci avem reprezentarile precizate mai sus, iar daca tip=stacked barele (batoanele) vor fi stivuite pe verticala.
Parametrul color specifica culoarea barelor (batoanelor) si are una din urmatoarele valori: r (rosu), g (verde), b (albastru), y (galben), m (violet), c (ciclamen),
k (negru), w (alb).
Tot ce sa spus despre bar se poate spune si pentru barh, numai ca orientarea
barelor este pe orizontala.

1.7.6 Instructiunea subplot


Sistemul Matlab are posibilitatea de a mparti o fereastra, pentru reprezentare grafica,
n m n zone (ferestre), cu ajutorul instructiunii subplot.
Forma generala a instructiunii este
subplot(m,n,p)

unde m, n si p sunt numere naturale, care exprima faptul ca fereastra initiala se


mparte n m n ferestre aranjate pe m linii si n coloane, iar reprezentarea grafica,
la momentul executiei instructiunii, se va face n fereastra p, numerotarea ferestrelor
facanduse pe linii.
Programul 1.7.11. Reprezentarea grafica poate fi facuta si cu ajutorul reprezentarilor
parametrice ale curbelor.
Pentru reprezentarea grafica a unui cerc cu centrul n originea axelor de coordoante am putea folosi secventa de instructiuni:
r = input(raza=);
t = 0:0.01:2*pi;
x = r*sin(t); y=r*cos(t);
subplot(2,1,1), plot(x,y)
axis normal
subplot(2,1,2), plot(x,y)
axis square

Pentru r=2, graficul din partea stanga a Figurii 1.12, se obtine cand nu sa impus ca
unitatile de masura pe cele doua axe de coordoanate sa fie aceleasi, iar graficul din
partea dreapta sa obtinut dupa ce sa nlaturat acest neajuns cu instructiunea axis
square.

1.7. Grafica bidimensionala

33

1.5

1.5
1

0.5

0.5
0

0
0.5

0.5

1
1.5

2
2

1.5

2
2

Figura 1.12: 

 , 

 ,

    
,


Programul 1.7.12. Pentru exemplificarea instructiunilor bar, barh si subplot,


facem din nou apel la o matrice magica de ordin m si sa reprezentam n patru ferestre
de tipul 2 2, prin bare verticale grupate si prin bare verticale stivuite, valorile primelor doua coloane ale matricei, respectiv prin bare orizontale grupate si prin bare
orizontale stivuite valorile ultimelor doua coloane:
m=input(m:); A=magic(m);
subplot(221), bar(A(:,[1 2]),grouped)
title(Primele doua coloane - grupate)
subplot(222), bar(A(:,[1 2]),stacked)
title(Primele doua coloane - stivuite)
subplot(223), barh(A(:,[m-1 m]),grouped)
title(Ultimele doua coloane - grupate)
subplot(224), barh(A(:,[m-1 m]),stacked)
title(Ultimele doua coloane - stivuite)
colormap summer

Reprezentarea grafica, pentru m=4, este data n Figura 1.13.

1.7.7 Instructiunea fplot


Pentru reprezentarea grafica a unei functii definite cu ajutorul unei proceduri Matlab,
se pot folosi una din urmatoarele variante ale instructiunii fplot:
fplot(numef,lim)
fplot(numef,lim,s)
fplot(numef,lim,tol)

34

Introducere n Matlab
Primele doua coloane grupate

Primele doua coloane stivuite

20

20

15

15

10

10

Ultimele doua coloane grupate

10

Ultimele doua coloane stivuite

15

10

15

20

Figura 1.13: Bare verticale si bare orizontale


fplot(numef,lim,tol,s)
fplot(numef,lim,n)
[X,Y] = fplot(numef,lim,...)

In toate cazurile se reprezinta grafic functia numef, cu limitele pentru axa absciselor specificate prin lim=[xmin xmax] sau lim=[xmin xmax ymin ymax].
Tipul liniei folosit n reprezentarea grafica este specificat prin parametrul s, ca si
n cazul instructiunii plot, iar eroarea relativa folosita n reprezentarea grafica este
precizata prin parametrul tol, care are valoarea implicita tol=2e-3. Parametrul n
specifica faptul ca graficul se traseaza cu ajutorul a n+1 puncte, valoarea implicita a
xmin
lui n este n=1, iar valoarea maxima a pasului nu depaseste xmax 

n
Remarcam faptul ca parametrii optionali s, tol si n pot fi luati n orice ordine.
Functia numef poate sa ntoarca, pentru un vector x, un vector y de aceeasi
lungime ca si x sau o matrice cu mai multe coloane si numar de linii ca si lungimea
lui x. In primul caz, se va reprezenta grafic o singura curba, iar n al doilea caz, pentru
fiecare coloana a matricei y cate o curba. Parametrul numef poate fi nlocuit si cu un
sir de caractere de tipul [f(x),g(x),...], unde f, g,... sunt nume de functii
Matlab, caz n care, pe aceeasi figura, se vor reprezenta grafic functiile respective.
De exemplu, instructiunea
fplot([sin(2*pi*x), cos(2*pi*x)],[0 1])

   si   , pe intervalul


va reprezenta
grafic,
pe
aceeas

i
figur
a
,
funct

iile
   .

1.7. Grafica bidimensionala

35

Ultima forma a instructiunii fplot nu produce nici un grafic, ci pastreaza


punctele graficului n X si Y, care pot fi apoi folosite efectiv, prin instructiunea
plot(X,Y), la reprezentarea grafica.

1.7.8 Instructiunea ezplot


Sintaxa instructiunii ezplot poate fi:
ezplot(f)
ezplot(f,[a,b])
ezplot(f,[a,b,c,d])
ezplot(x,y)
ezplot(x,y,[a,b])

Parametrul f reprezinta o expresie algebrica de una sau doua variabile.


Daca f este o expresie algebrica de o singura variabila, atunci este reprezentata
grafic functia definita de aceasta expresie, pe intervalul [a,b]. Valoarea implicita a
acestui parametru este [-2 ,2 ].
Daca f este o expresie algebrica de doua variabile, atunci este reprezentata grafic
functia implicita definita prin f=0, pe domeniul [-2 ,2 ] [-2 ,2 ], daca se
foloseste prima forma de apel, pe domeniul [a,b] [a,b], pentru a doua forma,
respectiv pe [a,b] [c,d], pentru a treia forma. Cele doua variabile sunt considerate ca fiind ordonate lexicografic.
Ultimele doua forme sunt folosite pentru reprezentarile parametrice, x reprezentand abscisa, iar y ordonata. Argumentul acestor parametri variaza n intervalul
[a,b], iar daca acesta lipseste, atunci se considera intervalul implicit [0,2 ].
De exemplu, instructiunea
ezplot(sin(3*t)*cos(t),sin(3*t)*sin(t),[0,pi])

produce graficul din Figura 1.14. Mai remarcam faptul ca parametrii f, x si y, pot fi
numele unor functii Matlab predefinite sau ale utilizatorului.

1.7.9 Instructiunea fill


Instructiunea fill este folosita pentru umbrirea interiorului unui poligon specificat
prin varfurile sale:
fill(x,y,c)

unde x si y specifica varfurile poligonului, iar c reprezinta culoarea dorita pentru


interiorul poligonului.
Instructiunea poate fi utilizata pentru umbrirea unei parti dintro figura.
Programul 1.7.13. Sa scriem un program care sa umbreasca aria cuprinsa ntre axa
absciselor, curba lui Gauss si dreptele perpendiculare pe axa absciselor n punctele a
  
si b (-3 a b 3).

36

Introducere n Matlab
x = sin(3 t) cos(t), y = sin(3 t) sin(t)

0.4

0.2

0.2

0.4

0.6

0.8

0.8

Figura 1.14: 

0.6

0.4



0.2

0
x

0.2

, 

 



0.4

0.6

 

0.8

,

   

Curba lui Gauss este data prin functia





e

 

a = input{a=}; b = input(b=);
xmin = -3; xmax = 3;
fplot{1/sqrt(2*pi)*exp(-x2/2),[xmin xmax]}
x = a; y = 0;
t = a:0.01:b;
x = [x,t]; y = [y,1/sqrt(2*pi)*exp(-t.2/2)];
x = [x,b]; y = [y,0];
fill(x,y,c)

Pentru a=-2 si b=1.5, se obtine graficul din Figura 1.15.

1.8 Instructiuni de ciclare si control


Ca si n celelalte limbaje de programare evoluate, sistemul Matlab dispune de
instructiuni, care permit repetarea unei secvente de instructiuni de un numar definit sau indefinit de ori, precum si de instructiuni, care permit iesirea din executarea
secventiala a instructiunilor unui program.

1.8. Instructiuni de ciclare si control

37

0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
3

Figura 1.15: Curba lui Gauss

1.8.1 Instructiunea if
Trei forme de baza ale instructiunii if sunt:
if exp
secv
end
%%%%%%%%%%%%%%
if exp
secv
else
secv1
end
%%%%%%%%%%%%%%
if exp
secv
elseif exp1
secv1
else
secv2
end

unde exp si exp1 sunt expresii logice ce pot fi evaluate n acest punct, iar secv,
secv1 si secv2 sunt secvente de instructiuni Matlab.
Instructiunea if sub prima forma face sa se execute secventa de instructiuni
secv numai daca valoarea expresiei logice exp este adevarata, dupa care se trece la
prima instructiune ce urmeaza liniei end.

38

Introducere n Matlab

A doua forma de instructiune if are ca efect executarea uneia dintre secventele


de instructiuni secv si secv1, n functie de faptul ca expresia logica exp este
adevarata, respectiv falsa, dupa care se trece la instructiunea ce urmeaza dupa linia
end.
Ultima forma are ca rezultat executarea uneia dintre secventele de instructiuni
secv, secv1 si secv2, dupa cum valoarea lui exp este adevarata, a lui exp este
falsa si a lui exp1 este adevarata, respectiv valorile expresiilor logice exp si exp1
sunt false si exp2 are valoare adevarata.
De exemplu secventa de instructiuni ce urmeaza stabileste daca elementele unui
vector v cu m componente ntregi sunt toate numere pare, toate impare sau sunt si
pare si impare:
if rem(v,2)==0
p=0;
elseif rem(v,2)==1
p=1;
else
p=2;
end
p

Rezultatul executiei acestei secvente atribuie lui p una din valorile 0, 1, 2, n functie
de faptul ca vectorul v are toate componentele numere pare, toate impare, respectiv
si pare si impare.

1.8.2 Instructiunea switch


Aceasta instructiune are ca rezultat trecerea executiei, n functie de valoarea unei
expresii, n diferite puncte ce urmeaza.
Forma generala a instructiunii switch este:
switch exp
case val1
secv1
case val2
secv2
. . . . .
otherwise
secv
end

unde exp este o expresie aritmetica sau de tip caracter, iar secv1, secv2, . . . ,
secv sunt secvente de instructiuni Matlab. Daca valoarea expresiei exp coincide cu
cu una din valorile val1, val2, . . . atunci se executa secventa de instructiuni corespunzatoare secv1, secv2, . . . , iar n caz contrar se executa secventa de instructiuni
secv.
De exemplu, secventa de instructiuni

1.8. Instructiuni de ciclare si control

39

m=input(m=);
switch expr
case ones
A=ones(m)
case eye
A=eye(m)
case magic
A=magic(m)
otherwise
A=zeros(m)
end

genereaza matricea patratica A de ordin m, care poate fi de la caz la caz, respectiv


matrice cu toate elementele 1, matrice unitate, matrice magica, matrice cu toate elementele zero.

1.8.3 Instructiunea while


Instructiunea while este o instructiune de ciclare prin care se repeta executia unei
secvente de instructiuni Matlab pana cand o conditie este satisfacuta. Forma generala
a instructiuni este:
while exp
secv
end

si are ca efect executarea secventei de instructiuni secv atata timp cat valoarea expresiei logice exp este adevarata.
De exemplu, daca vrem sa calculam valoarea aproximativa a solutiei ecuatiei

  , folosind metoda iterativa, impunand conditia de oprire prin aceea ca
numarul iteratiilor sa nu depaseasca o valoare data n si distanta dintre doua iterate
consecutive sa nu fie mai mare decat un epsilon 0 dat, atunci avem programul
n=input(n=);
epsilon=input(epsilon=);
xv=pi/4; k=1; d=1;
while d>epsilon & k<n
k=k+1; xn=cos(xv);
d=abs(xn-xv); xv=xn;
end
fprintf(k=%2d\n,k)
fprintf(d=%10.4f\n,d)
fprintf(x=%10.4f\n,xn)

Astfel, pentru valorile la intrare n=50 si epsilon=1e-5, sunt afisate rezultatele:


k=25
d=
x=

0.0000
0.7391

40

Introducere n Matlab

1.8.4 Instructiunea for


Fata de instructiunea while, instructiunea de ciclare for are fixat numarul repetarilor unei secvente de instructiuni.
Forma generala a instructiunii este:
for v=vi:pas:vf
secv
end

unde v este variabila de ciclare, care ia toate valorile, ncepand cu valoarea expresiei
aritmetice vi pana la valoarea expresiei vf, folosind pasul dat prin expresia aritmetica pas. Pentru fiecare din aceste valori ale lui v se executa succesiv secventa secv
de instructiuni Matlab.
Daca pas=1, atunci putem folosi urmatoarea forma a instructii for:
for v=vi:vf
secv
end

Mai remarcam faptul ca n interiorul unui ciclu for poate exista un alt ciclu for
s.a.m.d.
De exemplu, secventa urmatoare va genera matricea h de tipul (m,n), numita
matricea lui Hilbert:
m=input(m=);
n=input(n=);
h=[];
for i=1:m
for j=1:n
h(i,j)=1/(i+j-1);
end
end
format rat
disp(h)

In urma executarii acestui program, cu valorile m=3 si n=6, se obtin rezulatele


m=3
n=4
1
1/2
1/3

1/2
1/3
1/4

1/3
1/4
1/5

1/4
1/5
1/6

Mai consideram un exemplu de folosire a instructiunii for. Vrem sa construim




matricea Vandermonde V, corespunzatoare numerelor  ,
 , care sunt date

1.9. Instructiuni de ntrerupere

41

prin vectorul a. Reamintim ca forma generala a aceastei matrice este




























Matricea V poate fi generata prin secventa de program urmatoare:


m=input(m=);
for i=1:m
a(i)=input(a(i)=);
end
V=[];
for i=0:m-1
V=[V;a.i];
end
disp(V)

Se observa ca matricea V a fost intializata cu matricea vida, care este specificata prin
[], iar constructia efectiva sa facut prin operat
ia
de concatenare.

 

,
 , se obtine
Executand programul pentru m=4 si a 
m=4
a(i)=1
a(i)=2
a(i)=3
a(i)=4
1
1
1
1

1
2
4
8

1
3
9
27

1
4
16
64

1.9 Instructiuni de ntrerupere


1.9.1 Instructiunea try. . . catch
Forma generala a instructiunii este:
try
secv
catch
secv1
end

si are ca efect executia primei secvente de instructiuni, secv, pana la aparitia unei
erori, dupa care se executa a doua secventa de instructiuni, secv1. Daca nici o

42

Introducere n Matlab

eroare nu apare n executia secventei secv, dupa executarea acesteia, se trece la


prima instructiune dupa linia end. Daca la executia secventei de instructiuni secv1
apare o eroare, executia programului este oprita, daca o alta instructiune de tipul
try...catch nu exista.

1.9.2 Instructiunea pause


Instructiunea pause are ca efect ntreruperi temporare ale executiei programelor.
Instructiunea pause are urmatoarele forme:
pause(n)
pause
pause off
pause on

Prima forma are ca efect ntreruperea executarii programului timp de n secunde (n


este numar pozitiv), cand se ajunge cu executarea n acest punct.
A doua forma, pause fara argument, ntrerupe executarea programului, reluarea
executarii facanduse prin apasarea oricarei taste.
Instructiunea pause cu argumentul off are ca efect inhibarea tuturor instructiunilor pause si pause(n) ce urmeaza, iar daca are argumentul on, atunci se
produce reactivarea acestora.

1.9.3 Instructiunea return


Instructiunea
return

are ca efect ntoarcerea n programul de pe nivelul imediat superior (programul care


apeleaza unitatea n care se afla instructiunea). Nivelul cel mai nalt este cel care
corespunde modului interactiv de lucru, prin urmare instructiunea return, la acest
nivel nu are niciun efect.

1.9.4 Instructiunea break


Instructiunea
break

are efecte diferite n functie de locul unde este pozitionata.


Daca instructiunea break se afla ntrun ciclu while, se produce iesirea fortata
din ciclul respectiv, iar daca se afla ntrun ciclu for se produce la fel o iesire fortata
din ciclu, cu observatia ca daca exista un ciclu for superior, se continua cu executarea acestuia.

1.10. Functii (proceduri) n Matlab

43

Daca instructiunea break se afla ntro instructiune de tipul if, switch sau
try...catch, atunci se abandoneaza executia acestei instructiuni, iar daca este
pozitionata n oricare alta parte, se ncheie executarea programului.

1.9.5 Instructiunea error


Instructiunea
error(mesaj)

are ca efect abandonarea executiei si afisarea mesajului precizat prin mesaj.

1.10 Functii (proceduri) n Matlab


Toate programele scrise pana aici, numite fisiere script, ar putea fi considerate ca
fiind programe principale. Un astfel de program principal poate sa apeleze alte programe, pe care le numim functii sau proceduri, care la randul lor pot face apel la alte
proceduri.
Un program principal (fisier script), nu poate fi apelat de o alta unitate de program. Lansarea executiei unui astfel de program, se poate face numai cand sistemul
Matlab este n mod interactiv, adica avem pe ecran cursorul  al sistemului Matlab.
Lansarea se face n doua moduri:
prin tastarea, dupa cursorul

, a numelui sau, fara extensia .m;



prin copierea, dupa cursorul , a continutului fisierului ce contine programul,


un exemplu fiind cuplul de comenzi Copy Paste,
dupa care se tasteaza comanda Enter.
Remarcam faptul ca toata istoria unei sesiuni se afla pe ecran, chiar daca unele
secvente mai vechi nu sunt vizibile la un momnet dat, dar cu ajutorul mouseului,
folosind bara din dreapta a ecranului se poate aduce secventa dorita n partea vizibila a ecranului. Mai mult, cu ajutorul sistemului de sageti pot fi readuse comenzi
mai vechi sau mai noi, care pot fi reeditate (modificate) si lansate dupa o astfel de
reeditare. Exista chiar o cautare mai rapida a unor instructiuni din lista de instructiuni
ce au fost utlizate ntro sesiune Matlab, anume se tasteaza nceputul instructiunii
urmata de sageata n sus.
Inca ceva, toate variabilele folosite n timpul unei sesiuni Matlab, fie n mod
interactiv, fie prin executia unui program principal (scriptfile) au un caracter global
si sunt pastrate ntrun spatiu de lucru (workspace), care la ncheierea sesiunii
Matlab sunt pierdute. De aceea, avem la dispozitie comenzile pe care le-am prezentat,
diary si save care permit, prin lansarea lor, salvarea acestor informatii.

44

Introducere n Matlab

1.10.1 Definirea si structura unei functii Matlab


Colectia de programe ale sistemului Matlab este constituita, n mare parte, din functii
(proceduri) scrise n limbajul propriu. Acestea sunt fisiere cu extensia .m avand
urmatoarea structura:
function [lista1] = numef(lista2)
% linia H1 (help line)
% comentariu
%
corp

unde lista1 si lista2 reprezinta respectiv lista variabilelor de iesire (despartite


prin spatii sau virgule) si lista parametrilor de intrare (despartiti prin spatii sau virgule), corp este secventa de instructiuni ale functiei cu numele numef.
Variabilele din corpul procedurii au un caracter local, prin urmare la ntoarcerea
n unitatea care face apelul valorile acestora se pierd, desigur cu exceptia valorilor
din lista1. Exista posibilitatea schimbarii caracterului local, prin instructiunea
global lista

care are ca efect obtinerea caracterului global pentru variabilele din lista.
In corpul unei functii Matlab variabilele nargin si nargout specifica numarul
parametrilor de intrare, adica lungimea listei lista2, respectiv a parametrilor de
iesire, adica lungimea listei lista1.
Daca ntrun fisier script sau de la tastatura se da una din comenzile
nargin(numef)
nargout(numef)

atunci se obtin numarul parametrilor de intrare si respectiv numarul parametrilor de


iesire pentru functia Matlab cu numele numef.
Liniile dinaintea corpului procedurii, care ncep cu % sunt linii de comentariu si
vor fi listate cand se lanseaza comanda
help numef

Din acest motiv, partea de comentariu de la nceputul procedurii este bine sa contina
informatii, care sa descrie pe scurt cum trebuie sa fie apelata si folosita functia respectiva.
Mai remarcam prima linie de comentariu, notata cu H1, care are o nsusire aparte.
Cand se lanseaza comanda
lookfor key

care cauta cuvantul cheie key, aceasta se face numai n liniile H1 ale fisierelor cu
extensia .m, dupa care se listeaza numele fisierelor ce contin cuvantul cheie precizat.
In cadrul liniilor ce alcatuiesc corpul functiei pot exista de asemenea linii de
comentariu, care ncep cu simbolul %, dar care nu vor fi afisate odata cu lansarea
comenzii help. Mai mult aparitia simbolului % n interiorul unei linii face ca tot ce
urmeaza pe linia respectiva sa fie considerat comentariu.

1.10. Functii (proceduri) n Matlab

45

Numele unei functii Matlab, numef, scrisa de utilizator, este de dorit sa fie diferit de numele functiilor deja existente n sistemul Matlab, iar numele fisierului, cu
extensia .m, ce va contine functia sa fie numef.m.
Daca lista parametrilor de intrare, lista2, este vida, atunci linia de definitie a
functiei este de forma
function [lista1] = numef

Daca lista variabilelor de iesire, lista1, este formata dintro singura variabila,
atunci se poate renunta la parantezele drepte, iar daca este vida se poate elimina
complet.
Cu aceste precizari, cea mai simpla linie de defintie a unei functii (proceduri) este
function numef

1.10.2 Apelul unei functii (proceduri) Matlab


Apelarea unei functii se poate face n doua moduri.
Primul mod este cel interactiv, de exemplu, prin una din formele
[apel1] = numef(apel2)
numef(apel2)

unde apel2 este lista parametrilor actuali, care poate fi vida sau formata din cel
mult atatea elemente cat are lista parametrilor formali, lista2, din linia de definitie
a functiei numef, de fiecare data facanduse legatura de tipul: primul parametru din
apel2 corespunde primului parametru din lista2, al doilea element din apel2
corespunde celui de al doilea parametru din lista2,..., corespondenta ncheindu
se cand se termina lista apel2. Desigur, daca apel2 are mai putine elemente decat
lista2, atunci trebuie gestionata aceasta situatie n corpul functiei numef cu ajutorul varaibilei nargin.
Rezultatele executarii functiei numef, se pastreaza n lista apel1 n primul caz,
respectiv n ans n al doilea caz. O discutie analoga asupra corespondentei dintre
apel2 si lista2, se face si n cazul apel1 si lista1.
O alta cale de apel a unei functii este dintrun alt program sau procedura Matlab, prin aparitia ntro instructiune Matlab a numelui functiei, mpreuna cu lista
parametrilor actuali de tipul listei apel2, mai sus precizata.

1.10.3 Subfunctii
Functiile pot avea n corpul lor apeluri la alte functii. Totdeauna ntoarcerea n unitatea care cheama se face, cand se ajunge la linia finala a corpului unitatii chemate
sau cand se ntalneste instructiunea return.
Exista doua situatii mai speciale n constructia functiilor n Matlab.

46

Introducere n Matlab

In primul rand, exista posibilitatea ca dupa corpul unei functii sa fie definite
una sau mai multe functii, pe care le numim subfunctii si care pot fi apelate din
corpul functiei. Forma unei astfel de functii ar fi:
function [lista1] = numef(lista2)
%
% comentariu
%
corp
function [list1] = numef1(list2)
%
% comentariu1
%
corp1

n secventa de instructiuni corp facanduse apel la functia numef1. Functiile de


tipul functiei numef1 nu se pot apela din exteriorul fisierului numef.m. Drept
consecinta nici comentariu1 nu este vizibil din exteriorul functiei numef.

Functia 1.10.1. Sa scriem o procedura, care reprezinta grafic pe intervalul   


o multime finita precizata de polinoame ale lui Cebsev de speta I. Daca numarul
acestora este par, atunci sa fie reprezentate pe doua coloane, iar n caz contrar pe o
singura coloana.
function cebisev(lista)
% Polinomul Cebisev
% lista -- contine gradele polinoamelor Cebisev
%
care vor fi reprezentate grafic;
% daca lista are un numar par de elemente,
% polinoamele se vor reprezenta pe doua coloane;
% daca lista are un numar impar de elemente,
% polinoamele se vor reprezenta pe o coloana;
%
clf, x=-1:0.001:1; r=length(lista);
if rem(r,2)==0
m=fix(r/2); n=2;
else
m=r; n=1;
end
for i=1:r
y=cos(lista(i)*acos(x));
splots(m,n,i,x,y,lista(i))
end
function splots(m,n,k,u,v,gr)
subplot(m,n,k), plot(u,v,k-)
title([Polinom Cebisev de gradul n=,num2str(gr)])

Daca se apeleaza functia cebisev prin


cebisev([2:5])

se obtin graficele din Figura 1.16.

1.10. Functii (proceduri) n Matlab

47

Polinomul Cebisev de gradul n=2

Polinomul Cebisev de gradul n=3

0.5

0.5

0.5

0.5

1
1

0.5

0.5

1
1

Polinomul Cebisev de gradul n=4


1

0.5

0.5

0.5

0.5

0.5

0.5

0.5

Polinomul Cebisev de gradul n=5

1
1

0.5

1
1

0.5

Figura 1.16: Polinoamele lui Cebsev de grad



0.5

 

 

1.10.4 Functia feval


Un alt caz special este acela cand printre parametrii formali de intrare din lista2
exista si parametri ce pot lua valori nume ale unor functii. La apelul unei astfel de
functii pe pozitia parametrului actual corespunzator din lista apel2 trebuie sa se afle
un sir de caractere ce denumeste functia actuala.
Functia 1.10.2. Functia cu numele opmatrix opereaza prin operatorii Matlab
cunoscuti asupra a doua matrice:
function Z = opmatrix(op,X,Y)
%
% Efectueaza operatia definita prin op
% asupra matricelor X si Y.
% Rezultatul este returnat in Z
%
Z = feval(op,X,Y);

Folosind aceasta functie, de exemplu prin comenzile


opmatrix(plus,A,B)
opmatrix(minus,A,B)
opmatrix(and,A,B)

sau
opmatrix(+,A,B)
opmatrix(-,A,B)
opmatrix(&,A,B)

48

Introducere n Matlab

se obtin suma, diferenta si respectiv conjunctia matricelor A si B.

1.10.5 Comanda echo


Instructiunea echo are un comportament putin diferit pentru cele doua tipuri de
fisiere cu extensia .m.
Daca suntem n cazul unui fisier script, atunci instructiunile
echo on
echo off
echo

au respectiv urmatoarele efecte: prima are ca efect afisarea pe ecran a fisierului n derulare, a doua anuleaza acest efect, iar a treia are efectul primei forme, daca sistemul
se afla n mod off, iar daca se afla n mod off se va face trecerea la modul on.
Daca suntem n cazul functiilor Matlab cu extensia .m, atunci avem formele
echo
echo
echo
echo
echo

numef on
numef off
numef
on all
off all

Primele trei forme sunt analoge celor trei din cazul script, numai ca se mai specifica si
numele functiei la care se refera. Celelalte doua actioneaza asupra tuturor functiilor.

1.11 Instructiuni de evaluare a eficientei


Compararea eficientei algoritmului este posibila n sistemul Matlab fie prin numararea opertiilor n virgula flotanta, fie prin determinarea duratei, n secunde, a executiei
unei secvente de instructiuni, CPU (Central Processor Unit).

1.11.1 Instructiunea flops


Instructiunea flops este ncorporata n Matlab 6 prin pachetul LAPACK. Prin urmare este functionala numai daca sistemul contine si LAPACK.
Obtinerea numarului operatiilor n virgula flotanta efectuate pentru executia unei
secvente secv de instructiuni Matlab se realizeaza prin:
flops(0)
secv
flops

La ncheierea executiei acestei succesiuni de instructiuni n variabila flops se afla


numarul acestor operatii.

1.12. Grafica tridimensionala

49

1.11.2 Instructiunile tic si toc


Pentru obtinerea duratei executiei unei secventte secv de instructiuni Matlab avem
urmatoarea succesiune de instructiuni:
tic
secv
toc

unde tic marcheaza nceputul contorizarii timpului, iar toc anunta ncheierea contorizarii, variabila toc continand timpul masurat n secunde.

1.12 Grafica tridimensionala


Grafica tridimensionala sau altfel numita 3D este axata n sistemul Matlab pe doua
directii: reprezentarea curbelor n spatiu si reprezentarea suprafetelor.

1.12.1 Instructiunea plot3


Instructiunea plot3 este utilizata pentru reprezentarea curbelor n spatiu si n principiu nu se deosebeste mult de instructiunea plot din grafica bidimensionala.
Formele ntalnite pentru aceasta instructiune sunt:
plot3(x,y,z)
plot3(x,y,z,s)
plot3(x1,y1,z1,x2,y2,z2,...)
plot3(x1,y1,z1,s1,x2,y2,z2,s2,...)

Daca x, y, z sunt vectori de acceasi lungime m, atunci se unesc punctele de coordo 




nate x y z ,
 m, printro linie poligonala de tipul precizat prin parametrul
s, de la instructiunea plot, iar n lipsa acestui parametru, sistemul Matlab efectueaza o alegere implicita a tipului curbei. Desigur ca netezimea curbei este cu atat
mai buna cu cat numarul punctelor este mai mare.
Daca x, y, z sunt matrice de acelasi tip (m,n), atunci pentru fiecare coloana se
obtine cate o linie poligonala, adica n linii poligonale. Acestea sunt generate respectiv

  m 

 n, cu aceeasi
de punctele de coordonate x y z  pentru fiecare 
observatie privind parametrul s, care precizeaza tipul curbei. In acest caz pe aceeasi
figura vor fi obtinute mai multe grafice.
Ultimele doua forme sunt extinderi ale primelor doua, pentru a putea controla
mai bine n special tipul curbelor cu ajutorul parametrilor de tip s.
Remarcam de asemenea extinderea actiunilor comenzilor ce controleaza un grafic
din cazul bidimensional pentru cazul tridimensional.
Programul 1.12.1. Prezentam un program care ilustreaza miscarea unei particule din
punctul A pe o spirala pana n punctul B.

50

Introducere n Matlab
pas=input(pas=); h=input(h=);
t=0:pas:h; r=exp(-0.2*t); th=pi*t*0.5;
x=r.*cos(th); y=r.*sin(th); z=t;
plot3(x,y,z), hold on
plot3([1,1],[-0.5,0],[0,0])
text(1,-0.7,0,A), n=length(t);
text(x(n),y(n),h+2,B)
xlabel(x), ylabel(x), zlabel(z)

Sa explicam pe scurt o parte a instructiunilor acestui program.


Figura este obtinuta n doua etape, din cauza aceasta a fost introdusa instructiunea
hold on. Prima instructiune plot3 traseaza efectiv graficul spiralei, care se
mai completeaza prin segmentul din planul xoy delimitat de punctele de coordonate (1,-0.5,0) si (1,0,0), trasat cu a doua instructiune plot3. Cele doua
instructiuni au acelasi rezultat ca si instructiunea
plot3(x,y,z,[1,1],[-0.5,0],[0,0])

doar ca spirala va fi trasata cu o anumita culoare, iar segmentul din planul xoy cu
alta. Daca vrem ca ntreaga curba sa fie trasata cu aceeasi culoare se poate apela la
parametrul de tip s.
Se mai observa ca pozitia initiala A a punctului si pozitia finala B sunt afisate
cu instructiunile text, iar etichetele celor trei axe de coordoante sunt date prin
instructiunile de tip label.
Dupa executarea programului, cu h=20 si pas=0.01, sa obtinut graficul din
Figura 1.17.

20

15

10

0
1

A
1

0.5
0.5

0
0
0.5
y

0.5
1

Figura 1.17: Miscarea pe spirala

1.12. Grafica tridimensionala

51

1.12.2 Instructiunea ezplot3


Pentru reprezentarea grafica a curbelor n spatiu, poate fi folosita instructiunea
ezplot3, care se lanseaza prin una din comenzile:
ezplot3(x,y,z)
ezplot3(x,y,z,[a,b])
ezplot3(x,y,z,animate)
ezplot3(x,y,z,[a,b],animate)

Parametrii x, y si z, contin expresii algebrice ale reprezentarilor curbei n functie de


un parametru t, din [a,b]. Valoarea implicita a acestui interval este [0,2 ].
Prezenta parametrului animate produce pe figura un buton cu numele repeat,
care prin activare prezinta modul de deplasare a unui punct pe curba reprezentata
grafic.
De exemplu, daca se considera comanda
ezplot3(sin(t),cos(t),t,[0,10*pi],animate)

se va obtine graficul din Figura 1.18, n care se observa si butonul repeat.


x = sin(t), y = cos(t), z = t

35
30
25

20
15
10
5
0
1
1

0.5
0.5

0
0
0.5

0.5
1

Figura 1.18: 



, 



,

 
,   

1.12.3 Instructiunile meshgrid, mesh si surf

Reprezentarea grafica a unei suprafete, data prin functia


  , cuprinde dou
a etape.

   , pe domeniul

52

Introducere n Matlab

Prima data se realizeaza o retea rectangulara de puncte, cu ajutorul instructiunii


meshgrid, care are sintaxa
[X,Y]=meshgrid(x,y)

unde x si y sunt vectori, n general de lungimi diferite, m si n, care contin puncte


de pe axele ox si oy si care sunt folosite la generarea retelei rectangulare x y



 m,   n.
Rezultatul executarii instructiunii meshgrid, are ca efect generarea matricelor
X si Y avand acelasi tip (n,m). Fiecare linie a matricei X este formata din componentele vectorului x, iar fiecare coloana a matricei Y este formata din componentele


vectorului y. In acest fel punctul de coordonate x y al retelei rectangulare, se
poate exprima, cu ajutorul matricelor X si Y, prin perechea (X(j,i),Y(j,i)).
Inainte de a trece la a doua etapa, sa facem observatia ca daca x coincide cu y,
atunci se poate utiliza
[X,Y]=meshgrid(x)

Reprezentarea grafica a functiei


mesh, care are una din formele:

   , se face cu ajutorul instructiunii

mesh(Z)
mesh(Z,C)
mesh(x,y,Z)
mesh(x,y,Z,C)
mesh(X,Y,Z)
mesh(X,Y,Z,C)

De la nceput, sa remarcam faptul ca parametrul C precizeaza scara culorilor. Cand


lipseste acest parametru, scara culorilor este data de parametrul Z, care reprezinta

valorile functiei
   pe o reteaua rectangular
a. In acest ultim caz culoarea
 

va fi proportionala cu naltimea din punctul
.
De asemenea, trebuie sa remarcam faptul ca reprezentarea grafica a suprafetei
este de forma unei retele curbilinii sprijinita pe naltimile date prin matricea Z.
Parametrii X, Y si Z sunt matrice de aceleasi dimensiuni, daca avem n vedere
cum au fost obtinute matricele X si Y, atunci toate aceste trei matrice sunt de tipul
(n,m).
Parametrii x si y sunt vectori de tipul celor ce genereaza matricele X si Y prin
instructiunea meshgrid, adica daca acestia au lungimile m si respectiv n, matricea Z
va fi de tipul (n,m), iar punctele pe care se sprijina reteaua curbilinie, care reprezinta
graficul functiei, au coordonatele (x(j),y(i),Z(i,j)).
Daca primii doi parametri lipsesc, adica suntem n cazul primelor doua forme
ale instructiunii mesh, acestea sunt echivalente respectiv cu urmatoarele doua, prin
considerarea valorilor implicite x=1:m si y=1:n.
Instructiunea surf are aceeasi sintaxa ca instructiunea mesh, adica
surf(Z)
surf(Z,C)

1.12. Grafica tridimensionala

53

surf(x,y,Z)
surf(x,y,Z,C)
surf(X,Y,Z)
surf(X,Y,Z,C)

unde parametrii au aceleasi caracteristici. Deosebirea n reprezentarea grafica este ca


prin instructiunea surf se produce o colorare a patrulaterelor obtinute prin curbele

  .
care genereaza suprafata corespunzatoare functiei
Programul 1.12.2. Vom scrie un program care sa reprezinte grafic functia

 




 e


 

  
   , n doua figuri alaturate, odata cu instructiunea
pe domeniul
mesh si apoi cu instructiunea surf.
clear, clf
m=input(m=);
h=1/m; x=-1:h:1;
[X,Y]=meshgrid(x);
Z=1/(2*pi)*exp(-0.5*(X.2+Y.2));
subplot(1,2,1), mesh(X,Y,Z)
title(Grafica prin MESH)
xlabel(x), ylabel(y), zlabel(z)
subplot(1,2,2), surf(X,Y,Z)
title(Grafica prin SURF)
xlabel(x), ylabel(y), zlabel(z)

Executarea programului, cu

, conduce la reprezentarile grafice din Figura 1.19.

In ncheierea acestui paragraf, amintim ca exista posibilitatea de umbrire a unei


suprafete cu ajutorul comenzii
shading tip

unde tip poate fi:


faceted (implicit) umbreste fiecare patrulater de pe suprafata trasata cu o
intensitate fixa si traseaza laturile patrulaterelor;
flat umbreste fiecare patrulater de pe suprafata trasata cu o intensitate fixa,
fara trasarea laturilor patrulaterelor;
interp umbrirea fiecarui patrulater de pe suprafata trasata se face n mod
gradat, printrun procedeu de interpolare, care asigura o trecere neteda de la
un patrulater la altul, fara trasarea laturilor patrulaterelor.
Programul 1.12.3. Sa scriem un program care efectueaza umbrirea suprafetei reprezentata grafic prin Programul 1.12.2:

54

Introducere n Matlab
Grafica prin SURF

0.16

0.16

0.14

0.14

0.12

0.12

0.1

0.1

Grafica prin MESH

0.08

0.08

0.06

0.06

0.04

0.04

1
1

0.5

0.5

0.5

0.5

0
0.5
y

0
0.5

0.5
1

Figura 1.19:

e

0.5
1

  

m=input(m=);
h=1/m; x=-1:h:1;
[X,Y]=meshgrid(x);
Z=1/(2*pi)*exp(-0.5*(X.2+Y.2))
subplot(1,3,1), surf(X,Y,Z),
shading faceted
title(Umbrire - faceted)
subplot(1,3,2), surf(X,Y,Z),
shading flat
title(Umbrire - flat)
xlabel(x), ylabel(y), zlabel(z)
subplot(1,3,3), surf(X,Y,Z),
shading interp
title(Umbrire - interp)

Rezultatul executarii programului este n Figura 1.20.

1.12.4 Instructiunile contour si contourf


Reprezentarea curbelor de nivel ale suprafetei, data prin functia
face cu una din urmatoarele forme ale instructiunii contour:
contour(Z)
contour(Z,n)
contour(Z,v)
contour(X,Y,Z)

   , se poate

1.12. Grafica tridimensionala

55

Umbrire faceted

Umbrire flat

Umbrire interp

0.16

0.16

0.16

0.14

0.14

0.14

0.12

0.12

0.12

0.1

0.1

0.1

0.08

0.08

0.08

0.06

0.06

0.06

0.04

0.04

0.04

1
1

0.5
0

1
1

0.5

0.5

0.5
1

0.5

0
0.5

Figura 1.20: Umbrirea unei suprafete


contour(X,Y,Z,v)
contour(Z,[w w])
contour(X,Y,Z,[w w])

unde parametrii X, Y si Z au aceleasi interpretari ca si n cazul instructiunilor mesh


si surf.
Parametrul v este un vector prin care se specifica nivelurile curbelor de nivel ce
urmeaza a fi reprezentate grafic, iar n absenta sa, valorile acestui parametru sunt
automat calculate. Numarul curbelor de nivel se poate preciza prin parametrul n.
Formele instructiunii contour cu parametrul de tipul [w w] are ca efect trasarea curbei de nivel precizata prin w. Aceste forme permit reprezentarea grafica a
functiilor date sub forma implicita. Astfel, daca vrem sa reprezentam grafic functia

 



 
data prin   
, atunci graficul functiei
va fi dat de curba




de nivel pentru functia

, considerand w=0.
Instructiunea contourf difera de contour doar prin faptul ca ariile delimitate
de curbele de nivel sunt umbrite.
Programul 1.12.4. Sa reprezentam n curbe de nivel pentru functia considerata
n Programul 1.12.2. Reprezentarile acestor curbe de nivel sa fie facute atat cu
instructiunea contour, cat si cu contourf.
clear, clf
m=input(m=); n=input(n=);
h=1/m; x=-1:h:1;

56

Introducere n Matlab
[X,Y]=meshgrid(x);
Z=1/(2*pi)*exp(-0.5*(X.2+Y.2));
subplot(1,2,1), contour(Z,n)
title([n=,num2str(n), curbe de nivel])
subplot(1,2,2), contourf(Z,n)
title([n=,num2str(n), curbe de nivel umbrite])

 si n=5, conduce la reprezentarile grafice din

Executarea programului, cu
Figura 1.21.
n=5 curbe de nivel

n=5 curbe de nivel umbrite

12

12

10

10

10

12

10

12

Figura 1.21: Curbe de nivel

1.12.5 Instructiunile ezcontour si ezcontourf


O forma simplificat
a
  a, pentru reprezentarea curbelor de nivel, pentru o functie dat
prin
  , se obtine cu ajutorul instructiunii ezcontour, avand una din
formele:
ezcontour(f)
ezcontour(f,lim)
ezcontour(f,n)

unde f este expresia matematica a unei functii de doua variabile, privita ca un sir de
caractere.
Parametrul lim este fie un vector de forma [xmin,xmax], fie de forma
[xmin,xmax,ymin,ymax]. Daca lipseste, se ia implicit [-2 ,2 ,-2 ,2 ],
iar daca este de prima forma se ia [xmin,xmax,xmin,xmax].
Parametrul n specifica faptul ca n reprezentarea grafica se foloseste o retea de
n n puncte (implicit se considera n=60).
De exemplu,

1.12. Grafica tridimensionala

57

f=sqrt(x2+y2)
ezcontour(f,[-2,2])

are acelasi efect cu


ezcontour(sqrt(x2+y2),[-2,2])


, pe domeniul
si produc
curbele de nivel pentru functia
  
      .
Instructiunea ezcontourf, fata de ezcontour executa si umbrirea ariilor
generate de curbele de nivel.


1.12.6 Instructiunile ezmesh, ezsurf, ezmeshc si ezsurfc


Sintaxa apelurilor functiilor ezmesh, ezsurf, ezmeshc si ezsurfc este aceeasi,
iar efectul executarii lor este reprezentarea grafica a unei suprafete, respectiv a unei
suprafete, mpreuna cu sau fara curbele de nivel corespunzatoare. De aceea prezentam
modurile de apelare, numai pentru una dintre ele.
ezmesh(f)
ezmesh(f,lim)
ezmesh(x,y,z)
ezmesh(x,y,z,lim)

Parametrul f reprezinta o expresie algebrica, ce defineste suprafata, care urmeaza


sa fie reprezentata grafic, pe domeniul definit prin lim. Implicit, n absenta parametrului lim, domeniul este [-2 ,2 ] [-2 ,2 ]. Daca lim=[a,b], atunci
domeniul va fi [a,b] [a,b], iar daca lim=[a,b,c,d], atunci domeniul va fi
[a,b] [c,d].
Parametrii x, y, z, reprezinta expresii algebrice ce definesc suprafata n modul
parametric. In acest caz, corespunzator, parametrul lim, precizeaza domeniul n care
iau valori parametrii cu ajutorul carora se defineste n mod parametric suprafata ce
urmeaza a fi reprezentata.
Remarcam faptul ca formele mai sus prezentate, mai pot avea doi parametri.
Unul, n, de tip ntreg pozitiv, care precizeaza numarul n n al punctelor retelei. Implicit se considera n=60. Un altul este circ, care prin prezenta sa atrage reprezentarea lui f pe un disc centrat n domeniul mai sus precizat.
Pentru exemplificare, daca se executa programul Matlab format din urmatoarele
instructiuni:
subplot(1,2,1)
ezmesh(sin(x)*sin(y),[-pi,pi],circ)
subplot(1,2,2)
ezmeshc(sin(x)*sin(y),[-pi,pi],circ)
colormap spring

se obtin graficele din Figura 1.22.


Mai remarcam faptul ca f, x, y, z pot fi numele unor functii predefinite sau scrise
de utilizator.

58

Introducere n Matlab
sin(x) sin(y)

0.5

0.5

sin(x) sin(y)

0.5

0.5

5
5

0
0

0
y

Figura 1.22: Suprafata fara si cu curbe de nivel


Pentru a ilustra ca cele doua instructiuni de tipul ezmesh si ezsurf au de
regula acelasi efect, programul urmator reprezinta grafic aceeasi suprafata , respectiv
cu ezmesh si ezsurf.
clf
subplot(1,2,1),
ezsurf(x*exp(-x2 - y2),[-2,2],20)
title(Reprezentare cu ezsurf)
subplot(1,2,2)
ezsurf(x*exp(-x2 - y2),[-2,2],20)
colormap autumn
title(Reprezentare cu ezmesh)

Graficele sunt prezentate n Figura 1.23.

1.12.7 Instructiunile bar3 si bar3h


Instructiunile bar3 si bar3h corespund instructiunilor bar si respectiv barh din
grafica bidimensionala.
Forme ale acestor instructiuni sunt:
bar3(z,w,tip,color)
bar3(y,z,w,tip,color)
bar3h(y,w,tip,color)
bar3h(y,z,w,tip,color)

1.12. Grafica tridimensionala

59

Reprezentare cu ezsurf

Reprezentare cu ezmesh

0.5

0.5

0.5

0.5

2
2

0
1
y

0
1

1
2

Figura 1.23: Suprafata reprezentata

1
2

 

e 

 

argumentele w, tip si color sunt optionale, dar cand sunt specificate, trebuie
sa pastreze aceasta ordine.
Parametrul y este un vector de lungime m, avand componentele ordonate
crescator sau descrescator. Daca y lipseste, atunci se considera implicit y=1:m.
Daca z este un vector de aceeasi lungime cu y, atunci vor fi reprezentate grafic m


 m, de pe axa oy. Daca z este o mabare de lungimi z n dreptul punctelor y ,
trice de tipul (m,n), reprezentarile sunt efectuate pentru fiecare din cele n coloane


ale matricei, adica n fiecare punct y ,
 m, de pe axa oy, vor fi reprezentate cate
n bare (batoane).

Parametrul w specifica grosimea barelor, implicit fiind w
, iar pentru w  
barele se suprapun.
Daca parametrul tip=detached, care este valoarea implicita, atunci barele
din punctele y de pe axa oy vor fi detasate n adancime dupa axa ox. Daca
tip=grouped, barele (batoanele) vor fi grupate n punctele y , de pe axa oy, iar
daca tip=stacked, atunci barele vor fi stivuite n aceste puncte.
Parametrul color specifica culoarea barelor (batoanelor) si are una din urmatoarele valori: r (rosu), g (verde), b (albastru), y (galben), m (violet), c (ciclamen),
k (negru), w (alb).
Deosebirea ntre bar3 si bar3h este ca prima instructiune actioneaza pe verticala, iar a doua pe orizontala.

60

Introducere n Matlab

Programul
1.12.5. Sa scriem un program care genereaza o matrice magica de ordin

 . Folosind primele trei coloane ale matricei magice, s
a reprezentam prin bare
verticale valorile acestora cu fiecare din tipurile detached, grouped si stacked.
Folosind ultimele trei coloane sa se faca astfel de reprezentari cu ajutorul barelor
orizontale.
m=input(m:); A=magic(m);
subplot(2,3,1), bar3(A(:,1:3),.6,detached)
title(Bar3 - detached)
subplot(2,3,2), bar3(A(:,1:3),grouped)
title(Bar3 - grouped)
subplot(2,3,3), bar3(A(:,m-2:m),.6,stacked)
title(Bar3 - stacked)
subplot(2,3,4), bar3h(A(:,m-2:m),.6,detached)
title(Bar3h - detached)
subplot(2,3,5), bar3h(A(:,m-2:m),grouped)
title(Bar3h - grouped)
subplot(2,3,6), bar3h(A(:,1:3),.6,stacked)
title(Bar3h - stacked)
colormap spring

Executarea acestui program, pentru m=4, produce graficele din Figura 1.24.
Bar3 grouped

Bar3 detached

20

Bar3 stacked
40

15

20

10
10

20

5
0

0
1

0
1

1
2

4
1

Bar3h detached

2
3

3
4

Bar3h grouped

Bar3h stacked

2
1

0
10

10
20

20
20

Figura 1.24: Bare verticale si bare orizontale n 3D

40

Capitolul 2

Elemente de teoria probabilitatilor


Teoria probabilitat ilor are ca obiect de studiu fenomene nedeterministe sau aleatoare (ntamplatoare). Un fenomen nedeterminist este rezultatul imposibilitat ii
cunoasterii exacte si complete a tuturor elementelor care concura la realizarea acestuia. Astfel de fenomene aleatoare ar putea fi apelurile dintr-o centrala telefonica,
accidentele de circulatie dintr-o intersectie, extragerile numerelor loto, rezultatele
de la ruleta, noii nascuti la o maternitate, numarul particulelor dezintegrate dintro substanta radioactiva, miscarea browniana a particulelor unei substante dizolvata
ntr-un fluid, sosirea clientilor ntr-o statie de servire, raspandirea erorilor de tipar
dintr-o carte, vanzarea painii la o unitate alimentara si n fine raspandirea stafidelor
n prajitura cumparata de la o cofetarie. Toate aceste fenomene sunt fenomene aleatoare prin faptul ca nu sunt cunoscute toate conditiile n care sunt realizate, sau daca
o parte din aceste conditii pot fi precizate, ele nu sunt cunoscute cu exactitate. Factorii necunoscuti, care se regasesc n fenomenul real, conduc la astfel de fenomene
aleatoare (nedeterministe).
Teoria probabilitat ilor vine sa dea metode unitare pentru analiza si studiul unor
astfel de fenomene nedeterministe si care provin dintro gama larga a activitatii si
cunoasterii umane. Pentru aceasta este necesar sa fie formalizat limbajul prin care
se trateaza fenomenele aleatoare, ca apoi prin particularizari sa fie obtinute rezultate
specifice fenomenului considerat.
Vom presupune ca avem anumite cunostinte de relative la teoria probabilitat ilor.
Reamintim n acest capitol doar o parte din notiunilor de baza ale teoriei probabilitat ilor, pentru stabilirea unui limbaj comun n abordarea capitolelor urmatoare.
Tinand seama de aceasta motivatie recomandam celor neinitiati n aceasta disciplina
a teoriei probabilitat ilor lucrarile [10], [6], [9], [8].
61

62

Elemente de teoria probabilitat ilor

2.1 Camp de probabilitate


Daca se considera fenomenul aleator ( experimentul ) , vom numi probe rezultatele
experimentului, iar multimea probelor relative la experimentul o numim spatiul
probelor si pe care l notam prin .



Definitia 2.1.1. Spunem ca submultimea nevida 


borelian, -algebra) daca satisface urmatoarele conditii:

este un corp (corp

               

(2.1.1)



 se numeste camp de evenimente.


Multimea de indici  este o multime cel mult numarabila.


iar perechea

Definitia 2.1.2. Fiind dat campul de evenimente


, se numeste probabilitate o

, care verific
aplicatie 
a urmatoarele trei axiome:
    
(i)   


(ii)

(iii)



fiind evenimentul sigur (cert),




  

       

iar tripletul

 
   


   se numeste camp de probabilitate.

2.2 Variabile aleatoare


Fie campul de probabilitate
  , respectiv pe  si  .

 

si

algebrele

Definitia 2.2.1. Numim variabila aleatoare, aplicatia


masurabila, adica

  

(2.2.1)



      

multimilor Borel

,

 
, daca este 

       

Observat
Avand n vedere ca   poate fi generat de familia de intervale
    ia 2.2.2.

, conditia (2.2.1) de masurabilitate poate fi nlocuita prin


(2.2.2)

 

  

    

            

2.3. Functie de repartitie

63

Observatia 2.2.3. Cardinalul multimii   a valorilor unei variabile aleatoare  ,


conduce la o clasificarea a multimii variabilelor aleatoare:
variabile aleatoare de tip discret, daca
cel mult numarabila de valori;
variabile aleatoare simple, daca
de valori;






variabile aleatoare de tip continuu, daca


valori de puterea continuumului.



  , adica  are o multime

, adica  are o multime finita




, adica  are o multime

Definitia 2.2.4. Numim vector aleator (dimensional), aplicatia


daca este masurabila, adica

           

 
,

        

sau avand n vedere Observatia 2.2.2

 

unde  si  ,

ale vectorului .


        
                      



 , reprezinta respectiv componentele vectorului aleator

 si

2.3 Functie de repartitie

   si variabila aleatoare   .
Definitia 2.3.1. Numim functie de repartitie atasata variabilei aleatoare  , aplicatia

    definita prin
Fie campul de probabilitate

(2.3.1)



       

Observatia 2.3.2. Marea majoritate a tratatelor de teoria probabilitat ilor definesc


functia de repartitie prin formula



 

   

dar avand n vedere ca sistemul Matlab foloseste formula (2.3.1), n definirea functiei
de repartitie, vom considera aceasta abordare n cele ce urmeaza.

64

Elemente de teoria probabilitat ilor

Definitia 2.3.3. Numim funct


 ie de repartitie atasata vectorului aleator dimensional  , aplicatia  
definita prin





   

 

       

Fie vectorul aleator  cu functia de repartitie  si fie notata respectiv prin 



functia de repartitie a variabilei aleatoare  , care este componenta a vectorului


aleator, pentru fiecare
 .
Definitia 2.3.4. Spunem ca variabilele aleatoare
daca



 

 



 

,

  

 , sunt independente

   

2.4 Legi de probabilitate de tip discret


Daca variabila aleatoare  este de tip discret, adica are un numar cel mult numarabil

de valori, fie acestea   ,   , atunci functia de repartitie  atasata este o functie
n scara si este data prin:

(2.4.1)



   

unde 

 .

Definitia 2.4.1. Numim distributia sau repartitia variabilei aleatoare  de tip discret,
tabloul


 

unde   ,   , sunt valorile pe care le ia variabila aleatoare


probabilitatea cu care variabila aleatoare  ia valoarea  , adica 

pentru fiecare   .


 , iar


este
 ,

Deoarece evenimentele   ,   , formeaza un sistem complet de evenimente, avem ca 



. Remarcam de asemenea ca  , reprezinta marimea

saltului functiei de repartitie n punctul de discontinuitate  , pentru fiecare   .
In teoria probabilitat ilor si n aplicatiile sale, se ntalnesc clase de variabile aleatoare de tip discret. Forma cea mai generala a unei variabile aleatoare apartinand unei
clase se numeste lege de probabilitate de tip discret.


2.4. Legi de probabilitate de tip discret

65

2.4.1 Functiile Matlab pdf si cdf


Distributia variabilei aleatoare  poate fi precizata prin ceea ce numim functie de
probabilitate ( pdf probability distribution function, n Matlab) definita prin:



 

sau prin functia de repartit


 ie ( cdf cumulative distribution function).
Daca valorile  ,   , sunt calculate, atunci folosind instructiunile plot,
bar si stairs, se pot reprezenta grafic functia de probabilitate (pdf) si functia
de repartitie (cdf). Anume, daca vectorul x contine valorile variabilei aleatoare  ,
iar p probabilitat ile corespunzatoare, atunci intructiunile
plot(x,p,s)
bar(x,p)
stairs(x,p)

vor reprezenta grafic respectiv functia de probabilitate prin simbolul precizat prin s,
functia de probabilitate prin bare si functia de repartitie (functie n scara).
Remarcam faptul ca daca  ia o infinitate numarabila de valori, atunci trebuie
sa ne limitam la un numar finit de valori ale variabilei aleatoare, iar reprezentarile
grafice se vor face pe domeniul cuprins ntre valorile minima si maxima ale acestora.
Programul 2.4.2. Sa consideram variabila aleatoare





 care are distributia

si vrem sa reprezentam grafic functia de probabilitate (prin puncte si bare) si functia


de repartitie pe aceeasi figura.
Am putea presupune ca variabila aleatoare  se refera la aruncarea unui zar.
Anume, daca n urma arunc
 arii zarului se obtine un numar compus (4 sau 6), atunci
se pierde o miza (
), daca se obtine un numar prim (2, 3 sau 5) se castiga o

miza ( ), altfel nu se castiga si nu se pierde nimic (
).
Urmatorul program
x = [-1:1]; p = [1/3,1/6,1/2];
pc = [1/3,1/2,1];
subplot(1,3,1), plot(x,p,o)
axis([-1.5 1.5 0 1])
title(Functia de probabilitate)
subplot(1,3,2), bar(x,p)
axis([-1.5 1.5 0 1])
title(Functia de probabilitate)
subplot(1,3,3), stairs(x,pc)
title(Functia de repartitie)

produce reprezentarile grafice din Figura 2.1.

66

Elemente de teoria probabilitat ilor


Functia de probabilitate

Functia de probabilitate

0.9

0.9

0.8

0.8

0.7

0.7

0.6

0.6

0.5

0.5

0.4

0.4

0.3

0.3

0.2

0.2

0.1

0.1

Functia de repartitie
1

0.9

0.8

0.7

0.6

0.5

0.4

0.3
1

Figura 2.1: Functia de frecventa si functia de repartitie


Sistemul Matlab dispune de functii (instructiuni) care calculeaza valorile functiei
de probabilitate si ale functiei de repartitie pentru legile de probabilitate implementate
prin Statistics toolbox.
Functia pdf
Doua moduri de apel pentru calculul valorilor functiei pdf avem:
p=pdf(legea,x,par1,par2,...)
p=numef(x,par1,par2,...)

unde legea este un sir de caractere predefinit pentru fiecare din legile de probabilitate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt pdf, iar cele ce le preced sunt cele care dau numele predefinit al legii de
probabilitate (ca si cele din parametrul legea).
In urma executarii uneia din cele doua instructiuni, se calculeaza matricea p
a probabilitat ilor legii precizata prin parametrii legea, respectiv numef, corespunzatoare valorilor date prin matricea x si avand parametrii dati prin matricele
par1, par2,... Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca
daca unele sunt scalari, acestia se extind la matricele constante de aceleasi dimensiuni
cu celelalte si care iau valorile scalarilor corespunzatori.
Functia cdf
Si pentru calculul valorilor functiei de repartitie functia cdf avem doua forme de
apel

2.4. Legi de probabilitate de tip discret

67

cp=cdf(legea,x,par1,par2,...)
cp=numef(x,par1,par2,...)

unde legea este un sir de caractere predefinit pentru fiecare din legile de probabilitate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt cdf, iar cele ce le preced sunt cele care dau numele predefinit al legii de
probabilitate (ca si cele din parametrul legea).
In urma executarii uneia din cele doua instructiuni, se calculeaza matricea cp a
probabilitat ilor cumulate (valorile functiei de repartitie) a legii precizata prin legea
respectiv numef, corespunzatoare valorilor date prin matricea x si avand parametrii
dati prin matricele par1, par2,... Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca daca unele sunt scalari, acestia se extind la matricele constante
de aceleasi dimensiuni cu celelalte si care iau valorile scalarilor corespunzatori.

2.4.2 Legi de probabilitate de tip discret clasice


Vom prezenta n continuare legile de probabilitate de tip discret recunoscute de sistemul Matlab, prin pachetul de programe Statistics toolbox. In paranteza, pentru fiecare
lege de probabilitate sunt trecute si denumirile acceptate de sistemul Matlab. Facem
observatia ca pentru unele functii sunt acceptate si alte denumiri.

Legea lui Bernoulli


Variabila aleatoare
distributia

 urmeaza legea lui Bernoulli, pe care o notam 




(2.4.2)




  
unde  
,



, daca are

Legea lui Bernoulli modeleaza un fenomen aleator n desfasurarea caruia suntem


interesati n aparitia unui eveniment fixat , pe care l vom numi succes, respectiv

a lui  numit insucces. Probabilitatea obtinerii succesului este , iar valoarea corespunzatoare a variabilei aleatoare  este 1, respectiv 
  este probabilitatea
producerii insuccesului, cu valoarea 0 corespunzatoare pentru  .
Functia de probabilitate este



  



68

Elemente de teoria probabilitat ilor

Legea uniforma discreta (unid)


Variabila aleatoare
distributia



urmeaza legea uniforma discreta, notam


 


(2.4.3)

unde

, daca are



Functia de probabilitate este

    

Legea binomiala (bino)


Spunem ca variabila aleatoare
distributia


(2.4.4)

 urmeaza legea binomiala, notam 


 



unde

 

 

, daca are

  

 ,


  
iar  
 si
 .
Variabila aleatoare  reprezinta numarul succeselor obtinute n repetari independente ale unui experiment.
Descoperirea legii binomiala este atribuita lui James Bernoulli si care se afla n

cartea Ars Conjectandi (1713). Pascal a considerat cazul particular 

Functia de probabilitate este

   
 
 


 

Remarcam faptul ca variabila aleatoare  se obtine ca suma a variabile aleatoare independente, ce urmeaza fiecare legea lui Bernoulli   . Prin urmare, putem
 
spune si faptul ca legea lui Bernoulli    se obtine din legea binomiala 
,
pentru
.
Programul 2.4.3. Sa scriem un program Matlab care sa reprezinte grafic functia de
probabilitate (prin puncte si prin bare) si functia de repartitie ale legii de probabilitate
  .
Executarea programului

2.4. Legi de probabilitate de tip discret

69

n = input(n=);
p = input(p=); x = 0:n;
f = pdf(bino,x,n,p);
subplot(1,3,1), plot(x,f,o)
axis([-0.5 n+0.5 0 max(p)+0.02])
title(Functia de probabilitate)
subplot(1,3,2), bar(x,f)
axis([-.5 n+0.5 0 max(p)+0.02])
title(Functia de probabilitate)
f = cdf(bino,x,n,p);
subplot(1,3,3), stairs(x,f)
title(Functia de repartitie)
axis([0 n 0 1])

pentru n=7 si p=0.3, realizeaza graficele din Figura 2.2.


Functia de probabilitate

Functia de probabilitate

Functia de repartitie
1

0.3

0.3
0.9

0.25

0.25

0.2

0.2

0.15

0.15

0.1

0.1

0.05

0.05

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

Figura 2.2: Legea binomiala



Legea hipergeometrica (hyge)


Spunem ca variabila aleatoare  urmeaza legea hipergeometrica si vom nota prin

 
, daca are distributia



(2.4.5)

 



unde

 


 


  ,


iar

 

Variabila aleatoare  reprezinta numarul succeselor obtinute n extrageri dintr


o populatie de volum , fara ntoarcere, daca numarul indivizilor cu proprietatea
cercetata este .

70

Elemente de teoria probabilitat ilor


Functia de probabilitate corespunzatoare este:


 



 


  









 , adica probabilitat ile ca la


Observatia 2.4.4. Daca se noteaza 
si 
 , atunci
prima extragere sa se obtina succes, respectiv insucces, iar


 

   


adica se obtine distributia binomiala.



Programul 2.4.5. Pentru a ilustra afirmatia precedenta, sa scriem un program Matlab



 
care sa reprezinte grafic prin bare functiile de probabilitate pentru
si
 



, cu
Executarea programului



clf;
M = input(M:);
K = input(K(K<=M):);
n = input(n(n<=K):)
x = 0:n; p=K/M;
fh = pdf(hyge,x,M,K,n);
fb = pdf(bino,x,n,p);
bar(x,[fh,fb])
colormap winter

pentru M=100, K=40 si n=10, realizeaza graficul din Figura 2.3.


Legea lui Poisson (poiss)
Variabila aleatoare
distributia

(2.4.6)

urmeaza legea lui Poisson, vom nota





unde

Functia de probabilitate corespunzatoare este





     e  

 
 e  , iar 






, daca are

Variabila aleatoare  , care urmeaza legea lui Poisson, numara de cate ori apare
un anumit eveniment ntrun interval de tip, pe o distanta , pe o suprafata etc. Poisson

2.4. Legi de probabilitate de tip discret

71

0.35

0.3

0.25

0.2

0.15

0.1

0.05

Figura 2.3: Legea hipergeometrica

10

    
    si legea binomiala

  



(1837) a aratat ca legea, carei poarta numele, este un caz limita a legii binomiale,
 , pentru  . Altfel spus, cand este mare,  trebuie sa
anume cand 
fie mic, adica probabilitatea producerii evenimentului considerat este mica, de aici
denumirea de lege a evenimentelor rare.
Mai remarcam un rezultat cunoscut, care stabileste legatura dintre legea lui Poisson si legea exponentiala, care va fi prezentata mai ncolo. Anume, pe cand legea lui
Poisson numara evenimentele ce apar ntrun interval de timp, legea exponentiala da
lungimea intervalului dintre doua aparitii consecutive ale evenimentelor.
Programul 2.4.6. Vom scrie un program Matlab, care sa reprezinte grafic prin bare
 
  

functiile de probabilitate pentru 
si
cu
.
 

Avand n vedere comportarea legii 
, cand
, graficele functiilor de
probabilitate pentru cele doua legi de probabilitate trebuie sa se apropie.
  are o infinitate (numarabila) de valori, prin
Mai remarcam faptul ca legea
urmare n reprezentarea grafica pentru aceasta lege de probabilitate ne vom limita la
un numar finit de valori.
 Anume, vom considera numai valorile ntregi din intervalul
   
, alegere care va fi justificata mai tarziu.
Programul

clf;
n = input(n=); p = input(p=);
lambda = n*p;
vi = fix(lambda-3*sqrt(lambda));
vf = fix(lambda+3*sqrt(lambda));
x = vi:vf;

72

Elemente de teoria probabilitat ilor


fb = binopdf(x,n,p);
fl = poisspdf(x,lambda);
colormap autumn
bar(x,[fb,fl])

pentru n=100 si p=0.05, realizeaza graficul din Figura 2.4.


0.2

0.18

0.16

0.14

0.12

0.1

0.08

0.06

0.04

0.02

Figura 2.4: Legea binomiala

10


    

 si legea Poisson

11



Legea binomiala negativa (nbin)


Spunem ca variabila aleatoare  urmeaza legea binomiala negativa sau legea lui
 
Pascal, notata 
, daca are distributia






 
  

cu
 

 


  
 
iar  
 si
  . Variabila aleatoare  ce urmeaza legea 
reprezinta numarul insucceselor pana la aparitia succesului de rang , daca repetarile sunt
considerate independente.
 
Functia de probabilitate corespunzatoare legii 
este


 
  

   

 


Observatia 2.4.7. Unele tratate considera ca o variabila aleatoare  ce urmeaza


legea lui Pascal reprezinta rangul repetarii la care se produce succesul cu numarul .

2.5. Legi de probabilitate continue

73

Daca se are n vedere aceasta definitie se obtine distributia




 

(2.4.7)

 




    

cu

 

Legea geometrica (geo)



Legea geometrica, notata
, se obtine ca si caz particular,
 
gii 
. Prin urmare variabila aleatoare  urmeaza legea
distributia

      


  



, al le, daca are





si reprezinta numarul insucceselor pana la aparitia primului succes.



Functia de probabilitate pentru legea
este



 



De remarcat faptul ca daca se aduna variabile aleatoare independente, fie


care urmand legea
, atunci se obtine o variabila aleatoare ce urmeaza legea
 

.
Observatia 2.4.8. Corespunzator observatiei de la legea lui Pascal, avem ca unele
tratate considera ca o variabila aleatoare  ce urmeaza legea geometrica reprezinta
rangul repetarii la care se produce primul succes. Daca se are n vedere aceasta
definitie se obtine distributia


(2.4.8)






2.5 Legi de probabilitate continue


Definitia 2.5.1. Fie variabila aleatoare  avand functia de repartitie  . Vom spune
ca  este variabila aleatoare (absolut) continua, daca functia de repartitie  este
absolut continua, sau echivalent se poate reprezenta sub forma

functia 
toare  .





,



 


pentru orice   


numinduse densitatea de probabilitate a variabilei alea-

74

Elemente de teoria probabilitat ilor

Definitia 2.5.2. Fie vectorul aleator  avand functia de repartitie  . Spunem ca 


este vector aleator de tip continuu, daca functia de repartitie  se poate reprezenta
sub forma





 

 

 


 

 

   






, numinduse densitatea de probabilitate a vectorului aleator  .
functia  

Ca la variabilele aleatoare de tip discret si la cele de tip continuu exista clase


de variabile aleatoare. Forma cea mai generala a densitatii de probabilitate a unei
variabile aleatoare din clasa respectiva, ne da o lege de probabilitate de tip continuu.
Functiile Matlab pdf si cdf
Distributia variabilei aleatoare  de tip continuu poate fi precizata prin functie densitate de probabilitate (pdf probability density function) sau prin functia de
repartitie (cdf cumulative distribution function).
Reprezentarile grafice ale densitatii de probabilitate si functiei de repartitie n
Matlab se fac folosind instructiunea de tip plot.
Valorile densitatii de probabilitate  si ale functiei de repartitie  , pentru legile
de probabilitate implementate prin Statistics toolbox, ca si n cazul discret, se obtin
cu ajutorul functiilor Matlab pdf si respectiv cdf. Trebuie nsa sa tinem seama ca
 este continua (eventual cu o multime cel mult numarabila de puncte de discontinuitate), iar  nu mai este o functie n scara. Prin urmare, pentru asigurarea netezimii
graficelor se impune sa fie considerat un numar suficient de puncte ale graficelor
acestor functii.

2.5.1 Legi de probabilitate continue clasice


Prezentam si n acest caz legile de probabilitate de tip continue recunoscute de sistemul Matlab, prin pachetul de programe Statistics toolbox.
Legea uniforma (unif)

Spunem ca variabila aleatoare  urmeaza legea uniforma pe intervalul  , si vom
 

nota
, daca are densitatea de probabilitate

 



  



 

 
daca   

daca   

2.5. Legi de probabilitate continue

75

Functia de repartit
ie pentru variabila aleatoare

tervalul  , este

(2.5.1)

 



 , ce urmeaza legea uniforma pe in-

 

 



  







daca 


daca 

 

daca 

Denumirea de lege uniform


a este legata de faptul ca daca se considera subinter
vale ale intervalului  de lungimi egale, sa zicem ca au lungimea , atunci proba 
bilitatea ca variabila aleatoare  sa ia valori ntrun astfel de interval este
.
Adica, aceasta probabilitate nu depinde de pozitia subintervalului, ci numai de lungimea lui. Intuitiv, am putea spune ca valorile nt
amplatoare (aleatoare) ale functiei



 sunt uniform raspandite pe intervalul
. Acest lucru nu se ntampla la alte
legi de probabilitate, cand aceste valori sunt grupate n jurul uneia sau mai multor
valori pe care le ia variabila aleatoare  .
Programul 2.5.3. Sa reprezentam grafic densitatea de probabilitate
 

repartitie  pentru legea
.
Programul Matlab care urmeaza

 si functia de

clf;
a = input(a=); b = input(b=);
x = a-1:0.01:b+1;
f = pdf(unif,x,a,b);
F = cdf(unif,x,a,b);
subplot(1,2,1), plot(x,f,k-)
axis([a-1 b+1 -0.1 1/(b-a)+0.1])
title(Densitatea de probabilitate)
subplot(1,2,2), plot(x,F,k-)
axis([a-1 b+1 -0.1 1.1])
title(Functia de repartitie)

pentru a=1 si b=4, realizeaza graficele din Figura 2.5.


Putem remarca faptul ca functia de repartitie este continua. Astfel valorile ar s
gumentului 
i 
n formula (2.5.1) pot fi atasate respectiv la cazurile






si 
. Prin urmare intervalul pe care densitatea de probabilitate
este diferita de zero poate fi interval nchis la ambele capete, nchis la un capat si
deschis la celalalt, respectiv deschis la ambele capete. In toate aceste cazuri vom
 

considera ca avem legea uniforma de probabilitate
.
Proprietatea
2.5.4. Daca variabila aleatoare  urmeaza legea uniforma pe inter
 


valul
 , adica
 , numita si lege uniforma standard, si daca 
, atunci
variabila aleatoare




76

Elemente de teoria probabilitat ilor


Functia de repartitie

Densitatea de probabilitate
0.4

0.35
0.3

0.8

0.25
0.6

0.2
0.15

0.4
0.1
0.05
0.2
0
0.05
0.1


Figura 2.5: Legea uniforma pe  

urmeaza legea uniforma

 
.

Legea normala (norm)


Spunem ca variabila aleatoare  urmeaza legea normala (legea GaussLaplace) de
 
  si   , notam aceasta prin
parametri
 , daca are densitatea de
probabilitate

 

 



e

  

pentru orice   

Functia de repartitie pentru legea normala standard





 

e 



 este

  

si se numeste functia lui Laplace.


In Matlab (si nu numai) exista o functie erf (functia eroare):

 
erf     e  

care verifica relatia

erf  

   


2.5. Legi de probabilitate continue

77

Remarcam ca functia

 




e 

  

se numeste de asemenea functia lui Laplace. Intre cele doua functii Laplace exista
relatia
    


Folosind cele doua functii ale lui Laplace avem:

 

 


 


  
e 



  
 
 
  
  
 


 

Programul 2.5.5. Vom reprezenta grafic densitatea de probabilitate


 
 si functia de repartitie  corespunzatoare.
Executia programului

 pentru legea

clf;
m = input(mu=); s = input(sigma=);
x = m-3*s:0.01:m+3*s;
f = pdf(norm,x,m,s);
F = cdf(norm,x,m,s);
subplot(1,2,1), plot(x,f,k-)
title(Densitatea de probabilitate)
subplot(1,2,2), plot(x,F,k-)
title(Functia de repartitie)

pentru mu=0 si sigma=1, produce graficele din Figura 2.6.

Observatia 2.5.6. Daca se considera variabilele aleatoare  ,


 , indepen   , atunci combinatia liniara
dente, fiecare urmand respectiv legile normale


   






 





 
 

 
,

este o variabila aleatoare ce urmeaza legea normala

       






unde

78

Elemente de teoria probabilitat ilor


Densitatea de probabilitate

Functia de repartitie

0.4

0.9

0.35

0.8
0.3
0.7
0.25

0.6

0.2

0.5

0.4

0.15

0.3
0.1
0.2
0.05

0.1

0
4

0
4

Figura 2.6: Legea normala standard


Legea lognormala (logn)
Variabila aleatoare  urmeaza legea lognormala de probabilitate si vom nota aceasta
 
prin
 , daca are densitatea de probabilitate

Daca

 

 

 
  e

ln  


 urmeaza legea lognormala de parametri


ln  urmeaza legea normala ( e ).

 

si , atunci variabila aleatoare

Legea gamma (gam)


Variabila aleatoare  urmeaza legea gamma, notam aceasta prin
densitatea de probabilitate


unde



 





 e   

 
,

daca are



este functia lui Euler de speta a doua, adica



 e 

 

 

Cand 
, legea gamma tinde la legea normala. Adica, daca  urmeaza legea
 
 , variabila aleatoare poate fi considerata ca urmand
 
, atunci pentru 
 
legea
 , cu  si  .

2.5. Legi de probabilitate continue

79

Programul 2.5.7. Pentru a ilustra aceasta ultima afirmatie, sa reprezentam grafic, pe


aceeasi figura, densitatile de probabilitate pentru cele doua legi, parametrii acestora
satisfacand relatiile precizate mai sus.
Executand programul
clf;
a = input(a=); b = input(b=);
m = a*b; s = b*sqrt(a);
x = m-3*s:0.01:m+3*s;
fn = pdf(norm,x,m,s);
fg = pdf(gam,x,a,b);
plot(x,fn,k-.,x,fg,k-)
legend(Legea normala,Legea gamma)

pentru a=100 si b=10, acesta produce graficele din Figura 2.7.


3

4.5

x 10

Legea normala
Legea gamma
4

3.5

2.5

1.5

0.5

0
700

800

900

1000

Figura 2.7: Legile

1100

  
   si

1200

1300

  



Legea exponentiala (exp)


Variabila aleatoare  urmeaza legea exponentiala, notam 
tea de probabilitate

e

Observam ca se obtine ca si caz particular al legii

,

daca are densita-

 
, cand se ia

 si

80

Elemente de teoria probabilitat ilor

Legea exponentiala se aplica la modelarea evenimentelor ce apar aleator n timp.


De asemenea are aplicatii n studiile privind durata de viata .
Legea beta (beta)
Variabila aleatoare
probabilitate:

 urmeaza legea beta, notata 

 

unde




 

 

   

  

 
,

daca are densitatea de

     



    

este functia lui Euler de speta ntai.



Este cunoscut faptul ca daca doua variabile aleatoare independente  si ur


 urmeaza legile    si  , atunci variabila aleatoare 
 
 
meaza legea    .


Daca se considera legea    , cu 
 , se obtine legea de probabililate arcsin, care are densitatea de probabilitate



 

    

  

Legea Weibull (weib)


Variabila aleatoare  urmeaza legea lui Weibull, notam 
de probabilitate

 


 e  

 
,

daca are densitatea

Legea a fost descoperita de Weibull (1939) si modeleaza rezistenta la rupere a materialelor. De asemenea se pare ca modeleaza durata de viata mai bine decat legea
exponentiala. Se observa ca legea exponentiala este un caz particular, anume se obtine

cand   si
.
Legea Rayleigh (rayl)
Variabila aleatoare  urmeaza legea lui Rayleigh de probabilitate, notata prin 
daca are densitatea de probabilitate:





e

,

2.5. Legi de probabilitate continue

81

 
 
Se observa ca este caz particular al legii Weibull,
, 
.

Daca viteza unei particule n directiile  si sunt doua variabile aleatoare independente, care urmeaza legi normale de probabilitate, cu mediile zero si dispersiile
egale, atunci distanta parcursa de particula pe unitate de timp urmeaza legea lui Rayleigh.
2.5.2 Legi de probabilitate continue statistice
Prezentam legile de probabilitate de tip continuu, denumite astfel n sistemul Matlab,
prin pachetul de programe Statistics toolbox, deoarece utilizarea lor este strans legata
de statistica.
Legea t (Student) (t)
Variabila aleatoare  urmeaza legea t (Student) de probabilitate, notata
are densitatea de probabilitate

     



  



 

 





,

daca

  (numarul gradelor de libertate).

Gosset (1908) a descoperit aceasta lege de probabilitate. Nu i-a fost permis sa


publice rezultatul, drept urmare a publicato sub pseudonimul Student.
Pentru
, se obtine legea de probabilitatea a lui Cauchy.
Daca ,  , . . . ,  sunt independente, fiecare urmand legea normala de para
metri
si  , atunci


.
urmeaza legea

Daca urmeaza legea

,

  






  

atunci



    


urmeaza legea     .
 , se ajunge la legea normala standard
Cand



.

Programul 2.5.8. Pentru ilustrarea ultimei afirmatii, vom scrie un program care sa

reprezinte pe aceeasi figura graficele densitat ilor de probabilitate pentru legile
 
si
.
Prin executarea programului Matlab

82

Elemente de teoria probabilitat ilor


clf;
n = input(n=); x = -3:0.01:3;
fn = normpdf(x,0,1); fs = tpdf(x,n);
plot(x,fn,k-.,x,fs,k-)
legend(Legea normala, Legea Student)

pentru n=10, acesta produce graficele din Figura 2.8.


0.4
Legea normala
Legea Student
0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
3


  si legea

Figura 2.8: Legea





Legea t (Student) necentrata (nct)


 

Legea t (Student) necentrata, notata


sitatea de probabilitate


unde

 





  
 
 e 





 si are den-

, generalizeaza legea

 


   


 
  

 








  

  



Programul 2.5.9. Programul Matlab  ce urmeaza reprezinta grafic functiile de


 si
:
repartitie pentru legile

2.5. Legi de probabilitate continue

83

clf;
n = input(n=); d = input(delta=);
x = -5:0.01:5;
Fc = tcdf(x,n); Fnc = nctcdf(x,n,d);
plot(x,Fc,k-.,x,Fnc,k-)
legend(Legea Student,..
Legea Student necentrata,2)

Pentru n=10 si d=1, se obtin graficele din Figura 2.9.


1
Legea Student
Legea Student necentrata
0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0
5


  si legea

Figura 2.9: Legea

Legea


 

 (chi2)

Variabila aleatoare  urmeaza legea  sau legea HelmertPearson, vom nota prin
 , daca are densitatea de probabilitate:


   
  
  e 

  (numarul gradelor de libertate).






Legea   este un caz particular al legii   , cand   , iar
.


Daca  , , . . . ,  sunt independente, fiecare urmand legea normala de para
metri
si  , atunci variabila aleatoare


  

 

84

Elemente de teoria probabilitat ilor

urmeaza legea
respectiv legile

,



iar daca variabilele aleatoare independente


 si  , atunci variabila aleatoare

 si 

urmeaza

, varia-



.
urmeaza legea
Daca variabila aleatoare  urmeaza legea
 
bila aleatoare urmeaza legea
 , cu

,

si 

atunci,
 pentru
.

Programul 2.5.10. Pentru ilustrarea afirmatiei, scriem un program care sa repre  si


zinte pe
i figura graficele densitatilor de probabilitate pentru legile

 aceeas
.
Prin executarea programului Matlab
clf;
n = input(n=); s = sqrt(2*n);
x = n-3*s:0.01:n+3*s;
fn = normpdf(x,n,s); fchi = chi2pdf(x,n);
plot(x,fn,k-.,x,fchi,k-)
legend(Legea normala, Legea chi2,2)

pentru n=10, se obtin graficele din Figura 2.10.


0.06
Legea normala
Legea chi2

0.05

0.04

0.03

0.02

0.01

10

15

20

Figura 2.10: Legea

25

30


  si legea

35

40

45

  


50

2.5. Legi de probabilitate continue

85

 necentrata (ncx2)

Legea

Sa notam prin  o variabila aleatoare ce urmeaza legea  . Spunem ca variabila


aleatoare  urmeaza legea  necentrata, daca are functia de repartitie:


 
  e 
   


 

Programul 2.5.11. Programul Matlab ce urmeaz


a reprezinta grafic densitatile de
 



si legea
necentrata corespunzatoare:
probabilitate pentru legea
clf;
n = input(n=); d = input(delta=);
x = 0:0.01:15;
c = chi2pdf(x,n); fnc = ncx2pdf(x,n,d);
plot(x,fc,k-.,x,fnc,k-)
legend(Legea chi2, Legea chi2 necentrata)

Pentru n=4 si d=2, se obtin graficele din Figura 2.11.


0.2
Legea chi2
Legea chi2 necentrata
0.18

0.16

0.14

0.12

0.1

0.08

0.06

0.04

0.02

Figura 2.11: Legea

10

 

si legea

15



Legea F (FisherSnedecor) (f)


Variabila aleatoare  urmeaza legea F (FisherSnedecor), notata
densitatea de probabilitate:

 


      
  

 



 

  

 
,

daca are

86


Elemente de teoria probabilitat ilor


  (numarul gradelor de libertate)

Daca variabilele aleatoare independente


atunci




 si  urmeaza legile 

 si

 

,

.
urmeaza legea
, atunci   va urma legea
Daca variabila aleatoare  urmeaza legea

 
 .

 
, atunci transformata lui FiDaca variabila aleatoare  urmeaza legea

sher, adica  log , urmeaza legea
 , cand   , unde


   
 

(2.5.2)







Programul 2.5.12. Programul care urmeaza reprezinta pe aceeasi figura graficele


 
densitat ilor de probabilitate pentru transformata lui Fisher  si legea
 , unde
si  au valorile date prin (2.5.2).
Remarcam faptul ca densitatea de probabilitate a variabilei aleatoare  este



  e   e 

clf
m = input(m=); n = input(n=);
mu = (1/n-1/m)/2; s = sqrt((1/n+1/m)/2);
x = mu-3*s:0.01:mu+3*s;
f1 = normpdf(x,mu,s);
f2 = 2*exp(2*x).*fpdf(exp(2*x),m,n);
plot(x,f1,k-.,x,f2,k-)
legend(Legea normala,Transformata Fisher,2)

Pentru m=20 si n=30, se obtin graficele din Figura 2.12.


Legea F (FisherSnedecor) necentrata (ncf)
Daca variabilele aleatoare independente
 
necentrata si 
necentrata, atunci

 si 

urmeaza respectiv legile

 


urmeaza legea F (FisherSnedecor) necentrata, notata prin



Functia de repartitie pentru variabila aleatoare legea

   
  

  e  
 
  





 

 

.
este


 

2.5. Legi de probabilitate continue

87

2
Legea normala
Transformata Fisher
1.8

1.6

1.4

1.2

0.8

0.6

0.4

0.2

0
0.8

0.6

0.4

0.2

0.2

0.4

0.6

Figura 2.12: Transformata Fisher si legea normala corespunzatoare


unde

 

 
este

functia Beta incompleta de parametrii


.

Programul 2.5.13. Programul


ce urmeaz
a grafic densitatile de

Matlab
  a reprezint
 si 
probabilitate pentru legile
:
clf;
m = input(m=); n = input(n=);
d = input(delta=);
x = 0:0.01:10.01;
Fc = fpdf(x,m,n); Fnc = ncfpdf(x,m,n,d);
plot(x,Fc,k-.,x,Fnc,k-)
legend(Legea F, Legea F necentrata)

Pentru m=5, n=20 si d=10, se obtin graficele din Figura 2.13.

2.5.3 Functia Matlab normspec


Avand n vedere ca legea normala joaca un rol important n teoria probabilitat ilor
si n statistica, sistemul Matlab i acorda la randul sau o atentie speciala. Astfel, n
sistemul Matlab de baza exista functia normspec, cu urmatoarele moduri de apel:
normspec(sp,mu,sigma)
p = normspec(sp,mu,sigma)

Functia normspec reprezinta grafic densitatea de probabilitate a legii normale de


parametrii mu si sigma si umbreste aria marginita de dreptele perpendiculare pe
axa absciselor ce trec prin punctele axei precizate prin cele doua componente ale
vectorului sp, curba ce reprezinta graficul densitatii de probabilitate si axa absciselor.
Parametrul p, dupa executia functiei normspec, contine valoarea ariei umbrite,
adica probabilitatea ca variabila aleatoare sa ia valori din intervalul precizat prin sp.

88

Elemente de teoria probabilitat ilor


0.8
Legea F
Legea F necentrata
0.7

0.6

0.5

0.4

0.3

0.2

0.1

Figura 2.13: Legea

  

10

12



 
  si legea
 

Programul 2.5.14. Programul


a va reprezenta grafic densitatea
 Matlab ce urmeaz

s

i
va
umbri
aria
cuprins
a ntre dreptele de ecuatii
de probabilitate a legii


 s
i 
(
), curba ce reprezinta graficul densitatii de probabilitate si axa
absciselor.
m = input(mu=); s = input(sigma=);
a = input(a:); b = input(b (b>a):);
p = normspec([a,b],m,s);
xlabel([a= ,num2str(a),
b= ,num2str(b)])
ylabel(Densitatea de probabilitate)
title([Probabilitatea intre a si b : ,num2str(p)])

Executand acest program cu valorile de intrare mu=0, sigma=1, a=-1.5 si b=2,


se obtine graficul din Figura 2.14.
Se observa ca instructiunea title contine parametrul num2str(p), care
transforma valoarea numerica a lui p ntrun sir de caractere.

2.5.4 Distributie marginala


Fie vectorul
 aleator   
unde 
, iar 

 

 si vectorul aleator 

 

 

  ,

Definitia 2.5.15. Numim distributie marginala a vectorului distributia vectorului

.

Daca  este functia de repartitie a vectorului  , iar     este functia vectorului
aleator  , numinduse functie de repartitie marginala, atunci

   

 

 


 





2.5. Legi de probabilitate continue

89

Probabilitatea intre a si b : 0.91044


0.4

0.35

Densitatea de probabilitate

0.3

0.25

0.2

0.15

0.1

0.05

0
4

0
a= 1.5

b= 2

Figura 2.14: Legea





adica, pentru obtinerea functiei de repartitie a vectorului  se fac sa tinda la toate


argumentele functiei de repartitie  , cu exceptia argumentelor   , . . . ,   .
Daca vectorul aleator  este de tip continuu, avand densitatea de probabilitate  ,
iar vectorul aleator  are densitatea de probabilitate     , care se numeste densitate
de probabilitate marginala, atunci



 

 









   


 



 

adica    se obtine integrand densitatea de probabilitate  pe   , n raport cu
toate variabilele independente, cu exceptia variabilelor  , . . . ,   .

2.5.5 Functie de repartitie conditionata

   , avand functia de repartitie  .

Fie vectorul aleator bidimensional

Definitia 2.5.16. Numim functie de repartitie conditionata a variabilei aleatoare



de catre variabila aleatoare , functia 
  , data prin

pentru fiecare

 

 



   

 

   

  fixat.

Trebuie sa remarcam faptul ca formula de definitie se poate scrie sub forma

 

 

 


   

    


90

Elemente de teoria probabilitat ilor

       
 
 


       


  
     
      


 
Daca vectorul aleator 
este de tip discret, adica are distributia data prin tabloul
sau

 

 


 


bidimensional

 

..
.

..
.

..
.

..
.

atunci distributia variabilei aleatoare  conditionata de



 

 


 .


unde 
Remarcam de asemenea ca are loc formula


(2.5.3)



 
este

 

 

data prin

unde 
     .
Daca vectorul aleator   este de tip continuu, adica are densitatea de probabilitate  , atunci densitatea de probabilitate a variabilei aleatoare  conditionata de
   este data prin



  

 

 

 

pentru





Are loc formula (2.5.3) n varianta continua:



 



 

   


Exemplul 2.5.17 (Legea normala multidimensionala). Vectorul aleator, notat prin
  
 , urmeaza legea normala multidimensionala, notam aceasta prin
, daca
are densitatea de probabilitate

 

(2.5.4)

det


 

  






 

 

   

  

2.5. Legi de probabilitate continue

91


unde este o matrice patratica de ordin pozitiv definita, iar este inversa matri
cei .


Daca
si notam prin   vectorul aleator bidimensional corespunzator,
densitatea de probabilitate devine

 

(2.5.5)




    
   
        

 




  

 

  








unde     si   .

Se cunoaste ca fiecare din componentele  si ale vectorului aleator urmeaza


  s
legea normala respectiv
i
  .
Densitatea de probabilitate conditionata se exprima n acest fel prin:

(2.5.6)


unde
normale

 

 

   

e 



    

    , adica se obtine densitatea de probabilitate a legii
  


 

 

Programul 2.5.18. Scriem n cele ce urmeaza un program Matlab, care reprezinta


grafic densitatea de probabilitate a legii normale bidimensionale.
clf, clear
m1 = input(mu1=); m2 = input(mu2=);
s1 = input(sigma1=); s2 = input(sigma2=);
r = input(r(-1<r<1):);
x = m1-3*s1:.2:m1+3*s1; y = m2-3*s2:.2:m2+3*s2;
[X,Y] = meshgrid(x,y);
Z = 1/(2*pi*s1*s2*sqrt(1-r2))*exp(-1/(2*(1-r2))...
*((X-m1).2/s12-2*r*(X-m1).*(Y-m2)/(s1*s2)...
+(Y-m2).2/s22));
mesh(X,Y,Z)
title(Legea normala bidimensionala)

Prin executarea acestui program, pentru m1=m2=0, s1=1, s2=2 si r=-0.5, se


obtine graficul din Figura 2.15.
Programul 2.5.19. Programul Matlab care urmeaza reprezinta grafic densitatea de
probabilitate conditionata n cazul unui vector aleator ce urmeaza legea normala bidimensionala.
clf, clear
m1 = input(mu1=); m2 = input(mu2=);
s1 = input(sigma1=); s2 = input(sigma2=);

92

Elemente de teoria probabilitat ilor


Legea normala bidimensionala

0.1

0.08

0.06

0.04

0.02

0
6
4

2
0

1
0

2
6

Figura 2.15: Legea

 



 





r = input(r(-1<r<1):);
Y(1:3) = input(Y(trei valori):);
m = m1+s1*r*(Y-m2)/s2; s = sqrt(1-r2)*s1;
MM = max(m); mm = min(m);
X = []; X = mm-3*s:0.01:MM+3*s;
hold on
for i=1:3
P = []; P = normpdf(X,m(i),s);
if i==1 plot(X,P,k-.), end
if i==2 plot(X,P,k-), end
if i==3 plot(X,P,k--), end
end
title(Legea normala conditionata)

Prin executarea acestui program, pentru m1=1, m2=0, s1=1, s2=2, r=-0.5 si
Y=[-2,0,2], se obtin graficele din Figura 2.16. Graficul marcat prin punctlinie
este pentru prima valoare a lui Y, cel cu linie continua, pentru a doua valoare, iar prin
linie ntrerupta, pentru a treia.

2.5.6 Functie de supravietuire. Functie hazard


In aplicatii tehnice si nu numai, sunt utilizate si alte functii atasate variabilelor aleatoare, pentru exprimarea mai potrivita a fenomenului aleator cercetat.
Definitia 2.5.20. Daca variabila aleatoare  are functia de repartitie  , se numeste

2.5. Legi de probabilitate continue

93

Legea normala conditionata


0.5

0.45

0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
2

Figura 2.16: Legea normala conditionata pentru

  

 functia definita prin:


      

functie de supravietuire atasata variabilei aleatoare






Se observa ca daca  reprezinta durata de viata a unui individ, atunci


reprezinta probabilitatea ca durata de viata sa depaseasca un prag  dat.



Definitia 2.5.21. Daca variabila aleatoare de tip continuu  are functia de repartitie
 si densitatea de probabilitate  , se numeste functie hazard sau functie de risc
instantaneu atasata variabilei aleatoare  functia definita prin:








 


  

Avand n vedere definitia densitatii de probabilitate putem scrie


de unde

adica

  

  

  




 

 







   





94

Elemente de teoria probabilitat ilor




Prin urmare   ar reprezenta probabilitatea ca valoarea variabilei aleatoare  sa


ramana neschimbata ntrun interval imediat urmator, de lungime mica, daca valoarea
ei a depasit pragul .

2.6 Caracteristici numerice


2.6.1 Valoare medie. Dispersie (varianta ). Covarianta
Fie variabila aleatoare  avand functia de repartitie  .
Definitia 2.6.1. Numim valoare medie sau speranta matematica, caracteristica numerica

(2.6.1)




   


unde integrala Stieltjes se impune sa fie absolut convergenta pentru ca valoarea medie sa existe.

Observat
ia 2.6.2. Daca variabila aleatoare este de tip discret, adica are distributia


, atunci integrala Stieltjes se reduce la o suma, anume


 
 

care exista pentru cazul cand  este variabila aleatoare simpla, altfel se impune ca
seria ce apare n aceasta formula sa fie absolut convergenta.
Daca variabila aleatoare este de tip continuu, adica are densitatea de probabilitate  , atunci





 

  


 este un vector aleator dimensional, iar functia
Mai remarcam faptul ca daca 
  sa fie o variabila aleatoare, atunci
   este astfel ncat 

 

 


care n cazul continuu devine

 






  




 


 

 





 





2.6. Caracteristici numerice

95

Definitia 2.6.3. Numim dispersie sau varianta caracteristica numerica atasata variabilei aleatoare  definita prin:


(2.6.2)



Remarcam formula de calcul

 

  

  .



Definitia 2.6.4. Daca se considera vectorul aleator bidimensional


covarianta sau corelatie, caracteristica numerica

   

(2.6.3)

   
  

respectiv coeficient de corelatie, raportul

 


(2.6.4)

   , numim

   

 

 

Observatia 2.6.5. Pentru suma unui numar finit de variabile aleatoare avem:


 

 


 

     
    


iar daca variabilele aleatoare sunt independente doua cate doua




 

 



 

Definitia 2.6.6. Daca avem vectorul aleator


medie, vectorul

 






 
 

 , numim valoare

  

respectiv matrice a covariantelor, matricea




     



Observatia 2.6.7. Din cauza simetriei covariantei, avem ca matricea covariantelor


este simetrica.
Daca componentele vectorului aleator  sunt independente doua cate doua,
atunci matricea covariantelor este o matrice diagonala, pe diagonala principala
aflanduse dispersiile componentelor vectorului aleator.
Avand n vedere extinderea naturala a valorii medii la matrice aleatoare, putem
scrie:







  

 

96

Elemente de teoria probabilitat ilor

Teorema 2.6.8. Fie vectorul aleator 


   si matricea
, de tipul

 
, cu elemente numere reale. Daca se considera vectorul
 , atunci


(i)

este un vector aleator;

(ii) valoarea medie a vectorului aleator



  sau

este

(iii) matricea covariantelor vectorului aleator




(2.6.5)

   


este data prin

 


Demonstratie. (i) Transformarea liniara a unui vector aleator este vector aleator.
(ii) Avand n vedere proprietati ale valorii medii, pentru o componenta a vectoru, se poate scrie
lui




  



    





de unde rezulta

In mod analog se arata si a doua relatie.
(iii) Se poate proceda ca si pentru valoarea medie, daca se tine seama de proprietati ale corelatiei. Se scrie succesiv:


    

      

 


 

           

 
 

 

   
 



 


  
  


         

   

de unde se obtine relatia (2.6.5).


Acelasi lucru se poate obtine si prin folosirea relatiei de la punctul (ii). Anume,

2.6. Caracteristici numerice

97

se poate scrie:







  
 



 
  
  



  
  


 





de unde se obtine din nou relatia (2.6.5).




Proprietatea 2.6.9. Daca


  este matricea covariantelor vectorului aleator
atunci aceasta este o matrice pozitiv semidefinita, adica

     

,

 

Demonstratie. Pornind din membrul drept al relatiei ce se doreste a fi demonstrata,


putem scrie succesiv:

 


 

      

 


 

      



 

   



de unde se obtine relatia din enunt.


Proprietatea 2.6.10. Daca matricea
adica
atunci

  




este o matrice patratica pozitiv definita,

 

 

poate fi considerata matricea covariantelor unui vector aleator.

Demonstratie. Din algebra liniara este cunoscut faptul ca o matrice pozitiv definita
admite decompunerea

  

sau

 

 
  fiind matricea unitate, iar  este o matrice diagounde   
nala cu elementele numere pozitive. Putem face precizarea ca diagonala matricei 

contine valorile proprii ale matricei
, iar matricea  este formata din vectorii proprii ortonormati corespunzatori.


98

Elemente de teoria probabilitat ilor

Consideram vectorul aleator avand matricea covariantelor  . Un astfel de vector aleator exista, avand n vedere de exemplu vectorul aleator care are ca si compo 
nente variabile aleatoare independente ce urmeaza fiecare legea normala
.





Vectorul aleator 
va avea ca matrice a covariantelor chiar matri
cea
.
Intradevar, daca se tine seama de relatia (2.6.5), se obtine:


    

    

      

  

Din aceeasta succesiune de egalitati se obtine afirmatia facuta n enunt.




  a unui vector aleator  este

Corolarul 2.6.11. Daca matricea covariantelor



pozitiv definita, atunci exista o transformare  

.


aleator sa avem
si

astfel ncat pentru noul vector

Demonstratie. Folosinddescompunerea
     si alegand



obtinem ca

  este vectorul aleator cautat.
Pe de o parte avem


Pe de alta parte







  
         


are valoarea medie



satisface conditiile dorite.

  a unui vector aleator  este

       

Din cel doua succesiuni de relatii se obtine ca vectorul

   ,

 
    

Corolarul 2.6.12. Daca matricea covariantelor


pozitiv definita, atunci variabila aleatoare



Demonstratie. Cu notatiile din demonstratia corolarului precedent avem

      

Prin urmare, avem succesiv:









    



Dar avem ca
si 


fiecare
 , ceea ce conduce la

    

, astfel ca
.



 

 

 





, pentru

2.6. Caracteristici numerice

99

2.6.2 Functii Matlab pentru valoare medie si dispersie


Sistemul Matlab dispune de proceduri pentru calulul valorilor medii si ale dispersiilor
legilor de probabilitate implementate prin Statistics toolbox.
Pentru calculul valorilor acestor caracteristici numerice se foloseste apelul
[m,v]=numef(x,par1,par2,...)

unde numef este un sir de caractere, care definesc legea de probabilitate, din care
ultimele patru sunt stat, iar cele ce le preced sunt cele care dau numele legii.
In urma executarii instructiunii, se calculeaza matricele m si v ale valorilor medii
si ale dispersiilor pentru legea considerata, avand parametrii precizati prin matricele
par1, par2, ... Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca
daca unele sunt scalari, acestia se extind la matricele constante de aceleasi dimensiuni
cu celelalte si care iau valorile scalarilor corespunzatori.
Valorile medii si dispersiile se calculeaza, pentru fiecare lege de probabilitate n
parte, folosinduse formulele din Tabelul 2.1.

2.6.3 Valoare medie conditionata. Dispersie (varianta ) conditionata

    si  

Fie vectorul aleator bidimensional



conditionata de .

functia de repartitie a lui

Definitia 2.6.13. Numim valoare medie conditionata a variabilei aleatoare



catre , variabila aleatoare

   

Daca vectorul aleator








  

  



    este de tip discret, cu distributia



 
..
.

..
.

..
.

atunci variabila aleatoare





    fiind

o realizare a variabilei aleatoare




..
.

   va avea distributia
  




 de

100

Elemente de teoria probabilitat ilor

Legea

Denumirea













gam


 


logn

 


norm

 

 
 

weib
rayl

t
 

nct

f
 

ncx2

 

chi2

 




beta

exp




unif

 

geo

 

hyge
nbin



        

     






 
     
         
         
 
 
        

 
        
      


  e     e  e 


 



 



    
  

    
    

    
    
  


   


  
   , 
     

  
  
   
       , 
    
         
      
       
   
      
 

  
        


bino
poiss

 

unid

 


Valoarea medie si dispersia

ncf

Tabelul 2.1: Tabelul valorilor medii si dispersiilor

2.6. Caracteristici numerice

101

 
 
 
   
   



Daca vectorul aleator   este de tip continuu, avand densitatea de probabilitate  , atunci o realizare a variabilei aleatoare
   este data prin

unde





Proprietatea 2.6.14.





  

   

 .



   

 

Demonstratie. Demonstram proprietatea n cazul continuu. Cazul discret se demonstreaza analog.


Folosind definitia valorii medii avem succesiv:

   


 

  


 

  

    



 







 



    

 




Demonstratia se ncheie daca se retin extremitatile acestui sir de egalitati.

Definitia 2.6.15. Fie vectorul aleator 


varianta conditionata a variabilei aleatoare

Proprietatea 2.6.16.

  




 



 . Numim dispersie conditionata sau


 de catre  , variabila aleatoare

   

    

  

Demonstratie. Pornind de la definitia variantei si folosind proprietat i ale ei, putem


scrie:










 

      
 





   
  
 
             

Vom calcula pe rand cei trei termeni din partea dreapt


relatii.
a a acestei
Pentru primul termen, daca se noteaza 

   si se aplica proprietatea valorii medii conditionate avem:



 



    



102

Elemente de teoria probabilitat ilor

de unde se obtine ca

  

Pentru al doilea termen, daca se noteaza

  


 

de unde

 


  




  

 

  , se poate scrie:


  
  

    


 

  

A mai ramas sa aratam ca al treilea termen este


  si avand n vedere ca     zero. 
Fixam


  

  

const., putem scrie:



         
  
  
    
  

Ceea ce a mai ramas de aratat.

Exemplul 2.6.17. Sa consideram vectorul aleator  , care urmeaza legea normala, avand densitatea data prin (2.5.5). Este cunoscut ca parametrii acestei legi de
probabilitate au urmatoarele interpretari probabilistice:


iar

   

   
 

  este coeficientul de corelatie dintre  si .


 



Mai mult, pentru legea normala multidimensionala, avand densitatea de probabilitate data prin (2.5.4), se arata ca  este valoarea medie a vectorului aleator ce

urmeaza legea normala multidimensionala, iar este matricea covariantelor.
Sa revenim la cazul bidimensional si sa constatam ca

 
 











  

In mod analog, avem ca

  
 

 
   
  






2.6. Caracteristici numerice

103

Curbele de ecuatii







 




 

   



se numesc curbele de regresie a lui  n raport cu

 , respectiv a lui  n raport cu  .

2.6.4 Functie caracteristica


Fie variabila aleatoare

 si vectorul aleator

dimensional

.

Definitia 2.6.18. Numim functie caracteristica atasata variabilei aleatoare


pectiv vectorului aleator  , functia definita prin




 , res-


e      
 e      

Utilitatea functiei caracteristice este data de netezimea ei, care este superioara
functiei de repartitie, aceasta din urma putand fi discontinua, pe cand functia caracteristica este uniform continua. In plus, pe baza formulei de inversiune, exista o
caracterizare completa a distributiei unei variabile aleatoare sau a unui vector aleator
cu ajutorul functiei caracteristice.

2.6.5 Momente
Definitia 2.6.19. Fie variabila aleatoare  . Numim moment (initial) si respectiv
moment centrat de ordin , caracteristicile numerice



 

 

 
  

Remarcam ca n statistica sunt folosite n primul rand primele patru momente.


Astfel momentele centrate de ordinele doi si trei se folosesc pentru definirea asimetriei (skewness)



 


iar momentele centrate de ordinele doi si patru se folosesc pentru definirea excesului
(kurtosis)

 
sau



In sistemul Matlab, excesul este definit cu prima formula.

104

Elemente de teoria probabilitat ilor

2.6.6 Mediana. Cuartile. Cuantile


Definitia 2.6.20. Fie variabila aleatoare  , care are functia de repartitie  . Numim
mediana, caracteristica numerica , care satisface conditiile
(2.6.6)



    

Avand n vedere proprietat i ale functiei de repartitie, conditiile (2.6.6) se pot scrie
echivalent sub forma
    


 
Daca variabila aleatoare este de tip continuu, relatiile (2.6.6) se reduc la relatia



   , adica
  .
In cazul discret, folosind (2.6.6) sar putea ca mediana sa nu fie determinata n
  
mod unic, de aceea se alege ca fiind cel mai mic numar pentru care 


Definitia 2.6.21. Fie variabila aleatoare  , care are functia de repartitie  . Numim
 
cuantila de ordin 
 , caracteristica numerica  , care satisface conditiile
(2.6.7)

     

si



Ca si n cazul medianei, aceste conditii se pot scrie echivalent sub forma


    
  

care se reduce la relatia   


, adica    , n cazul continuu.

In cazul discret, cuantila  se ia ca fiind cel mai mic numar pentru care are loc
inegalitatea     .

Unele cuantile au denumiri speciale. Iata de exemplu, cuantila de ordin

este chiar mediana. 
 
Daca
   , se obtin ceea ce se numesc cuartile, respectiv cuartila inferioara, mediana si cuartila superioar
 a .

 


 ,
 , se obtin ceea ce poarta denumirile
Daca
 ,
 ,
decile si respectiv centile.

2.6.7 Functia Matlab icdf


Am vazut ca pentru calculul cuantilelor este necesara inversarea functiei de repartitie.
Sistemul Matlab prin Statistics toolbox dispune de functii pentru inversarea functiilor
de repartitie ale legilor de probabilitate implementate.
Apelarea acestor functii se face cu una din urmatoarele forme:
x = icdf(legea,P,p1,p2,...)
x = numef(P,p1,p2,...)

2.6. Caracteristici numerice

105

unde legea este un sir de caractere predefinit pentru fiecare din legile de probabilitate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt inv, iar cele ce le preced sunt cele care dau numele predefinit al legii de
probabilitate (ca si cele din parametrul legea).
In urma executarii uneia din cele doua instructiuni, se calculeaza matricea x a
cuantilelor legii precizata prin parametrii legea, respectiv numef, corespunzatoare
valorilor date prin matricea P si avand parametrii dati prin matricele par1, par2,...
Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca daca unele sunt
scalari, acestia se extind la matricele constante de aceleasi dimensiuni cu celelalte si
care iau valorile scalarilor corespunzatori.
Programul 2.6.22. Pentru a ilustra grafic modul de calcul al cuantilelor, vom da un
program care calculeaza mediana pentru legea uniforma discreta si reprezinta grafic
acest lucru pentru doua valori distincte ale parametrului N, precum si cuartilele legii
normale.
clf, clear
N1 = input(N1=); N2 = input(N2=);
m = input(mu=); s = input(sigma=);
xu1 = 0:N1+1; yu1 = unidcdf(xu1,N1);
xu2 = 0:N2+1; yu2 = unidcdf(xu2,N2);
xn = m-3*s:0.01:m+3*s; yn = normcdf(xn,m,s);
me1 = icdf(unid,1/2,N1);
me2 = icdf(unid,1/2,N2);
Q = icdf(norm,[1/4,2/4,3/4],m,s);
subplot(3,1,1), stairs(xu1,yu1)
set(gca,Xlim,[0,N1+1]), set(gca,xtick,[me1])
set(gca,xticklabel,[me1]), hold on
plot([0,me1],[1/2,1/2],k:,me1,1/2,o)
plot([me1,me1],[0,1/2],k-.)
subplot(3,1,2), stairs(xu2,yu2)
set(gca,Xlim,[0,N2+1]), set(gca,xtick,[me2])
set(gca,xticklabel,[me2]), hold on
plot([0,me2],[1/2,1/2],k:,me2,1/2,o)
plot([me2,me2],[0,1/2],k-.)
subplot(3,1,3),
plot(xn,yn,[Q(1),Q(2),Q(3)],[1/4,2/4,3/4],o)
set(gca,xtick,[Q(1),Q(2),Q(3)])
set(gca,xticklabel,[Q(1),Q(2),Q(3)])
hold on
X = [m-3*s,Q(1);m-3*s,Q(2);m-3*s,Q(3)];
plot(X,[1/4,1/4;1/2,1/2;3/4,3/4],k:)
plot([Q(1),Q(1)],[0,1/4],k-.)
plot([Q(2),Q(2)],[0,2/4],k-.)
plot([Q(3),Q(3)],[0,3/4],k-.)

Executarea programului pentru N=5 si N=6, respectiv pentru mu=0 si sigma=2, are
ca rezulatat graficele din Figura 2.17.

106

Elemente de teoria probabilitat ilor

0.5

0.5

0.5

1.34898

Figura 2.17: Medianele pentru

 si

1.34898

 si cuartilele pentru

  

2.7. Siruri de variabile aleatoare

107

2.6.8 Functia Matlab disttool


Functia (comanda) disttool este un program de demonstrativ. Lansarea acestuia
se face prin:
>>disttool

n urma careia se produce o fereastra grafica interactiva (demonstrativa) privind


functiile de repartitie (cdf) si functiile de probabilitate (pdf).
Fixarea (stabilirea) legii de probabilitate n scop demonstrativ se face prin alegerea din meniul legilor de probabilitate situat n partea stanga sus a ferestrei, iar
una din alternativele pdf si cdf se face folosind meniul din partea dreapta sus a
ferestrei. Pentru stabilirea valorilor parametrilor legii de probabilitate considerate se
poate proceda n doua moduri. Fie prin introducerea n ferestrele corespunzatoare ale
valorilor dorite, fie prin deplasarea barelor atasate acestora. In plus, limite pentru parametrii legii de probabilitate considerate pot fi precizate prin introducerea acestora
n ferestrele considerate.
Determinarea valorii functiei pdf respectiv cdf ntrun punct, se poate obtine
prin introducerea argumentului functiei n fereastra de pe axa absciselor sau prin
deplasarea dreptei verticale afisata pe grafic, cu ajutorul mouselui, pana cand aceasta
trece prin punctul respectiv. Inversa functiei de repartitie (icdf) se poate obtine de
asemenea, prin introducerea valorii functiei de repartitie (cdf) n fereastra de pe
axa ordonatelor sau prin deplasarea dreptei orizontale afisata pe grafic, cu ajutorul
mouselui, pana cand aceasta trece prin punctul respectiv.

2.7 Siruri de variabile aleatoare


2.7.1 Inegalitatea lui Cebsev
Fie variabila aleatoare  , pentru care exista valoarea medie si dispersia.
Inegalitatea lui Cebsev este cunoscuta sub una din formele










 

    





Observatia 2.7.1. Daca n inegalitatea lui Cebsev se ia





  abaterea standard, atunci aceasta devine






 

 



, unde sa notat

108

Elemente de teoria probabilitat ilor



Astfel, pentru
se obtine  
          ceea ce
nseamna ca probabilitatea ca valorile lui  sa se abata de la valoarea medie

mai putin de trei ori abaterea standard este mai mare decat 

Observatia 2.7.2. Fie variabilele aleatoare  ,


 , independente si identic



repartizate,
and valorile medii si dispersiile

,     , pentru
av
 
fiecare
 cu ajutorul carora construim variabila aleatoare

   

 



cu

si

Daca se aplica inegalitatea lui Cebsev se obtine













        



 






  
 


Cele doua inegalitati dau evaluari ale probabilitat ilor ca media aritmetica a variabilelor aleatoare sa se abata de la valoarea medie mai putin, respectiv mai mult, decat

fixat.


2.7.2 Tipuri de convergenta


Sa consideram sirul de variabile aleatoare
corespunzatoare   .

  cu sirul functiilor de repartitie


    converge n proba
bilitate la variabila aleatoare  , si vom nota 
 , daca pentru orice ,
avem ca




    

Definitia 2.7.3. Spunem ca sirul de variabile aleatoare

 

Definitia 2.7.4. Spunem ca sirul de variabile aleatoare    converge n repar


titie la variabila aleatoare  , si vom nota 
 , daca avem ca


 
 



 

unde  este functia de repartitie a variabilei aleatoare  , iar limita considerata


exista pentru orice punct de continuitate    al functiei  .





Observatia 2.7.5. Daca 


 , atunci   . Implicatia inversa nu are loc,
dar daca  este o constanta , atunci afirmat
ia inversa are loc de asemenea, adica







.
daca 
, pentru
, atunci 

2.7. Siruri de variabile aleatoare

109

2.7.3 Legea numerelor mari


Sa consideram sirul de varaibile aleatoare

 .

Definitia 2.7.6. Spunem ca sirul de variabile aleatoare



ba) a numerelor mari, daca pentru orice  avem ca

       
   
 





 

adica




   






       



Observatia 2.7.7. Daca variabilele aleatoare ale sirului


si identic repartizate, iar
  , atunci

 





  urmeaza legea (sla-

adica

  sunt independente






unde     .
Prin urmare, media aritmetica a primelor variabile aleatoare din sirul considerat
 .
si pierde caracterul aleator, pentru
Evident, deoarece
 convergenta n probabilitate implica convergenta n repartitie,


, dar vom vedea imediat ca exista chiar un rezultat mai bun n
avem si 
ceea ce priveste convergenta n repartitie.

2.7.4 Teoreme limita


Am vazut ca legea numerelor mari este n stransa legatura cu convergenta n probabilitate, chiar si cu asa numita convergenta tare, dar care nu a fost prezentata n
sectiunea precedenta.
Teoremele limita abordeaza problematica comportarii asimptotice a sirurilor de
varaibile aleatoare din perspectiva convergentei n repartitie.
Teorema 2.7.8 (LindebergLevy). Fie sirul de variabile aleatoare independente si
identic repartizate   , pentru care se introduc notatiile





 

  

 

110

Elemente de teoria probabilitat ilor

Daca se construies te sirul de variabile aleatoare

  , cu termenul general


 


atunci





, unde  este o variabila aleatoare ce urmeaza legea normala



, adica

 


 




   e  
 

   

 fiind functia de repartitie a variabilei aleatoare .


Observatia 2.7.9. Teorema limita de acest tip, n care legea de probabilitate limita
este legea normala se numeste teorema limita centrala.
Teoremele limita au un rol aparte n statistica, unde sunt privite n urmatoarea
 ), atunci variabila aleatoare  poate fi considemaniera. Daca este mare (
rata ca urmand o lege de probabilitate cunoscuta, n cazul teoremei precedente legea
 
normala
.

 , urmeaza legea normala

Mai observ
a
m ca variabila aleatoare  , cand



Teorema 2.7.10 (MoivreLaplace). Daca variabila aleatoare


binomiala, adica are distributia



atunci

unde




  



unde




 








urmeaza legea

   



 


 este o variabila aleatoare ce urmeaza legea normala



.

Rezultatul teoremei se exprima de regula sub forma




 

(2.7.1)
         e  

Observatia 2.7.11. Teorema limita MoivreLaplace este o consecinta imediata a
Teoremei LindebergLevy, daca se are n vedere ca variabila aleatoare  este suma

2.7. Siruri de variabile aleatoare

111

 ,

a variabile aleatoare independente


Bernoulli, adica avand distibutia








 



 , fiecare urmand aceeasi lege a lui

unde



 

Mai remarcam faptul ca variabila aleatoare , care urmeaza legea binomial


 
 , ca urmand legea normala
     . a
, poate fi privita, pentru

Observatia2.7.12 (Regula celor trei ). Daca n formula MoivreLaplace se con


sidera
, atunci

  






 

 

        
Prin urmare, rezulta ca 

Deoarece, abaterea medie
  , avem
patratica a variabilei aleatoare  ce urmeaza legea binomiala este 
regula urmatoare cunoscut
a sub denumirea de regula celor trei : probabilitatea ca

frecventa absoluta sa se abata de la valoarea medie
   mai putin de trei
 
ori abaterea medie patratica este mai mare decat
.
Observatia 2.7.13 (Corectie de continuitate). Avand n vedere procesul de aproximare a unei legi de tip discret (legea binomiala) cu una de tip continuu (legea
normala), pentru obtinerea unor rezultate mai bune n aplicarea formulei (2.7.1), se
impune aplicarea unei corectii de continuitate, data prin

 




 

  
 


unde



 








 

 

 




 e

 




reprezinta functia lui Laplace.


Folosind aceasta corectie de continuitate avem urmatoarele formule de aproxi-

112

Elemente de teoria probabilitat ilor

mare:

   

 






  
 

   

  






 


   
 
   

     
   
 


 
  

   
      
  
  
  







Programul 2.7.14. Pentru a ilustra rezultatele Teoremei MoivreLaplace, programul Matlab care urmeaza, reprezinta grafic prin bare functia de probabilitate a legii

binomiale 
mpreun
densitatea de probabilitate a legii normale cores
  a cu
 .
punzatoare, adica
clf
n = input(n=); p = input(p=);
m = n*p; s = sqrt(n*p*(1-p));
x = 0:n; xx = -1:0.01:n+1;
P = binopdf(x,n,p); y = normpdf(xx,m,s);
bar(x,P,0.3), hold, plot(xx,y)

Executarea programului pentru n=15 si p=0.4, produce graficul din Figura 2.18.
0.25

0.2

0.15

0.1

0.05

0
2

Figura 2.18: Legea  



10

  si legea

12

14




16

Capitolul 3

Statistica descriptiva
Statistica se ocupa cu descrierea si analiza numerica a fenomenelor de masa,
dezvaluind particularitat ile lor de volum, structura, dinamica, conexiune, precum si
regularitat ile sau legile care le guverneaza.
Etapele principale ce se disting n cercetarea statistica a unui fenomen aleator se
pot considera ca fiind:
a). Definirea (conceptia) obiectului studiat, care contine definirea unitatilor statistice, conceperea chestionarului (ntrebarilor), planificarea culegerii datelor.
b). Observarea fenomenului (culegerea datelor) conform criteriilor stabilite la
etapa precedenta.
c). Descrierea statistica, ce cuprinde reprezentarea grafica a datelor statistice,
sistematizarea acestora, precum si calcularea indicatorilor numerici pentru punerea
n evidenta a unor proprietati si pentru sugerarea unor ipoteze referitoare la legile
care guverneaza fenomenul cercetat.
d). Modelarea probabilistica a fenomenului cercetat, care are ca obiectiv principal cercetarea fenomenului folosind ca instrument de lucru teoria probabilitat ilor
relativ la datele statistice obtinute conform etapelor precedente.
Daca primele doua etape pot fi considerate ca preliminare, etapa a treia conduce
la ceea ce numim statistica descriptiva, iar a patra etapa conduce la statistica matematica sau statistica inferentiala.
Desigur, nu se poate face o delimitare exacta ntre statistica descriptiva si statistica matematica, mai mult o descriere statistica fundamentata matematic va conduce la realizarea unei modelari a fenomenului, care pune n evidenta proprietatile
esentiale ale acestuia si legaturile dintre acestea. Ca o componenta de baza a statisticii descriptive, care s-a dezvoltat n mod impresionant odata cu explozia utilizarii
calculatoarelor n statistica, o reprezinta analiza datelor. Printre capitolele mai importante ale analizei datelor amintim metodele de clasificare si metodele factoriale.
113

114

Statistica descriptiva

Pe de alta parte, statistica matematica cuprinde ca si capitole principale teoria


selectiei, teoria estimatiei si verificarea ipotezelor statistice, strans legat de teoria
deciziilor.
Din cele prezentate putem spune ca statistica descriptiva are ca obiectiv principal
culegerea si clasificarea datelor statistice n vederea descrierii numerice si grafice a
fenomenului cercetat. Statistica matematica elaboreaza modelul matematic, folosind
datele statistice, estimeaza parametrii modelului, stabileste metode pentru validarea
ipotezelor statistice, toate acestea avand la baza teoria probabilitat ilor.
Amintim ca studiul statistic al fenomenelor economice face obiectul statisticii
economice, iar studiul statistic al fenomenelor ce pot constitui riscuri asigurate reprezinta obiectul statisticii actuariale.

3.1 Concepte de baza ale statisticii


Definitia 3.1.1. Numim colectivitate (populatie) o multime de elemente cercetata din punct de vedere a uneia sau mai multor proprietati, elementele componente
numindu-se indivizi sau unitati statistice, iar numarul elementelor lui se numeste
volumul colectivitat ii.
Definitia 3.1.2. Numim caracteristica sau variabila a colectivitat ii proprietatea supusa investigarii statistice relativa la . Cand o caracteristica poate fi masurata o
numim caracteristica cantitativa sau numerica, iar daca aceasta se exprima printr-o
nsusire o numim caracteristica calitativa sau atribut.
In unele tratate de statistica variabilele (caracteristicile) calitative sunt numite
variabile nominale. O clasa intermediara de variabile (caracteristici) este formata de
asa numitele variabile (caracteristici) ordinale.
Observatia 3.1.3. Daca se considera colectivitatea a studentilor dintr-un an de studiu, atunci naltimea, greutatea, media obtinuta la sfarsitul anului sunt caracteristici
cantitative (numerice), pe cand sexul, culoarea ochilor, grupa sanguina sunt caracteristici calitative (nominale). Un exemplu de caracteristica ordinala ar fi gradul de
pregatire (foarte bun, bun, satisfacator, nesatisfacator). Se observa ca relativ la o variabila ordinala se poate face ordonarea indivizilor, ca si pentru o variabila numerica,
ceea ce nu se ntampla pentru o variabila nominala, dar nu se pot face operatii aritmetice, cum se ntampla si la variabilele nominale, pe cand pentru o variabila numerica
astfel de operatii sunt posibile.
Observatia 3.1.4. Din punct de vedere al teoriei probabilitat ilor o caracteristica a
unei populatii este o variabila aleatoare  . Scopul principal al cercetarii statistice

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

115

este de a stabili legea de probabilitate pe care o urmeaza caracteristica  , utilizand


observatiile (datele statistice) relative la colectivitatea cercetata.
Daca avem n vedere mai multe caracteristici  ,. . . ,, acestea reprezinta componentele unui vector aleator  , iar cercetarea fenomenului aleator modelat prin  ,
se poate extinde si la determinarea legaturilor ce exista ntre componentele vectorului
aleator.
Definitia 3.1.5. O caracteristica  ce ia o multime cel mult numarabila de valori o
numim caracteristica de tip discret, iar daca ia valori dintr-un interval finit sau infinit
o numim caracteristica de tip continuu.
Observatia 3.1.6. Daca se considera colectivitatea a bolnavilor externati dintr
un spital pe parcursul unei saptamani, atunci caracteristica  ce reprezinta numarul

zilelor de internare este o caracteristica de tip discret, pe cand greutatea a bolnavilor externati reprezinta o caracteristica de tip continuu. Remarcam faptul ca pentru
 caracterul continuu este estompat prin imposibilitatea masurarii ecaracteristica
xacte a acestei caracteristici, de aceea, practic, se considera ca fiind de asemenea de
tip discret.

3.2 Culegerea, prezentarea si prelucrarea


datelor statistice
Modurile de culegere (observare) a datelor statistice cele mai des utilizate sunt:
a). Observarea totala (exhaustiva, recensamant), cand toti indivizii colectivitat ii
sunt nregistrati.
b). Observare partiala (sondaj, selectie), cand dupa criterii bine stabilite sunt
nregistrati o parte din indivizii colectivitat ii , numita esantion sau selectie.
c). Observare curenta, cand nregistrarea indivizilor se efectueaza odata cu aparitia (producerea) lor.
d). Observarea periodica, cand nregistrarea fenomenului se efectueaza la intervale de timp stabilite.

3.2.1 Generarea numerelor aleatoare n Matlab


Matematica, si prin teoria probabilitat ilor si statistica matematica, printre multiplele
si larg raspanditele aplicatii, poseda, poate, una legata de modelarea matematica, care
se distinge n mod special prin vastul domeniu de aplicabilitate. Modelarea matematica, dupa cum spune si numele, are drept scop construirea de modele matematice
asociate unor fenomene sau sisteme pe care le ntalnim n diferite domenii: fizica,
chimie, biologie, demografie, medicina, geografie, geologie, economie etc. Desigur,

116

Statistica descriptiva

astfel de modele matematice depind de niste parametri, fie aleatori, fie nealeatori.
Odata modelul matematic construit se are n vedere realizarea practica a acestuia.
Dar, apare o mare problema, este acest model matematic (teoretic) construit viabil? Avem doua alternative, sau realizam practic modelul respectiv si urmarim cum
functioneaza acesta (ceea ce, n general, nu e de dorit), sau simulam functionarea
modelului respectiv prin diferite particularizari ale parametrilor modelului si alegem
varianta convenabila. Daca relativ la parametrii nealeatori care intervin n modelul
teoretic nu se ridica probleme speciale, n privinta parametrilor aleatori apare o noua
problema, anume obtinerea valorilor acestor parametri. Deoarece parametrii aleatori
sunt, din punct de vedere al teoriei probabilitat ilor, variabile aleatoare, apare asadar
problema generarii de valori numerice ale acestor variabile aleatoare si care vor purta
denumirea de numere aleatoare. Desigur ca ntr-un fel vor fi generate aceste numere
aleatoare daca parametrul urmeaza, sa zicem, legea uniforma pe un anumit interval si
altfel cand urmeaza legea normala.
Deoarece pentru prezentarea notiunilor si rezultatelor teoretice ale statisticii matematice sunt necesare exemplificari ale acestora, iar culegerea unor date statistice
reale nu este ntodeauna la ndemana, de multe ori vom considera numerele aleatoare
ca fiind date statistice carora li se vor aplica metodele cercetarii statisticii.
Putem sa amintim de asemenea ca testarea programelor pe calculator, determinarea statistica a caracteristicilor numerice ale variabilelor aleatoare, care ne conduce
la metoda Monte Carlo, fac de asemenea necesara generarea numerelor aleatoare.
Metodele de generare a numerelor aleatoare se mpart n trei categorii:
tabelele cu numere aleatoare (uniforme) obtinute, de exemplu, din aruncarea
monedei, aruncarea zarului, jocul de ruleta, tabele matematice, tabele de recensamant etc.
procedeele fizice, care au la baza fenomene fizice, cum ar fi emiterea particulelor de o sursa radioactiva, intensitatea curentului la diferite momente, zgomotul
electronic etc.
procedeele aritmetice (analitice), care utilizeaza o formula de calcul de forma
 



   





 

Deoarece, de regula, se foloseste un volum mare de numere aleatoare, s-a impus generarea acestora cu ajutorul procedeelor aritmetice. Inconvenientul acestor procedee
analitice este legat de faptul ca nu poseda caracterul strict aleator, din moment ce
exista o legatura functionala ntre acestea. Dar exista posibilitatea de a alege astfel
de procedee analitice care produc siruri de numere pseudoaleatoare, foarte apropiate
din punct de vedere statistic de numerele aleatoare propriuzise.

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

117

In lucrarile [3] si [5] sunt prezentate proceduri pentru generarea de numere aleatoare pentru diferite legi de probabilitate.
Sistemul Matlab are implementate astfel de proceduri pentru generarea numerelor
aleatoare, fie prin Statistics toolbox, fie prin sistemul de baza din Matlab.
Functia random
Instructiunile prin care sunt generate numere aleatoare ce urmeaza una din legile de
probabilitate recunoscute de sistemul Matlab prin Statistics toolbox sunt de forma:
x=random(legea,par1,par2,...,m,n)
x=numef(par1,par2,...,m,n)

unde legea este un sir de caractere predefinit pentru fiecare din legile de probabilitate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt rnd, iar cele ce le preced sunt cele care dau numele predefinit al legii de
probabilitate (ca si cele din parametrul legea).
Executarea uneia din cele doua forme ale instructiunii random, are ca efect generarea matricei x, cu m linii si n coloane, de numere aleatoare ce urmeaza legea
de probabilitate corespunzatoare cu parametrii precizati prin matricele p1, p2, . . . .
Aceste matrice trebuie sa aiba aceleasi dimensiuni cu matricea x, cu exceptia cand
unele sunt scalari, caz n care acestea sunt extinse la matricele constante de aceleasi
dimensiuni cu celelalte si care iau valorile corespunzatoare scalarilor. Daca toti parametrii legii de probabilitate sunt scalari, cand lipsesc parametrii m si n se genereaza
un numar aleator, cand lipseste n, atunci trebuie ca m sa fie un vector cu doua componente, care contine dimensiunile matricei x. Daca cel putin unul din parametrii legii
probabilitate nu este scalar si daca parametrii m si n sunt prezenti, acestia trebuie sa
coincida cu dimensiunile matricelor.
Functiile mvnrnd si mvtrnd
Functiile mvnrnd si mvtrnd sunt singurele functii din Statistics toolbox, prin care
se genereaza legi de probabilitate multidimensionale, respectiv legile normala si t
(Student).
Apelurile acestor functii se pot face respectiv prin:
x=mvnrnd(mu,v,m)
x=mvtrnd(r,n,,m)

In primul caz, sunt generati m vectori aleatori ce urmeaza legea normala multidimensionala, avand vectorul valorilor medii mu si matricea covariantelor v (matrice
patratica pozitiv definita). Cei m vectori aleatori generati sunt obtinuti n matricea x,
care n consecinta va avea m linii, iar numarul coloanelor este dat de dimensiunea legii de probabilitate si care trebuie sa coincida cu lungimea vectorului mu si cu ordinul
matricei patratice v.

118

Statistica descriptiva

In al doilea caz, vor fi generati m vectori aleatori ce urmeaza legea Student multidimensionala.
Parametrul r reprezinta matricea coeficientilor de corelatie, care este matrice pozitiv definita avand pe diagonala principala toate elementele . Daca aceasta ultima
conditie nu este ndeplinita, adica daca este matricea covariantelor, atunci sistemul
Matlab calculeaza prima data, din matricea r, matricea coeficientilor de corelatie.
Parametrul n reprezinta numarul gradelor de libertate, putand fi un scalar sau un
vector de lungime m.
Cei m vectori aleatori sunt obtinuti n cele m linii ale matricei x si care are atatea
coloane cat este dimensiunea legii de probabilitate.
Trebuie sa remarcam faptul ca o linie a matricei x se obtine dintrunvector aleator ce urmeaza legea normala multidimensionala, avand valoarea medie si matricea
covariantelor data prin parametrul r, ale carui componente se mpart la un numar
aleator ce urmeaza legea  cu n grade de libertate.
Functiile rand si randn
Sistemul Matlab de baza contine doua functii pentru generarea de numere aleatoare
 
 , prin rand, respectiv legea normala standard
ce urmeaza legea uniforma
 
 , prin randn.
Apelul acestor functii se poate face prin instructiuni de forma:
x=rand
x=rand(m)
x=rand(m,n)
x=randn
x=randn(m)
x=randn(m,n)

In urma executarii unor astfel de instructiuni este generat un numar aleator ce ur 
 
meaza legea
 respectiv
 , cand nu este folosit nici un argument, o matrice patratica de ordin m de numere aleatoare, cand apare un argument si o matrice
de numere aleatoare de tipul (m,n), cand sunt folosite ambele argumente.
Unele situatii impun regasirea unui anumit sir de numere aleatoare generat prin
una din cele doua functii rand si respectiv randn. Pentru aceasta avem la dispozitie
ceea ce se numeste starea generatorului.
Obtinerea starii generatorului rand si randn la un moment dat se poate face
prin:
s=rand(state)
s=randn(state)

Pentru reinitializarea sau schimbarea starii generatorului, se pot utiliza urmatoarele


instructiuni:

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

119

rand(state,s)
randn(state,s)
rand(state,0)
randn(state,0)
rand(state,sum(100*clock))
randn(state,sum(100*clock))

Parametrul s precizeaza starea la care urmeaza sa fie resetat generatorul, daca


acesta este 0, generatorul va fi resetat la starea initiala. Daca apare parametrul
sum(100*clock), generatorul este resetat la fiecare apel n functie de timpul calculatorului.
Instructiuni mostenite din Matlab 4 si Matlab 5 sunt de asemenea active:
rand(seed)
randn(seed)
rand(seed,0)
randn(seed,0)
rand(seed,r)
randn(seed,r)

Functia randperm
Generarea unei permutari a primelor n numere naturale se realizeaza prin instructiunea
perm=randperm(n)

si va avea ca efect obtinerea vectorului perm ce contine o astfel de permutare.

3.2.2 Tabele statistice


Definitia 3.2.1. Numim tabel statistic (simplu, nesistematizat) un tablou n care
nregistrarile sunt trecute n ordinea aparitiei lor.
Observatia 3.2.2. Daca observatiile statistice s-au facut relativ la  caracteristici, fie
acestea  , , , , asupra a indivizi, atunci tabelul statistic simplu este matri     , unde  este valoarea caracteristicii  pentru individul .
cea 
Definitia 3.2.3. Numim tabel statistic (sistematizat) relativ la caracteristica  de tip
discret, tabloul n care sunt trecute valorile distincte ale caracteristicii si frecventele
cu care au aparut aceste valori.
Observatia 3.2.4. Avand caracteristica  de tip discret,
care ia valorile distincte
   


 
 , tabelul statistic
 , pentru care s-au obtinut datele primare   
sistematizat are forma

120

Statistica descriptiva












..
.

..
.

 n datele primare  


unde  este frecventa absolut
a
a
aparit

iei
valorii


Prin urmare are loc relatia   
.

Definitia 3.2.5. Fie caracteristica de tip continuu  , care ia valori din intervalul
 

, descompus n intervale disjuncte, numite clase, prin punctele care satisfac
relatiile

     

Numim tabel statistic (sistematizat) relativ la caracteristica  , tabloul ce contine


clasele caracteristicii si frecventele cu care au aparut aceste clase.
Observatia 3.2.6. Daca datele
primare
ale caracteristicii continue  , care ia valori

 

 






n intervalul
, sunt , 
,
, atunci tabelul statistic sistematizat are forma

    
    



..
.




..
.

  

 

sau













..
.

..
.



unde
 este
frecventa absolut
a a aparitiei clasei     printre datele primare


 





 Daca se considera varianta din dreapta pentru tabelul
 , iar 
sistematizat, se obtine aceeasi forma de tabel ca si n cazul caracteristicii discrete.
In acest fel s-a ajuns la o unificare a prezentarii prin tabele sistematizate a tipurilor
discrete si continue de caracteristici.

Observatia 3.2.7. Prin stabilirea claselor unei caracteristici continue (care pot fi de
lungimi egale sau nu) s-a efectuat o grupare a datelor statistice primare, si care se
efectueaza si n cazul caracteristicilor de tip discret, daca au un numar mare de valori
distincte.


Definitia 3.2.8. Numim amplitudinea


clasei definita de intervalul     lungimea




.
acestui interval, 

Observatia 3.2.9. Cand amplitudinile claselor sunt egale, doua reguli de stabilire a
numarului claselor sunt utilizate mai des:







lg
(regula lui Sturges) si 
     


3.2. Culegerea, prezentarea si prelucrarea datelor statistice


unde




   




 

si

In acest fel, din prima regula, se obtine ca


Cand

 
este

si



   

si

    

 

infinit, atunci



121

   



 






Exemplul 3.2.10. Se considera un lot de  becuri din punct de vedere al caracteristicii  , ce reprezinta durata de viata n mii ore. Datele statistice obtinute sunt:
1.318
3.426
3.972
2.128
1.548
1.937
2.500

3.128
1.690
2.637
2.465
2.298
1.977
2.641

2.758
3.537
0.842
2.316
1.875
2.206
1.631

1.583
2.214
2.256
2.262
3.394
1.681
1.864

2.517
2.219
1.708
1.962
1.931
1.960
2.015

2.304
2.072
1.628
1.802
1.179
3.281
2.502

1.155
2.726
2.345
2.230
1.946
2.838
2.444

3.156
1.403
1.855
3.460
1.355
2.525
2.636

2.807
2.493
1.546
1.493
3.006
1.553
2.337

2.879
1.560
3.852
3.093
2.455
2.676
1.966

Vrem sa scriem tabelul sistematizat al datelor statistice, considerand clase de


amplitudini egale.
Folosind regula lui Sturges avem ca numarul al claselor poate fi calculat cu

ajutorul numarului al datelor statistice prin


 



lg

 

de unde rezulta ca

. In acest fel avem ca amplitudinea  a claselor este


   
    






Cand se foloseste formula





    


pentru calculul amplitudinii claselor, se obtine 
. In acest caz numarul


claselor va fi




   

 




de unde
 .

al

122

Statistica descriptiva

Se observa ca folosind cele doua metode s-au obtinut valori distincte pentru
numarul claselor. Aceste formule au mai mult rolul de a da o prima informatie relativa la numarul claselor.

  

In continuare vom considera numarul claselor

, 
,
,

si 
.
Folosind aceasta grupare se obtine tabelul sistematizat

 
  
   
   
 





 

 


 
  
  
  












sau

























Programul 3.2.11. In urma executarii urmatorului program Matlab


load x.dat -ascii
N=length(x);
ns=fix(1+10/3*log10(N));
ds=(max(x)-min(x))/ns;
fprintf(
ns= %2d,
ds= %4.2f\n,ns,ds)
da=8*(max(x)-min(x))/100;
na=fix((max(x)-min(x))/da);
a=0.7:0.3:4; n=length(a)-1;
fprintf(
na= %2d,
da= %4.2f\n,na,da)
for i=1:N
for j=1:n
if (a(j)<=x(i))&(x(i)<a(j+1))
cl(i)=j;
end
end
end
t=tabulate(cl);
fprintf( Tabelul sistematizat\n)
for j=1:n
t(j,1)=(a(j)+a(j+1))/2;
fprintf(%10.2f | %2d\n,t(j,1),t(j,2))
end

se obtin rezultatele:
ns= 7,
ds= 0.45
na= 12,
da= 0.25
Tabelul sistematizat

3.2. Culegerea, prezentarea si prelucrarea datelor statistice


0.85
1.15
1.45
1.75
2.05
2.35
2.65
2.95
3.25
3.55
3.85

|
|
|
|
|
|
|
|
|
|
|

123

1
2
9
9
10
15
10
5
4
3
2

Se observa ca prima comanda citeste datele statistice din fisierul x.dat, care este un
fisier ascii.

Definitia 3.2.12. Numim frecventa relativa a clasei  raportul 

Definitia 3.2.13. Numim frecvente cumulate ascendente, respectiv frecvente cumulate descendente frecventele date de relatiile




unde



si 




 






.



Observatia 3.2.14. Pentru frecventele relative are loc relatia




iar pentru cele cumulate au loc relatiile 

 

 
,

Definitia 3.2.15. Numim distributie statistica a caracteristicii







si 


 tabloul de forma

sau



unde  ,
 , sunt clasele considerate, iar
frecventele absolute si frecventele relative.

 

si


,

 , sunt respectiv

Exemplul 3.2.16. Consideram datele statistice de la Exemplul 3.2.10. Atunci distributia statistica a caracteristicii  poate fi scrisa, fie cu ajutorul frecventelor absolute,
fie cu ajutorul frecventelor relative. Astfel avem ca

 



      





















124

Statistica descriptiva

 

















 
 



..
.

..
.




..
.

..
.

..
.


 




Tabelul 3.1: Tabel de contingenta

sau



      































Definitia 3.2.17. Fie colectivitatea relativ la care sunt cercetate doua caracteristici
 si  . Numimtabel de contingenta , un tablou care contine clasele caracteristicilor
 si respectiv , mpreuna cu frecventele absolute ale acestor clase.

Observatia 3.2.18. Daca pentru cele doua caracteristici  si avem respectiv cla


,
sele date prin
 , si  , 
 , iar datele primare sunt date prin pere


 
 
   
  , atunci tabelul de contingenta este Tabelul 3.1
chile       
    n datele primare    ,
unde
 este frecventa absoluta a aparitiei clasei
 . Dupa cum se vede tabelul a fost completat cu o linie si o coloana ale caror
elemente sunt date prin formulele





















 

Observatia 3.2.19. Cand caracteristicile  si sunt caracteristici cantitative si ntre


ele exista o relatie de dependenta , tabelul de contingenta se numeste tabel de corelatie.
Exemplul 3.2.20.
 Un astfel de tabel
 de corelatie este prezentat pentru datele statistice
ce reprezinta   de copii de  ani cercetati din punct de vedere al naltimii 
(n centimetri) si al greutatii (n kilograme). Datele au fost trecute n tabelul de
corelatie care urmeaza

3.2. Culegerea, prezentarea si prelucrarea datelor statistice


126
127
128
129
130
131
132
133
134
135
136
137



24

25

26

27

1
3
4
1

3
4
5
2
1
1

1
1
7
6
7
6
2

16

30

28

29

1
9
36
27
10
1

1
2
6
17
56
16
7
1

84

106

30

1
4
6
39
26
10
2
1

89

31

1
2
18
7
11
4
2

45

32

1
4
2
6
7
3
1
24

125

33

1
1
2
3
1
2
1
11

34

1
1
1
2
2
7

35



1
1
2

6
9
21
29
70
152
64
38
18
8
6
4
425

3.2.3 Functiile tabulate si crosstab


Obtinerea de tabele sistematizate, n Matlab, este posibila cu ajutorul acestor doua
functii din Statistics toolbox.
Functia tabulate
Apelul functiei tabulate se poate face prin:
tabulate(x)
t=tabulate(x)

unde x este un vector cu valori pozitive. Prin executarea unei astfel de instructiune,
se obtine pe ecran respectiv n t un tabel statistic sistematizat avand trei coloane.
Prima coloana contine valorile distincte ale lui x, a doua contine frecventele absolute
ale acestor valori distincte, iar ultima reprezinta frecventele relative n procente.
Programul 3.2.21. Vom scrie un program Matlab, care genereaa N numere aleatoare
, dup

ce urmeaza legea uniforma
a care construies te tabelul sistematizat, considerand numarul claselor n dat prin regula lui Sturges, iar clasele fiind identificate
prin mijloacele lor.
clear
a=input(a:); b=input(b (a<b):);
N=input(N=); n=fix(1+10/3*log10(N));
xx=unifrnd(a,b,1,N); c=a:(b-a)/n:b;
for i=1:N
for j=1:n
if c(j)<=xx(i) & xx(i)<c(j+1)
x(i)=j;
end
end
end

126

Statistica descriptiva
t=tabulate(x);
for j=1:n
t(j,1) =(c(j)+c(j+1))/2;
end
fprintf( Clasa
f
frel\n)
fprintf( ______________________\n)
fprintf(%7.3f %5d %8.2f%%\n,t)

Executarea programului, cu datele de intrare a=0, b=5 si N=200, produce tabel


sistematizat:
Clasa
f
frel
______________________
0.313
22
11.00%
0.938
27
13.50%
1.563
27
13.50%
2.188
32
16.00%
2.813
27
13.50%
3.438
23
11.50%
4.063
25
12.50%
4.688
17
8.50%

Functia crosstab
Apelul functiei crosstab se poate face prin:
crosstab(x,y,z,...)
t=crosstab(x,y,z,...)

unde x, y, z, ... sunt vectori cu valori nntregi pozitive avand aceleasi lungimi. Prin
executarea unei astfel de instructiune, se obtine pe ecran respectiv n t un tabel statistic sistematizat t, cu atatea intrari cati parametri (vectori) exista. Daca sunt doi
parametri, x si y, se obtine tabelul de contingenta .
Programul 3.2.22. Programul Matlab care urmeaza, genereaza N vectori aleatori ce
urmeaza legea normala bidimensionala, dupa care construies te tabelul de corelatie cu
m clase n raport cu prima variabila, respectiv n clase n raport cu a doua variabila.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
N=input(N=); m=input(m=); n=input(n=);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
X=mvnrnd(mu,v,N); xx=X(:,1); yy=X(:,2);
xmin=min(xx); xmax=max(xx);
ymin=min(yy); ymax=max(yy);
cx =xmin:(xmax-xmin)/m:xmax;
cy =ymin:(ymax-ymin)/n:ymax;

3.2. Culegerea, prezentarea si prelucrarea datelor statistice


for k=1:N
for i=1:m-1
if (cx(i)<=xx(k))
x(k)=i;
end
end
if (cx(m)<=xx(k)) &
x(k)=m;
end
for j=1:n-1
if (cy(j)<=yy(k))
y(k)=j;
end
end
if (cy(n)<=yy(k)) &
y(k)=n;
end
end
t=crosstab(x,y);
disp(t)

127

& (xx(k)<cx(i+1))

(xx(k)<=cx(m+1))

& (yy(k)<cy(j+1))

(yy(k)<=cy(n+1))


2 1 
m=6 si n=4, se obtine tabelul de
1 3

Pentru N=100, mu=(5,10), v


corelatie:
1
2
5
2
1
1

2
7
14
17
12
1

0
0
6
8
12
1

0
0
1
1
3
3

3.2.4 Functiile caseread, casewrite, tblread si tblwrite


Pentru completarea tabelului de contingenta construit prin functia crosstab, se
poate face apel la aceste functii.
Functia casewrite
Apelul functiei casewrite are sintaxa
casewrite(obs,file)

si are ca efect scrierea datelor din matricea obs de tip caracter n fisierul cu numele
file.
Functia caseread
Apelul functiei caseread are sintaxa
obs=caseread(file)

si are ca efect citirea datelor din fisierul cu numele file n matricea obs de tip
caracter.

128

Statistica descriptiva

Functia tblwrite
Sintaxa functiei tblwrite este:
tblwrite(t,va,obs,file)

si are ca efect scrierea n fisierul cu numele file a matricelor va, obs de tip
caracter si a datelor din matricea numerica t.
Matricele va si obs trebuie sa aiba atatea linii cate coloane, respectiv cate linii are matricea t. Liniile celor doua matrice de tip caracter vor reprezenta etichete
pentru coloanele, respectiv liniile matricei t, si drept urmare vor fi asezate n dreptul
coloanelor si liniilor corespunzatoare.
Functia tblread
Sintaxa functiei tblread este:
[t,va,obs]=tblread(file)

si are ca efect citirea din fisierul cu numele file a matricelor va, obs de tip caracter
si a datelor din matricea numerica t.
Programul 3.2.23. Programul care urmeaza completeaza Programul 3.2.22, pentru
obtinerea n tabelul de contingenta si a mijloacelor claselor pentru cele doua variabile.
. . . . . . . . . . . . . .
t=crosstab(x,y);
fy=fopen(ly.txt,w+);
for j=1:n
laby(j)=(cy(j)+cy(j+1))/2;
ly=num2str(laby(j));
fprintf(fy,%s\n,ly);
end
fx=fopen(lx.txt,w+);
for i=1:m
labx(i)=(cx(i)+cx(i+1))/2;
lx=num2str(labx(i));
fprintf(fx,%s\n,lx);
end
va=caseread(ly.txt); obs=caseread(lx.txt);
tblwrite(t,va,obs,clase.txt);
type clase.txt, fclose(all);

In urma executarii programului cu aceleasi date de intrare folosite n Programul 3.2.22, prin instructiune type este afisat pe ecran tabelul de contingenta :
2.5895
3.8424
5.0952
6.348
7.6008
8.8537

7.5244
4
4
1
2
1
0

9.7152
6
16
13
12
1
0

11.906
2
7
12
9
4
1

14.0967
0
0
0
1
3
1

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

129

Se observa ca datele din tabelul obtinut nu sunt aceleasi cu cele obtinute prin executarea Programului 3.2.22, desi se dau aceleasi date de intrare. Lucru de asteptat,
avand n vedere ca se genereaza un alt set de numere aleatoare.
Se observa de asemenea, n noul program, ca apar instructiunile fopen,
fclose, caseread, tblwrite.
Instructiunea fopen este folosita pentru deschiderea fisierelor lx.txt si
ly.txt, care vor contine etichetele claselor celor doua variabile. Acestea sunt
date de mijloacele claselor si sunt transformate n siruri de caractere prin comanda
num2str. Parametrul w+, are ca efect crearea unui fisier nou sau actualizarea
unuia deja existent, dupa ce a fost anulat continutul sau, n vederea scrierii sau citirii
n respectivul fisier. Evident instructiunea fclose este folosita n vederea nchiderii
fisierelor.
Prin instructiunile caseread sunt citite etichetele claselor din fisierele lx.txt
si ly.txt, care apoi sunt folosite pentru scrierea acestora n fisierul clase.txt,
cu ajutorul comenzii tblwrite, mpreuna cu elementele tabelului de contingenta .

3.2.5 Reprezentari grafice


Definitia 3.2.24. Numim diagrama prin batoane (bare) a unei distributii statistice 
de tip discret, reprezentarea
a ntr-un sistem
axe rectangulare a segmentelor
 grafic
 de


  


(batoanelor) date prin   
 ,  fiind un factor de
 ,
proportionalitate, iar  este frecventa absoluta a valorii  .
Definitia 3.2.25. Numim diagrama cumulativa (ascendenta) a unei distributii statistice  de tip discret, linia poligonala care uneste punctele de coordonate
    ,      ,     ,    ,      ,    , unde  este


este un factor de
frecventa cumulata (ascendenta) atasata valorii  , iar
proportionalitate.
Definitia 3.2.26. Numim histograma unei distributii statistice  de tip continuu,
diagrama obtinuta prin construirea de dreptunghiuri avand drept baze clasele
distributiei statistice si naltimile astfel considerate ncat ariile dreptunghiurilor sa
fie proportionale cu frecventele claselor.
Observatia 3.2.27. Cand clasele distributiei statistice sunt de amplitudini egale,
atunci naltimile dreptunghiurilor histogramei sunt proportionale cu frecventele

claselor. Daca factorul de proportionalitate este  , atunci se obtine histograma
frecventelor relative.
Se stie ca aria delimitata de curba ce reprezinta graficul unei densitati de probabilitate si axa absciselor este 1. Din acest motiv, este de preferat ca factorul de
proportionalitate n construirea histogramei frecventelor relative sa fie astfel ales nct

130

Statistica descriptiva

aria totala a dreptunghiurilor histogramei sa fie de asemenea 1. Severifica 


usor ca




,
daca
este volumul datelor, iar clasa     are amplitudinea




pentru
 , atunci functia n scara ce delimiteaza aceste dreptunghiuri este data
prin:






  

 



Exemplul 3.2.28. Daca se considera datele statistice din Exemplul 3.2.10, si avand
n vedere sistematizarea acestora, atunci histograma frecventelor absolute este prezentata n Figura 3.1.
16

14

12

10

0
0.4

0.7

1.3

1.6

1.9

2.2

2.5

2.8

3.1

3.4

3.7

4.3

Figura 3.1: Histograma frecventelor absolute

Metoda ferestrei mobile


Histograma frecventelor relative a distributiei statistice reprezinta o aproximare destul de rudimentara a graficului densitatii de probabilitate a caracteristicii  . O ameliorare a acestei aproximari se obtine daca se aplica metodaferestrei
  

    mobile.
Metoda ferestrei mobile consta n construirea clasei

 ,  , pen
tru fiecare    , si determinarea frecventei  a acestei clase, cu ajutorul careia
  
 

se obtine curba data prin     

   
Daca se considera functia indicatoare a intervalului
  , adica

(3.2.1)





 

   
  ,

 
   ,
 

daca  
daca

3.2. Culegerea, prezentarea si prelucrarea datelor statistice


atunci



 


  



131

Pentru a obtine o forma mai regulara pentru  se pot considera si alte tipuri de
functie nucleu , care de regula este o densitate de probabilitate simetrica.
Mai des se utilizeaza nucleul Gaussian

(3.2.2)





sau nucleul parabolic (Epanechnikov)




(3.2.3)





 

 

e

 



  



daca  
,
daca   

.

Alte nuclee ce sar putea folosi sunt:

(3.2.4)



(3.2.5)



(3.2.6)





     daca    ,




 
daca    

    daca     ,
 
daca    ,

   daca    ,
 
daca    .

Programul 3.2.29. Programul ce urmeaza genereaza N numere aleatoare ce urmeaza


 
legea normala
 , dupa care, folosind acelasi pas h pozitiv, reprezinta grafic
functia  mpreuna cu densitatea de probabilitate a legii normale, pentru fiecare din
cele sase nuclee, mai sus definite.
Calculul valorilor celor sase nuclee se face cu urmatoarea functie Matlab:
function y = K(k,x)
switch k
case 1
y=(abs(x)<1/2);
case 2
y=1/(sqrt(2*pi))*exp(-x.2/2);
case 3
y=(abs(x)<sqrt(5));

132

Statistica descriptiva
y=3/(4*sqrt(5))*(1-x.2/5).*y;
case 4
y=(abs(x)<1);
y=15/16*(1-x.2).2.*y;
case 5
y=((x>0)&(x<1));
y=(1+cos(2*pi*x)).*y;
case 6
y=(abs(x)<1); y=abs(x).*y;
otherwise
error(Eroare)
end

iar programul Matlab este


clf,clear
N=input(N=); h=input(h=);
X=randn(1,N); x=-3:0.01:3;
n=length(x); p=pdf(norm,x,0,1);
for ka=1:6
s=zeros(1,n);
for i=1:N
s=s+K(ka,(x-X(i))/h);
end
f=s/(N*h);
subplot(3,2,ka), plot(x,f,-,x,p,--)
end

In urma executarii programului, cu valorile N=500 si h=1, se obtin graficele din


Figura 3.2.
Definitia 3.2.30. Numim poligonul frecventelor al unei distributii statistice  de tip



continuu, poligonul obtinut prin unirea punctelor de coordonate 
 ,
 ,
unde este factor de proportionalitate, iar  este frecventa clasei  .
Exemplul 3.2.31. Daca se considera datele statistice din Exemplul 3.2.10, si avand n
vedere sistematizarea acestora, atunci poligonul frecventelor absolute este prezentata
n Figura 3.3.
Definitia 3.2.32. Numim diagrame integrale (cumulative) ale frecventelor cumulate
ascendente, respectiv descendente, relative la distributia statistica  de tip continuu,


liniile poligonale obt
inute prin unirea punctelor de coordonate   ,
,
 



si respectiv   
.
Exemplul 3.2.33. Daca se considera datele statistice din Exemplul 3.2.10, si avand n
vedere sistematizarea acestora, atunci diagramele integrale ale frecventelor cumulate
(ascendente si descendente) sunt prezentate n Figura 3.4.

3.2. Culegerea, prezentarea si prelucrarea datelor statistice


0.4

0.4

0.3

0.3

0.2

0.2

0.1

0.1

0
4

0
4

0.4

0.4

0.3

0.3

0.2

0.2

0.1

0.1

0
4

0
4

0.4

0.4

0.3

0.3

0.2

0.2

0.1

0.1

0
4

0
4

Figura 3.2: Grafice pentru

133



Pentru trasarea diagramelor integrale, n tabelul urmator calculam frecventele absolute ascendente si respectiv descendente, conform formulelor








  
   




 


   





            

















 




Definitia 3.2.34. Numim nor statistic atasat caracteristicilor   si , punctele din




plan obtinute prin reprezentarea grafica a datelor primare   ,
 .
Observatia 3.2.35. Norul statistic este utilizat pentru observarea formei legaturii
functionale care exista ntre cele doua caracteristici. Amintim cateva legaturi mai
des ntalnite:



 

  




 

 

134

Statistica descriptiva
16

14

12

10

0
0.55

0.85

1.15

1.45

1.75

2.05

2.35

2.65

2.95

3.25

3.55

3.85

4.15

Figura 3.3: Poligonul frecventelor absolute








 





 



  




 

 




Daca legatura liniara
este usor de observat din norul statistic, pen
 , prin logaritmare se
tru celelalte se ncearca liniarizarea. De exemplu, daca


,   ,    si se


. Se noteaza 

ajunge la 




obtine legatura liniara
 , pentru  si  . Pentru
se va repre aceasta







zenta grafic norul statistic dat de punctele
,
 . Daca punctele
din acest nor statistic sunt situate n jurul unei drepte, atunci se poate considera ca



legatura dintre  si este de forma
.

3.2.6 Functii Matlab pentru reprezentarea grafica a datelor statistice


Sistemul Matlab, atat prin sistemul de baza, cat si prin Statistics toolbox, dispune de
functii pentru reprezentarea grafica a datelor statistice.
Cazul discret
Daca n cercetare se considera o caracteristica (variabila)  de tip discret, functiile
Matlab, deja prezentate, bar si stairs se pot utiliza cu succes.

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

135

70

60

50

40

30

20

10

0
0.4

0.7

1.3

1.6

1.9

2.2

2.5

2.8

3.1

3.4

3.7

4.3

Figura 3.4: Diagramele integrale ale frecventelor absolute


Pentru exemplificarea modului de utilizare a acestor functii Matlab, vom scrie
doua functii Matlab pentru construirea diagramei prin batoane si respectiv pentru
construirea diagramei cumulative ascendente.
Functia 3.2.36. Functia Matlab pe care o scriem, va genera N numere aleatoare ce
urmeaza o lege de probabilitate de tip discret, va construi diagrama prin batoane pentru datele astfel obtinute, iar pe aceeasi figura va reprezenta, pentru comparatie, tot
prin batoane, functia de probabilitate a legii de probabilitate considerate. Pentru o
vizualizare corecta a comparatiei, se impune, fie amplificarea functiei de probabilitate cu factorul N, fie mpartirea frecventelor distributiei statistice cu N, adica prin
considerarea frecventelor relative. In cele ce urmeaza vom considera prima varianta.
function diag1(N,lege)
% Functia diag1 produce diagrama prin batoane
% N - reprezinta volumul datelor ce urmeaza a fi generate
% lege - reprezinta denumirea Matlab a legii de probabilitate
clf, colormap spring
switch lege
case unid
n = input(n (parametrul legii uniforme discrete):);
x = random(lege,n,1,N);
t = tabulate(x);
P =N*pdf(lege,t(:,1),n);
bar(t(:,1),[t(:,2),P])
legend(Frecvente observate, Frecvente teoretice,1)
return
case bino
n = input(n=); p = input(p=);
x = random(lege,n,p,1,N);

136

Statistica descriptiva
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,n,p);
case hyge
M = input(M=); K = input(K=);
n = input(n=);
x = random(lege,M,K,n,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,M,K,n);
case poiss
lambda = input(lambda=);
x = random(lege,lambda,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,lambda);
case nbin
r = input(r=); p = input(p=);
x = random(lege,r,p,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,r,p);
case geo
p = input(p=);
x = random(lege,p,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,p);
otherwise
error(Lege discreta necunoscuta)
end
bar(t(:,1),[t(:,2),P])
legend(Frecvente observate, Frecvente teoretice,1)

Apelul functiei diag1 se face prin


>>diag1(N,lege)

unde valorile pentru N si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>diag1(50,poiss)

are ca efect apelul functiei pentru legea lui Poisson, iar pe ecran se va cere introducerea parametrului lambda, dupa care pe ecran va fi reprezentat graficul din Figura 3.5,
n cazul n care lambda=7. Sa remarcam totusi ca la un nou apel, cu aceeasi parametri, graficul difera, deoarece sunt generate alte numere aleatoare.
Functia 3.2.37. Urmatoarea functie Matlab, va genera N numere aleatoare ce urmeaza o lege de probabilitate de tip discret, va construi diagrama cumulativa ascendenta pentru datele astfel obtinute, iar pe aceeasi figura va reprezenta, pentru
comparatie, functia de repartitie a legii de probabilitate considerate. Pentru o vizualizare corecta a comparatiei, se impune, fie amplificarea functiei de repartitie cu factorul N, fie mpartirea frecventelor cumulate ale distributiei statistice cu N, adica prin
considerarea frecventelor relative cumulate. In cele ce urmeaza vom considera a doua
varianta.

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

137

9
Frecvente observate
Frecvente teoretice
8

10

Figura 3.5: Legea

12

14

16



function diag2(N,lege)
% Functia diag2 produce diagrama cumulativa
% N - reprezinta volumul datelor generate
% lege - reprezinta denumirea legii de probabilitate
clf
switch lege
case unid
n=input(n (parametrul legii uniforme discrete):);
x=random(lege,n,1,N);
t=tabulate(x);
xx=[t(1,1)-1;t(:,1);t(end,1)+1];
cf=[0;cumsum(t(:,2));N]/N;
P=cdf(lege,xx,n);
stairs(xx,cf,k-),hold on,
stairs(xx,P,k-.),return
case bino
n=input(n=); p=input(p=);
x=random(lege,n,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,n,p);1];
case hyge
M=input(M=); K=input(K=);
n=input(n=);
x=random(lege,M,K,n,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];

18

138

Statistica descriptiva
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,M,K,n);1];
case poiss
lambda=input(lambda=);
x=random(lege,lambda,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,lambda);1];
case nbin
r=input(r=); p=input(p=);
x=random(lege,r,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,r,p);1];
case geo
p=input(p=);
x=random(lege,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,p);1];
otherwise
error(Lege discreta necunoscuta)
end
stairs(xx,cf,k-),hold on,
stairs(xx,P,k-.)

Apelul functiei diag2 se face analog apelului functiei diag1 prezentata n


Functia 3.2.36:
>>diag2(N,lege)

De exemplu, comanda
>>diag2(50,bino)

are ca efect apelul functiei pentru legea binomiala, iar pe ecran se vor cere introducerea parametrilor n si p, dupa care pe ecran va fi reprezentat graficul din Figura 3.6,
n cazul n care n=7 si p=0.4. Diagrama cumulativa este reprezentata prin line continua, iar functia de repartitie teoretica prin linie-punct. Si aici remarcam ca la un
nou apel, cu aceeasi parametri, graficul difera, deoarece sunt generate alte numere
aleatoare.
Cazul continuu
Reprezentari grafice pentru distributia statistica a unei caracteristici (variabile) de tip
continuu se obtin, fie prin utilizarea functiei plot si bar, fie prin functiile hist,

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

139

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0
1

Figura 3.6: Legea  





histc. Remarcam faptul ca hist si histc sunt functii specifice sistemului de


baza Matlab.
Functia hist
Modurile de apel ale functiei hist sunt:
hist(y)
hist(y,nb)
hist(y,x)
n=hist(y)
n=hist(y,nb)
n=hist(y,x)
[n,x]=hist(y)
[n,x]=hist(y,nb)

Primele trei forme au ca efect reprezentarea grafica a histogramei corespunzatoare


datelor continute de vectorul y. Parametrul nb reprezinta numarul claselor de amplitudini egale, iar daca acesta lipseste, se considera nb=10. Amplitudinea acestor clase
este obtinuta prin mpartirea lungimii intervalului definit prin valoarea minima si valoarea maxima ale componentelor vectorului y la nb. Cand se utilizeaza parametrul
x, acesta trebuie sa contina mijloacele claselor.
Celelalte forme nu produc reprezentari grafice pentru histograme, ci doar calculeaza frecventele absolute si respectiv mijloacele claselor n vectorii n si x, care au
lungimea data prin nb.

140

Statistica descriptiva

Toate formele accepta parametrul y ca fiind matrice, caz n care operatia se executa pentru fiecare coloana a matricei.
Functia histc
Apelul functiei histc se poate face prin:
n=histc(y,a)
[n,nb]=hist(y,a)

care au ca efect, pentru datele vectorului y, obtinerea n n a frecventelor claselor


precizate prin componentele vectorului a, care se impune a fi ordonate crescator.
Valorile lui y care sunt nafara componentelor lui a nu sunt luate n considerare.
De aceea e de dorit ca sa fie folosite valorile -inf si inf pentru a fi incluse toate
valorile lui y.
Daca y este o matrice, atunci functia opereaza pentru fiecare coloana n parte.
Parametrul nb va contine numerele de ordine ale claselor n care au intrat fiecare
din elementele lui y. Pentru elementele care nu au fost clasificate se obtine valoarea 0.
Sa remarcam ca Figura 3.1, Figura 3.3 si Figura 3.4 au fost realizate, respectiv cu
programele Matlab:
clear, clf, load x.dat -ascii2
N=length(x);
a=0.7:0.3:4; n=length(a)-1;
for j=1:n
mij(j)=(a(j)+a(j+1))/2;
end
fr=histc(x,a); fr=fr(1:end-1);
bar(mij,fr,1)
axis([0.4 4.3 0 16])
set(gca,xtick,[0.4:0.3:4.3]), colormap spring
clear, clf, load x.dat -ascii
N=length(x);
a=0.7:0.3:4; n=length(a)-1;
for j=1:n
mij(j)=(a(j)+a(j+1))/2;
end
fr=histc(x,a); fr=fr(1:end-1);
plot(mij,fr,k-o)
axis([0.55 4.15 0 16])
set(gca,xtick,[0.55:0.3:4.15]), grid on
clear, clf, load x.dat -ascii
N=length(x);
a=0.7:0.3:4; n=length(a)-1;
fr=histc(x,a); fr=fr(1:end-1);
FA=[0;cumsum(fr)], FD=N-FA,

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

141

plot(a,FA,k-o,a,FD,k-o)
axis([0.4 4.3 0 70])
set(gca,xtick,[0.4:0.3:4.3]), grid on

care utilizeaza functiile histc si bar.


Functia 3.2.38. Urmatoarea functie Matlab, va genera N numere aleatoare ce urmeaza o lege de probabilitate de tip continuu si va construi histograma pentru datele
astfel obtinute. Intro figura alaturata se va construi histograma folosind functia bar,
mpreuna cu densitatea de probabilitate a legii de probabilitate considerate. Pentru o
vizualizare corecta a comparatiei, se impune, mpartirea frecventelor absolute cu Nh,
unde h este amplitudinea claselor.
function hist0(N,lege)
% Functia hist0 produce histograma
% N - reprezinta volumul datelor generate
% lege - reprezinta denumirea legii de probabilitate
clf, colormap spring
n=fix(1+10/3*log10(N));
switch lege
case unif
a=input(a:); b=input(b(a<b):);
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case norm
mu=input(mu=); s=input(sigma=);
x=random(lege,mu,s,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,mu,s);
case logn
mu=input(mu=); s=input(sigma=);
x=random(lege,mu,s,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,mu,s);
case gam
a=input(a=); b=input(b=);
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case exp
mu=input(mu=);
x=random(lege,mu,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,mu);

142

Statistica descriptiva
case beta
a=input(a=); b=input(b=);
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case weib
a=input(a=); b=input(b=)
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case rayl
b=input(b=);
x=random(lege,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a);
otherwise
error(Lege continua necunoscuta)
end
subplot(1,2,1), hist(x,n)
subplot(1,2,2), bar(c,f/(N*h),1)
hold on, plot(t,y,k-)

Apelul functiei hist0 se face prin


>>hist0(N,lege)

De exemplu, comanda
>>hist0(500,norm)

are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introducerea parametrilor mu si sigma, dupa care pe ecran va fi reprezentat graficul din
Figura 3.7, n cazul n care mu=0 si sigma=1.
Functia scatter
Sistemul Matlab este prevazut cu functia scatter pentru reprezentarea norului statistic n cazul bidimensional. Apelul functiei se face prin:
scatter(x,y)
scatter(x,y,s)
scatter(x,y,s,c)
scatter(x,y,s,c,m)
scatter(x,y,s,c,m,filled)

Efectul executarii unei astfel de instructinui este producerea norului statistic precizat
prin vectorii x si y, care au aceeasi lungime.
Parametrul optional s specifica marimea marcajelor (cerculete) punctelor norului. Acesta poate sa fie un scalar, n care caz toate marcajele vor avea aceleasi marimi

3.2. Culegerea, prezentarea si prelucrarea datelor statistice


140

143

0.45

0.4
120
0.35
100
0.3
80

0.25

0.2

60

0.15
40
0.1
20
0.05

0
4

Figura 3.7: Legea

0
4





sau poate sa fie un vector de aceeasi lungime cu x si y, caz n care se pot specifica
marimi diferite pentru puncte diferite.
Parametrul c specifica culoarea marcajelor si poate lua una din cele opt culori
folosite si la functia plot. Daca c este vector, atunci trebuie sa aiba aceeasi lungime
cu ceilalti parametri de tip vector, caz n care se pot specifica culorile fiecarui marcaj
n parte.
Parametrul m permite nlocuirea marcajului implicit (cerculet), prin marcajul precizat prin m.
Prezenta optiunii filled atrage dupa sine umbrirea interiorului marcajului.
Remarcam faptul ca se poate folosi cu succes functia plot, daca se foloseste un
singur tip de marcaj.

Functia scatter3
Sistemul Matlab este prevazut cu functia scatter3 pentru reprezentarea norului
statistic n cazul tridimensional. Apelul functiei se face cu aceleasi instructiuni ca si
n cazul functiei scatter, doar ca se mai insereaza nca un parametru z, a treia
dimensiune, dupa primii doi parametri x si y.

144

Statistica descriptiva

Functia gscatter
Statistics toolbox dispune de functia gscatter pentru reprezentarea norului statistic n cazul bidimensional pe grupe de puncte. Apelul functiei se face prin:
gscatter(x,y,g)
gscatter(x,y,s)
gscatter(x,y,c,m,s)
gscatter(x,y,c,m,s,leg)
gscatter(x,y,c,m,s,leg,xl,yl)

Efectul executarii unei astfel de instructinui este producerea norului statistic precizat
prin vectorii x si y, care au aceeasi lungime, folosind gruparea specificata prin vectorul g de aceeasi lungime. Punctele norului vor fi marcate la fel pentru valori identice
corespunzatoare ale lui g.
Parametrul c specifica culorile marcajelor si are valoarea implicita data
prinbgrcmyk.
Parametrul optional m este un tablou de tip caractere recunoscute de functia
plot, valoarea implicita fiind caracterul . (punct).
Parmetrul s specifica marimea marcajelor punctelor norului. Acesta poate sa fie
un scalar, n care caz toate marcajele vor avea aceleasi marimi sau poate sa fie un
vector.
Daca nu sunt specificate valori suficiente pentru toate grupele, sistemul Matlab
efectueaza o ciclare a valorilor specificate.
Parametrul leg precizeaza daca se doreste afisarea unei legende (implicit acesta
este on), sau nu se doreste legenda, cand se va specifica valoarea off.
Parametrii xl si yl precizeaza etichetele pentru cele doua axe de coordoante. Daca acesti parametri lipsesc, sistemul Matlab eticheteaza axele de coordoante cu denumirile variabilelor x si respectiv y.
Programul 3.2.39. Programul ce urmeaza genereaza n vectori aleatori ce urmeaza
legea normala bidimensionala si n numere aleatoare ce urmeaza legea uniforma discreta. Folosind aceste date, se va reprezenta norul vectorilor aleatori bidimensionali,
efectuand gruparea conform numerelor aleatoare uniforme generate.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N(parametrul legii uniforme):);
n=input(n=); X=mvnrnd(mu,v,n);
x=X(:,1); y=X(:,2); g=unidrnd(N,n,1);
gscatter(x,y,g,k,o*.+)

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

145

2 -1
si N=4, se obtine Figura 3.8.
-1 3 

Pentru n=25, mu=(5,10), v


14

1
2
3
4

13

12

11

10

6
x

Figura 3.8: Nor statistic pe grupe

Functia plotmatrix
Sistemul de baza Matlab contine functia plotmatrix, care reprezinta pe aceeasi
figura mai multi nori statistici. Formele de apel ale functiei sunt
plotmatrix(x)
plotmatrix(x,y)
plotmatrix(x,y,s)

unde x si y sunt matrice cu aceleasi numar de linii, dar numarul coloanelor poate fi
diferit, fie acesta m si respectiv n. Executarea unei instructini de acest tip, produce
m n nori statistici, pentru fiecare coloana a matricei x cu fiecare coloana a matricei
y, cu marcajele specificate prin parametrul optional s, care are sintaxa de la functia
plot.
Prima forma este echivalenta cu
plotmatrix(x,x)

cu exceptia ca pe diagonala principala a matricei norilor statistici vor fi reprezentate


histogramele coloanelor matricei x.
Programul 3.2.40. Programul urmator va genera o matrice x de tipul (N,3), care
contine vectori aleatori ce urmeaza legea normala tridimensionala, dupa care se va
aplica functia plotmatrix.

146

Statistica descriptiva
clear, mu(1)=input(m1=);
mu(2)=input(m2=); mu(3)=input(m3=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(3,3)=input(sigma32=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
v(1,3)=input(Cov(X,Z)=); v(3,1) =v(1,3);
v(2,3)=input(Cov(Y,Z)=); v(3,2) =v(1,3);
N=input(N=); X=mvnrnd(mu,v,N);
plotmatrix(X,o)

Pentru N=10, mu=(5,10,15) si v

2 -1 1
-1 3 0
1
0 1


  se obtine Figura 3.9.

10
8
6
4
15

10

5
18
16
14
12
0

10

10

15

10

15

20

Figura 3.9: Functia plotmatrix

Functia gplotmatrix
Statistics toolbox contine functia gplotmatrix, care are n principal acelasi efect
ca si functia plotmatrix, avand nsa posibilitatea afisa rii punctelor norului statisitic n functie de grupele la care apartin.
Formele de apel sunt cele de la functia gscatter, doar ca x si y, n acest caz,
sunt matrice cu acelasi numar de linii, iar numarul coloanelor putand fi diferite.

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

147

3.2.7 Functia randtool


Avand la dispozitie functiile random si hist, putem sa prezentam functia demonstrativa randtool. Lansarea acestei functii se face prin:
>>randtool

n urma careia se produce o fereastra grafica interactiva (demonstrativa) privind generarea numerelor aleatoare si ilustrarea acestora cu ajutorul histogramelor.
Fixarea (stabilirea) legii de probabilitate n scop demonstrativ se face prin alegerea din meniul legilor de probabilitate situat n partea stanga sus a ferestrei.
Volumul numerelor aleatoare, ce urmeaza a fi generate, se precizeaza prin introducerea acestuia n fereastra din partea dreapta sus.
Pentru stabilirea valorilor parametrilor legii de probabilitate considerate se poate
proceda n doua moduri. Fie prin introducerea n ferestrele corespunzatoare ale valorilor dorite, fie prin deplasarea barelor atasate acestora. In plus, limite pentru parametrii legii de probabilitate considerate pot fi precizate prin introducerea acestora n
ferestrele considerate.
Activarea butonului output are ca efect salvarea numerelor aleatoare curente n
varaibila ans sau n variabila precizata de utilizator, iar butonul resample permite
repetarea generarii de numere aleatoare cu acelasi volum si aceeasi parametri.

3.2.8 Functiile pie si pie3


Reprezentari ale datelor prin sectoare circulare n plan, respectiv n spatiu, se obtin
prin functiile pie si pie3, care se apeleaza prin formele:
pie(x,ex,label)
pie3(x,ex,label)

unde x este un vector avand componentele pozitive si normalizate, adica astfel ncat
suma acestora sa fie 1. Daca suma acestora va fi mai mica decat 1, atunci numai o
parte a cercului va fi reprezentata grafic.
Parametrul ex este optional si specifica sectoarele de cerc ce urmeaza sa fie
detasate pe figura, acesta, daca este prezent, trebuie sa fie un vector numeric de
aceeasi lungime cu vectorul x.
Parametrul optional label, specifica etichetele sectoarele de cerc, acesta, daca
este prezent, trebuie sa fie un vector de aceeasi lungime cu vectorul x, dar care contin
numai siruri de caractere.
Programul 3.2.41. Programul
  ce urmeaza genereaza n numere aleatoare ce urmeaza
legea uniforma discreta
, construies te tabelul sistematizat, dupa care reprezinta
datele sistematizate folosind functiile pie si pie3.
n=input(n=); N=input(N=);
x=unidrnd(N,1,n);
t=tabulate(x); d=length(t(:,3));

148

Statistica descriptiva
ex=zeros(1,d); ex(1)=1;
subplot(2,1,1), pie(t(:,3)/100,ex)
subplot(2,1,2), pie3(t(:,3)/100,ex)
colormap summer

Prin executia acestui program, cu datele n=50 si N=4, se obtin reprezentarile grafice
din Figura 3.10.
28%

32%

28%

32%

22%
18%

22%

18%

Figura 3.10: Diagrame circulare

3.3 Parametrii distributiilor statistice




Se considera datele statistice primare
care se obtine distributia statistica

, relative la caracteristica

 , din



3.3.1 Parametri statistici ce masoara tendinta


Definitia 3.3.1. Media (aritmetica) a distributiei statistice a caracteristicii
data prin





       


 

 

 este

 

Definitia 3.3.2. Media geometrica a distributiei statistice a caracteristicii pozitive 


este data prin





 




 




 



 

3.3. Parametrii distributiilor statistice

149

Observatia 3.3.3. In aplicatii se lucreaza mai usor cu


      
 
 

log 

 

 

 

 

Definitia 3.3.4. Media armonica a distributiei statistice a caracteristicii nenule


este data prin






 

 

Observatia 3.3.5. Intre cele trei medii definite mai nainte exista relatiile cunoscute
    
.

3.3.2 Functiile mean, geomean si harmean


Sistemul de baza Matlab contine functia mean, iar Statistics toolbox dispune de celelalte doua functii, geomean si harmmean.
Apelul acestor functii se face prin:
ma=mean(x)
mg=geomean(x)
mh=harmmean(x)

si au ca efect calculul mediilor corespunzatoare, pentru componentele vectorului x,


iar daca x este matrice, atunci operatia se executa pentru fiecare coloana a matricei.
Prin urmare, n acest ultim caz, rezultatul este un vector avand atatea componente
cate coloane are matricea x.

3.3.3 Functia trimmean


Sistemul Matlab, prin Statistics toolbox, dispune de functia trimmean, care se poate
apela prin
m=trimmean(x,p)

avand ca efect calculul mediei aritmetice a vectorului x, dupa ce au fost eliminate


cele mai mici p componente si cele mai mari p componente, iar daca x este
matrice, aceasta operatie se face pentru fiecare coloana n parte.
Definitia 3.3.6. Numim mediana distributiei statistice a caracteristicii  , valoarea
numerica care mparte datele statistice, ordonate crescator, n doua parti egale.
Observatia 3.3.7. Fie datele statistice primare ordonate n mod nedescrescator

        

 

150

Statistica descriptiva

atunci mediana va fi data prin

 
 

    





daca

 

daca


.

,

Observatia 3.3.8. Cand datele statistice sunt grupate, atunci se determina prima data

intervalul median     astfelncat pentru
 frecventele cumulate   si  sa fie



satisfacute inegalitatile 
 si    . Folosind apoi interpolarea liniara se

ia ca mediana





unde  este amplitudinea intervalului median.






Cand caracteristica cercetata este de tip discret, mediana este

 .

3.3.4 Functia median


Sistemul de baza Matlab dispune de functia median. Apelarea acesteia se face prin
m=median(x)

si are ca efect calculul medianei pentru componentele vectorului x, iar daca x este
matrice, atunci operatia se executa pentru fiecare coloana a matricei. Prin urmare, n
acest ultim caz, rezultatul este un vector avand atatea componente cate coloane are
matricea x.

3.3.5 Parametri statistici ce masoara dispersarea


Definitia 3.3.9. Numim cuartile ale distributiei statistice a caracteristicii  , valorile
numerice  (cuartila inferioara), 
,  (cuartila superioara), care mpart
datele statistice, ordonate crescator, n patru parti egale.
Observatia 3.3.10. Cand datele statistice sunt grupate, ca si n cazul medianei, folosind interpolarea liniara consideram




  


  

 
  






dupa ce s-a
ncat sa aiba loc
 determinat
 intervalul cuartilic inferior    , astfel


  si   ,respectiv intervalul cuartilic superior    , astfel ncat
    si   

3.3. Parametrii distributiilor statistice

151


Cand caracteristica cercetata este de tip discret, avem ca

 si

 .

Observatia 3.3.11. In mod analog se definesc parametri numerici cum ar fi decilele


si centilele.

3.3.6 Functia prctile


Statistics toolbox contine functia prctile, care se poate apela prin
c=prctile(x,p)

si care calculeaza pentru componentele vectorului x, dupa ce acestea au fost ordonate


crescator, centilele precizate prin parametrul p, care contine unul sau mai numere
ntregi de la 1 la 99. De exemplu, p=[25, 50, 75] produce respectiv cuartila
inferioara (  ), mediana, cuartila superioara (  ):

   
 
 
 

floor

ceil



 
   
 
 


floor

ceil




 




Daca x este matrice, atunci se opereaza pentru fiecare coloana n parte.


Definitia 3.3.12. Numim mod al distributiei statistice a caracteristicii  orice punct
de maxim local al distributei statistice.
Observatia 3.3.13. Cand distributia statistica are un singur mod spunem ca avem
distributie statistica unimodala. Daca exista doua sau mai multe moduri spunem ca
avem distributii statistice bimodale, respectiv multimodale.
Observatia 3.3.14. Cand datele statistice sunt grupate, pentru determinarea modului,
se determina intervalul modal, adica intervalul cu frecventa maxima locala. Daca

intervalul modal este    , atunci se considera


 

 

   






,
unde 
   ,     . Formula
se obtine





    cu




usor daca se intersecteaza interpolantul liniar al punctelor




interpolantul liniar al punctelor    ,   

 .
Cand caracteristica cercetata este de tip discret, avem ca

Definitia 3.3.15. Numim moment de ordin


 , valoarea numerica



al distributiei statistice a caracteristicii



     













152

Statistica descriptiva

Definitia 3.3.16. Numim amplitudinea (interval de variatie) distributiei statistice a


caracteristicii  , valoarea numerica

   


 

 



    

 

   

Definitia 3.3.17. Numim abatere cuartilica (interval intercuartilic) a distributiei statistice a lui 
a dintre cuartila superioara si cuartila inferioara, adica
, diferent
.
diferenta 
Observatia 3.3.18. Mai ntalnim, n aplicatii, variatia intercuartilica data prin formula





respectiv abaterea cuartila relativa




Observatia 3.3.19. Daca 
 , atunci distributia se considera intens concentrata, iar n caz contrar, intens dispersata.

Definitia 3.3.20. Numim abatere medie (absoluta) a distributiei statistice


rea numerica


unde 

.



 

               
 
 
 


Definitia 3.3.21. Numim moment centrat de ordin


loarea numerica

 , valoa-

     










al distributiei statistice


  


 , va-

 

Definitia 3.3.22. Momentul centrat de ordinul doi al distributiei statistice  se


numeste dispersie si se noteaza  
, iar 
 se numeste abatere medie
patratica sau abatere standard.
Observatia 3.3.23. Alte formule de calcul pentru dispersie sunt

 
 
      

 


 



 




      


 

(formula lui Konig)

3.3. Parametrii distributiilor statistice

153

Observatia 3.3.24. Se observa ca pentru calculul dispersiei ar fi necesar sa fie parcurse datele statistice de doua ori, odata pentru calculul mediei aritmetice , iar apoi
pentru calculul lui  , care foloseste pe . Prezentam o metoda pentru calculul dispersiei printr-o singura parcurgere a datelor statistice.
Pentru aceasta introducem notatiile





si









Vom arata, prima data, ca are loc relatia de recurenta





 
    

 

 

Pentru stabilirea relatiei de recurenta se scrie succesiv



        
 
 


 
















 






 














 

 
   

   






 
   
 





Daca retinem extremitatile sirului de egalitati avem:

  


 



  






 

 
    


 

ce trebuie aratat.
  , iar     . Prin urmare formula de recurenta de
Observam ca 
la punctul precedent permite calculul lui   odata cu calculul lui , deci printr-o
parcurgere a datelor statistice.
Algoritmul de calcul poate fi descris prin urmatoarele etape:

 
1. ,  .
2. Pentru 
3. 

;

 






 ,  

 
   .

 

154

Statistica descriptiva

Definitia 3.3.25. Numim coeficient de variatie al distributiei statistice

 , raportul




care de regula se exprima n procente (  

).

Definitia 3.3.26. Numim coeficient de variatie intercuartil al distributiei statistice  ,


raportul
 
 






Definitia 3.3.27. Numim coeficientul de asimetrie intercuartil (Yule) al distributiei


statistice  , raportul

 
 
  
  





  
, iar daca

Observat
lui Yule satisface relatiile 
 ia 3.3.28.
 Coeficientul






(  ), atunci
, n caz contrar
 

.

Definitia 3.3.29. Numim coeficienti ai lui Pearson relativ la distributia statistica


rapoartele:






(3.3.1)







(skewness)

(kurtosis)

(coeficient de asimetrie)



,

Definitia 3.3.30. Numim coeficienti ai lui Fisher relativ la distributia statistica a lui
 , valorile numerice

(3.3.2)






(asimetria)








(excesul)




Observatia 3.3.31. Pentru curba lui Gauss avem ca 
, deci 
. Cand



, maximul curbei distributiei este deplasat spre dreapta n raport cu valoarea

medie, iar cand   , maximul este deplasat spre stanga.

3.3. Parametrii distributiilor statistice

155



pentru curba lui Gauss avem ca 
, deci 
. Astfel, daca
 De asemenea,


atunci
curba
distribut

iei
este
mai

ngustat
a
dec
a
t
curba
lui Gauss,



 
 
distributia numindu-se leptocurtica. Daca 
curba
distribut
iei este


mai turtita, distributia numindu-se platicurtica.


O parte din acesti parametri statistici exista n sistemul de baza Matlab, iar altii
se gasesc n Statistics toolbox. Facem prezentarea lor n cele ce urmeaza.

3.3.7 Functia moment


Apelul functiei moment se poate face prin
s=moment(x,k)

si are ca efect calculul, pentru componentele vectorului x, a momentului centrat de


ordin k, iar daca x este matrice, atunci se opereaza pe fiecare coloana n parte.

3.3.8 Functiile var si std


Apelurile functiilor var si std se pot face prin:
v=var(x)
s=std(x)
v=var(x,w)
v=var(x,1)

Primele doua forme calculeaza, pentru componentele vectorului x, dispersia definita


prin

  
 

v
x
x
 

unde este lungimea vectorului, si respectiv abaterea standard s


v.
Forma a doua pentru var, cand parametrul optional w este prezent, acesta trebuie
sa fie un vector cu ponderi pozitive a caror suma este 1, si are ca efect calculul lui v
dupa formula


w



    
x
x
wx



Forma a treia pentru var, cand parametrul optional 1 este prezent, are ca efect
calculul lui v dupa formula momentului centrat de ordinul 2.
In toate cazurile, daca x este matrice, se opereaza pe fiecare coloana n parte.

3.3.9 Functiile range, iqr, mad, skewness si kurtosis


Apelurile functiilor range, iqr, mad, skewness, kurtosis se fac prin

156

Statistica descriptiva
r=range(x)
iq=iqr(x)
md=mad(x)
sk=skewness(x)
k=kurtosis(x)

si calculeaza pentru componentele vectorului x, respectiv amplitudinea, abaterea


cuartilica, abaterea absoluta, asimetria (cu formula (3.3.2)) si excesul (cu formula
(3.3.1)).
Daca x este matrice, se opereaza pe fiecare coloana n parte.

3.3.10 Functiile max si min


Prezentam numai modul de apel pentru functia max, deoarece functia min se utilizeaza la fel.
Pentru max avem urmatoarele forme de apel:
r=max(x)
r=max(x,y)
[r,k]=max(x)
[r,k]=max(x,y)

Prin acestea se calculeaza valoarea maxima a componentelor vectorului x, iar n


k se obtin si indicii corespunzatori componentelor. Daca este prezent parametrul
optional y, care este un vector de aceasi lungime cu cea a lui x, atunci r este un
vector ce va contine valorile maxime, prin compararea celor doi vectori pe componente. Daca x este matrice, respectiv cand apare y matrice de aceasi dimensiune,
atunci comparatiile sunt efectuate pe coloane n primul caz, iar n al doilea caz se
face compararea element cu element.

3.3.11 Functiile sort si sortrows


Functia sort are urmatoarele forme de apel
y=sort(x)
y=sort(x,k)
[y,s]=sort(x)
[y,s]=sort(x,k)

si sortrows aceleasi forme de apel.


Functia sort ordoneaza crescator elementele fiecarei coloane a matricei x, cand
k=1 (care este valoarea implicita), respectiv ordonarea crescatoare pe linii, cand k=2.
Vectorul s pastreaza indicii elementelor dinainte de ordonare. Daca x este vector,
atunci parametrul optional lipseste si este efectuata ordonarea crescatoare a componentelor vectorului, eventual cu pastrarea indicilor componentelor dinainte de ordonare n s.

3.3. Parametrii distributiilor statistice

157

Functia sortrows ordoneaza lexicografic liniile matricei x, avand n vedere


toate elementele liniilor matricei (cand parametrul k lipseste) sau numai elementele
ce apartin coloanelor precizate prin vectorul k, cu posibilitatea pastrarii n s a indicilor liniilor nainte de ordonare.

3.3.12 Functiile sum, prod, cumsum si cumprod


Apelurile functiilor sum, prod, cumsum, cumprod, se pot realiza prin:
y=sum(x)
y=sum(x,k)
y=prod(x)
y=prod(x,k)
y=cumsum(x)
y=cumsum(x,k)
y=cumprod(x)
y=cumprod(x,k)

Executia acestor instructiuni calculeaza respectiv sumele, sumele partiale, produsele,


produsele partiale pentru fiecare coloana a matricei x, cand k=1 (valoare implicita),
iar cand k=2, se executa aceste operatii pe linii. Daca x este vector, atunci parametrul
optional k lipseste, iar operatiile se executa asupra componentelor vectorului.

3.3.13 Functia diff


Apelul functiei diff se realizeaza prin:
y=diff(x)
y=diff(x,r)
y=diff(x,r,k)

In urma executarii unei astfel de instructiune, se calculeaza diferentele de ordin r ale


elementelor liniilor consecutive ale matricei x, cand k=1 (valoare implicita), respectiv diferentele de ordin r ale elementelor coloanelor consecutive ale matricei x, cand
k=2, adica


y
y

  x 

x   x 
x







k=1 
k=2 

Diferentele de ordin doi pentru x sunt diferentele de ordinul ntai pentru y. Daca x
este vector, atunci parametrul k lipseste, iar operatia se executa asupra componentelor
vectorului.

158

Statistica descriptiva

3.3.14 Functiile nanmean, nanmedian, nanstd,


nanmin, nanmax si nansum
Aceste functii din Statistics toolbox sunt definite ca si functiile corespunzatoare
mean, median, std, min, max, sum, cu exceptia faptului ca sunt excluse din calcule valorile NaN.

3.3.15 Corectiile lui Sheppard


Daca datele statistice relative la caracteristica  de tip continuu au fost grupate, n
unele cazuri, se cere sa fie aplicate corectiile lui Sheppard
pentru momentele  .


Daca se noteaza cu  momentul corectat de ordinul , atunci

 
 



    
 
 





  

 

unde  este amplitudinea claselor.


Folosind formula precedenta scriem primele patru momente corectate:

 


      

    

Avand n vedere ca

     


      

         


       


            

obtinem, de asemenea, momentele centrate corectate




  



 


 


Corectiile lui Sheppard se aplica, de regula, cand avem distributie unimodala si




 
pentru
 
,   .
Exemplul 3.3.32. Sa revenim la datele statistice din Exemplul 3.2.10 si sa calculam
parametrii statistici definiti pana aici.
Printre parametrii statistici care masoara tendinta i calculam pe urmatorii.
Media (aritmetica), care este data prin


  


 


  





   

 
 

3.3. Parametrii distributiilor statistice

159

Mediana, care se obtine dupa ordonarea crescatoare a datelor statistice. Anume, avem
ca

           
 
 

 


 
 



 

 
 













 

 








 



 
 


 

 
 
 
   
    
 









  
 



 






 




 

 

 

 

Datele statistice dublu ncadrate fiind la mijlocul acestei ordonari (numar par de date
statistice) obtinem mediana ca fiind
  
  



Cuartila inferioara se obtine din aceeasi ordonare a datelor statistice, luand data

statistica cu numarul de ordine  , prima ncadrata, adica 

, iar cuartila
superioara, luand data statistica cu numarul de ordine  , a doua ncadrata, adica


.
Printre parametrii statistici care masoara gradul de mprastiere i calculam pe cei
care urmeaza.
Intervalul de variatie este

   

   



Abaterea cuartila sau intervalul intercuartilic se obtine prin




   
Deoarece 
 
concentrata.
Abaterea cuartila relativa este










     


 

 , avem ca distributia statistica este intens

 



Abaterea medie (absoluta) are valoarea data prin






160

Statistica descriptiva

  

 
 

 

 



Primele patru momente sunt


    























 

 

  


 

  


 

   


 

 


 

 

 

        

    




  

   



   


  

Folosind legaturile dintre momentele obisnuite si momentele centrate se obtin acestea din urma cu formulele
    
  
   

  






 


              





Se pot calcula apoi coeficientii lui Pearson







 

 (skewness)



respectiv coeficientii lui Fisher

 

(asimetria)

  (kurtosis)



 

(excesul)

Sa recalculam parametrii statistici pe baza datelor statistice sistematizate (grupate).


Media (aritmetica) va fi


   


 


 




Pentru a calcula mediana folosim formula






 







 




 

3.3. Parametrii distributiilor statistice

161

Aici   este cea mai


a cumulata (ascendenta) ce nu depaseste pe  ,
 mare frecvent


    , intervalul

deci 

.
Astfel
se obtine    



  si frecventa absoluta 
median, care are amplitudinea 
. Prin
urmare rezulta ca

 

 


Pentru a calcula cuartila inferioara se determina prima data intervalul cuartilic inferior
     astfel ncat   sa fie cea mai mare frecventa cumulata ascendenta ce nu





 . Aceasta este 
depaseste pe 
 . Prin urmare         , iar

 
. Se foloseste apoi formula

   





In mod analog, pentru cuartila superioara







 





 
  

 
 

Intervalul modal, cel cu frecventa maxima, este    


modul va fi calculat cu formula

















    . Prin urmare

 
 
    
  



Abaterea (absoluta) este





      


 


 

 
 



  

     

  

   

  



Primele patru momente se calculeaza prin





   

 




 

 





  

 

 






 

  





 

  

 
 
 

162

Statistica descriptiva

 


   



 





 

  



 

iar apoi se obtin momentele centrate

       
            
              






Coeficientii lui Pearson sunt




 

 (skewness)






(kurtosis)

iar coeficientii lui Fisher sunt






 

 (asimetria)



 (excesul)

Programul 3.3.33. Sa scriem un program, care sa calculeze o parte din acesti parametri statistici din exemplul precedent. Ne vom opri numai la acei parametri, care
sunt definiti prin functii Matlab, dar evident ca odata deteminati acesti parametri, se
pot calcula usor si ceilalti parametri din exemplul precedent.
load x.dat -ascii% fisierul x.dat contine datele
% primare din exemplul precedent
ma=mean(x);
fprintf(ma=
%6.4f\n,ma)
mg=geomean(x); fprintf(mg=
%6.4f\n,mg)
mh=harmmean(x); fprintf(mh=
%6.4f\n,mh)
m=median(x);
fprintf(mediana=%6.4f\n,m)
Q=prctile(x,[25,75]);
fprintf(Q1=
%6.4f\n,Q(1)),
fprintf(Q3=
%6.4f\n,Q(2))
md=mad(x);
fprintf(md=
%6.4f\n,md)
mu=moment(x,2); fprintf(mu2=
%6.4f\n,mu)
mu=moment(x,3); fprintf(mu3=
%6.4f\n,mu)
mu=moment(x,4); fprintf(mu4=
%6.4f\n,mu)
r=range(x);
fprintf(range= %6.4f\n,r)
iq=iqr(x);
fprintf(iq=
%6.4f\n,iq)
s=std(x);
fprintf(s=
%6.4f\n,s)
v=var(x);
fprintf(v=
%6.4f\n,v)
sk=skewness(x); fprintf(sk=
%6.4f\n,sk)
k=kurtosis(x); fprintf(k=
%6.4f\n,k)

Prin executarea programului se obtin rezultatele


ma=
mg=

2.2708
2.1725

3.3. Parametrii distributiilor statistice

163

mh=
2.0704
mediana=2.2430
Q1=
1.8020
Q3=
2.6410
md=
0.5277
mu2=
0.4379
mu3=
0.1156
mu4=
0.5402
range= 3.1300
iq=
0.8390
s=
0.6666
v=
0.4443
sk=
0.3988
k=
2.8164

3.3.16 Functia grpstats


Functia grpstats, din Statistics toolbox, face posibila determinarea unor parametri
statistici pentru date clasificate (grupate) dupa o anumita variabila de grupare.
Apelul functiei se face prin
ma=grpstats(x,g)
[ma,s,fr,nume]=grpstats(x,g)

Parametrul g este un vector numeric sau de tip caracter, de aceeasi lungime cu


numarul liniilor matricei x, si care permite gruparea datelor continute de x. O astfel
de grupare este formata din acele date din x, pentru fiecare coloana n parte, pentru
care valorile corespunzatoare din g sunt aceleasi.
Executarea primei instructiuni are ca efect calculul mediilor aritmetice pentru
fiecare grupa a fiecarei coloane din matricea x.
A doua instructiune, fata de prima instructiune, mai calculeaza abaterile standard
s, pentru fiecare grupa din fiecare coloana a matricei x, precum si numarul datelor
fr si etichetele nume, pentru fiecare grupa.
Programul 3.3.34. Programul care urmeaza genereaza 100 de numere aleatoare ce

urmeaza legea uniforma discreta, cu
, n vectorul g, care va reprezenta un
vector de grupare.
In matricea x cu 100 de linii si 3 coloane, vor fi generate numere aleatoare ce
 
urmeaza legea normala
 , unde parametrul  , iar parametrul , este
respectiv 1, 2 si 3 pentru cele trei coloane.
Folosind vectorul de grupare g, se calculeaza valorile medii, abaterile standard,
frecventele absolute si se precizeaza numele grupelor, pentru coloanele matricei x.
g=unidrnd(4,100,1);
t=1:3;
t=t(ones(100,1),:);

164

Statistica descriptiva
x=normrnd(t,1);
[ma,s,fr,nume]=grpstats(x,g);
fprintf(
Mediile pe grupe \n)
disp(ma)
fprintf(
Abaterile standard pe grupe \n)
disp(s)
fprintf(
Frecventele grupelor \n)
disp(fr)
fprintf(
Etichetele grupelor \n)
disp(nume)

In urma executarii programului se obtin urmatoarele rezultate


Mediile pe grupe
1.2486
1.8376
0.6895
2.0323
1.0393
1.9893
1.0034
1.8834
Abaterile
0.2024
0.2076
0.2051
0.1875

3.0692
3.2620
3.0223
3.0419

standard pe grupe
0.1701
0.2033
0.1793
0.2763
0.1723
0.1574
0.1670
0.1859

Frecventele
24
24
23
23
27
27
26
26

grupelor
24
23
27
26

Etichetele grupelor
1
2
3

3.3.17 Functia boxplot


Sistemul Matlab, prin Statistics toolbox, dispune de functia boxplot, care se poate
apela cu una din urmatoarele forme:
boxplot(x)
boxplot(x,cr)
boxplot(x,cr,s)
boxplot(x,cr,s,v)
boxplot(x,cr,s,v,w)

Efectul executarii acestor instructiuni este reprezentarea grafica prin dreptunghiuri cu


prelungiri de segmente pentru fiecare coloana a matricei x. Laturile de jos si de sus
ale dreptunghiurilor au ordonatele date de cuartilele inferioare si superioare corespunzatoare, medianele fiind si ele marcate la randul lor prin segmente paralele situate
n interioarele dreptunghiurilor, pozitionate prin ordonatele date de valorile acestora.

3.4. Corelatie si regresie

165

In mijloacele laturilor de jos si de sus ale dreptunghiurilor sunt trasate spre exterior segmente verticale de lungimi date prin


  



respectiv


 


 

 

 

unde avem valoarea implicita w


. Datele care se afla nafara acestor

prelungiri se numesc outliers (erori grosolane) si sunt marcate prin simbolul precizat prin parametrul s (implicit s=+). Daca nu exista astfel de date ntro parte sau
alta, atunci segmentul din partea de jos se termina cu un marcaj.
Daca cr=1, atunci dreptunghiurile sunt crestate pe laturile verticale, avand mijloacele crestaturilor n dreptul medianelor, iar deschiderile crestaturilor prezinta
estimatii robuste pentru valorile medii teoretice. Valoarea cr=0 (valoare implicita)
implica faptul ca dreptunghiurile nu sunt crestate.
Cand v=0 (valoare implicita este v=1) reprezentarile prezentate pana aici sunt

rotite cu
, adica sunt prezentate pe orizontala.
Remarcam faptul ca daca x este un vector, atunci poate apare un parametru suplimentar g, imediat dupa parametrul x. Parametrul g este un vector numeric sau de
tip caracter, de aceeasi lungime cu x, si care permite gruparea datelor continute de x.
O astfel de grupare este formata din acele date din x, pentru care valorile corespunzatoare din g sunt aceleasi. Functia boxplot n acest caz va produce dreptunghiuri
pentru fiecare grupare n parte.
Programul 3.3.35. Programul urmator genereaza n vectori aleatori, care urmeaza
legea normala bidimensionala, n matricea X de tipul n 2, dupa care, folosind functia
boxplot, reprezinta grafic datele pentru prima variabila si respectiv pentru a doua
variabila.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); X=mvnrnd(mu,v,n); boxplot(X)
xlabel(Numarul variabilelor),
ylabel(Valorile variabilelor)

In urma executarii programului, cu valorile mu1=10, mu2=10, v

2 -2
si
-2 3 

n=50, se obtine Figura 3.11.

3.4 Corelatie si regresie


Corelatia (ntr-un sens larg) poate fi nteleasa ca legatura care exista ntre o caracteristica dependenta si una sau mai multe caracteristici independente, iar regresia este

166

Statistica descriptiva
14

13

12

Valorile variabilelor

11

10

2
Numarul variabilelor

Figura 3.11: Reprezentare de date cu boxplot

 









 
 



..
.










..
.




..
.

..
.

..
.


 




Tabelul 3.2: Tabel de corelatie

metoda prin care se stabileste acesta legatura.


 relative la colectivitatea . DaSa consideram caracteristicile
cantitative

s

i

  


tele statistice primare sunt   
 , care dupa grupare sunt prezentate n
 
Tabelul de corelatie 3.2. unde  reprezinta frecventa absoluta a clasei 
. De
asemenea, avem ca















  
 al distributiei statistice a carac-

Definitia 3.4.1. Numim moment de ordinul



teristicii bidimensionale  , valoarea numerica

  


  
  







   








 

 

 
  

3.4. Corelatie si regresie



unde 

167

este frecventa relativa a clasei 

 
.

 

 al distributiei statistice

Definitia 3.4.2. Numim moment centrat de ordinul



bidimensionale  , valoarea numerica

 





   
      







 



 

unde


 

 





 


 

 

 

  

   



Observatia 3.4.3. Remarcam, printre momentele centrate, dispersiile pentru distri


butiile statistice ale caracteristicilor  si respectiv , anume



  

   



   




  

Definitia 3.4.4. Numim coeficient de corelatie (al lui Pearson) al distributiei statis
tice bidimensionale  , raportul

  




      

    

 

  

Observatia 3.4.5. Folosind datele statistice negrupate avem formulele de calcul pentru coeficientul de corelatie

       
 

         


sau

      

   


 








 










  


168

Statistica descriptiva

Observatia 3.4.6. Folosind inegalitatea CauchySchwarzBuniakovski

  
   
   
 
   

 
  





se stabileste ca   . De asemenea, daca   , atunci ntre cele doua caracteris


tici exista o legatura liniara, si invers. Cand
, spunem ca cele doua caracteristici
sunt (liniar) necorelate. Prin urmare, coeficientul de corelatie poate fi folosit pentru
a stabili daca ntre cele doua caracteristici exista sau nu o legatura liniara. In cazul

n care caracteristica bidimensionala   urmeaza legea normala bidimensionala

implica faptul ca cele doua caracteristici sunt independente.
Exemplul 3.4.7. Sa calculam cativa din parametrii definiti pentru datele statistice de
la Exemplul 3.2.20.
Pentru a calcula coeficientul de corelatie, calculam prima data valorile medii ale

caracteristicilor  si . Remarcam, pentru aceasta, ca distributiile statistice ale ca
racteristicilor  si sunt respectiv






    







  









    
   




  







       





















Obtinem astfel ca






 
 



 


        cm
   
 
 

 
  



 kg

 

De asemenea, calculand dispersiile caracteristicilor se obtine





      

 


 



    


  
  
 

 


  

 
 
 
 


 



   
 


    


3.4. Corelatie si regresie

 

169



      



 


 





 
   





Covarianta dintre  si
Cov




 
  
 




    
 

 

 



se calculeaza cu formula



      

  


 




  


 
 
 
 


Astfel se ajunge la coeficientul de corelatie





Cov  



 
  




 














Programul 3.4.8. Programul Matlab, care urmeaza, efectueaza aceste calcule


f=[1,1,3,1,zeros(1,8);
0,3,4,1,0,1,zeros(1,6);
1,4,5,7,1,2,1,zeros(1,5);
0,1,2,6,9,6,4,1,zeros(1,4);
zeros(1,2),1,7,36,17,6,2,1,zeros(1,3);
zeros(1,2),1,6,27,56,39,18,4,1,zeros(1,2);
zeros(1,3),2,10,16,26,7,2,1,zeros(1,2);
zeros(1,4),1,7,10,11,6,2,1,0;
zeros(1,5),1,2,4,7,3,1,0; zeros(1,6),1,2,3,1,1,0;
zeros(1,8),1,2,2,1; zeros(1,9),1,2,1];
x=[126:137]; y=[24:35]; fx=sum(f); fy=sum(f);
xa=sum(fx.*x)/(sum(fx)); ya=sum(fy.*y)/(sum(fy));
vx=(sum(fx.*x.2)-(sum(fx.*x))2/sum(fx))/sum(fx);
vy=(sum(fy.*y.2)-(sum(fy.*y))2/sum(fy))/sum(fy);
cov=(x*f*y-sum(fx.*x)*sum(fy.*y)/sum(fx))/sum(fx);
r=cov/(sqrt(vx*vy));
fprintf( xa=%8.3f\n ya=%8.4f\n,xa,ya)
fprintf( vx=%8.5f\n vy=%8.5f\n,vx,vy)
fprintf( cov=%7.5f\n r=%9.6f,cov,r)

iar rezultatele sunt urmatoarele:


xa= 131.054
ya= 29.2447
vx= 3.45354



170

Statistica descriptiva
vy= 3.35188
cov=2.56323
r= 0.753374

Definitia 3.4.9. Numim valoare medie conditionata a distributiei statistice a carac


teristicii n raport cu   , valoarea numerica






 



 

 

si respectiv valoare medie conditionata a distributiei statistice a caracteristicii


  , valoarea numerica
raport cu
  



 





 

 n

Definitia 3.4.10. Curba de ecuatie


  pe care se situeaz
a punctele de co






,
 , se numeste curba de regresie a lui n raport cu  ,
ordonate

 
iar curba de ecuatie 
pe care se situeaza punctele de coordonate 
,



 , se numeste curba de regresie a lui  n raport cu .
Definitia 3.4.11. Numim dispersie conditionata a distributiei statistice a caracteris
ticii n raport cu   , valoarea numerica





 


   


 

   

si respectiv dispersie conditionata a distributiei statistice a caracteristicii  n raport


  , valoarea numerica
cu

 




   




 

   

 

Definitia 3.4.12. Numim dispersia conditionata a distributiei statistice a lui


raport cu distributia statistica a lui  , valoarea numerica





   





 
 

si respectiv dispersia conditionata a distributiei statistice a lui  n raport cu distri


butia statistica a lui , valoarea numerica





     
   
   



3.4. Corelatie si regresie


unde 

a clasei .

171




este frecventa relativa a clasei  , iar 

este frecventa relativa

Proprietatea 3.4.13. Dispersiile conditionate definite mai nainte satisfac relatiile

           





unde

 







   

 







  

  

adica sunt dispersiile valorilor medii conditionate.


Demonstratie. Se porneste de la identitatea


  

care se nmulteste cu


 

   




    


    


 


 
 
 

 

 

    

 

 

 

 . Astfel se obtine

si se nsumeaza dupa 

    

   

 

Retinem extremitatile acestui sir de egalitati, le nmultim cu




 . Rezulta n acest mod



 




  



  

 


   


 



  



  

si le nsumam dupa

  
     


de unde se obtine prima relatie. Analog se obtine si cealalta relatie.


Definitia 3.4.14. Numim raport de corelatie al distributiei statistice a caracteristicii
 fata de distributia statisticii  , valoarea numerica






 








 



172

Statistica descriptiva

si n mod analog avem











   






 , atunci
Observatia 3.4.15. Cand
, prin urmare


 



, ceea ce nseamna absenta dependentei n medie. Pe de


 

alta parte,
 cand  
,
 , adica pentru fiecare clasa  valorile


caracteristicii sunt aceleasi.

In cazul n care, relativ la caracteristica

 , exista numai doua clase avem

     

 

Daca se nlocuies te aceasta expresie n formula

 
se obtine ca

 

   

 

 




 

deci



  

   

  


 


Aplicatia 3.4.16. (Determinarea curbelor de regresie). Prezentam n continuare metoda celor mai mici patrate pentru determinarea ecuatiilor curbelor de regresie.
  

,
 , curba de
Presupunem ca din reprezentarea n plan a punctelor 


 


 
 . Vom
regresie a lui n raport cu
 este
de forma
    





determina parametrii 
 , astfel ncat


 








 
  



 

sa fie minima.



 

 



3.4. Corelatie si regresie

173


Punctul de minim   
lui normal de ecuatii, rezultat din



 


pentru

 

 al functiei

 

se obtine prin rezolvarea sistemu-

  


 . Ecuatia curbei de regresie va fi




     

La fel se determina si ecuatia curbei de regresie a lui  n raport cu

.

Aplicatia 3.4.17. (Drepte de regresie). Consideram cazul liniar, adica ecuatia curbei

 

de regresie este
. Expresia minimizata este




 


 

  

care conduce la sistemul normal de ecuatii


 
  









    

 
 
 


   


      
 

     
     

sau

Solutia acestui sistem liniar este




      
    
     

 

 
 





 
 

      
    
              

Se obtine n acest fel ecuatia dreptei de regresie a lui











 

 


 n raport cu  ca fiind

174

Statistica descriptiva
In mod analog se ajunge la ecuatia dreptei de regresie a lui  n raport cu 


(3.4.1)






 



Punctul de intersectie al celor doua drepte de regresie are coordonatele   si


se numeste centrul de greutate al distributiei statistice a caracteristicii bidimensionale
   .
Daca se noteaza






coeficientul unghiular al dreptei de regresie a lui



de regresie al lui n raport cu  ) si cu



coeficientul de regresie al lui  n raport cu






 , atunci



 n raport cu  (numit coeficientul



De asemenea se constata ca sign 


sign 


format de cele doua drepte de regresie este dat prin relatia
tg

Se arata ca unghiul

 
 
    
 

Folosind aceasta relatie se pot trage urmatoarele concluzii:



a) daca     atunci
, deci dreptele de regresie se confunda, cu specificatia
ca pentru
 dreptele au panta (coeficientul unghiular) negativa, iar pentru

panta este pozitiva.


b) daca  si sunt independente atunci
, deci
 (dreptele de regresie
sunt perpendiculare).
Observatia 3.4.18. Alte tipuri de curbe de regresie mai des ntalnite si care pot fi
liniarizate sunt:
1.
2.

meaza 



3. 




(exponentiala), care prin logaritmare se liniarizeaza dupa cum ur




   luand


,   ,   ;
(hiperbolica), care se liniarizeaza daca se noteaza
sau

, care se liniarizeaza daca se noteaza 

,

;

3.4. Corelatie si regresie


4.
5.

 



luand
6.
7.




8. 

175

(exponentiala), care prin logaritmare se liniarizeaza ln



ln ;

e , care prin logaritmare se liniarizeaza ln



ln ;

e

sau

,

 , luand



e  , care se liniarizeaza daca se ia 




ln

  , luand 

ln

, care prin logaritmare se liniarizeaza,  



,   ;


 ;

(logaritmica), care se liniarizeaza daca se noteaza

e  si

Aceasta ultima legatura este un caz particular al legaturii logistice definita prin





Printre legaturile ce nu pot fi liniarizate amintim:






 ,

 

a doua putand fi adusa la forma polinomiala.


Exemplul 3.4.19. Sa consideram din nou datele statistice de la Exemplul 3.2.20, sa
calculam noile caracteristici numerice definite si sa determinam ecuatiile dreptelor
de regresie.

Valorile medii conditionate si dispersiile conditionate ale lui n raport cu  se
calculeaza cu formulele


 

si







 

 

   

In mod analog se obtin valorile medii conditionate si dispersiile conditionate ale lui
 in raport cu  .
Aceste valori calculate sunt trecute n tabelele urmatoare.

176

Statistica descriptiva












 









 

 









 



 
 

Dispersia conditionata a lui




 
      



  
















si







 
  
 


 

 
 
  

n raport cu  va fi



 
 





  


 
 

















 

 


 


  




In mod analog dispersia conditionata a lui  n raport cu  este





   



 



 

Dispersia conditionata a lui

 
 

 



 n raport cu  se poate calcula si cu formula


unde




 

 



 

  



este dispersia valorilor medii. Anume, avem ca



   



   
 

de unde
In mod analog,





 

 


   




 
 


   

 


  
 

3.4. Corelatie si regresie

177

unde



adica
   
 
     

 






Raportul de corelatie al lui

 

 



 






 

 






 



 

 
 




 
 


 


 
 
 


 

este










Ecuatiile dreptelor de regresie respectiv a lui


 au ecuatiile



 






 

    



  

fata de  este

iar raportul de corelatie al lui  fata de



 

In acest fel se obtine ca

 

 



 n raport cu  si a lui  n raport cu




  






 





 




 

Avand n vedere ca









avem ecuatiile


 









   


  












  



Centrul de greutate al distributiei statistice   este punctul de coordonate



   
 
  
 , adica punctul de intersectie a celor doua drepte de regresie.


178

Statistica descriptiva

Coeficientul de regresie al lui


n raport cu

dreptei de regresie a lui n raport cu  , adica













 este coeficientul unghiular al



In mod analog, coeficientul de regresie al lui  n raport cu  este




Pentru determinarea unghiului

tg
de unde






format de cele doua drepte de regresie avem formula




 
  
    
 



tg
adica

 
 




 rad.

Programul 3.4.20. Calculele de mai sus se pot face cu programul Matlab, care urmeaza:
f=[1,1,3,1,zeros(1,8);
0,3,4,1,0,1,zeros(1,6);
1,4,5,7,1,2,1,zeros(1,5);
0,1,2,6,9,6,4,1,zeros(1,4);
zeros(1,2),1,7,36,17,6,2,1,zeros(1,3);
zeros(1,2),1,6,27,56,39,18,4,1,zeros(1,2);
zeros(1,3),2,10,16,26,7,2,1,zeros(1,2);
zeros(1,4),1,7,10,11,6,2,1,0;
zeros(1,5),1,2,4,7,3,1,0; zeros(1,6),1,2,3,1,1,0;
zeros(1,8),1,2,2,1; zeros(1,9),1,2,1];
x=[126:137]; y=[24:35]; fx=sum(f); fy=sum(f);
xa=sum(fx.*x)/(sum(fx)); ya=sum(fy.*y)/(sum(fy));
vx=(sum(fx.*x.2)-(sum(fx.*x))2/sum(fx))/sum(fx);
vy=(sum(fy.*y.2)-(sum(fy.*y))2/sum(fy))/sum(fy);
cov=(x*f*y-sum(fx.*x)*sum(fy.*y)/sum(fx))/sum(fx);
r=cov/(sqrt(vx*vy));
yb=f*y./fx; xb=f*x./fy;
for i=1:12
syb(i)=f(i,:)*(y-yb(i)).2/fx(i);
end
for j=1:12
sxb(j)=f(:,j)*(x-xb(j)).2/fy(j);
end
syx=sum(fx.*syb)/sum(fx);

3.4. Corelatie si regresie

179

sxy=sum(fy.*sxb)/sum(fx);
syxb=sum(fx.*(yb-ya).2)/sum(fx);
sxyb=sum(fy.*(xb-xa).2)/sum(fx);
eyx=sqrt(syxb/vy); exy=sqrt(sxyb/vx);
ayx=r*sqrt(vy/vx); axy=r*sqrt(vx/vy);
tang=(1-r2)/r2*sqrt(vx*vy)/(vx+vy);
arctan=atan(tang); arc=180*arctan/pi;
fprintf( i | yb
| syb
|
j |
xb
| sxb\n)
for i=1:12
fprintf(%3d |%6.2f |%6.3f |%7d |%6.3f |%6.3f\n,...
i,yb(i),syb(i),i,xb(i),sxb(i))
end
fprintf(\n syx=%8.5f, sxy=%8.5f,syx,sxy)
fprintf(\n eyx=%8.6f, exy=%8.6f,eyx,exy)
fprintf(\n ayx=%8.6f, axy=%8.6f,ayx,axy)
fprintf(\n tg=%9.3f, alpha=%6.0f,tang,arc)

In urma executarii programului precedent, se obtin urmatoarele rezultate:


i
1
2
3
4
5
6
7
8
9
10
11
12

|
|
|
|
|
|
|
|
|
|
|
|
|

yb
25.67
26.11
26.62
28.14
28.43
29.32
29.56
30.63
31.67
31.88
33.50
34.00

|
|
|
|
|
|
|
|
|
|
|
|
|

syb
0.889
1.432
2.141
1.843
1.045
1.363
1.340
1.706
1.444
1.359
0.917
0.500

syx= 1.39279,
eyx=0.764509,
ayx=0.742203,
tg=
0.381,

|
|
|
|
|
|
|
|
|
|
|
|
|

j
1
2
3
4
5
6
7
8
9
10
11
12

|
xb
|127.000
|127.556
|127.813
|129.433
|130.464
|130.943
|131.438
|132.000
|133.125
|134.091
|135.429
|136.500

|
|
|
|
|
|
|
|
|
|
|
|
|

sxb
1.000
0.691
1.902
2.112
0.844
1.204
1.280
1.778
2.276
2.992
1.959
0.250

sxy= 1.40291
exy=0.770568
axy=0.764713
alpha=
21

3.4.1 Functiile cov si corrcoef


Aceste doua functii sunt specifice sistemului Matlab de baza si pot fi apelate prin:
C=cov(x)
C=cov(x,y)
r=corrcoef(x)

Functia cov calculeaza matricea covariantelor pentru matricea x, unde fiecare coloana este considerata a fi o variabila:
C


    


x
x x
x

  



180

Statistica descriptiva

Daca x este vector este returnata varianta vectorului, caz n care se poate folosi si parametrul optional y, care este vector de aceeasi dimensiune cu x, cand este calculata
covarianta dintre x si y, pe langa variantele lui x respectiv y, adica

  x  x y  y

  

Prin urmare, n acest caz, cov(x,y) produce acelasi rezultat ca si cov([x y]).
Remarcam faptul ca instructiunea diag(cov(x)) genereaza vectorul variantelor
fiecarei coloane a matricei x, iar sqrt(diag(cov(x))) este vectorul abaterilor standard pentru fiecare coloana a matricei x.
Functia corrcoef calculeaza matricea coeficientilor de corelatie pentru matricea x, unde fiecare coloana este considerata o variabila:
r

CC C



Programul 3.4.21. Programul urmator genereaza n vectori aleatori, care urmeaza legea normala bidimensionala, n matricea X de tipul n 2, dupa care, folosind functiile
cov si corrcoef, calculeaza matricele covariantelor si a coeficientilor de corelatie,
pentru cele doua coloane ale matricei X.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); X=mvnrnd(mu,v,n);
v=cov(X); r=corrcoef(X);
fprintf(Matricea covariantelor\n), disp(v)
fprintf(Matricea coeficientilor de corelatie\n), disp(r)

In urma executarii programului, cu valorile mu1=100, mu2=-100, v


n=1000, se obtin rezultatele
Matricea covariantelor
5.1327
4.0419
4.0419
4.0487
Matricea coeficientilor de corelatie
1.0000
0.8867
0.8867
1.0000


5 4
si
4 4

3.4. Corelatie si regresie

181

3.4.2 Functiile lsline, refline si gline


Functiile lsline, refline si gline apartin la Statistics toolbox, apelurile lor
facanduse prin:
lsline
refline
refline(m)
refline(m,n)
gline
gline(f)

Functia lsline reprezinta grafic n figura curenta dreptele de regresie, obtinute


cu metoda celor mai mici patrate, pentru fiecare curba a figurii, care a fost reprezentata grafic cu instructiunea plot, dar nu prin linie continua, ntrerupta sau de tipul
punctlinie.
Functia refline reprezinta grafic n figura curenta dreapta de ecuatie y=mx+n.
Daca lipseste parametrul n, se impune ca parametrul m sa fie un vector avand doua
componente, m(1) reprezentand panta dreptei, iar m(2)=n. Adica n acest caz
dreapta, ce se va reprezenta grafic, va avea ecuatia y=m(1)x+m(2). Daca lipsesc ambele argumente, m si n, efectul functiei refline coincide cu cel al functiei
lsline.
Functia gline reprezinta grafic n figura precizata prin parametrul f, iar daca
acesta lipseste n figura curenta, segmentul de dreapta prin marcarea cu ajutorul
mouse-lui a capetelor segmentului.
Programul 3.4.22. Vom prezenta un program Matlab, care genereaza N vectori aleatori ce urmeaza legea normala bidimensionala, reprezinta grafic norul statistic pentru
aceste date, precum si cele doua drepte de regresie, a lui Y n raport cu X, respectiv a
lui X n raport cu Y.
Dreapta de regresie a lui Y n raport cu X se va reprezenta grafic cu functia
lsline, iar dreapta de regresie a lui X n raport cu Y se va face cu functia refline,
avand n vedere parametrii m si n ai dreptei de regresie definita prin (3.4.1), anume
m

 

 

  m

clear,clf, mu(1)=input(m1=); mu(2)=input(m2=);


v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=Z(:,2);

182

Statistica descriptiva
ma=mean(Z); s=std(Z);r=corrcoef([X,Y]);
m=s(2)/(r(1,2)*s(1)); n=ma(2)-m*ma(1);
plot(X,Y,.), lsline, refline(m,n)
text(ma(1),ma(2),o Centrul de greutate)


Pentru datele de intrare N=20, mu=(0,0), v

1
-0.8 
se obtin grafi-0.8
1 

cele din Figura 3.12.


3

o Centrul de greutate

3
2

1.5

0.5

0.5

1.5

Figura 3.12: Drepte de regresie

3.4.3 Functiile polyfit si refcurve


Functia polyfit este specifica sistemului de baza Matlab, iar functia refcurve
este continuta de Statistics toolbox, fiind folosite n ajustarea datelor prin functii polinomiale.
Apelurile acestor functii se pot face prin:
p=polyfit(x,y,n)
refcurve(p)

Functia polyfit determina coeficientii polinomului de ajustare de grad n, cu me


toda celor mai mici patrate, corespunzator datelor statistice x y  . Prima componenta a vectorului p este coeficientul monomului de grad n. Daca n=1, se obtin
coeficientii dreptei de regresie a variabilei Y n raport cu variabila X.
Functia refcurve reprezinta grafic n figura curenta functia polinomiala precizata prin coefcientii p, cu precizarea ca p(1) reprezinta coeficientul monomului
de grad maxim. Daca parametrul p are doua componente, functia este echivalenta cu
functia refline.

3.4. Corelatie si regresie

183

Calculul valorilor unei functii polinomiale se face cu ajutorul functiei polyval,


pe care o prezentam n continuare, mpreuna cu alte functii specifice sistemului Matlab de baza, din acest grup de functii.

3.4.4 Functiile polyval, polyvalm, poly si roots


Forme de apel pentru functiile polyval, polyvalm, poly si roots sunt:
y=polyval(p,x)
y=polyvalm(p,x)
p=poly(a)
p=roots(a)

Functia polyval calculeaza valorile y ale polinomului precizat prin coeficientii


continuti de vectorul p, pe fiecare punct al matricei sau vectorului x.
Functia polyvalm calculeaza matricea patratica y, care reprezinta valoarea matriceala a polinomului precizat prin coeficientii continuti de vectorul p, pentru matricea patratica x, adica
y

p x



px 

  p

daca p are
 componente.
Functia poly calculeaza coeficientii polinomului caracteristic al matricei patratice a:


 
 

 







 


 

 



 



iar cand a este un vector calculeaza coeficientii polinomului care are ca radacini
elementele vectorului, adica ai lui





Functia roots calculeaza radacinile polinomului cu coeficientii dati prin vectorul p.


Programul 3.4.23. Programul urmator va genera matricea Z, care contine N vectori
aleatori ce urmeaza legea normala bidimensionala. Se transforma apoi componenta
a doua a vectorilor aleatori, prin ridicarea acestora la puterea a treia, iar apoi se determina polinomul de ajustare de grad trei, prin folosirea datelor transformate. Polinomul de ajustare obtinut se reprezinta grafic mpreuna cu norul statistic al datelor
transformate.

184

Statistica descriptiva
clf, clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=Z(:,2); p=polyfit(X,Y.3,3);
scatter(X,Y.3,7,filled), hold on,
m=mu(1); s=sqrt(v(1,1));
x=m-3*s:0.01:m+3*s;
y=polyval(p,x); plot(x,y)

Pentru datele de intrare N=25, mu=(0,0), v

1
-0.9 
se obtine grafi-0.9
1 

cul din Figura 3.13.


15

10

10

15

20

25
3

Figura 3.13: Polinom de ajustare de grad 3

3.4.5 Functia polytool


Functia demonstrativa polytool se lanseaza prin:
>>polytool(x,y)
>>polytool(x,y,n)

In urma lansarii se produce un grafic interactiv (demonstrativ) privind polinomul de


ajustare pentru datele continute n vectorii coloana x si y, avand gradul precizat

3.4. Corelatie si regresie

185

prin parametrul n (valoarea implicita este n=1). Schimbarea gradului polinomului


de ajustare se face prin introducerea noii valori n fereastra din partea de sus.
Pe figura este reprezentat norul statistic pentru datele x si y, mpreuna cu graficul
polinomului de ajustare (cu linie continua).
Prin introducerea valorii unui argument  n fereastra de jos sau prin deplasarea
dreptei verticale pe pozitia abscisei , pe axa ordonatelor se obtine valoarea corespunzatoare.
Pe langa aceste elemente, graficul demonstrativ contine si alte elemente, care
se refera la notiuni ce urmeaza a fi prezentate n capitolele ce urmeaza, cum ar fi
probabilitate de ncredere si intervale de ncredere.
De asemenea, exista posibilitatea ajustarii datelor cu alte metode decat metoda
celor mai mici patrate. Alegerea unei astfel de metoda se face prin activarea butonului
method din meniu.

3.4.6 Functia nlinfit


Pentru ajustarea neliniara, Statistics toolbox dispune de functia nlinfit, bazata pe
metoda celor mai mici patrate. Apelul functiei se poate face prin:
a=nlinfit(x,y,numef,a0)
[a,r]=nlinfit(x,y,f,a0)

unde numef reprezinta numele functiei, care defineste legatura cautata dintre variabila dependenta, cu valorile continute de vectorul coloana y, variabilele independente, cu valorile continute n coloanele matricei x. Matricea x trebuie sa aiba acelasi
numar de linii ca si lungimea vectorului y.
Parametrul a0 reprezinta valorile de pornire (initiale) ale parametrilor a, care
urmeaza sa fie calculati.
Functia numef poate fi o functie Matlab proprie, care are linia de definitie
function z=numef(a,x)

In urma executarii primei instructiuni, se obtin coeficientii a ai functiei numef,


iar daca se foloseste a doua instructiune se mai obtin si erorile r=y-numef(a,x).
Programul 3.4.24. Vom considera N vectori aleatori ce urmeaza legea normala bidimensionala, pastrati n matricea Z de tipul (N,2). Asupra elementelor coloanei a
doua se efectueaza transformarea data prin functia exp. Daca a doua coloana a lui
Z astfel transformata o consideram ca reprezinta valorile unei variabile dependente
Y, iar prima coloana consideram ca reprezinta valorile unei variabile independente X,
vrem sa determinam legatura de forma
Y

beaX

Procedam n doua moduri, cu ajutorul functiei nlinfit (linie continua pe grafic),


respectiv prin liniarizarea acestei relatii (linie nrerupta pe grafic), adica prin logaritmare:  Y  b aX

186

Statistica descriptiva
clf, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=exp(Z(:,2));
a=nlinfit(X,Y,expo,[1,1]);
p=polyfit(X,log(Y),1);
a1=p(1); b1=exp(p(2));
scatter(X,Y,7,filled), hold on
m=mu(1); s=sqrt(v(1,1));
x=m-3*s:0.01:m+3*s;
y=expo(a,x); y1=b1*exp(a1*x);
plot(x,y,-,x,y1,--)

1
-0.9 
se obtin
-0.9
1 

Considerand datele de intrare N=20, mu=(0,0), v


graficele din Figura 3.14.
12

10

0
3

Figura 3.14: Ajustare neliniara

3.4.7 Functia nlintool


Functia demonstrativa polytool se lanseaza prin:
>>nlintool(x,y,numef,a0)

3.4. Corelatie si regresie

187

In urma lansarii se produce un grafic interactiv (demonstrativ) privind ajustarea datelor continute n vectorul coloana y si matricea x, avand tipul legaturii precizat prin
parametrul numef, care poate fi o functie Matlab proprie.
Pe figura este reprezentat graficul de ajustare (cu linie continua).
Prin introducerea valorii unui argument  n fereastra de jos sau prin deplasarea
dreptei verticale pe pozitia abscisei , pe axa ordonatelor se obtine valoarea cores
punzatoare pentru .
Elementele obtinute, prin lansarea acestei functii, pot fi salvate n spatiul de lucru,
workspace, partial sau n totalitate, prin utilizarea butonului export.
Pe langa aceste elemente, graficul demonstrativ contine si alte elemente, care
se refera la notiuni ce urmeaza a fi prezentate n capitolele ce urmeaza, cum ar fi
intervale de ncredere.

3.4.8 Coeficientii Spearman si Kendall

Definit
ia 3.4.25. Fie   ,
 , rangurile datelor statistice primare
  

  ,
 , obtinute prin ordonarea crescatoare dupa prima, respectiv a
doua componenta. Numim coeficient de corelatie al rangurilor sau coeficientul lui
Spearman, valoarea numerica


  

unde  si sunt noile caracteristici care definesc rangurile datelor statistice, res
pectiv pentru  si .

Proprietatea 3.4.26. Daca notam 
   diferenta rangurilor aceluiasi
individ, atunci

  


 

  

Demonstratie. Conform definitiei lui avem ca


   


  
Deoarece   

  
 


         
          
  







 




si



   
            

 

 

 



, rezulta ca

188

Statistica descriptiva

 








          
    





deci numitorul din expresia lui este calculat.


Pentru calcularea numaratorului pornim de la identitatea
 

                 
           

      

care se nsumeaza pentru

  

 



. Obtinem n acest fel

 

adica

                  
 
 
 

    
    



        

 


    



  




Daca se nlocuiesc aceste expresii n formula lui


prietatii.

 

se obtine relatia din enuntul pro-

 

Corolarul 3.4.27. Coeficientul lui Spearman verifica relatiile 


.



 se obtine cand 
 , adica toate
Demonstratie. Valoarea maxima
 
rangurile corespunzatoare celor doua caracteristici coincid. Valoarea minima

se va obtine cand diferentele rangurilor sunt maxime, adica rangurile sunt inverse
pentru cele doua caracteristici. In acest caz avem

 
 

        



  
 


de unde se obtine, ntr-adevar,


.

Acelasi rezultat se obtine si din faptul ca este definit cu ajutorul
 coeficientului

(pentru ranguri) Pearson, despre care stie ca ia valori n intervalul    .
Observatia 3.4.28. Pe baza corolarului precedent, vom spune ca pentru
 sunt identice, pentru 
doua clasamente pentru caracteristicile  si
 
inverse unul celuilalt, iar pentru
sunt independente.

  cele
 sunt

3.4. Corelatie si regresie

189

Observatia 3.4.29. Cand exista doua sau mai multe date statistice primare care au
aceeasi valoare, atunci rangurile acestora se considera toate egale (ex-aequo) cu media aritmetica a rangurilor pe care le ocupa aceste date n ordonarea crescatoare.

corespunzator vom face modificarea lui .
Daca n ordonarea dupa caracteristica  avem  grupe de date statistice care
 

coincid, fiecare grupa continand
 , date statistice si daca n ordonarea dupa


caracteristica
avem  grupe de date statistice ce coincid, fiecare grupa continand




 , date statistice, atunci se modifica dupa cum urmeaza


         



         
 
 





unde






  


si

 

 

 

 


Definitia 3.4.30. Numim coeficientul lui Kendall relativ la distributia statistica a



caracteristicii bidimensionale  , raportul

 



 sign 
  
   


unde



Proprietatea 3.4.31. Coeficientul lui Kendall satisface relatiile

  

.

Demonstratie. Valoarea maxim


a a lui se obtine cand este maxim, adica atunci
      
 
 , pentru fiecare
cand
.
In acest caz avem ca


 

 




 

deci
.

   
Valoarea minima a lui se obtine cand este minim, 
 
pentru fiecare
 , caz n care

         




 
deci

. Prin urmare avem

  

.







,

190

Statistica descriptiva

Observatia 3.4.32. Din proprietatea precedenta, avem ca pentru



clasamente ale celor doua caracteristici
  si sunt identice, pentru
inverse unul celuilalt, iar pentru
sunt independente.

 cele
 doua

 sunt

Observatia 3.4.33. Pentru calculul rapid


al lui
, se poate proceda dupa cum ur  


meaza. Se ordoneaza datele primare   
 , n mod crescator dupa prima

   
componenta. Fie aceasta     
calculeaza apoi numarul


, cu  

 sign    


 

      


Se



obtinandu-se astfel .
Remarcam de asemenea ca toate formulele relative la coeficientul lui Kendall

raman adevarate dac
a se lucreaza cu rangurile   , corespunzatoare datelor statis





,
tice primare 
 , asa cum s-au introdus pentru definirea coeficientului
lui Spearman.
Observatia 3.4.34. Cand n cele doua clasamente sunt valori egale (ex-aequo) se
procedeaza ca la Observatia 3.4.29, adica se nlocuiesc toate rangurile pentru valorile
egale prin media aritmetic
a a rangurilor pe care le ocupa n ordonare. Corespunzator
se face modificarea lui prin formula

  

 

  



 



 
  




unde 
 si 
 cu
definiti la
 
 
Observatia 3.4.29. Pentru calculul lui pentru fiecare pereche ex-aequo valoarea lui
ramane neschimbata.


Exemplul 3.4.35. Echipele diviziei nationale de fotbal sunt clasificate dupa numarul
 n primele
de goluri primite   si dupa numarul cartonaselor galbene primite
 meciuri ale campionatului. Datele statistice sunt trecute n tabelul urmator
Echipa

E  E E  E  E  E  E  E  E  E  E  E  E  E  E  E  E  E 

15 13 10 13 12 11 16 11 13

10

14

15

10

11

13 9 11 11 12 8

10

11

10

13

14

Sa calculam coeficientii lui Spearman respectiv al lui Kendall. Pentru aceasta ordonam crescator echipele dupa caracteristica  , dupa care folosind regula ex-aequo
stabilim rangurile datelor statistice.
Calculele sunt efectuate n tabelul urmator.

3.4. Corelatie si regresie

191

Echipa
E 
E 
E 
E 

8
9
9
9
10
10
10
11
11
11
12
13
13
13
14
15
15
16

E
E 
E 
E
E
E 
E
E
E
E
E 
E
E 
E

Rang

5
8
9
10
11
8
13
8
6
14
12
9
11
9
10
13
11
7

1
3
3
3
6
6
6
9
9
9
11
13
13
13
15
16.5
16.5
18

Rang



1
5
8
10.5
13
5
16.5
5
2
18
15
8
13
8
10.5
16.5
13
3

0
2
5
7.5
7
1
10.5
4
7
9
4
5
0
5
4.5
0
3.5
15

0
4
25
56.25
49
1
110.25
16
49
81
16
25
0
25
20.25
0
12.25
225

0
2
4
6
7
2
9
2
0
8
6
1
3
1
1
2
1
0

17
12
9
7
4
9
1
8
9
0
1
4
1
3
2
0
0
0

715

55

87

Total

Numarul grupelor ex-aequo este cinci atat pentru  cat si pentru

 


 











 

 

 








  
    

 
   


   






 . Avem astfel

  
  

 
  


  






 





   

 

 




 
 
 
    





 

 



 

Daca se nlocuiesc aceste valori n formule se obtin coeficientii

 





192

Statistica descriptiva

Programul 3.4.36. Programul Matlab, care urmeaza, calculeaza cei doi coeficienti,
Spearman si Kendall, fara tratarea cazurilor ex-aequo.
x=[15,13,10,13,12,11,16,11,13,9,10,14,15,9,8,9,10,11];
y=[13,9,11,11,12,8,7,6,9,8,8,10,11,9,5,10,13,14];
[xord,ind]=sort(x); [yord,jnd]=sort(y);
for i=1:18
rx(ind(i))=i; ry(jnd(i))=i;
end
d=abs(rx-ry); d2=d.2;
sp=1-6*sum(d2)/18/(182-1);
ke=0;
for i=1:18
for j=1:18
if i<j
ke=ke+sign((rx(i)-rx(j))*(ry(i)-ry(j)));
end
end
end
ke=2*ke/(18*17);
fprintf( x |
y |rang(x)|rang(y)|
d | d2 \n)
for i=1:18
fprintf(%3d |%4d |%5d |%5d |%4d |%4d\n,...
x(i),y(i),rx(i),ry(i),d(i),d2(i))
end
fprintf(\n sp=%5.3f,
ke=%5.3f,sp,ke)

In urma executarii acestui program, se obtin urmatoarele rezultate:


x
15
13
10
13
12
11
16
11
13
9
10
14
15
9
8
9
10
11

|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|

y
13
9
11
11
12
8
7
6
9
8
8
10
11
9
5
10
13
14

sp=0.269,

|rang(x)|rang(y)|
|
16 |
16 |
|
12 |
7 |
|
5 |
12 |
|
13 |
13 |
|
11 |
15 |
|
8 |
4 |
|
18 |
3 |
|
9 |
2 |
|
14 |
8 |
|
2 |
5 |
|
6 |
6 |
|
15 |
10 |
|
17 |
14 |
|
3 |
9 |
|
1 |
1 |
|
4 |
11 |
|
7 |
17 |
|
10 |
18 |
ke=0.203

d
0
5
7
0
4
4
15
7
6
3
0
5
3
6
0
7
10
8

| d2
|
0
| 25
| 49
|
0
| 16
| 16
| 225
| 49
| 36
|
9
|
0
| 25
|
9
| 36
|
0
| 49
| 100
| 64

3.4. Corelatie si regresie

193

Observatia 3.4.37. (Formula lui Daniels). Coeficientul


de corelatie (al lui Pear

son), coeficientul al lui Spearman si coeficientul al lui Kendall se pot exprima
prin formula unica

  
 


      

Daca se ia

 







se obtine coeficientul de corelatie .


Intradevar, prin calcule algebrice simple se poate scrie

 

 
  
  




 

iar

 












      


Daca se ia


 







astfel ca

   









  

 





   


 
   
 
 
 
   
 

    








 

 








   


 

se obtine, ca mai nainte, coeficientul al lui Spearman, iar daca se considera


sign 

se obtine coeficientul

 


al lui Kendall.

sign

  

194

Statistica descriptiva

Definitia 3.4.38. Fie colectivitatea cercetata din punct de vedere a  caracteristici


      si fie datele statistice primare relative la aceste caracteristici scrise
n matricea
 
 

 


 


 

 

 







cu matricea





 a rangurilor corespunzatoare pentru fiecare caracteristica data prin




 
  
 





Numim coeficientul de concordanta al lui Kendall raportul






unde




   

 






Observatia 3.4.39. Fiecare coloana a tabloului rangurilor este o permutare


   a nu 

merelor 
, deci suma elementelor din fiecare coloana este
 si prin
urmare
  





Cand cele  clasamente sunt identice, deci coloanele din matricea ranguri

 
lor sunt identice, totalurile  
formeaza o permutare a elementelor
 

   

. In acest caz valoarea lui va fi maxima, anume


 
    
   
   










prin urmare
.
Cand 
  atunci se obtine valoarea minima
avem independenta ntre caracteristicile cercetate.


, caz n care

Observatia 3.4.40. Cazurile ex-aequo se trateaza ca si pentru doua caracteristici, iar


formula modificata este




          


3.4. Corelatie si regresie

195

este numarul datelor ex-aequo pentru caracteristica  .



Exemplul 3.4.41. Se considera  familii pentru care sunt cercetate urmatoarele caracteristici  , , ,  reprezentand cheltuielile (n sute de lei) zilnice pentru
paine, legume, fructe, carne respectiv. S-au obtinut urmatoarele date statistice

unde



 

 








 








 
















 


 
 
 









Vrem sa calculam coeficientul de concordanta al lui Kendall.


Pentru a calcula coeficientul de concordanta al lui Kendall, se determina rangurile
datelor statistice pentru fiecare caracteristica n parte. Matricea rangurilor este



  

 

























 

 

 

 

 

 

 
 






 

 

 





 
  

De asemenea, avem ca sumele rangurilor de pe fiecare line a matricei rangurilor sunt



  


    
  
    

, deci

 
 







 


 




 


 

 




 


 

196

Statistica descriptiva


   




    




  


Coeficientul de concordanta al lui Kendall va fi






 
 
  
 

 







 

Programul 3.4.42. Un program Matlab, care efectueaza aceste calcule, este prezentat n continuare
x=[332,428,354,1437;293,559,388,1527;372,767,562,1948;
406,563,341,1509;386,608,396,1501;438,843,689,2345;
534,660,367,1620;460,699,483,1856;385,789,621,2366;
655,776,423,1848;584,995,548,2056;515,1097,887,2630];
N=12; p=4;
[x1,i1]=sort(x(:,1)); [x2,i2]=sort(x(:,2));
[x3,i3]=sort(x(:,3)); [x4,i4]=sort(x(:,4));
for i=1:12
r1(i1(i))=i; r2(i2(i))=i; r3(i3(i))=i; r4(i4(i))=i;
end
r=[r1,r2,r3,r4]; sb=sum((sum(r)-sum(sum(r))/12).2);
w=12*sb/(p2*(N3-N));
fprintf(
Matricea rangurilor\n)
for i=1:12
fprintf(%6d |%3d |%3d |%3d\n,r1(i),r2(i),r3(i),r4(i))
end
fprintf(\n
w=%5.3f,w)

iar rezultatele obtinute, n urma executarii programului, sunt


Matricea
2 | 1
1 | 2
3 | 7
6 | 3
5 | 4
7 | 10
10 | 5
8 | 6
4 | 9
12 | 8
11 | 11
9 | 12

rangurilor
| 2 | 1
| 4 | 4
| 9 | 8
| 1 | 3
| 5 | 2
| 11 | 10
| 3 | 5
| 7 | 7
| 10 | 11
| 6 | 6
| 8 | 9
| 12 | 12

w=0.735

Capitolul 4

Teoria selectiei
Studiul statistic al unei colectivitat i din punct de vedere al uneia sau mai multor caracteristici prin considerarea tuturor indivizilor colectivitatii de multe ori este
imposibil de efectuat sau foarte costisitor. Daca ne gandim, de exemplu, la studiul calitatii produselor unei fabrici de conserve, ne dam seama ca nu are sens considerarea
tuturor acestor produse pentru efectuarea controlului, ceea ce ar duce la distrugerea
ntregii productii. De asemenea, daca se are n vedere recensamantul populatiei unei
ta ri, ne dam seama de costul ridicat al acestei operatii, motiv pentru care astfel de
recensaminte sunt destul de rare.
Si numai din cele doua exemple amintite nainte, ne dam seama ca ar fi potrivit
ca sa fie considerata pentru studiu numai o parte a colectivitat ii cercetate, iar apoi
rezultatele obtinute relative la aceasta parte sa fie extinse la ntreaga colectivitate.

4.1 Tipuri de selectie


Definitia 4.1.1. Numim esantion (selectie, sondaj) relativ la colectivitatea
o
submultime de indivizi a lui , care urmeaza sa fie cercetati din punct de vedere
a uneia sau mai multor caracteristici, iar numarul indivizilor din esantionul se
numeste volumul esantionului.
Observatia 4.1.2. Modurile de obtinere a esantionului
atoare si respectiv metode aleatoare de selectie.

ne conduc la metode neale-

Dintre metodele nealeatoare amintim:


selectia sistematica, cand indivizii care intra n esantion sunt considerati dupa


o anumita regula, de exemplu din  n  ;
197

198

Teoria selectiei
selectie tipica, cand, cunoscandu-se informatii anterioare referitoare la colectivitate, sunt considerati indivizi cu valori medii apropiate de valoarea medie a
ntregii colectivitat i;
selectie stratificata, cand colectivitatea este clasificata (stratificata) dupa anumite criterii, cunoscanduse proportia indivizilor pentru fiecare strat. Esantionul se ia astfel ncat sa fie respectate aceste proportii pentru fiecare strat.

Pentru metodele aleatoare, fiecare individ al colectivitat ii poate sa intre n esantion


cu aceasi probabilitate (selectie cu probabilitat i egale) sau cu probabilitat i diferite.
Metodele aleatoare de selectie sunt:
repetate (bernoulliene), cand individul, ce intra n esantion, dupa ce a fost cercetat, este reintrodus n colectivitate;
nerepetate, cand individul ce intra n esantion, dupa ce a fost cercetat, nu este
reintrodus n colectivitate.
Observatia 4.1.3. Daca volumul colectivitat ii este mult mai mare decat volumul esantionului, atunci o selectie nerepetata poate fi considerata ca fiind de tip repetat.
Aceasta are la baza rezultatul privind comportarea asimptotica a legii hipergeometrice
ca si o lege binomiala (a se vedea Observatia 2.4.4).

4.2 Functii de selectie


In cele ce urmeaza vom considera ca avem de fiecare data o selectie repetata.
Definitia 4.2.1. Fie colectivitatea cercetata din punct de vedere al caracteristicii
 . Numim date de selectie relative la caracteristica  datele statistice      
privind indivizii care intra n esantion.
Observatia 4.2.2. Datele de selectie pot fi considerate ca fiind valorile unor variabile



, numite variabile de selectie si care n cazul unei selectii
aleatoare   
repetate sunt variabile aleatoare independente, identic repartizate cu  .
Definitia 4.2.3. Numim functie de selectie sau statistica variabila aleatoare


 






    

  

unde
este o functie masurabila, iar
numeste valoarea functiei de selectie.

    

 

se

4.2. Functii de selectie

199

4.2.1 Media de selectie


Definitia 4.2.4. Numim medie de selectie functia de selectie



  

iar

 

  

 

se numeste valoarea mediei de selectie.


Proprietatea 4.2.5. Fie caracteristica


persia  
 , atunci

 avand valoarea medie




si

  si dis-



Demonstratie. Folosind proprietat ile valorii medii si ale dispersiei si avand n vedere
ca selectia este repetata avem succesiv

  




  

 



 



  







Observatia 4.2.6. In cazul n care caracteristica  urmeaza legea normala


 ,

atunci  , fiind o combinatie liniara de variabile aleatoare independente, ce urmeaza fiecare aceasi lege normala, va urma de asemenea legea normala (a se vedea

Observatia 2.5.6). Pe baza proprietat ii precedente  va urma asadar legea normala
 
 .


Proprietatea 4.2.7. Fie caracteristica  avand valoarea medie




persia  
 , atunci statistica
(4.2.1)







  si dis-

 
 , iar cand  urmeaza
converge n repartitie la legea normala
 , cand
 
legea normala
 afirmatia are loc pentru orice valoare a lui .

Proprietatea nu reprezinta altceva decat Teorema 2.7.8.

200

Teoria selectiei

Functia 4.2.8. Pentru ilustrarea proprietat ii precedente, scriem o functie Matlab, care
genereaza o matrice de tipul (n,m), ale carei elemente sunt numere aleatoare ce urmeaza o lege de probabilitate precizata. Pentru fiecare coloana a matricei generate, se
calculeaza valoarea zn , folosind formula (4.2.1), dupa care se reprezinta grafic histo .
grama valorilor zn , mpreuna cu densitatea de probabilitate a legii normale
function hist2(n,m,lege)
% Comportare asimptotica a mediei de selectie
% lege - legea de probabilitate
% (n,m) - tipul matricei generate
switch lege
case unid
N=input(N=);
X=unidrnd(N,n,m); [med,var]=unidstat(N);
case bino
nn=input(n=); p=input(p=);
X=binornd(nn,p,n,m); [med,var]=binostat(nn,p);
case hyge
M=input(M=); K=input(K=); nn=input(n=);
X=hygernd(M,K,nn,n,m); [med,var]=hygestat(M,K,nn);
case poiss
la=input(lambda=);
X=poissrnd(la,n,m); [med,var]=poisstat(la);
case nbin
r=input(r=); p=input(p=);
X=nbinrnd(r,p,n,m); [med,var]=nbinstat(r,p);
case geo
p=input(p=);
X=geornd(p,n,m); [med,var]=geostat(p);
case unif
a=input(a:); b=input(b(a<b):);
X=unifrnd(a,b,n,m); [med,var]=unifstat(a,b);
case norm
mu=input(mu=); s=input(sigma=);
X=normrnd(mu,s,n,m); [med,var]=normstat(mu,s);
case logn
mu=input(mu=); s=input(sigma=);
X=lognrnd(mu,s,n,m); [med,var]=lognstat(mu,s);
case gam
a=input(a=); b=input(b=);
X=gamrnd(a,b,n,m); [med,var]=gamstat(a,b);
case exp
mu=input(mu=);
X=exprnd(mu,n,m); [med,var]=expstat(mu);
case beta
a=input(a=); b=input(b=);
X=betarnd(a,b,n,m); [med,var]=betastat(a,b);
case weib
a=input(a=); b=input(b=);

4.2. Functii de selectie

201

X=weibrnd(a,b,n,m); [med,var]=weibstat(a,b);
case rayl
b=input(b=);
X=raylrnd(b,n,m); [med,var]=raylstat(b);
case t
nn=input(n=);
X=trnd(nn,n,m); [med,var]=tstat(nn);
case chi2
nn=input(n=);
X=chi2rnd(nn,n,m); [med,var]=chi2stat(nn);
case f
mm=input(m=); nn=input(n=);
X=frnd(mm,nn,n,m); [med,var]=fstat(mm,nn);
otherwise
error(Lege necunoscuta)
end
Z=mean(X); Z=(Z-med)/sqrt(var/n);
hist(Z,fix(1+10/3*log10(m)), hold on
x=-3:0.01:3; f=normpdf(x,0,1);
plot(x,f,k-), colormap spring

Apelul functiei hist2 se face prin


>>hist2(n,m,lege)

unde valorile pentru n, m si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>hist2(25,35,unif)

are ca efect apelul functiei pentru legea uniforma, iar pe ecran se va cere introducerea

parametrilor a si b (a b), dupa care pe ecran va fi reprezentat graficul din Figura 4.1,
n cazul n care a=-1 si b=1. Sa remarcam totusi ca la un nou apel, cu aceeasi
parametri, graficul difera, deoarece sunt generate alte numere aleatoare.

4.2.2 Momente de selectie


Definitia 4.2.9. Numim moment de selectie de ordin



 

iar



functia de selectie

   





se numeste valoarea momentului de selectie de ordin .


Observatia 4.2.10. Se vede imediat ca



Proprietatea
4.2.11. Fie

 caracteristica

ordin , 
 , atunci

 



si

 .

 pentru care exista momentul teoretic de




 

    


202

Teoria selectiei
12

10

0
3



Figura 4.1: Legea


iar pentru

, avem ca



  
  






converge n repartitie la legea normala

.

Demonstratie. Deoarece selectia este repetata putem scrie succesiv

 


 







 




 



   


 










 

 


   


Ultima afirmatie rezulta prin aplicarea Teoremei 2.7.8 sirului    de varia


 
bile aleatoare
si identic repartizate. Anume, deoarece

 independente



 , avem


si  


  
  


   
    

  
   


   

 


 

   
  


4.2. Functii de selectie

203


dar  converge n repartitie la legea normala

, ceea ce ncheie demonstratia.

Definitia 4.2.12. Numim moment centrat de selectie de ordin




    



iar



   



functia de selectie

se numeste valoarea momentului centrat de selectie de ordin .



Observatia 4.2.13. Se 
vede imediat ca  
, iar momentul centrat de ordinul doi
se poate scrie   .

Proprietatea 4.2.14. Fie caracteristica  pentru care exista momentul teoretic  ,


atunci pentru momentul centrat de ordinul doi avem

 
unde





si

 

 , si de asemenea

  






 

Demonstratie. Pentru prima relatie scriem succesiv



  
    




   
   
  
 



    
  


 








 
 


  

          




 


Daca se retin extremitatile sirului de egalitati avem prima relatie.


consideram variabilele aleatoare reduse, notate prin
a calcula dispersia,

 Pentru
  ,   , care sunt independente si identic repartizate si pentru
  ,     ,
care
 .
Se arata usor ca




    

 

unde



  

 

204

Teoria selectiei
Pe de alta parte avem ca


 


 

 


 






 

   

 

apoi


   

 



 



      

 

 


deoarece
avem

  

 




, pentru orice

 


 

 




 ,

         









.




Pentru ultimul termen







              
   
 
 



 

 

Calculam pe rand termenii din membrul drept al aceste relatii. Astfel avem
 
 
 
 
 
 

 
 


 
  
 



  

 

de unde se obtine


 . Pentru aceasta avem




        




 
 



   
         



  
 

 


 


A ramas, prin urmare, de calculat


 

 

   

 









4.2. Functii de selectie

 



Termenii lui
ca factor pe




205

, care nu au fost luati n considerare, sunt nuli deoarece contin



. Obtinem n acest fel ca


      
 

 
 

 





 






 
 





deci pentru dispersie avem succesiv




 


 

 
 





     





 

deoarece

 

 

 
 




 


 

 






  






, cand


 

.



 

 
 





Asadar




Observatia 4.2.15. Din proprietatea precedenta avem ca








 

 



  deci 

 


    




 


, caz n care










, deci

 

 

 
 


   






Pentru ultima relatie putem considera


avem


  

 







adica

   
  

     , avem ca statisticile  si  sunt necorelate
Deoarece
 , iar daca  are distributia simetrica (  ), atunci  si  sunt
pentru
necorelate pentru orice .

206

Teoria selectiei
De asemenea se poate arata ca statistica

  
 







converge n repartitie la legea normala

, cand

Definitia 4.2.16. Numim dispersie de selectie functia de selectie

 
     iar valoarea numerica 
  



      


  

se numeste valoarea dispersiei de selectie.


Observatia 4.2.17. Intre momentul centrat de selectie de ordinul doi si dispersia de
selectie exista relatia



(4.2.2)

 


Ca urmare avem ca







  

 





 






 pentru care exista momentul centrat teo   



, atunci

Proprietatea 4.2.18.
Fie caracteristica


retic

 

Demonstratie. Folosind formula binomului avem ca



         








 
 




 

 

   
 

       




Fara a restrange generalitatea,


se poate considera ca



tile
,
 . Putem scrie atunci


 

  



   


, deci au loc egalita-



 


  

4.2. Functii de selectie

207



   



 

  

Pe de alta parte, din inegalitatea lui Schwarz, se obtine ca






  
 

    

Daca se are n vedere Proprietatea 4.2.11, rezulta ca









Se poate arata, de asemenea, ca


warz se obtine



  



 



      






 
    





 . Astfel din inegalitatea lui Sch

  


sau

In cazul 

, se calculeaza direct

 
 

   


 

 

  

Luand n considerare aceste evaluari, se obtine n final






    


4.2.3 Coeficient de corelatie de selectie





Observatia 4.2.19. Printro cale analoga, se poate obtine ca


            









 









Definitia 4.2.20. Fie caracteristica bidimensinal


a   si o selectie repetata de




volum , cu
datele de selectie   ,
 , si respectiv variabilele de selectie
  



,
 . Numim coeficient de corelatie de selectie functia de selectie



  
  

 
 




 
    
  

208

Teoria selectiei

iar valoarea numerica

       

 
 






      


se numeste valoarea coeficientului de corelatie de selectie.

Observatia 4.2.21. Fisher a aratat ca pentru o caracteristica bidimensionala  ,





care urmeaza legea normala
     , densitatea de probabilitate a coeficientului de corelatie de selectie este
           



       






  
       

  

         




  



 
     





De asemenea, daca se considera transformarea (lui Fisher)





  
 ln  atunci  urmeaza aproximativ legea normala


, avem densitatea de probabilitate a lui  exprimata prin

In cazul particular






 

a
 ln  si dac
     
    .




     

      


iar statistica
(4.2.3)
urmeaza legea Student cu





 

  
  

grade de libertate.

Programul 4.2.22. Vom scrie un program, care genereaza de N ori cate n vectori
aleatori, ce urmeaza legea normala bidimensionala, avand coeficientul de corelatie
dintre cele doua componente nul, adica r=0. Folosind aceste date se vor calcula
N numere aleatoare dupa regula precizata prin statistica (4.2.3), iar histograma corespunzatoare acestor noi date va fi reprezentata grafic mpreuna cu densitatea de
probabilitate a legii Student cu n-2 grade de libertate.
clear,clf,
mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=0; v(2,1)=0;

4.2. Functii de selectie

209

n=input(n=); N=input(N=);
for k=1:N
Z=mvnrnd(mu,v,n); r=corrcoef(Z); r12=r(1,2);
t(k)=sqrt(n-2)*r12/sqrt(1-r122);
end
x=-3:0.01:3; f=tpdf(x,n-2);
nn=fix(1+10/3*log10(N));
[fr,cl]=hist(t,nn); h=cl(2)-cl(1);
bar(cl,fr/(h*N),1),hold on, plot(x,f,k-)
colormap spring


2 0 
se obtin graficele din Figura 4.2.
0 3

Pentru N=50, n=20, mu=(5,10), v


0.45

0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
3

Figura 4.2: Legea

Lema 4.2.23 (Fisher). Daca variabilele aleatoare   


 sunt indepen 
dente, fiecare urmand legea normala
 si daca se considera matricea orto




normata
 , atunci variabilele aleatoare


   



sunt independente, fiecare urmand legea normala



.


Demonstratie. Pentru a arata ca variabilele aleatoare ,


 , sunt independente

 
 

 . Pornind de
determinam functia caracteristica a vectorului aleator


210

Teoria selectiei

la definitia functiei caracteristice avem


 










 ,

Variabilele aleatoare


  






 
  
   



  





   




 , fiind independente se obtine


   









 
 



Fiecare factor din membrul drept este


 valoarea functiei caracteristice a legii normale
 
 , pe punctele, respectiv     , 
 , adica


 





  
 
 
 









 







 

  
 



         




 
  

     






 



  

 




Folosind conditiile de ortonormalitate relative la coeficientii  , se obtine ca



 
 
 
 
     
  

 

adica faptul ca 
care legea normala



 sunt variabile aleatoare independente, ce urmeaza fie-

.

 
Proprietatea 4.2.24. Fie caracteristica  , ce urmeaza legea normala
 si va


riabilele de selectie   
, ce corespund unei selectii repetate de volum ,
atunci statisticile

 



   


 


 
   

 

sunt variabile aleatoare


 independente, ce urmeaza legea normala

tiv legea
cu
 grade de libertate.



 si respec-

4.2. Functii de selectie

211

Demonstratie. Se considera matricea ortonormata











 
 









  
  


     






  








pentru care se aplica Lema 4.2.23.


Pe de o parte avem ca

   
 

si

  


    
        





   

 

     
  

 



 

 sunt independente rezulta ca  si  sunt independente.


Deoarece  
 urmeaza legea normala   , iar  fiind suma
Pe de alta 
parte 
patratelor a
 variabile aleatoare independente,
 fiecare urmand legea normala

 


 , obtinem ca
urmeaza legea
cu
 grade de libertate (a se vedea
legea  prezentata n Capitolul 2).


  si
Proprietatea 4.2.25. Fie caracteristica  , ce urmeaza legea normala





variabilele de selectie  
 , ce corespund unei selectii repetate de volum , atunci statisticile








    


  

sunt variabile aleatoare


independente, ce urmeaza respectiv legea normala


si legea
cu
 grade de libertate.
Demonstratie. Se considera variabilele aleatoare












212

Teoria selectiei

 
care sunt variabile aleatoare independente ce urmeaza fiecare legea normala
.

Prin aplicarea Proprietatii 4.2.24 pentru variabilele aleatoare ,
 , se obtine
afirmatia facuta. Intr-adevar avem ca

 



  

  


si

 

   


 
 

 
    
     



    
 



     


 






Proprietatea 4.2.26. Fie caracteristica  , ce urmeaza legea normala


  si



, ce corespund unei selectii repetate de vovariabilele de selectie   
lum , atunci statistica


(4.2.4)
urmeaza legea Student cu









 grade de libertate.

Demonstratie. Cu notatiile de la Proprietatea 4.2.25, aratam ca



 

Intr-adevar, avem succesiv




 






 



 


     


   









Din teoria probabilitat ilor se stie ca raportul dintre o variabila aleatoare, ce urmeaza
 
legea normala
 si radicalul unei variabile aleatoare ce urmeaza legea , raportata la numarul gradelor de libertate, n cazul n care cele doua variabile aleatoare
sunt independente, este o variabila aleatoare, ce urmeaza legea Student cu acelasi
numar al gradelor de libertate ca legea  considerata (a se vedea legile  si pre
zentate n Capitolul 2). Avand n vedere cine sunt  si  rezulta afirmatia din
enuntul proprietatii.

4.2. Functii de selectie

213

Programul 4.2.27. Pentru ilustrarea acestui rezultat, programul Matlab, care urmeaza, genereaz
a legea nor a o matrice de tipul (n,m) de numere aleatoare, ce urmeaz
mala
 , dupa care pentru fiecare coloana a matricei generate, se construiesc
datele aleatoare conform statisticii (4.2.4). Pentru aceste date se reprezinta grafic histograma corespunzatoare, mpreuna cu densitatea de probabilitate a legii Student cu
n-1 grade de libertate.
clear,clf, mu=input(mu=); sigma=input(s=);
n=input(n=); m=input(m=);
Z=normrnd(mu,sigma,n,m);
t=(mean(Z)-mu)./sqrt(var(Z)/n);
x=-3:0.01:3; f=tpdf(x,n-1);
nn=fix(1+10/3*log10(m));
[fr,clasa]=hist(t,nn);
h=clasa(2)-clasa(1);
bar(clasa,fr/(h*m),1)
hold on, plot(x,f,k-)
colormap([.7,.7,.7])

Pentru n=15, m=100, mu=5 si sigma=2, se obtin graficele din Figura 4.3.
0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
3

Figura 4.3: Legea

 

Proprietatea 4.2.28. Fie caracteristicile


independente
 si  , fiecare urmand

 


legea
normala, respectiv
 si
 si variabilele de selectie
   
, respectiv     

, ce corespund unei selectii repetate de volum 


pentru caracteristica  si unei selectii repetate de volum
pentru caracteristica




214



Teoria selectiei

, atunci statistica

(4.2.5)

     
 
 
  


unde






 
  

   
 

 

  
 











       
 
  

urmeaza legea Student cu









  


 

 
    








grade de libertate.

Demonstratie. Conform Observatiei 4.2.6, avem ca mediile de select ie  si 



 
urmeaza fiecare legea normala respectiv

si   

. Prin urmare
statistica

      




 
 



 
urmeaza legea normala
.
Pe de alta parte, folosind Proprietatea 4.2.25, se obtine ca statistica




      
    

     
     
 cu    grade de libertate, fiind suma a doua variabile









urmeaza legea
aleatoare
independente, ce urmeaza legea
 
 grade de libertate.

cu

 grade de libertate si respectiv

Ca si la demonstratia Proprietatii 4.2.26, statistica 





 urmeaza legea


  
Student cu
grade de libertate. Mai ramane de aratat ca aceasta statistica
este chiar statistica  . Intr-adevar, avem succesiv







     
 

 
 





  
 



     


   









4.2. Functii de selectie

215

     
 
 
  

 
  




 

 

 









ceea ce trebuie demonstrat.


Observatia 4.2.29. Daca se consider
a caracteristicile independente
 si  , fiecare
 
  
 si respectiv
urmand legea normal
a


s

i
dac
a
avem variabilele

 
 



de selectie   
 , ce corespund unei select

ii
repetate
de
volum
relativa
 
 
  

ce corespund unei
 

la caracteristica  si variabilele
de
select

ie




selectii repetate de volum
relativa la caracteristica  , atunci statistica


       
 




 


urmeaza legea normala







.

Proprietatea 4.2.30. Fie caracteristicile


independente
 si  , fiecare urmand
 
  


legea
normal
a, respectiv
 si
 si variabilele de selectie



   
, respectiv     

, ce corespund unei selectii repetate de volum


pentru
caracteristica  si unei selectii repetate de volum
pentru caracteristica

 , atunci statistica











(4.2.6)



urmeaza legea FisherSnedecor cu





 si

 grade de libertate.

Demonstratie. Din Proprietatea 4.2.25, avem ca functiile de selectie



   
 







urmeaza fiecare legea
cu
 si
 grade de libertate.


Pe de alta parte, deoarece  si  sunt independente,
si
sunt indepen















dente. Din calculul probabilitat ilor (a se vedea legea f prezentata n Capitolul 2) este
cunoscut ca raportul a doua variabile aleatoare independente, ce urmeaza legea ,
raportate fiecare la numarul gradelor de libertate corespunzator, este o variabila aleatoare, ce urmeaza legea FisherSnedecor cu numarul gradelor de libertate date de
numerele gradelor de libertate ale celor doua legi . Asadar avem ca






urmeaza legea FisherSnedecor cu











 si

 









 grade de libertate.

216

Teoria selectiei

Observatia 4.2.31. Daca  urmeaza legea FisherSnedecor cu si grade de li


bertate, atunci urmeaza legea FisherSnedecor cu si grade de libertate. Prin
urmare, daca notam cu     cuantila
arul pen de ordin  a lui , adica, num
     




  unde
tru care are loc  

atunci avem ca  





   este cuantila de ordin a lui . Intr-adevar avem ca relatia care defineste





    


  ,
este echivalenta cu    
sau cu




  
relatia 
Comparand ultima relatie cu relatia care defineste



 

cuantila    , se obtine relatia dintre cele doua cuantile mai sus precizata.
pe


Programul 4.2.32. Pentru ilustrarea Proprietatilor 4.2.28 si 4.2.30, vom genera doua
matrice de tipurile (n1,m) si (n2,m), ale
aror elemente
sunt numere aleatoare, ce
 c

   s
i
urmeaza respectiv legile normale
  . Folosind cele doua matrice se vor determina, pentru fiecare pereche de coloane cu acelasi numar de ordine,
din cele doua matrice, datele construite conform definitiilor statisticilor (4.2.5) si
(4.2.6). Datele astfel obtinute se reprezinta grafic folosind histogramele corespunzatoare, mpreuna cu densitatea legii Student cu n1+n2-2 grade de libertate, respectiv
a legii FisherSnedecor cu n1-1 si n2-1 grade de libertate.
clear,clf
mu1=input(mu1=); s1=input(sigma1=);
mu2=input(mu2=); s2=input(sigma2=);
n1=input(n1=); n2=input(n2=); m=input(m=);
X1=normrnd(mu1,s1,n1,m); X2=normrnd(mu2,s2,n2,m);
t=(mean(X1)-mean(X2)-mu1+mu2);
t=t./sqrt((n1-1)*var(X1)+(n2-1)*var(X2));
t=t*sqrt((n1+n2-2)/(1/n1+1/n2));
f=(var(X1)/s12)./(var(X2)/s22);
x1=-3:0.01:3; x2=0:0.01:6;
f1=tpdf(x1,n1+n2-2); f2=fpdf(x2,n1-1,n2-1);
nn=fix(1+10/3*log10(m));
[fr1,c1]=hist(t,nn); [fr2,c2]=hist(f,nn);
h1=c1(2)-c1(1); h2=c2(2)-c2(1);
subplot(1,2,1)
bar(c1,fr1/(m*h1),1), hold on, plot(x1,f1,k-)
hold off
subplot(1,2,2)
bar(c2,fr2/(m*h2),1), hold on, plot(x2,f2,k-)
colormap([.7,.7,.7])

Pentru n1=15, n2=20, m=50, mu1=5, mu2=10, sigma1=2 si sigma2=3, se


obtin graficele din Figura 4.4.

4.2.4 Functie de repartitie de selectie


Definitia 4.2.33. Fie caracteristica


si variabilele de selectie   

 cercetata, datele de selectie      


. Numim functie de repartitie de selectie,

4.2. Functii de selectie

217

0.5

0.9

0.45

0.8

0.4

0.7

0.35
0.6
0.3
0.5
0.25
0.4
0.2
0.3
0.15
0.2

0.1

0.1

0.05

0
4

 si

Figura 4.4: Legea


functia de selectie definita prin


unde
iar










card



legea

 

 
  

  

      


card   

  




  

se numeste valoarea functiei de repartitie de selectie.


Observatia 4.2.34. Valoarea functiei de repartitie selectie este o functie n scara de
o variabila reala. Daca datele de selectie sunt ordonate crescator, atunci
 
  

 daca





 





daca 
daca 

    

 

De asemenea, functia de repartitie de selectie, se vede ca este o variabila aleatoare


de tip discret si care are distributia








 

 







  



218

Teoria selectiei

Pentru demonstratia unui rezultat fundamental al statisticii matematicii, descoperit de matematicianul rus Glivenko, vom prezenta doua leme.

Lema 4.2.35. Fie sirul de evenimente
    astfel ncat
  , avem  .
atunci, pentru evenimentul 

 

,

,

Demonstratie. Aratam la nceput ca proprietatea enuntata are loc pentru un numar


finit de evenimente. Demonstratia o facem prin inductie dupa .

Pentru
, avem        
, de unde    
,
care nlocuita n relatia


            
conduce la      .
ca proprietatea are
loc pentru
  
Presupunem

. Din nou avem ca


si aratam ca este adevarat


a si pentru
   







, deci
 .
Scriem formula lui Poincare si tinem seama de ipoteza inductiei, ceea ce conduce la
 
 
 
 






       
     













  







 


Retinem extremitatile si vom obtine



         




 
 

sau




 

 





  




 




 




 

   



 

 




.

Cand sirul de evenimente este infinit, avem n vedere scrierea lui  ca urmatoarea
intersectie de evenimente

adica

              
unde evenimentele intersectiei satisfac relatiile

             

4.2. Functii de selectie

219

Conform teoremei de continuitate din teoria probabilitat ilor si 


avand n vedere prima
parte a demonstratiei putem ncheia prin



 

 


Din calculul probabilitat ilor este cunoscuta forma tare a teoremei lui Bernoulli
sau teorema lui Borel si care o dam sub forma unei leme.
Lema 4.2.36. Se considera repetari independente ale
unui experiment. La fiecare
repetare evenimentul  apare cu probabilitatea  . Fie frecventa absoluta a aparitiei
evenimentului  n cele repetari, atunci



 
     

adica frecventa relativa a aparitiei evenimentului  converge tare (aproape sigur) la


probabilitatea  de aparitie a evenimentului .

Teorema 4.2.37 (Glivenko). Fie caracteristica  care are functia de repartitie teoretica  si fie o selectie repetata de volum relativa la caracteristica  cu variabi


lele de selectie   
 si functia de repartitie de selectie  corespunzatoare, atunci


 
       

adica functia de repartitie de selectie converge aproape sigur la functia de repartitie


teoretica.
Demonstrat
  ie. Se considera
, definite prin relatia

  oarecare, dar fixat, si consideram numerele 

   









,

  se obtine dupa cum este aratat n Figura 4.5 si reprezinta


Geometric, punctul

cuantila de ordin
Daca se considera evenimentul  
    , atunci avem

  

   

 


   

      card    


Prin urmare    este frecventa relativa a aparitiei evenimentului  si conform
si

Lemei 4.2.36 rezulta ca





        
 




220

Teoria selectiei
1

y=k/r

xr,k

y=k/r

r,k

y=k/r

xr,k

Figura 4.5: Determinarea cuantilei 






 . Se poate renunta la valoarea
, deoarece 






.

Notam prin  evenimentul


         cand 

Deoarece   ,
 , conform Lemei 4.2.35, rezulta ca
pentru
 fiecare





  


 nseamna
         


 


unde evenimentul

In mod analog, considerand evenimentul 



 
       

 

cand

 



 , se obtine ca




si

4.2. Functii de selectie



 . Daca se noteaza prin


    
   

pentru fiecare 

 

evenimentul


  

  , care nseamna
            
   


si

221

cand


atunci
.
Daca se considera evenimentul

cand

   , care nseamna

                 





    
 

   

  , conform Lemei 4.2.35, avem
atunci  
. In acest fel, daca
 , adica




      













         
 
   




Aratam n continuare implicatia





 

din care se va obtine




 

  
 
 

deci



  
 
 























Pentru aceasta sa consideram    oarecare. Pentru orice   va exista


 astfel ncat        . Avand n vedere ca  si  sunt functii
nedescrescatoare, putem sa scriem urmatoarele inegalitati:
            

si

de unde se obtine



 



   



   








  

 




  

 

222

Teoria selectiei
Pe de alta parte, din modul de definire a numerelor  ,


de unde

    



  

   

si



, avem ca

    



  

   

Utilizate n dubla inegalitate de mai nainte, conduc la



 

 

     





Din prima inegalitate se obtine


de unde



   


  



 




  



   



      


          

         

 



Din a doua inegalitate se obtine

 

            

           



 

  
 
Folosind cele doua inegalitati obtinute rezulta ca       
, unde



                  
          



 
de unde         
   , pentru orice   .



        
 , care conduce la
In final avem ca 



  



implicatia care trebuia demonstrata.

Teorema 4.2.38 (Kolmogorov). Fie caracteristica  care are functia de repartitie


teoretica  continua si fie o selectie repetata de volum relativa la caracteristica 

4.2. Functii de selectie

223

cu variabilele de selectie

selectie , atunci

    




 

 si corespunzator functia de repartitie de


 

 

unde

 


 



 

iar





   

 



este functia lui Kolmogorov.


Observatia 4.2.39. Teorema lui Kolmogorov reprezinta comportarea asimptotica
a distantei dintre functia de repartitie de selectie si functia de repartitie teoretica.
Demonstratia poate fi gasita n [56].
Observatia 4.2.40. Functia lui Kolmogorov este tabelata, pentru anumite valori, n
Anexa V.
Observatia 4.2.41. Pentru calculul valorilor aproximative ale functiei lui Kolmogorov se pot utiliza urmatoarele formule de aproximare



 



    








   


 





  












daca 
daca





daca 

 

daca 




4.2.5 Functia cdfplot


Statistics toobox dispune de functia cdfplot, care reprezinta grafic functia de
repartitie de selectie. Apelul functiei se poate face prin:
cdfplot(x)
h=cdfplot(x)
[h,stats]=cdfplot(x)

Prima forma reprezinta grafic functia de repartitie de selectie corespunzatoare datelor continute de vectorul x, caracteristici cum ar fi culoarea, tipul liniei etc. sunt
considerate implicit de sistemul Matlab. Pentru modificarea unor astfel de caracteristici, adica alegerea acestora de catre utilizator, se recomanda a doua forma, prin care
parametrul h poate fi folosit n comanda set.

224

Teoria selectiei

Parametrul stats contine, dupa executarea functiei, o parte din parametrii statsitici pentru x. Acestia sunt: valoarea minima (stats.min), valoarea maxima
(stats.max), valoarea mediei de selectie (stats.mean), valoarea medianei
(stats.median) si abaterea standard (stats.std).
Functia 4.2.42. Functia Matlab care urmeaza genereaza n numere aleatoare, care urmeaza o lege de probabilitate precizata, dupa care reprezinta grafic, pe aceeasi figura,
functia de repartitie teoretica prin linie-punct, mpreuna cu functia de repartitie de
selectie.
function compar(n,lege)
% Functie de repartitie de selectie
% lege - legea de probabilitate
% n - volumul datelor
clf
switch lege
case unid
N=input(N=);
X=unidrnd(N,n,1); [med,var]=unidstat(N);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,N);
case bino
m=input(n=); p=input(p=);
X=binornd(m,p,n,1); [med,var]=binostat(m,p);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,m,p);
case hyge
M=input(M=); K=input(K=); m=input(n=);
X=hygernd(M,K,m,n,1); [med,var]=hygestat(M,K,m);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,M,K,m);
case poiss
la=input(lambda=);
X=poissrnd(la,n,1); [med,var]=poisstat(la);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,la);
case nbin
r=input(r=); p=input(p=);
X=nbinrnd(r,p,n,1); [med,var]=nbinstat(r,p);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,r,p);
case geo
p=input(p=);
X=geornd(p,n,1); [med,var]=geostat(p);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,p);
case unif
a=input(a:); b=input(b(a<b):);
X=unifrnd(a,b,n,1); [med,var]=unifstat(a,b);

4.2. Functii de selectie


x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,a,b);
case norm
mu=input(mu=); s=input(sigma=);
X=normrnd(mu,s,n,1); [med,var]=normstat(mu,s);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,mu,s);
case logn
mu=input(mu=); s=input(sigma=);
X=lognrnd(mu,s,n,1); [med,var]=lognstat(mu,s);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,mu,s);
case gam
a=input(a=); b=input(b=);
X=gamrnd(a,b,n,1); [med,var]=gamstat(a,b);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,a,b);
case exp
mu=input(mu=);
X=exprnd(mu,n,1); [med,var]=expstat(mu);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,mu);
case beta
a=input(a=); b=input(b=);
X=betarnd(a,b,n,1); [med,var]=betastat(a,b);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,a,b);
case weib
a=input(a=); b=input(b=);
X=weibrnd(a,b,n,1); [med,var]=weibstat(a,b);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,a,b);
case rayl
b=input(b=);
X=raylrnd(b,n,1); [med,var]=raylstat(b);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,b);
case t
m=input(n=);
X=trnd(m,n,1); [med,var]=tstat(m);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,m);
case chi2
m=input(n=);
X=chi2rnd(m,n,1); [med,var]=chi2stat(m);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,m);
case f
m1=input(m=); m2=input(n=);

225

226

Teoria selectiei
X=frnd(m1,m2,n,1); [med,var]=fstat(m1,m2);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,m1,m2);
otherwise
error(Lege necunoscuta)
end
plot(x,f,k-.), hold on, cdfplot(X), grid off
title(Functia de repartitie de selectie)

Apelul functiei compar se face prin


>>compar(n,lege)

unde valorile pentru n si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>compar(25,bino)

are ca efect apelul functiei pentru legea binomiala, iar pe ecran se va cere introducerea
parametrilor n si p, dupa care pe ecran va fi reprezentat graficul din Figura 4.6, n
cazul n care n=7 si p=0.4.
Functia de repartitie de selectie
1

0.9

0.8

0.7

F(x)

0.6

0.5

0.4

0.3

0.2

0.1

0
2

Figura 4.6: Legea  





Comanda
>>compar(15,norm)

are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introducerea parametrilor mu si sigma, dupa care pe ecran va fi reprezentat graficul din
Figura 4.7, n cazul n care mu=5 si sigma=2.

4.2. Functii de selectie

227

Functia de repartitie de selectie


1

0.9

0.8

0.7

F(x)

0.6

0.5

0.4

0.3

0.2

0.1

0
2

Figura 4.7: Legea

 

10

12

228

Teoria selectiei

Capitolul 5

Teoria estimatiei
Relativ la colectivitatea este cercetata caracteristica  , care urmeaza legea de pro
babilitate data prin functia de probabilitate    , ce reprezinta functia de frecventa
daca  este de tip discret, respectiv densitatea de probabilitate n cazul continuu, iar

este un parametru real necunoscut. Se considera o selectie repetata de volum



avand corespunzator variabilele de selectie   
.

5.1 Functie de verosimilitate


Definitia 5.1.1. Numim functie de verosimilitate, functia de selectie

  


 



 


   

Observatia 5.1.2. Daca se considera functia de n variabile reale


    







 

 
   

aceasta reprezinta functia frecventa (n cazul discret), respectiv densitatea de proba




bilitate (n cazul continuu) a vectorului aleator   
 .

Definitia 5.1.3. Statistica


    este statistica 
suficienta (exhaus

 nenegativ

tiva) pentru parametrul , daca exista functia masurabila
a si



functia masurabila

nenegativa, astfel ncat


    

unde



  

    

    

 

 
.

229



    

 

 

230

Teoria estimatiei

Observatia 5.1.4. Echivalenta cu conditia precedenta pentru suficienta statisticii


este conditia ca functia de frecventa (n cazul discret), respectiv densitatea de pro
   
   a vectorului aleator      
babilitate (n cazul continuu)   


   , sa nu depinda de parametrul .
conditionata de evenimentul
Exemplul 5.1.5. Fie caracteristica  ce urmeaza legea lui Poisson cu parametrul
 

necunoscut, adica are functia de frecventa




     


 



 . Deoarece variabilele aleatoare     
 

Consideram statistica



sunt independente si identic repartizate cu  avem ca urmeaza legea lui Poisson



de parametru , adica

       



 
Pe de o parte avem:
    







 

   



   

 


 

  

 

   e 

 

  e 

Se poate considera
    

 


   

 



Avand n vedere ca putem scrie si




se poate considera de asemenea


    



 e 

  

    

 



   

 



   











e

 





Prin urmare, unicitatea acestei scrieri nu se impune.



Pe de alta parte, avand n vedere ca urmeaza legea
   

  
 
 





e


, avem succesiv




5.1. Functie de verosimilitate

231





 






  

 







 



                







        

   

















   

 

     nu depinde de parametrul , decat prin intermediul



Asadar    
valorii statisticii .

Exemplul 5.1.6 (Familia exponentiala). Se considera caracteristica


functia de probabilitate de forma

 










Vom arata ca, n acest caz, statistica

  










 , care are

  




este suficienta pentru parametrul . Intr-adevar avem ca


    










Daca se considera
    

atunci

 

    



 

 






 




 

 

 








deci conditia suficientei este ndeplinita.

 



si


   






 





    

 

 

 



 




 

 

 

232

Teoria estimatiei

Definitia 5.1.7. Numim cantitate de informatie (Fisher) a unei selectii de volum



relativa la parametrul   necunoscut, valoarea medie

 
















cand functia de verosimilitate este derivabila n raport cu .


Observatia 5.1.8. Daca parametrul  este  dimensional, matricea

 






 

    

 

   



 

se numeste matricea informatiei lui Fisher.


Teorema 5.1.9. Daca domeniul valorilor caracteristicii  nu depinde de parame

trul , iar functia de verosimilitate este derivabila de doua ori n raport cu , atunci





    ln     

Demonstratie. Se porneste de la relatia cunoscuta



     

    





pe care o satisface densitatea de probabilitate. Se deriveaza aceasta relatie n raport



cu si se tine seama de faptul ca

  

    




    

 

    


ln



   

obtinandu-se



    


ln

  



    



     



Derivand nca odata n raport cu rezulta










ln
ln

    


    




  

  



    
    




     

     










5.1. Functie de verosimilitate

233

sau, avand n vedere relatia de mai nainte, rezulta ca











ln
ln

  

    




   

    




     



     



    



    



Asadar am obtinut ca


ln

   

   

  

ln

    



de unde avem relatia dorita.


Observatia 5.1.10. In demonstratia teoremei precedente am considerat cazul unei
caracteristici  de tip continuu. In mod analog se procedeaza si n cazul discret,
integrala multipla este nlocuita cu o suma multipla.

 nu depinde de

Corolarul 5.1.11. Cand domeniul de definitie al caracteristicii




  .
parametrul , atunci  
Demonstratie. Deoarece selectia este repetata, avem ca

ln


 ln    
 

  

    




Folosind Teorema 5.1.9, se obtine








 

deoarece



ln 

   




 

 

ln 





 






Observatia 5.1.12. Din demonstratia Teoremei 5.1.9 avem de asemenea ca


deoarece



ln

ln

  

  

   

   

234

Teoria estimatiei

Exemplul 5.1.13. Sa consideram caracteristica  , ce urmeaza legea normala


 
 , unde   este necunoscut, iar    este cunoscut.
Deoarece


avem ca



 

 e 
 



ln 

  


  

 




Prin urmare, cantitatea de informatie continuta (adusa) de o observatie, relativ la


parametrul , este cu atat mai mare cu cat dispersia este mai mica.


Teorema 5.1.14. Fie caracteristica  , cu functia de probabilitate     derivabila







de doua ori n raport cu si statistica
  relativa la caracte    
ristica  , cu functia de probabilitate
 , atunci cantitatea de informatie







relativa la parametrul
continuta n statistica
nu depaseste cantitatea de

   
 .
informatie   continuta de selectia considerata, adica 


Demonstratie. Daca
  este functia de frecventa (n cazul discret), respectiv
densitatea de probabilitate (n cazul continuu) pentru statistica , atunci

  

    



    

 

     



    este functia de frecventa (n cazul discret), respectiv


unde    


densitatea de probabilitate (n cazul continuu) pentru vectorul aleator  
 

conditionata de evenimentul
.
Asadar avem ca


(5.1.1)
deci

ln



  

    



ceea ce trebuia aratat.





ln 

ln

 
  ln 


  

    


      



     

 

5.1. Functie de verosimilitate

235

Exemplul 5.1.15. Se considera caracteristica  ce urmeaza legea normala


si o selectie repetata de volum . Vom compara informatia dispersiei de selectie

 

 
    


relativa la dispersia teoretica
parametru.

  

  , cu informatia selectiei relativa la acelasi

Calculam prima data informatia selectiei de volum relativa la parametrul notat


cu
    . Avand n vedere ca densitatea de probabilitate a caracteristicii
 este
  


  
      e 



se obtine

 
  




ln    


 

 ln 


 



si

Rezulta astfel ca



        
 



deci

 





 

 

 
 


 


Pe de alta parte, se stie ca statistica



 
 
   
     

urmeaza legea  cu
 grade de libertate. Avand n vedere legatura dintre statisticile  si  rezulta ca densitatea de probabilitate pentru  este data prin




    

 



Astfel se obtine ca


ln




C











ln

      
  e 




ln



 
 


236

Teoria estimatiei

de unde
ln






  

 




 

ln

si

 



Calculam acum informatia dispersiei de selectie relativa la


seama de faptul ca







   




 

. Pentru aceasta tinem










     
      






deci

   







Observatia 5.1.16. Deoarece, n cazul unei statistici suficiente, avem ca functia
 





        nu depinde de rezulta ca     n acest caz. Acest
Astfel obtinem:

lucru se obtine imediat, daca se are n vedere relatia (5.1.1).

5.2 Functii de estimatie




Definitia 5.2.1. Fie caracteristica  cu functia de probabilitate    , parame


trul   necunoscut si o selectie repetata de volum . Numim functie de estimatie

(estimator) pentru parametrul , functia de selectie

care ia valori n domeniul



numeste estimatia lui .

    

, iar valoarea


  

numerica

   



 

se

Definitia 5.2.2. Estimatorul


(functie de es    este estimator

  
timatie) nedeplasat pentru parametrul necunoscut , daca
iar valoarea
numerica

trul .

   



 

se numeste estimatie nedeplasata pentru parame-

Definitia 5.2.3. Spunem ca estimatorul


    este estimator con
 p 
, adica
sistent, pentru parametrul necunoscut , daca

   
 



 



pentru orice

, iar valoarea numerica

estimatie consistenta pentru parametrul .

   



 

se numeste

5.2. Functii de estimatie

237

5.2.1 Functii de estimatie absolut corecte


Definitia 5.2.4. Numim functie de estimatie (estimator) absolut corecta pentru para
     
metrul , functia de selectie
   , care satisface conditiile



(i)
(ii)

 
 





iar valoarea numerica



pentru parametrul .




   



 

se numeste estimatie absolut corecta

Proprietatea 5.2.5. Un estimator absolut corect este un estimator consistent.

   , un estimator absolut corect


Demonstratie. Fie estimatorul

pentru parametrul . Din inegalitatea lui Cebsev avem



    

 
 





. Facand pe
, se obtine

     




pentru orice

 

pentru orice




, ceea ce trebuie demonstrat.

 , unde paExemplul 5.2.6. Fie caracteristica  , ce urmeaza legea normala





este cunoscut, iar   este necunoscut. Considerand o selectie
rametrul
repetata de volum , vom determina constanta  astfel ncat statistica



  





sa fie estimator absolut corect pentru abaterea standard .


Avand n vedere ca variabilele de selectie  , , . . . , sunt variabile aleatoare
identic repartizate cu  , putem scrie succesiv


(5.2.1)



 










 





238

Teoria estimatiei

Tinem seama de faptul ca  urmeaza legea normala






 


 
si

          
  


obtinem


 e  



Facem schimbarea de variabila


si tinem seama de faptul ca functia obtinuta
este para, iar intervalul de integrare este simetric fata de origine:
              

 
  
  





    


 
 
  

Din conditia de nedeplasare si din formula (5.2.1) avem




adica   
Pana aici am aratat ca statistica






   



este un estimator nedeplasat pentru parametrul .


Deoarece selectia considerata este repetata rezulta ca variabilele de selectie sunt
independente, prin urmare se poate scrie





Astfel este ndeplinita si conditia (ii) din Definitia 5.2.4, anume


 

  


    cand


 






 





 



 







   
          
 

 
 


Proprietatea
5.2.7. Fie caracteristica
 pentru care exista momentul teoretic de



ordinul ,    , si fie o selectie repetata de volum , atunci momentul de
Remarcam ca


selectie de ordin



 


este functie de estimatie absolut corecta pentru parametrul

.

5.2. Functii de estimatie

239

   si de asemenea
   

Demonstratie. Din Proprietatea 4.2.11 avem ca





 

 


 

Conditiile Definitiei 5.2.4 sunt satisfacute, deci proprietatea este demonstrata.



Observatia 5.2.8. Media de selectie


corecta pentru media teoretica


 .

 este

functie de estimatie absolut

5.2.2 Functii de estimatie corecte


Definitia 5.2.9. Numim functie de estimatie (estimator) corecta, pentru parametrul

      
necunoscut , functia de selectie
   , care satisface conditiile



(i)

 

(ii)

 

 

 





iar valoarea numerica



parametrul .




   



 

se numeste estimatie corecta pentru

Proprietatea 5.2.10. Un estimator corect este un estimator consistent.

Demonstratie. Fie estimatorul


pentru parametrul ,
    corect
 

atunci din conditiile (i) si (ii) avem ca pentru orice  si  exista numarul
   
natural
astfel ncat

pentru




   



. Asadar, putem scrie

        

 


 

 

si


   

   



  


 


 
   
  


pentru
, de unde daca 
vom avea ca 







. Prin urmare avem




            







care conduce la inegalitatea





 







  


 





, pentru

240

Teoria estimatiei

Pe de alta parte, folosind inegalitatea lui Cebsev,

Deoarece



  



 



 , pentru

  


 



Prin urmare se ajunge la







, rezulta ca



    
    



 p 
de unde
, ceea ce trebuie aratat.

   

 



   

Proprietatea
5.2.11. Fie caracteristica  pentru care exista momentul teoretic de



ordin , 
 , si fie o selectie repetata de volum , atunci momentul
centrat de selectie de ordin





   



este functie de estimatie corect


a pentru momentul centrat teoretic de ordin , adica


pentru 

  .
Demonstratie. Conform Observatiei 4.2.18 avem

 


 

De asemenea, avem




  





 


 

  

       



Asadar, conditiile Definitiei 5.2.9 sunt satisfacute.



Observatia 5.2.12. Momentul centrat de selectie de ordinul ,

estimatie corecta pentru dispersia teoretica   
 .

, este functie de

Avand n vedere Observatia 4.2.17 (formula (4.2.2)) avem ca dispersia de selectie



 
   


  

este functie de estimatie absolut corecta pentru dispersia teoretica



 .

5.2. Functii de estimatie

241

5.2.3 Functii de estimatie eficiente


Teorema 5.2.13 (Inegalitatea Rao-Cramer). Se considera caracteristica  avand
 

functia de probabilitate    ,   , pentru care exista derivata partiala de

     
ordinul ntai n raport cu si fie o statistica

 absolut corecta

pentru parametrul , atunci


 

Demonstratie. Deoarece estimatorul



  




este nedeplasat, avem ca

 







     



, adica





  
     este functia de verosimilitate.
unde  

Prin derivarea n raport cu a acestei relatii se obtine ca




 

  


 

 

sau



 
ln     

 

  


 


   


  

 




     

  



 







Pe de alta parte, deoarece



ln    

avem





 
ln     





    

 



  

 

care scazuta din egalitatea obtinuta nainte conduce la


adica





 


  


 



 


ln    









 

ln 





  



     

 

242

Teoria estimatiei
Se aplica acum inegalitatea lui Schwarz si se obtine








 

adica


 



ln 

  


  

ln

   



ln 

  



 

ln 

  



ln 

 

 
 

  








Dar avem ca









ln 

 




ln 






care nlocuita n inegalitatea dinainte conduce la inegalitatea RaoCramer.


Definitia 5.2.14. Se numeste eficienta a unei functii de estimatie absolut corecte,
     
   , pentru parametrul , raportul
e









Definitia 5.2.15. Spunem ca functia de estimatie absolut corecta pentru parame 



trul ,
eficienta daca inegalitatea RaoCramer este
      , este

verificata prin egalitate, adica
.
Exemplul 5.2.16. Se considera caracteristica  ce urmeaza legea normala

si o selectie repetata de volum relativa la aceasta caracteristica. Vrem sa deter

minam eficienta estimatorului lui 
 , construit n Exemplul 5.2.6, dat
prin

       


Stim ca

 si 



 
  deci

 este estimator absolut corect pentru .

5.2. Functii de estimatie

243

Pe de alta parte avem

 


ln 

de unde

 







e

  



 

Se calculeaza usor

  
  
   




Avem astfel eficienta estimatorului



    
  
  
e





 

adica estimatorul nu este estimator eficient pentru parametrul .


  

Teorema 5.2.17 (Rao-Cramer). Se considera caracteristica  cu functia de pro 



babilitate    ,   , care satisface conditiile Teoremei 5.2.13 si fie functia
      
de estimatie absolut corecta
   pentru parametrul . Conditia

necesara si suficienta ca sa fie functie de estimatie eficienta pentru parametrul
este ca sa aiba loc reprezentarea

ln    

 



  

n plus are loc formula

  


 





 

  



Demonstratie. Pentru necesitate, din demonstratia inegalitatii RaoCramer, avem ca


egalitatea n aceasta inegalitate are loc daca inegalitatea lui Schwarz este verificata
prin egalitate. Aceasta are loc daca si numai daca variabilele aleatoare considerate
depind n mod liniar, adica


Considerand







 

  



 ( oarecare),

   

 

 

  

 


ln    


ln 

     



const., (=0 de exemplu) avem


  ln    



244

Teoria estimatiei

de unde


ln    










Astfel s-a obtinut ca


ln    

 

 

 



si prin urmare

 
 

     



 

de unde
   



pentru orice  

 





   


 

 

 



 









 



. Rezulta de aici ca







sunt constante (nu depind de ), deoarece


urmare
   






si daca se noteaza
   



 

 









   




 

 

 

nu depinde de . Prin

, atunci



 

 

Asadar s-a ajuns la

  


 



 

 

Pe de alta parte, deoarece



ln    






 

 

5.2. Functii de estimatie


obtinem

245


ln    


ln    

de unde


ln     





de unde

 

 


ln    

 



Integram, dupa ce am notat







 







 

, ultima relatie n raport cu

  

  

 

 









  

 







Pentru suficienta se porneste de la relatia cunoscuta


    

 

adica

 exp


 

  












pe care o derivam n raport cu . Obtinem astfel ca


de unde, deoarece

 



 





 



Derivam din nou n raport cu



 




 


    

si se ajunge la

        
 


Deoarece




, rezulta ca



de unde


    



  





       





    

, am obtinut astfel ca


      


si obtinem

   

 




  

246

Teoria estimatiei

deci




Pe de alta parte













 






    


    







  




  


Prin urmare putem scrie

deci

 
ln    

 



 



 













  este estimator eficient pentru parametrul .



Se considera caracteristica  ce urmeaza legea 

    


Exemplul 5.2.18.
, cu

cunoscut si necunoscut. Vrem sa aratam ca media de selectie este estimator eficient


pentru parametrul necunoscut
. Pentru aceasta vom considera o

selectie repetata de volum relativa la aceasta caracteristica.

Functia de frecventa a caracteristicii  este





 

de unde

 

ln

deci
unde
ca

ln

 



 si





ln 
ln



    ln    ln

Considerand


 

ln 



  
 

 


 

ln





ln






ln





  





ln

avem

ln


ln



 

Pe baza teoremei RaoCramer se obtine

este estimator eficient pentru parametrul

  

  



 

  

ln



 



5.2. Functii de estimatie

247

5.2.4 Estimatori optimali




   , pentru parameDefinitia 5.2.19. Estimatorul nedeplasat



trul , este optimal daca are dispersia minima dintre toti estimatorii nedeplasati ai

lui .


Observatia 5.2.20. Un estimator eficient este optimal, invers proprietatea nu are loc.
Proprietatea 5.2.21. Estimatorul optimal al unui parametru este unic.





 

   
 si 
  doi
Demonstratie. Fie 
   
estimatori optimali distincti pentru parametrul . Daca se considera functia de selectie
 

 , atunci este estimator nedeplasat pentru , deoarece
 

 




 




Pe de alta parte







 

   



 









unde  
 .
Din inegalitatea lui Schwarz se obtine

 

    


 

 


 

 



. Prin urmare, putem scrie ca     , ceea
ce contrazice
faptul ca ,  sunt

estimatori optimali, afara de cazul n care








 , adica
. Avand n vedere aceste rezultate, putem




deci

scrie:


adica




faptul ca

 








 



. Dar avem ca



 

Prin urmare se ajunge la

cu afirmatia ca cei doi estimatori sunt distincti.


  




 , ceea ce implica


, n contradictie

248

Teoria estimatiei

Teorema 5.2.22 (Rao-Blackwell). Fie caracteristica  cu functia de probabilitate




    si fie
    un estimator nedeplasat pentru parametrul .
Daca statistica
   este o statistica suficienta pentru parametrul ,



     
 este un estimator nedeplasat
atunci estimatorul
pentru

si are loc relatia

    

Demonstratie. Deoarece statistica este suficienta rezulta ca functia de probabilitate


 




        condit
ionata a vectorului aleator  
  de evenimentul

 nu depinde de , deci



  


 



 



      



nu depinde de , adica este o functie de selectie ce nu depinde de . Pe de alta parte,


folosind proprietati ale mediei conditionate avem



deci nedeplasarea are loc.


Pentru a stabili inegalitatea dintre dispersiile celor doi estimatori avem ca



Dar avem ca




  









 





      







 



iar ultimul termen este nul deoarece pentru


deci

 



adica primul termen din expresia lui


este


 








  

  

 



. Al doilea termen din aceeasi expresie

   


fixat, avem

   

   



 
   


 

const.,




5.2. Functii de estimatie

249

Am stabilit astfel relatia




    

 

de unde

  
Definitia 5.2.23. Statistica
  

, daca
de legi de probabilitate   ,

implica faptul ca
a.s.


 

Exemplul 5.2.24. Statistica


 
Poisson cu parametrul  .

  este
completa pentru familia





, pentru orice  ,

este completa pentru familia de legi



Pe de alta parte


urmeaza legea lui Poisson de parametru , deci

 

       

Prima data avem ca








, pentru orice

 



, conduce la




pentru orice

 
  ,ceea ce are loc numai daca fiecare coeficient este nul, adica
, cand
.

conditiile Teoremei RaoBlackwell, daca


Teorema 5.2.25 (LehmannScheffe). In
statistica
       este completa, atunci estimatorul

     

 



este estimator optimal.




    un estimator nedeplasat pentru parameDemonstratie. Fie



trul . Folosind Teorema RaoBlackwell, avem ca estimatorul


    



Asadar avem ca

de unde



completa rezulta ca


 .






sau




este nedeplasat pentru parametrul , adica

 

, si






  





Avand n vedere ca statistica

a.s., deci



este

a.s., de unde

250

Teoria estimatiei

In final  



orice estimator nedeplasat

  

adica

    

, pentru

, ceea ce este chiar conditia din definitia optimalitatii.

Exemplul 5.2.26. Fie caracteristica  , care urmeaza legea lui Poisson de parametru


 
 . Vrem s
 .
a determinam un estimator optimal pentru parametrul
Functia de frecventa a caracteristicii

 

 este






 



ln 

  este completa


In Exemplul 5.2.24 am vazut ca statistica suficienta


pentru familia de legi Poisson si urmeaza legea lui Poisson de parametru
ln
Daca se considera functia de selectie


atunci

    

are distributia

 

card  








    
 





 




deci




adica este estimator nedeplasat pentru parametrul .


      cu distributiile date prin
Daca se introduc variabilele aleatoare  



 

daca 
daca 





  ,     , atunci avem ca
deci
Aplicam Teorema RaoBlackwell si obtinem


Pentru



  
  

 

  





, avem















5.3. Metode pentru estimarea parametrilor

251

Folosind formula lui Bayes avem










 






    


     



 











de unde se obtine ca



 

 

 , care este dat prin

Am ajuns astfel la estimatorul optimal pentru parametrul


formula

           




5.3 Metode pentru estimarea parametrilor


5.3.1 Metoda momentelor
Se considera caracteristica  , care are functia de probabilitate      cu parametrul
  
   
 si o selectie repetat
 

necunoscut 
a de volum .

Definitia 5.3.1. Numim estimator pentru

      parametrul



telor solutia
a sistemului




 


unde  este momentul


teoretic de ordin ,
selectie de ordinul , adica

  



 obtinut prin metoda momen-

 

, iar

 este momentul de

Observatia 5.3.2. Metoda momentelor este una din cele mai vechi metode de estimare a parametrilor, folosita initial n mod empiric. Este fundamentata teoretic pe
faptul ca momentele de selectie sunt estimatori absolut corect
momentele

 a.s.ipentru

teoretice corespunzatoare. Este cunoscut de asemenea ca
cand

252

Teoria estimatiei

Exemplul 5.3.3. Se considera caracteristica  , care urmeaza legea gamma cu para



metrii   necunoscuti. Densitatea de probabilitate pentru  este

  

 


Vrem sa estimam parametrii


Se stie ca












Prin urmare, avem sistemul de ecuatii

   
e

si prin metoda momentelor.

      





     


 















   





  


si




    


    



care are solutia

5.3.2 Metoda verosimilitatii maxime


Se considera caracteristica  cu functia de probabilitate     , unde parametrul

 . Relativ la caracteristica  se consider
a o selectie repetata
necunoscut  
de volum .

Definitia 5.3.4. Numim estimator de verosimilitate maxima, pentru parametrul ,


statistica


    

 

pentru care se obtine maximul functiei de verosimilitate

  


   

iar 

parametrul .

 

           


se numeste estimatie de verosimilitate maxima, pentru

Observatia 5.3.5. In definitia estimatorului de verosimilitate maxima nu este necesar ca      sa fie diferentiabila n raport cu . De asemenea, nu este neaparat
unic si nedeplasat.

5.3. Metode pentru estimarea parametrilor

253

Observatia 5.3.6. Daca functia de verosimilitate este diferentiabila de doua ori n


raport cu , atunci estimatorul de verosimilitate maxima se obtine ca solutie a sistemului de ecuatii

   

Sistemul de ecuatii este echivalent cu


ln

   

   


   




ln 



  





 

numit sistemul ecuatiilor de verosimilitate maxima.


Exemplul 5.3.7. Sa determinam estimatorii de verosimilitate maxima pentru valoarea medie si abaterea standard, daca se considera caracteristica  , care urmeaza legea
 
normala
.
  si    , iar densitatea de probabilitate a lui  este
Se stie ca

 e 
 

  

 


Pentru a scrie sistemul de verosimilitate maxima, avem ca




   


de unde


   





         


 



     



   


In acest mod se obtine















 


sau



      


 
  
 

 
 














 
  








  







     




 








254

Teoria estimatiei

de unde se rezulta estimatorii de verosimilitate maxima










    




      
 

si .

pentru parametrii

 
Exemplul 5.3.8. Caracteristica  urmeaza legea uniforma pe intervalul
, unde


parametrul  este necunoscut. Relativ la caracteristica  se considera o selectie
repetata de volum . Vrem sa se determinam estimatorul de verosimilitate maxima


, pentru parametrul necunoscut .


Estimatorul de verosimilitate maxima pentru se determina astfel ncat functia
de verosimilitate

  


 



    

 


   



 . Deoarece
 



 



   

  


    
      

sa fie maxima pentru









 
se obtine ca
Se observa ca n acest exemplu nu s-a putut folosi ecuatia de verosimilitate ma 
xima, deoarece domeniul valorilor caracteristicii  , care este
, depinde de parametrul estimat.
Vom arata, n continuare, ca estimatorul astfel construit este estimator corect pen
tru parametrul . Apoi vom folosi acest estimator pentru obtinerea unui estimator

absolut corect pentru .

Functia de repartitie a statisticii este


   

deci

  



are densitatea de probabilitate

  


   



    



     

  


cand

  

     

   

Se calculeaza usor





  













  

5.3. Metode pentru estimarea parametrilor

255

Astfel se obtine ca
 





 



 





 





 




   

 
 



Prin urmare, este estimator


pentru .


 corect
, rezulta ca
Punand conditia



de unde se obtine

 
 si n final




Deoarece




cand






, rezulta ca




 







  

 


  






 

este estimator absolut corect pentru parametrul .

Proprietatea 5.3.9. Daca


    este statistica suficient
a pentru


parametrul , iar este estimator de verosimilitate maxima pentru , atunci este
functie de .


Demonstratie. Deoarece statistica




 

este suficienta rezulta ca







    

 

   

decimaximul lui , dupa , se obtine atunci si numai atunci cand se obtine maximul

lui dupa . Astfel ca se exprima n functie de .


  este functie de estimatie eficient
Teorema 5.3.10. Daca
a


  
pentru parametrul , atunci este estimator de verosimilitate maxima pentru .

Demonstratie. Deoarece
este estimator eficient pentru , din inegalitatea Rao
Cramer (cu egalitate), avem ca
ln
Astfel ca
ln
deci

  

    


    

  

verifica ecuatia verosimilitat ii maxime.



  

    



256

Teoria estimatiei


Observatia 5.3.11. Daca valoarea adevarata a parametrului este , se arata ca




functia de verosimilitate maxima pentru parametrul are
urmatoarele comportari

 a.s.

  


asimptotice:
, cand
, iar
converge n repartitie la

 
    .
legea normala

5.3.3 Metoda minimului

Se considera colectivitatea si caracteristica  cercetata, cu legea de probabilitate


 
   
 Domeniul valorilor lui

data prin functia     , unde 


 l consideram compus din clasele ,  . Vom introduce notatiile urmatoare


   , adica probabilitatea ca un individ luat la ntamplare din
colectivitatea sa apartina clasei .


,
Daca se considera o selectie repetata de volum cu datele de selectie  




respectiv variabilele de selectie 
 , notam prin frecventa absoluta a da
telor de selectie din clasa . Fie
variabila aleatoare (de selectie) corespunzatoare

    
lui , atunci vectorul aleator
urmeaza legea multinomiala de





parametri
,  .

Definitia 5.3.12. Estimatorul cu  minim pentru parametrul  este estimatorul


          care realizeaza valoarea minima a
(functia de selectie)
expresiei




n raport cu parametrul , iar


minim pentru parametrul .






 

   





 

se numeste estimatie cu



  




 se obtine cand este minima expresia  

 

prin urmare, minimul lui


 , atunci valoarea lui  se poate scrie n felul

Observatia 5.3.13. Daca notam 


urmator:



Observatia 5.3.14. Daca   ,


 , sunt diferentiabile de doua ori n raport

cu , atunci se obtine ca solutie a sistemului


 








5.3. Metode pentru estimarea parametrilor

257

 de mai sus, numit indicatorul lui Pear-

Observatia 5.3.15. In locul expresiei lui


son, se pot utiliza alte expresii ca:

 

 



 

 

 

 








 




ln

  ln






indicatorul de verosimilitate




indicatorul lui Kullbach

  
ln 
ln




indicatorul lui Neyman

indicatorul lui Berkson

5.3.4 Metoda intervalelor de ncredere




Se considera caracteristica  cu legea de probabilitate    , unde parametrul ne


   , numit
cunoscut   . Fie
 o selectie repetata de volum si numarul
probabilitate de risc, 
numindu-se probabilitate de ncredere.

Definitia 5.3.16. Numim interval de ncredere pentru parametrul , intervalul aleator

  



           
 
 

  
unde statisticile  si  sunt astfel ncat
iar intervalul

  

           



    

     
   
numeric  

intervalului de ncredere pentru parametrul .

 

se numeste valoarea

Observatia 5.3.17. Pentru determinarea intervalului de ncredere se considera o statistica


      , care urmeaza o lege de probabilitate cunoscuta, dar

n expresia careia apare parametrul . Se determina apoi intervalul numeric   

    
astfel ncat

relatie care se va scrie, n mod echivalent,


    



Observatia 5.3.18. Cu cat este mai mic si intervalul de ncredere are lungimea mai
mica cu atat estimatia parametrului necunoscut este mai buna.

 

 

  
Observatia 5.3.19. Din relatia

, intervalul    nu este
determinat n mod unic.
De la problema la problema se mai adauga o conditie suplimentara, de exemplu


fixarea valorii fie a lui , fie a lui . De asemenea, se poate considera o legatura
 
ntre si  data de anumite ipoteze de lucru.

258

Teoria estimatiei

Interval de ncredere pentru media teoretica dispersie cunoscuta


Se considera caracteristica  ce urmeaza legea normala
 , unde   este

necunoscut, iar   este cunoscut.
Pentru construirea unui interval de ncredere pentru media teoretica
necunoscuta efectu
a
m
o
select

ie
repetat
a
de
volum
s

i
consider
a
m
probabilitatea
de

 
ncredere 
data, 
.
Se construies te statistica








 
care urmeaza legea normala
 (a se vedea Observatia 4.2.6). Prin urmare, pen
tru dat determinam intervalul numeric    astfel ncat


 

unde








 






 

este functia lui Laplace. Functia lui Laplace estetabelat


I pentru valori
  anAnexa
.
pozitive ale argumentului, avand n vedere ca
Deoarece dubla inegalitate


este echivalenta cu

     
 







  



rezulta ca  
adica      este un interval de ncredere
 
pentru media teoretica .

Desigur ca intervalul numeric    nu este n mod unic determinat. Daca nu
exista nici o informatie suplimentara relativa la valoarea medie, atunci se va considera

intervalul de ncredere de lungime minima, pentru fixat,
si se obtine cand 
.












In acest caz 
 , va fi dat prin relatia



ceea



     

ce este echivalent cu

Cand se foloseste functia lui Laplace definita prin






 

 

5.3. Metode pentru estimarea parametrilor

 
atunci   se determina din relatia
 

de ordin  
Intervalul de ncredere pentru parametrul

        
        

(5.3.1)

259



 si reprezinta de fapt cuantila

are extremitatile


  

   





 




Observatia 5.3.20. Geometric, daca se considera graficele functiei de repartitie si


 
densitat ii de probabilitate a legii normale
 , modul de obtinere a cuantilei 
este prezentat n Figura 5.1. Adica, fie intersectand graficul functiei de repartitie a
 

legii normale
 cu dreapta de ecuatie
, fie alegandul pe  astfel ca aria
umbrita de sub graficul densitatii de probabilitate sa fie .
1

y=

0
z

Figura 5.1: Determinarea cuantilei 


Observatia 5.3.21. Daca exista o informatie relativa la valoarea medie 
de forma ca
 


  ,
aceasta nu este limitata superior, atunci intervalul numeric


care conduce la intervalul de ncredere

           


In mod analog, daca se cunoaste ca valoarea medie nu este limitata inferior, adica
are tendinta de a avea valori mici n raport cu ceea ce ne asteptam, atunci intervalul

260

Teoria estimatiei

numeric



,

care conduce la intervalul de ncredere



           


Pe baza teoremei limita centrala avem ca rezultatul obtinut se mentine cand  ur
meaza o lege de probabilitate oarecare, pentru  (a se vedea Proprietatea 4.2.7).
Exemplul 5.3.22. Relativ la populatia se cerceteaza caracteristica  privind media teoretica

. Stiind ca dispersia teoretica a caracteristicii  este





, sa se stabileasca un
 interval de ncredere pentru media teoretica
cu probabilitatea de ncredere 
, utilizand distributia empirica de
selectie
 

    
  





 







Deoarece volumul selectiei este
  , putem considera ca statistica






unde

 

 
 . Asadar, extremitat ile intervalului de ncredere penurmeaza legea normala
tru media teoretica sunt date prin (5.3.1). Calculam valorile acestor extremitat i pe
baza datelor de selectie.

Valoarea mediei de selectie  este

 
 


                

 
iar din Anexa I, pentru 
De asemenea, avem ca






, se gaseste









 


 .

 

Obtinem, n acest fel, intervalul de ncredere pentru media teoretica



     
         

 


 

  







  

Programul 5.3.23. Calculele pot fi facute cu urmatorul program Matlab:



5.3. Metode pentru estimarea parametrilor

261

x=[22.7,22.8*ones(1,3),22.9*ones(1,7),23*ones(1,4),...
23.1*ones(1,6),23.2*ones(1,7),23.3*ones(1,5),23.4*ones(1,2)];
s=sqrt(0.35)*norminv(0.975)/sqrt(35);ma=mean(x);
m1=ma-s; m2=ma+s;
fprintf( (m1,m2)=(%6.3f,%6.3f),m1,m2)

si care, n urma executarii, afiseaza rezultatul


(m1,m2)=(22.881,23.273)

Interval de ncredere pentru media teoretica dispersia necunoscuta


In conditiile sectiunii precedente, dar cu    necunoscut, se va considera statistica








care, conform Proprietatii 4.2.26, urmeaza legea Student cu



Se determina intervalul numeric    astfel ncat

unde








     





 
    



 
    
 




 grade de libertate.

  

este functia de repartitie a legii Student cu grade de libertate si care este tabelata,
pentru anumite valori, n Anexa II.


 

    
Luand 
, avem ca     


 iar







  


  , deci, intervalul de ncredere pentru media teoretica
are extremitatile date prin

(5.3.2)

        
 
       
 

Observatia 5.3.24. Daca exista o informatie relativa la valoarea medie de forma ca


aceasta nu este limitata superior, adica are tendinta 
de a avea valori mai mari decat


   , care conduce la
cele asteptate, atunci intervalul numeric   
 
intervalul de ncredere pentru :

 


 
    

262

Teoria estimatiei

In mod analog, daca se cunoaste ca valoarea medie nu este limitata inferior, atunci

   , care conduce la intervalul de ncredere
intervalul numeric   


            
 
Observatia 5.3.25. Geometric, daca se consider
 a graficele functiei de repartitie si
densitat ii de probabilitate a legii Student cu
grade de libertate, modul de obtinere




a cuantilei
este prezentat n Figura 5.2.

1

y=

0
t

tn1,

n1,

Figura 5.2: Determinarea cuantilei

 


Din teorema limita centrala avem ca rezultatele pot fi aplicate pentru o caracte
ristica  ce urmeaza o lege de probabilitate oarecare, pentru  .
Exemplul 5.3.26. Pentru receptionarea unei marfi ambalata n cutii, se efectueaza un

control, prin sondaj, privind greutatea  a cutiilor. Pentru
de cutii cantarite s-a
obtinut distributia empirica de selectie, relativ la caracteristica  :



















Folosind probabilitatea de ncredere
, sa determinam un interval de ncredere
pentru valoarea medie a greutatii cutiilor, presupunand ca  urmeaza legea normala
 
.

5.3. Metode pentru estimarea parametrilor


Deoarece abaterea standard
tistica

263

  este necunoscuta, se considera sta-





care urmeaza legea Student cu


 grade de libertate.
Extremitatile intervalului de ncredere pentru valorea medie teoretica

sunt date prin 
(5.3.2).



 
Pentru

 si 
, din Anexa II se determina

  
 .
 
De asemenea, folosind datele de selectie, obtinem valoarea  a mediei de selectie

 , anume



  

               

 

si valoarea abaterii standard de selectie






 

     

  


 





Putem scrie atunci intervalul (numeric) de ncredere




           
 
 






 
    
 
 
 

 
 


 

Programul 5.3.27. Daca se executa programul Matlab


x=[2.7,2.8*ones(1,2),2.9*ones(1,5),3*ones(1,3),...
3.1*ones(1,5),3.2*ones(1,4),3.3*ones(1,2)];
ma=mean(x); va=var(x);
s=tinv(0.99,21)*sqrt(va)/sqrt(22);
m1=ma-s; m2=ma+s;
fprintf( (m1,m2)=(%6.3f,%6.3f),m1,m2)

relativ la problema precedenta, se obtine intervalul de ncredere:


(m1,m2)=( 2.942, 3.122)

Interval de ncredere pentru dispersie


Consideram caracteristica  ce urmeaza legea normala
  cu   necu
noscut si   necunoscut. Determinam un interval de ncredere pentru dispersia
teoretica   a caracteristicii  .


264

Teoria estimatiei
Statistica ce se considera n acest caz este

  
 




    


  

 cu
care, conform Proprietatii 4.2.25, urmeaza legea

  
Se determina intervalul numeric
 astfel nat

 grade de libertate.

 
   


 
  
     

 





  




  




este functia de repartitie a legii
cu
grade de libertate si este tabelata, pentru
unde





anumite valori, n Anexa III.


Daca se alege 
   si


se obtine

(5.3.3)



    


     







   , adica astfel ncat


 

si


    
 

, unde

     

 

     

 

  
  

  
 
 
  



Observatia 5.3.28. Modul geometric de obtinere a cuantilei   este prezentat n



Figura 5.3, daca se consider
a graficele functiei de repartitie si densitatii de probabili
tate a legii  cu
 grade de libertate.
Exemplul 5.3.29. Fie  caracteristica ce reprezinta timpul de producere a unei
 
reactii chimice, masurat n secunde. Daca  urmeaza legea normala
 si


avand o selectie repetata de volum
, cu datele de selectie  ,  ,
,

 

 

 ,
,
 ,
, ,
,  , vom determina intervalul de ncredere


 si pentru abaterea standard 


pentru dispersia  

 , cu

probabilitatea de ncredere
.
Se considera statistica

  
  


unde

 

 
     







 

 

5.3. Metode pentru estimarea parametrilor

265

y=

2
n1,

2
n1,

 

Figura 5.3: Determinarea cuantilei

care urmeaza legea  cu


 grade de libertate. Extremitatile intervalului de

ncredere pentru  vor fi date prin (5.3.3).
Pentru determinarea valorilor numerice ale acestor intervale de ncredere, calculam:

 



  
  






 


    


 

      









Asadar, intervalele de ncredere pentru   si  sunt


  
 

 

 




 
respectiv

 





 



 

 si

 


 





   




 

Programul 5.3.30. Un program Matlab, care sa rezolve aceasta problema, ar putea


fi urmatorul:
x=[4.21,4.03,3.99,4.05,3.89,3.98,4.01,3.92,4.23,3.85,4.20];
va=var(x); c1=chi2inv(0.025,10); c2=chi2inv(0.975,10);

266

Teoria estimatiei
v1=10*va/c2; v2=10*va/c1; s1=sqrt(v1); s2=sqrt(v2);
fprintf( (v1,v2)=(%6.3f,%6.3f)\n,v1,v2)
fprintf( (s1,s2)=(%6.3f,%6.3f),s1,s2)

In urma executarii, se obtin intervalele de ncredere pentru dispersie si respectiv pentru abaterea standard:
(v1,v2)=( 0.008, 0.052)
(s1,s2)=( 0.091, 0.229)

Interval de ncredere pentru raportul dispersiilor


Se considera caracteristicile
independente
 si  fiecare urmand legea normala,
 
  
  si
 . Relativ la celedoua caracteristici se considera
respectiv
cate o selectie repetata, respectiv
de volume si . Vom determina un interval de



 corespunzator probabilitatii de ncredere 
ncredere pentru raportul 
data.
Pentru aceasta se considera statistica












 





care, conform
Proprietatii 4.2.30, urmeaza legea FisherSnedecor cu
 
 grade de libertate.

Se determina intervalul numeric    astfel ncat

unde

 




 

      

  


 
   

 
   


 si

 



este functia de repartitie a legii FisherSnedecor cu si grade de libertate si care


este tabelata pentru anumite valori n Anexa IV.
Daca se alege      si      , adica astfel ncat




     

atunci




  


(5.3.4)



si







     






    




Aceasta relatie pune n evidenta intervalul de ncredere pentru raportul celor doua
dispersii.

5.3. Metode pentru estimarea parametrilor

267

Observatia 5.3.31. Modul geometric de obtinere a cuantilei    este prezentat n


Figura 5.4, daca se considera graficele functiei de repartitie si densitatii de probabilitate a legii FisherSnedecor cu si grade de libertate.
1

y=

0
f

fm,n,

m,n,

Figura 5.4: Determinarea cuantilei

  

Exemplul 5.3.32. Se cerceteaza precizia cu care doua masini produc conserve de


acelasi tip. Pentru aceasta, se considera cate un esantion din conservele produse de
cele doua masini si se masoara greutatea acestora.
Fie  greutatea n grame a unei

conserve produsa de prima masina, respectiv  pentru a doua masina. Masuratorile
obtinute sunt:


 






  







   
 

  





 
 

 




 

  
    
 
 
 

 





Sa se calculeze
de ncredere pentru raportul abaterilor standard, adica
 un interval

 

  

 folosind probabilitatea de risc  .


pentru 




Vom considera ca cele dou


a caracteristici  si   sunt independente si ca ur 

meaza legile normale
  si respectiv
 .
Statistica
ce se utilizeaza pentru stabilirea intervalului de ncredere pentru rapor

tul   este










 





268

Teoria estimatiei


care urmeaza legea FisherSnedecor cu


de libertate.
Intervalul de ncredere este dat prin (5.3.4).
Pentru aceasta avem ca

 






 

 
 


 

 



 




 



     
    

 
   

  
  
 





 




 si

 
 



 




  









 

  

 grade

 


  

    


 
   








  






Pe de alta parte, se obtin cuantilele

   





   

 

pe baza Anexei IV. Facem observatia ca n acest calcul s-a avut n vedere ca


   

   

adica







   
 



Se ajunge astfel la faptul ca








 
  

 

 
 

  

La acelasi rezultat se ajunge si daca se considera statistica









 

Programul 5.3.33. Programul Matlab, care urmeaza, calculeaza intervalele de


ncredere pentru raportul dispersiilor, respectiv al abaterilor standard, pentru datele
considerate n problema precedenta.
x1=[1021,980,988,1017,1005,998,1014,985,995,1004,...
1030,1015,995,1023,1008,1013];
x2=[1003,988,993,1013,1006,1002,1014,997,1002,1010,975];
v1=var(x1); v2=var(x2); r=v1/v2;

5.3. Metode pentru estimarea parametrilor

269

f1=finv(0.025,10,15); f2=finv(0.975,10,15);
r1=f1*r; r2=f2*r; s1=sqrt(r1); s2=sqrt(r2);
fprintf( (r1,r2)=(%6.3f,%6.3f)\n,r1,r2)
fprintf( (s1,s2)=(%6.3f,%6.3f),s1,s2)

In urma executarii programului, sa obtinut:


(r1,r2)=( 0.445, 4.795)
(s1,s2)=( 0.667, 2.190)

Interval de ncredere pentru diferenta mediilor


Caracteristicile
independente  si  urmeaza respectiv legile
normale
 




si
  . Folosind cate o selectie repetata de volum si pentru cele doua
caracteristici, vrem sa determinam un interval de ncredere pentru diferenta
.
Distingem urmatoarele trei situatii:




A. abaterile standard ale celor doua caracteristici sunt cunoscute,


B. abaterile standard sunt necunoscute, dar se stie ca sunt egale,
C. abaterile standard sunt necunoscute si diferite,
pe care le tratam pe rand n continuare.
A. Abaterile standard

 si 


Se considera statistica

sunt cunoscute.

       
 




 

(5.3.5)





 
 (a se vedea Observatia 4.2.29). Astfel, pencare urmeaza legea normala
 

 data, se poate determina intervalul numeric
tru probabilitatea de risc

     



 
astfel ncat  
Anume,  
 




 
 
 , unde
se calculeaza din relatia


 




e 

este functia lui Laplace, tabelata n Anexa I. Se ajunge astfel la relatia


(5.3.6)




 






 




270

Teoria estimatiei

unde












care pune n evidenta extremitatile intervalului de ncredere pentru diferenta celor


doua medii.
B. Abaterile standard

 si 




sunt egale cu , dar necunoscut.

Se considera statistica

     
 
 
  

(5.3.7)



unde




 
  

   
 

 










    


 





 


 

  


  
si care urmeaza legea Student cu
grade de libertate (a se vedea
Proprietatea 4.2.28).
Ca la punctul precedent se obtin extremitatile intervalului de ncredere

(5.3.8)
unde

 


 


  




 
 

 




  
 


  este cuantila de ordin   pentru legea Student cu




 

C. Abaterile standard

 si 


Se considera statistica

care urmeaza legea Student cu


(5.3.10)

   
 


grade de libertate.

sunt diferite si necunoscute.

       
 




 

(5.3.9)







grade de libertate si care se calculeaza prin formula


 
 





 

unde





 



Ca la punctul precedent se ajunge la extremitatile intervalului de ncredere pentru


diferenta celor doua medii:
(5.3.11)

    




 







  




5.3. Metode pentru estimarea parametrilor

271


Exemplul 5.3.34. Masinile  si  ambaleaz
a carne n pachete de 
grame.

 
Greutatea cutiilor este o caracteristic
a

,
ce
urmeaz
a
legea
normal
a
  si

  
respectiv o caracteristica  , ce urmeaza legea normala
 .


Cantarind  de pachete din cele produse de masina
sa obtinut valoarea


mediei de selectie
  grame, iar din cantarirea a  de pachete de la masina


grame.
 sa obtinut 

Folosind probabilitatea
de

ncredere
, sa determinam intervalul
de ncredere





pentru diferenta
, daca se stie ca abaterile standard sunt 
si 
.
 
Se foloseste statistica (5.3.5), care 
urmeaz
a
legea
normal
a

.
Astfel,
inter
valul de ncredere pentru diferenta
este dat prin (5.3.6), unde   se deter 
       

.
mina astfel ca
 . Folosind Anexa I, obtinem  



De asemenea, avem ca

  



















Astfel, intervalul de ncredere pentru diferenta











 

este

   
   




    
 

     




  

 





Programul 5.3.35. Executarea programului Matlab:


z1=norminv(0.01,0,1); z2=norminv(0.99,0,1);
s=sqrt(9/100+16/150); d=1007-1002;
m1=d+z1*s; m2=d+z2*s;
fprintf( (m1,m2)=(%6.3f,%6.3f),m1,m2)

conduce la rezultatul:
(m1,m2)=( 3.968, 6.032)

Exemplul 5.3.36. Fie caracteristica  ce urmeaza legea normala


  si care
reprezint
a vanzarile n milioane lei pe saptamana la magazinele alimentare n orasul

si  vanzarile n milioane
lei la magazinele alimentare din orasul  si care ur 
. Sau efectuat dou
meaz
a
legea
normal
a

a sondaje, respectiv pentru  si

 si sau obtinut urmatoarele date de selectie:


     
      













 







272

Teoria estimatiei


Cu probabilitatea de
ncredere
, vrem sa se construim un interval de ncredere
 


pentru diferenta
, daca   este necunoscut.

  
Folosind statistica (5.3.7), care urmeaza legea Student cu

 

grade de libertate, se va construi intervalul de ncredere pentru
. Anume,
acest interval de ncredere este precizat prin (5.3.8).
Pentru a determina valoarea numerica a intervalului de ncredere, se calculeaza
pe rand



 



 


 



                 



             
 


 




  

 

  

   

 

  



 si

va fi


         
    



 

  

 
 

 

  

 
 



 


De asemenea, din Anexa II, pentru 


astfel ca intervalul de ncredere pentru





 

  



, obtinem

 

    

 

  


,


 

Programul 5.3.37. Prin executarea programului Matlab:


x1=[226.5,224.1,218.6,220.1,228.8,229.6,222.5];
x2=[221.5,230.2,223.4,224.3,230.8,223.8];
ma1=mean(x1); ma2=mean(x2); md=ma1-ma2;
v1=var(x1); v2=var(x2);
t1=tinv(0.025,11); t2=tinv(0.975,11);
s=sqrt((1/7+1/6)/11)*sqrt(6*v1+5*v2);
m1=md+t1*s; m2=md+t2*s;
fprintf( (m1,m2)=(%6.3f,%6.3f)\n,m1,m2)

regasim intervalul de ncredere pentru diferenta valorilor medii:


(m1,m2)=(-6.324, 3.619)


Exemplul 5.3.38.
Se
consider
a
dou
a
aparate
de

mbuteliat
vin

n
sticle
de

ml. Fie

a cantitatea de vin (n ml) mbuteliata de primul aparat
caracteristica  ce reprezint

ntr-o sticla si respectiv  aceeasi caracteristica pentru al doilea aparat. Pentru compararea modului de mbutliere pentru cele doua aparate, se considera cate o selectie
din sticlele mbuteliate de cele doua aparate, respectiv
               
          

5.3. Metode pentru estimarea parametrilor

273

Vom construi un interval de ncredere pentru diferenta


  

folosind
probabilitatea de risc
. Vom considera ca cele
doua caracteristici
 
  
 si
  si   sunt independente si ca urmeaza legile normale

 .


Distingem doua cazuri, unul cand se stie ca    , caz
 n care se foloseste
statistica (5.3.7), care urmeaz
a
legea
Student
cu
grade de libertate,
 

respectiv cand se stie ca 
 , caz n care se foloseste statistica (5.3.9), care
urmeaza legea Student cu grade de libertate. Numarul al gradelor de libertate se
calculeaza, n acest caz, cu formula (5.3.10)


In cazul 
, extremitatile intervalului de ncredere pentru diferenta  
sunt date prin formulele






       
 


       
 




Cuantila

 

  




Pe de alta parte





  







 



Astfel avem ca



 
 














  
 



   
 

  
 



 
 







   
  
 
 









, s-a determinat, conform Anexei II, din relatia

    
    

  

  
 



 
 

 
 
 

 




 

 

 



  



  



  

















 
 

 

  

  


       
 
           
 

 



274

Teoria estimatiei

  


Pentru cazul
Astfel avem ca









  





iar apoi


, calculam prima data numarul





 









al gradelor de libertate.

  

 

 




 

   



Avand n vedere ca






 






de unde avem ca
.
Extremitatile intervalului de ncredere sunt date prin


        

 



        

 


  




  

 
 







 rezulta ca

   


 



 












 





Programul 5.3.39. Programul Matlab, care urmeaza, rezolva problema precedenta,


adica, va determina intervale de ncredere pentru diferenta mediilor, n cele doua
cazuri, cand se considera dispersii egale si necunoscute, respectiv dispersii diferite
necunoscute.
x1=[746,743,748,748,750,745,744,753,750,751,743,747,749,742];
x2=[749,748,748,753,750,749,747,745,744,751];
ma1=mean(x1); ma2=mean(x2); md=ma1-ma2;
v1=var(x1); v2=var(x2);
t1=tinv(0.025,22); t2=tinv(0.975,22);
s=sqrt((1/14+1/10)/22)*sqrt(13*v1+9*v2);
m1=md+t1*s; m2=md+t2*s;
fprintf( (m1,m2)=(%6.3f,%6.3f)\n,m1,m2)
c=(v1/14)/(v1/14+v2/10);n=c2/13+(1-c)2/9;
n=ceil(1/n); t1=tinv(0.025,n); t2=tinv(0.975,n);
s=sqrt(v1/14+v2/10); m1=md+t1*s; m2=md+t2*s;
fprintf( (m1,m2)=(%6.3f,%6.3f)\n,m1,m2)

Dupa executarea programului, se obtin cele doua intervale de ncredere:


(m1,m2)=(-3.990, 1.333)
(m1,m2)=(-3.888, 1.231)

5.3. Metode pentru estimarea parametrilor

275

5.3.5 Metoda intervalelor de ncredere pentru selectii mari





Fie caracteristica  cercetata, cu legea de probabilitate    , unde  
este un parametru necunoscut. Consideram o selectie repetata de volum relativa la



caracteristica  , pentru care avem variabilele de selectie   
.

Proprietatea 5.3.40. Daca se considera variabilele aleatoare


prin relatia


ln     

  

 definite

si pentru care exista dispersia

  


   



pentru


, atunci statistica







, urmeaza legea normala

 



ln 

   



.

independente si identic reDemonstratie. Variabilele aleatoare  ,


 , fiind



partizate, rezulta ca si variabilele aleatoare ,
 , sunt independente si identic
repartizate. Conform teoremei limita centrala, avem ca




rezulta ca 


   



converge n repartitie la legea normala



Deoarece

 

 



ln 

.

  





, ceea ce ncheie demonstratia.


Pentru probabilitatea
de ncredere 
data se va determina intervalul numeric




           
    
astfel ncat 












 
 
 Functia
Ceea ce revine la determinarea cuantilei   astfel ncat




a lui Laplace este aici, cea tabelata n Anexa I.

 
Prin operatii algebrice se nlocuieste inegalitatea   
inega , cu dubla



















litate echivalenta de forma
   
  care
  
defineste intervalul de ncredere pentru parametrul .

Aplicatia 5.3.41.
 si 
cu probabilit
at ile 
  Fie caracteristica  ce ia numai valorile


 





si respectiv 
, adica are functia de frecventa  


   
unde
 este un parametru necunoscut.

276

Teoria estimatiei

Vom folosi metoda intervalelor de ncredere pentru selectii mari n vederea estimarii parametrului  .Consideram o selectie repetata de volum
(mare) si probabi
litatea de ncredere 
. Deoarece ln       ln 
   ln    avem
ca
  
  
ln     
  



 

si prin urmare se obtine statistica






 
  
 


rezulta

ln    



Stiind ca



Statistica









 

   





sau




  


 


 



 
 .
si care urmeaza legea normala
 , cand

Pentru dat, se determina 
astfel ncat


Putem scrie ca   
este echivalenta cu


 






 devine asadar

  


  



 


  

  
 

 



  
Discriminantul trinomului este pozitiv, anume


deci inecuatia n  are solutia de forma unui interval    si care va reprezenta
intervalul de ncredere pentru parametrul  .
Astfel extremitatile intervalului de ncredere au urmatoarele expresii:





      

 
     
  
 


         
 
    

  
 
 

5.3. Metode pentru estimarea parametrilor

277

Aceste formule de calcul sunt complicate. Avand n vedere ca aceste formule au



fost deduse pentru mare, sa zicem  , cand se obtin rezultate bune, putem
face simplificari ale acestor formule. In primul rand putem folosi urmatoarea scriere
asimptotica




iar apoi


     


     

  




    
  


    


S-a ajuns, n acest mod, la intervalul de ncredre pentru 

 


  





    







  


  




Observatia 5.3.42. Daca se doreste sa se determine


parametrul  cu o incertitudine


, pentru o probabilitate de ncredere 
, atunci volumul selectiei se determina
n felul urmator. Avand n vedere ca


 



     


    conduce la volumul optim al




conditia
, echivalenta cu
selectiei.
Mai jos prezentam un tabel cu valorile optime ale volumului selectiei pentru diferite valori ale nivelului de ncredere si ale lui  :


0.90

0.95

0.98

0.01

6760

9600

13530

0.02

1700

2400

3380

0.05

270

380

540

5.3.6 Functii Matlab privind estimatia


Sistemul Matlab, prin Statistics toolbox, dispune de functii corespunzatoare teoriei
estimatiei, pe care le prezentam n continuare.

278

Teoria estimatiei

Functia histfit
Functia histfit are drept rezultat reprezentarea pe aceeasi figura a histogramei si
 
.
a densitat ii legii normale
Lansarea executarii functiei se face prin una din formele
histfit(x)
histfit(x,nc)

unde x este un vector ce contine datele ce urmeaza a fi prelucrate, iar nc este numarul
claselor. Daca parametrul nc este absent, atunci numarul claselor se considera ca
fiind radicalul volumului datelor, adica radicalul lungimii vectorului x.
Programul 5.3.43. Programul urmator genereaza n numere aleatoare, ce urmeaza
legea normala
, dupa care
 apeleaza la functia histfit, iar graficul obtinut,
pentru n=100,
 si 
, este prezentat n Figura 5.5.
n=input(n=); mu=input(mu=);
s=input(sigma=);x=normrnd(mu,s,1,n);
histfit(x), colormap spring

20

18

16

14

12

10

10

Figura 5.5: Legea

12

14

16

 
 

Functia mle
Pentru estimarea parametrilor, folosind metoda verosimilitat ii maxime, precum si
metoda intervalelor de ncredere, poate fi utilizata functia mle. Apelul functiei se
poate face prin una din instructinile:

5.3. Metode pentru estimarea parametrilor

279

P=mle(lege,x)
[P,int]=mle(lege,x)
[P,int]=mle(lege,x,alpha)
[P,int]=mle(lege,x,alpha,n)

unde lege specifica una din legile: bernoulli, unid, bino, poiss, geo,
unif, norm, gam, exp, beta, weib si rayl. Parametrul x este un vector, iar n
urma executarii unei astfel de instructiune, P si int vor contine estimatori de verosimilitate maxima, respectiv intervale de ncredere, pentru parametrii legii considerate,
obtinute pe baza datelor continute de x.
Parametrul optional alpha, avand valoarea implicita alpha=0.05, specifica
probabilitate de ncredere, 1-alpha, n construirea intervalelor de ncredere.
Ultima forma este specifica numai legii binomiale, adica lege=bino, parame
trul n fiind parametrul cel de la legea  n  . Daca x si n sunt scalari, se returneaza
n P raportul acestora, daca x este vector si n este scalar, se va returna n P fiecare
element a lui x mpartit la n, iar daca x si n sunt vectori de aceleasi dimensiuni, P va
contine rapoartele pe componente ale lui x si n.
Mai remarcam ca pentru prima data ntalnim legea lui Bernoulli, care reprezinta

cazul particular al legii binomiale,    . Daca lege=bernoulli, atunci x, desigur, trebuie sa contina numai valorile 0 si 1.
Functia 5.3.44. Vom scrie o functie, care genereaza n numere aleatoare ce urmeaza
una din legile de probabilitate: uniforma discreta, Poisson, uniforma, normala, Gamma, exponentiala, Weibull si Rayleigh. Se va apela aceasta functie pentru obtinerea
estimatiilor de verosimilitate maxima ale parametrilor legii de probabilitate considerate. De asemenea, se va reprezenta grafic, pe aceeasi figura, functia de repartitie a
legii de probabilitate considerata, mpreuna cu functia de repartitie a aceleasi legi, dar
avand parametrii precizati nlocuiti cu estimatiile acestora.
function veros(lege,n)
switch lege
case unid
P1=input(N=);
case poiss
P1=input(lambda=);
case unif
P1(1)=input(a=); P1(2)=input(b=);
case norm
P1(1)=input(mu=); P1(2)=input(sigma=);
case gam
P1(1)=input(a=); P1(2)=input(b=);
case exp
P1=input(mu=);
case beta
P1(1)=input(a=); P1(2)=input(b=);
case weib
P1(1)=input(a=); P1(2)=input(b=);

280

Teoria estimatiei
case rayl
P1=input(b=);
otherwise
error(Eroare)
end
if length(P1)==1
x=random(lege,P1,1,n);
else
x=random(lege,P1(1),P1(2),1,n);
end
P2=mle(lege,x); xx=min(x):0.01:max(x);
if length(P1)==1
F1=cdf(lege,xx,P1); F2=cdf(lege,xx,P2);
else
F1=cdf(lege,xx,P1(1),P1(2)); F2=cdf(lege,xx,P2(1),P2(2));
end
plot(xx,F1,k-.,xx,F2,k-)
legend(Functia de repartitie teoretica,...
Functia de repartitie estimata,2)

Apelul functiei veros se face prin


>>veros(lege,n)

unde valorile pentru n si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>veros(poiss,50)

are ca efect apelul functiei pentru legea lui Poisson, iar pe ecran se va cere introducerea parametrului lambda, dupa care pe ecran va fi reprezentat graficul din Figura 5.6,
n cazul n care lambda=7. Sa remarcam totusi ca la un nou apel, cu aceeasi parametri, graficul difera, deoarece sunt generate alte numere aleatoare.
Daca se considera comanda
>>veros(norm,50)

are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introducerea parametrilor mu si sigma, dupa care pe ecran va fi reprezentat graficul din
Figura 5.7, n cazul n care mu=10 si sigma=2.
Functiile normlike, gamalike,betalike si weiblike
Functiile normlike, gamlike, betalike si weiblike sunt specifice pentru
Statistics toolbox si se pot apela cu una din comenzile
L=numef(par,x)
[L,cov]=numef(par,x)

unde numef reprezinta numele uneia din cele patru functii.


Parametrul par contine respectiv parametrii legilor normala, gamma, beta si
Weibull, iar x este un vector, care contine datele de selectie.

5.3. Metode pentru estimarea parametrilor

281

1
Functia de repartitie teoretica
Functia de repartitie estimata
0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

Figura 5.6: Legea

10

12

14



1
Functia de repartitie teoretica
Functia de repartitie estimata
0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

Figura 5.7: Legea

10

11

 
 

12

13

14

282

Teoria estimatiei

Prima forma returneaza n L valoarea logaritmului functiei de verosimilitate de


parametrii precizati prin par, nmultita cu -1.
Daca se foloseste a doua forma, se mai returneaza matricea var, care reprezinta
valoarea asimptotica a matricei covariantelor estimatorilor parametrilor legii considerate, cand sau considerat parametrii de intrare par, ca fiind estimatiile de verosimilitate maxima ale acestora. Remarcam faptul ca var reprezinta inversa matricei
informatiei lui Fisher, cand volumul selectiei tinde la infinit.
Functiile binofit, poissfit, unifit, normfit,
gamfit, expfit, betafit, raylfit si weibfit
Functiile Matlab din aceasta categorie returneaza estimatii punctuale si intervale de
ncredere pentru parametrii respectiv ai legilor de probabilitate binomiala , Poisson,
uniforma, normala, Gamma, exponentiala, Beta, Rayleigh si Weibull.
Apelul acestor functii nu are o sintaxa generala.
Pentru functia binofit se pot folosi comenzile
P=binofit(x,n)
[P,int]=binofit(x,n)
[P,int]=binofit(x,n,alpha)

parametrul x fiind un vector, iar n precizeaza parametrul ntreg pozitiv al legii binomiale  n  . Pentru functiile poiss si exp, respectiv pentru gam, beta, rayl
si weib, apelurile sunt de forma:
P=numef(x)
[P,int]=numef(x,alpha)

unde parametrul numef reprezinta numele functiei, iar x este fie un vector, fie o
matrice, pentru prima grupa de functii, iar pentru a doua, numai vector. Daca x este
matrice, atunci functia opereaza pentru fiecare coloana n parte.
Pentru legile unif si norm, apelurile sunt:
[par1,par2,int1,int2]=unifit(x)
[par1,par2,int1,int2]=normfit(x,alpha)

unde x poate fi vector sau matrice. In al doilea caz, operatiunea se executa pentru
fiecare coloana n parte.
De regula, estimatiile punctuale returnate, sunt obtinute prin metoda verosimilitatii maxime, folosinduse datele continute n parametrul x, n parametrii P, par1
si par2. Intervalele de ncredere sunt returnate n parmetrii int, int1 si int2, si
sunt determinate folosind probabilitatea de ncredere 1-alpha. Valoarea implicita
pentru alpha fiind alpha=0.05.
Pentru legile unif si norm, n comenzile de apel pot lipsi int2, int1 si par2,
caz n care sunt returnate numai valorile parametrilor ramasi.
Mai remarcam faptul ca int, int1 si int2 au cate doua componente, extremitatile intervalului de ncredere corespunzator.

5.3. Metode pentru estimarea parametrilor

283

Functia 5.3.45. Vom scrie o functie, care genereaza n numere aleatoare, ce urmeaza
una din legile Gamma, Beta, Weibull si Rayleigh. Folosind aceste numere, se vor
da estimatii punctuale pentru parametrii acestora, precum si intervale de ncredere,
considerand o probabilitate de ncredere 1-alpha specificata. Folosind estimatiile
punctuale obtinute pentru parametri, se vor reprezenta grafic densitatile de probabilitate, folosind parametrii estimati si respectiv parametrii considerati la generarea
numerelor aleatoare. De asemenea, se vor afisa intervalele de ncredere obtinute.
function estimat(lege,n,alpha)
switch lege
case gam
a=input(a=); b=input(b=);
x=gamrnd(a,b,n,1); [P,I]=gamfit(x,alpha);
case beta
a=input(a=); b=input(b=);
x=betarnd(a,b,n,1); [P,I]=betafit(x,alpha);
case weib
a=input(a=); b=input(b=);
x=weibrnd(a,b,n,1); [P,I]=weibfit(x,alpha);
case rayl
b=input(b=); x=raylrnd(b,n,1);
[P,I]=raylfit(x,alpha);
otherwise
error(Eroare)
end
t=min(x):0.01:max(x);
if length(P)==1
y=pdf(lege,t,P); yy=pdf(lege,t,b);
fprintf( bbarat=%6.3f\n,P)
fprintf( (b1,b2)=(%6.3f,%6.3f)\n,I)
else
y=pdf(lege,t,P(1),P(2)); yy=pdf(lege,t,a,b);
fprintf( abarat=%6.3f, bbarat=%6.3f\n,P)
fprintf( (a1,a2)=(%6.3f,%6.3f)\n,I(1,1),I(2,1))
fprintf( (b1,b2)=(%6.3f,%6.3f)\n,I(1,2),I(2,2))
end
plot(t,y,k-,t,yy,k-.), plot(t,y,k-,t,yy,k-.)
legend(Legea estimata, Legea teoretica)

Apelul functiei estimat se face prin


>>estimat(lege,n,alpha)

unde valorile pentru n, lege si alpha, fie ca sunt precizate n acest apel, fie sunt
precizate nainte. De exemplu, comanda
>>estimat(beta,500,0.01)

are ca efect apelul functiei pentru legea Beta, iar pe ecran se va cere introducerea
parametrilor a si b, dupa care pe ecran va fi reprezentat graficul din Figura 5.8, n
cazul n care a=3 si b=7. Sa remarcam totusi ca la un nou apel, cu aceeasi parametri,
graficul difera, deoarece sunt generate alte numere aleatoare. De asemenea, se vor
afisate si estimatiile punctuale, respectiv intervalele de ncredere:

284

Teoria estimatiei
3
Legea estimata
Legea teoretica

2.5

1.5

0.5

0.1

0.2

0.3

0.4

Figura 5.8: Legea 


abarat= 2.925, bbarat= 7.130
(a1,a2)=( 2.431, 3.418)
(b1,b2)=( 5.928, 8.333)

0.5

0.6

 


0.7

0.8

Capitolul 6

Verificarea ipotezelor statistice


6.1 Concepte de baza
Fie colectivitatea cercetata din punct de vedere al caracteristicii  , care are le
gea de probabilitate data prin functia de probabilitate    , ce reprezinta functia
de frecventa n cazul discret, respectiv densitatea de probabilitate n cazul continuu,
pentru variabila aleatoare  .
Definitia 6.1.1. Numim ipoteza statistica o presupunere relativa la legea de probabilitate pe care o urmeaza caracteristica  .
Definitia 6.1.2. Metoda de stabilire a veridicitat ii unei ipoteze statistice, se numeste
test (criteriu) de verificare a ipotezei statistice.
Definitia 6.1.3. Cand ipoteza statistica se refera la parametri de care depinde legea
de probabilitate a caracteristicii  se obtine un test parametric, iar n caz contrar se
obtine un test neparametric.


Observatia 6.1.4. Pentru testele parametrice vom considera ca     ,


. Ipoteza     o vom numi ipoteza nula, iar ipoteza
unde    


 o vom numi ipoteza alternativa.
Definitia 6.1.5. O ipoteza parametrica se numeste ipoteza simpla, daca multimea la
care se presupune ca apartine parametrul necunoscut este formata dintr-un singur
element, iar n caz contrar se numeste ipoteza compusa.
Observatia 6.1.6. Ipoteza nula este aceea care o intuim a fi cea apropriata de realitate, intuitie pe care o obtinem din informatiile pe care le detinem referitoare la
caracteristica cercetata  .
285

286

Verificarea ipotezelor statistice

Observatia 6.1.7. Construirea unui test revine la obtinerea unui domeniu


numit regiune critica, pentru un nivel de semnificatie (probabilitate de risc)
astfel ncat


    

    

  ,
dat,

unde   
 sunt variabilele de selectie corespunzatoare unei selectii de
volum considerata.


Folosind datele de selectie si regiunea critica astfel determinata, avem ca ipo



  

, iar n caz contrar va
teza nula  va fi admisa (acceptata) daca   
fi respinsa, altfel spus ipoteza alternativa  va fi admisa (acceptata) n al doilea caz.

6.2 Testul

privind media teoretica

Se considera caracteristica  care urmeaza legea normala



este necunoscut, iar   este cunoscut.
Relativ la media teoretica
  facem ipoteza nula
din alternativele:






(testul

 bilateral),

(testul

 unilateral dreapta),

(testul

 
,

unde



, cu una

 unilateral stanga).
Pentru verificare ipotezei nule  cu una din alternativele precizate mai nainte,


consideram o selectie repetata de volum


Se cunoaste ca statistica






 
urmeaza legea normala
 . Prin urmare, pentru
 

interval numeric
 astfel ncat

 

   .

si un nivel de semnificatie

 



   , putem determina un





Intervalul    nu este determinat n mod unic, dar avand n vedere alternativa


 considerat
a, adaugam conditia suplimentara:





, daca


, unde


, adica    






 , unde

, daca




;

;

6.2. Testul


 privind media teoretica




, unde

287

 

, daca

.

Corespunzator celor trei alternative definim regiunea critica respectiv prin:



        

 




      



 
 

 



      

   


    

 

    
    

 



Aici s-a folosit notatia      .
Intr-adevar, pentru fiecare din cele trei regiunui critice scrise mai nainte, avem

    
ca   

 
Modul n care am ales regiunea critica ne
conduce respectiv la testul  bilateral, unilateral dreapta si unilateral stanga.
Mai tarziu va fi fundamentata riguros modalitatea de construire a regiunii critice
pentru alternativele considerate.
Odata construita regiunea critica , ipoteza nula va fi admisa daca datele de


  

, iar n caz contrar va fi respinsa.
selectie satisfac conditia   
Remarcam de asemenea ca regiunea critica corespunde multimii complemen
tare intervalului   .
Etapele aplicarii testului
1. Se dau:

   

    ;



2. Se calculeaza intervalul
s-a precizat mai nainte);

 


  astfel ncat

3. Se calculeaza
4. Concluzia: daca
este respinsa.

unde










(dupa cum

  

 

  ipoteza  este admisa, n caz contrar ipoteza

Observatia 6.2.1. Testul  se poate aplica si n cazul unei caracteristici  care nu



urmeaza legea normala, daca volumul selectiei este mare (  ), considerandu

se media teoretica
  necunoscuta si abaterea standard 

cunoscuta. Aceasta consideratie se bazeaza pe Teorema 2.7.8.

288

Verificarea ipotezelor statistice

Exemplul 6.2.2. Caracteristica  reprezinta cheltuielile lunare n mii lei pentru abonamentele la ziare si reviste ale unei familii. Sa se verifice, cu nivelul de semnificatie

, daca media acestor cheltuieli lunare pentru o familie este de  mii lei,

stiind ca abaterea standard 
mii lei si avand o selectie repetata de volum
 ,
care ne da distributia empirica de selectie



 

 

 
 



Deoarece
 
si abaterea standard
 pentru verificarea ipotezei nule




Pentru



este cunoscuta, vom folosi testul

cu ipoteza alternativa

, folosind Anexa I, se determina

  


Anume, se obtine ca  


pentru statistica notata prin:












.

, astfel ncat

 
 

 , care ne da intervalul numeric








Calculam succesiv

 
 
  





  





         
    









  

Deoarece
 
   , rezulta ca se accepta ipoteza ca cheltuielile
medii lunare ale unei familii pentru abonamentele la ziare si reviste sunt de 16 mii

lei, cu nivelul de semnificatie
.
Programul 6.2.3. Programul Matlab, care urmeaza, executa aceste calcule si afiseaza
intervalul de ncredere, mpreuna cu valoarea calculata a statsiticii .
x=[11 13 15 17 20]; f=[4 6 12 10 8];
z=(sum(x.*f)/40-16)/(3/sqrt(40));
z1=norminv(0.005,0,1); z2=norminv(0.995,0,1);
fprintf( (z1,z2)=(%6.3f,%6.3f)\n,z1,z2)
fprintf(
z=%6.3f,%6.3f),z)

6.2. Testul

 privind media teoretica

289

In urma executarii programului, sau obtinut rezultatele:


(z1,z2)=(-2.576, 2.576)
z=-0.422,

Observatia 6.2.4. Avand n vedere ca functia


a lui Laplace este monoton

crescatoare si ca pentru determinarea intervalului    este necesara inversarea
functiei lui Laplace, se poate renunta la inversarea acesteia. Pentru aceasta se determina ceea ce se numeste valoare critica si pe care o notam prin . Vom analiza pe
rand cele trei alternative.
Daca se considera testul bilateral, facand notatia

   
   adica





ipoteza nula va fi respinsa daca      , adica
.


Pentru testul unilateral dreapta, se noteaza














adica





  , adica, la fel ca mai nainte, daca


iar ipoteza nula este respinsa, daca 

.
Un rationament analog, pentru testul unilateral stanga ne conduce la valoarea cri
 
tica, calculata dupa formula
. Drept urmare, ipoteza nula este respinsa,


daca
.
In rezumat, ipoteza nula este respinsa, daca  , unde

  

















  

 

daca



daca



daca









Pentru datele din Exemplul 6.2.2, se obtine

 


 







 

pentru testul bilateral

pentru testul unilateral dreapta


petru testul unilateral stanga

290

Verificarea ipotezelor statistice

6.2.1 Functiile zscore si ztest


Sistemul Matlab, prin Statistics toolbox, dispune de functiile zscore si ztest, cu
aplicabilitate la testul . Apelarea acestor functii se face prin:
z=zscore(d)
h=ztest(x,m0,sigma)
h=ztest(x,m0,sigma,alpha)
h=ztest(x,m0,sigma,alpha,tail)
[h,c,ci,zc]=ztest(x,m0,sigma,alpha,tail)

In urma executarii primei instructiuni, daca d este un vector, se calculeaza abaterile


componentelor vectorului de la valorea medie a componentelor, raportate la abaterea
d d
standard a componentelor, adica x
Daca d este matrice, atunci operatia
d
este executata pentru fiecare coloana n parte.
Celelalte instructiuni se refera la functia ztest si efectueaza testul  asupra
datelor continute n vectorul x, folosind nivelul de semnificatie alpha, care are valoarea implicita alpha=0.05.
Parametrul tail specifica una din cele trei alternative, care conduc la testul bilateral (tail=0, implicit), unilateral dreapta (tail=1) si unilateral stanga
(tail=-1). Daca h=1, atunci ipoteza nula va fi respinsa, respectiv daca h=0, ipoteza nu poate fi respinsa.
Ultima forma de apel permite, de asemenea, obtinerea valorii critice c, a valorii
zc a statisticii , precum si a intervalului de ncredere pentru media teoretica, corespunzator probabilitat ii de ncredere 1-alpha, obtinut n vectorul cu doua componente ci.
Programul 6.2.5. Programul Matlab, ce urmeaza, rezolva problema din Exemplul 6.2.2. Mai mult, se considera si testele unilateral dreapta si unilateral stanga,
precum si obtinerea intervalelor de ncredere.
x=[11*ones(1,4),13*ones(1,6),15*ones(1,12),...
17*ones(1,10),20*ones(1,8)];
fprintf( h
c
ci
z\n)
fprintf(____________________________________\n)
for i=-1:1
[h,c,ci,zc]=ztest(x,16,3,0.01,i);
fprintf( %d %5.4f
(%4.2f,%4.2f)
%6.4f\n,...
h,c,ci,zc)
end

In urma executarii programului, se obtin rezultatele:


h
c
ci
z
____________________________________
0 0.3366
(-Inf,16.90)
-0.4216
0 0.6733
(14.58,17.02)
-0.4216
0 0.6634
(14.70, Inf)
-0.4216

6.3. Puterea unui test

291

Se observa ca pentru tail=-1 si tail=1, se construiesc intervale nemarginite,


respectiv la stanga si la dreapta.

6.3 Puterea unui test


Definitia 6.3.1. Daca se considera un test relativ la ipoteza nula  cu alternativa
, se numes
te eroare de genul (speta) ntai respingerea unei ipoteze adevarate, iar
probabilitatea acestei erori se numeste risc de speta ntai (risc al furnizorului) si este
data de nivelul de semnificatie, adica


    


    

Definitia 6.3.2. Se numeste eroare de genul (speta) al doilea admiterea unei ipoteze
false, iar probabilitatea acestei erori se numeste risc de speta a doua (risc al benefi
ciarului) si este notata ,


    

   

Observatia 6.3.3. Producerea unei erori de genul al doilea este mai grava decat a
unei erori de genul ntai, cand verificam concentratia unui medicament, care peste
un anumit grad de concentratie devine daunator. Pe de alta parte, producerea unei
erori de genul ntai este mai grava decat cea a unei erori de genul doi, cand verificam
calitatea unui articol de mbracaminte.
Definitia 6.3.4. Numim puterea unui test probabilitatea respingerii unei ipoteze false,
adica

 

 
      



  


cand este parametrul asupra caruia se face ipoteza statistica, iar este regiunea
 
critica construita sub ipoteza nula cu nivelul de semnificatie 
 fixat.
Observatia 6.3.5. Daca testul considerat se refera la ipoteza nul
a
 
 

, atunci 
ipoteza alternativa 
si    



cu

Aplicatia 6.3.6. Calculam n continuare puterea testului , cand avem ipoteza alter .

nativa 
Dupa cum am vazut la testul  regiunea critica n acest caz este


 

  

 


     
 

292

Verificarea ipotezelor statistice




Pentru calculul puterii 




  




a testului avem




 


   











Daca se considera evenimentul contrar, vom putea scrie succesiv

  



  
 



         








 
 
 








de unde avem ca
(6.3.1)










 
 


 
 









 
 





 
 

adica



 
 





 
 
(6.3.2)


 
 


   
   
 , vom
Deoarece
 si
, rezulta ca pentru
 


avea
, adica 
. Asadar, putem determina, din relatia precedenta

valoarea lui (volumul selectiei) astfel ncat puterea testului (corespunzator riscul
de speta a doua) sa fie atinsa pentru acel .

Exemplul 6.3.7. Relativ la caracteristica  s-a efectuat o selectie de volum
,
obtinandu-se datele de selectie
 



 
     



 


   

  
   
Stiind ca  urmeaza legea normala
  cu abaterea standard teoretica cunos



cuta 

, vrem sa verificam ipoteza nula 
 , cu nivelul de semnificatie , cand,
se considera ipoteza alternativa 



iar apoi sa calculam puterea testului, cand

 
, si sa determinam
volumul optim al selectiei cand se considera alternativa 
, si riscul de
 
speta a doua
.


6.3. Puterea unui test

293

Cand se considera alternativa


determina cuantila

 se foloseste testul

   
din relatia


 


 bilateral. Se
 
 

Pe de alta parte avem ca

 





 




    

 


astfel ca













 
 
Deoarece  


, ipoteza 
 este admisa.

Formula de calcul a puterii testului  bilateral este (6.3.2). Prin urmare, se obtine









           
 

 

          




           

 

 


          








Pentru determinarea volumului optim al selectiei, cand se considera alternativa



, se foloseste formula (6.3.1). Astfel se obtine


 









 

 

















  
 
 
Cand este astfel
ncat 

, se observa ca valoarea
 nu poate
  




 

fi atinsa. Daca 
  , atunci  , astfel avem


     .
Prin urmare, pentru determinarea
lui optim avem relatia
      ,de
  
si folosind Anexa I se obtine 

 , adica
unde se obtine
 .

Programul 6.3.8. Programul Matlab, ce urmeaza, pe langa faptul ca va efectua calculele din exemplul precedent, va reprezenta grafic si functia putere. Punctele de pe
curba puterii, ale caror valori au fost calculate n exemplul de mai sus, sunt marcate
prin cerculete n Figura 6.1.

294

Verificarea ipotezelor statistice


clear,clf
x=[3.59,4.27,2.83,2.28,3.69,2.81,3.16,3.03,3.65,...
3.84,4.32,3.21,3.20,3.32,3.82,3.27,3.77,3.56,...
3.29,4.08,2.97,3.29,3.78,3.58];
z=(mean(x)-3.5)/(0.5/sqrt(24));
z1=norminv(0.005,0,1); z2=norminv(0.995,0,1);
fprintf( z=%6.3f\n z1=%6.3f\n z2=%6.3f\n,z,z1,z2)
m=3:0.01:4; m1=3.4:0.1:3.7;
c1=norminv(0.005,0,1); c2=norminv(0.995,0,1);
pib=1-normcdf((3.5-m)./(0.5/sqrt(24))+c2,0,1)...
+normcdf((3.5-m)./(0.5/sqrt(24))+c1,0,1);
pib1=1-normcdf((3.5-m1)./(0.5/sqrt(24))+c2,0,1)...
+normcdf((3.5-m1)./(0.5/sqrt(24))+c1,0,1);
plot(m,pib,k-,m1,pib1,o), grid on, len=length(m1);
for i=1:len
fprintf( pi(%3.1f)=%5.3f\n,m1(i),pib1(i))
end
za=norminv(0.005,0,1); zb=norminv(0.95,0,1);
n=ceil(0.52*(zb-za)2/(3.5-3.4)2);
fprintf( nopt=%3d,n)

Rezultatele obtinute, n urma executarii programului, sunt urmatoarele:


z=-0.567
z1=-2.576
z2= 2.576
pi(3.4)=0.055
pi(3.5)=0.010
pi(3.6)=0.055
pi(3.7)=0.269
nopt=446

Lema 6.3.9 (NeymanPearson). Fie caracteristica  cu legea de probabilitate data




 este parametrul necunoscut asupra c
aruia se face
prin    , unde  



  



ipoteza nula simpla

, cu ipoteza alternativa simpla

.
Se considera o selectie repetata de volum relativa la caracteristica  si nivelul de
 
semnificatie dat 
 , atunci







   
 




 




    





regiunea critica , fiind definita prin


 

 

 




 
 

  
   



 

6.3. Puterea unui test

295

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

3.1

3.2

3.3

3.4

3.5

3.6

3.7

3.8

3.9

Figura 6.1: Curba functiei putere


unde








 


   

Demonstratie. Facem demonstratia n doua etape.



In prima etapa, consideram ca se cunoaste constanta 





 

   

Pentru aceasta, daca notam 

 

  




     

    







    



si aratam ca

   



, obtinem succesiv

de unde avem ca

  







 










    









     

     



     



 



     






 

296

Verificarea ipotezelor statistice

adica

    

 







(6.3.3)









     



Putem trece acum la calculul diferentei

 

     







   

 

 



      

    
         


    




     







 





    



Scriem aceata diferenta sub forma

 














   
   

  
 
   







     







     



Pentru fiecare integrala din membrul drept aplicam formula de medie. Prin urmare
 
 
 


    astfel ncat
 si  
exista  

 





    
   
    
   






     



     



 



 





Folosind relatia (6.3.3), stabilita mai nainte, avem ca

 




    
   







 




   

   
    






6.3. Puterea unui test

297

Dar integrala din membrul drept este pozitiva, iar din modul cum s-a definit regiunea
critica avem ca



    


   
 






    
   

  
deci

si ca urmare 
 
. Ceea ce ncheie partea ntai a demonstratiei.
In partea a doua aratam existenta constantei   .

Notam prin   urmatoarea regiune


si prin

 



 

 



 

 



  

 









  

, urmatoarea probabilitate


 

Se observa ca




   



     




, iar




 

     

 








De asemenea, avem ca funct
ia  este monoton
 
  descrescatoare. Prin urmare,

 fixat, exista

astfel ncat
, adica
pentru


 

   

 


 

Ceea ce ncheie demonstratia lemei.


Observatia 6.3.10. Demonstratia lemei NeymanPearson a fost facuta n cazul continuu. In mod analog se demonstreaza si pentru cazul discret, integralele multiple
care apar fiind nlocuite cu sume multiple.
Definitia 6.3.11. Testul pentru care puterea este maxima l numim cel mai puternic
test.
Definitia 6.3.12. Testul pentru care are loc inegalitatea





    

   


    


    

adica puterea testului este mai mare decat riscul de speta ntai se numeste test nedeplasat.

298

Verificarea ipotezelor statistice

Proprietatea 6.3.13.Cel mai puternic test dat de lema NeymanPearson este un test

nedeplasat, adica 

.
Demonstratie. Cu notatiile de la lema NeymanPearson, avem ca



    

 

  







 



     



Distingem dou
a cazuri.
Daca avem   , atunci obtinem






  




de unde 

.
In cazul cand 





de unde 










     



     










, avem




     









    



     






     







, ceea ce trebuie demonstrat.

Observat
ia 6.3.14. Prin micsorarea riscului de speta ntai, pentru fixat, creste con, deci creste riscul de speta a
stanta  si prin urmare scade puterea testului, 
doua.
Aplicatia 6.3.15. Fie caracteristica  ce urmeaza legea normala
 , unde

  este necunoscut si   este cunoscut. Fie ipoteza nula 
, cu





ipoteza alternativa
. Vrem sa determinam cel mai puternic test
pentru verificarea acestei ipoteze nule.
Pentru aceasta aplicam lema Neyman-Pearson.
Prima data determinam regiunea critica .
Deoarece












    






  
 


 



6.3. Puterea unui test

299

rezulta ca
    
    



  

 





    
   
  
 







Conditia care defineste regiunea critica


    
    

devine prin logaritmare



  
 



        

 
sau

adica




 







   ln  




 

 

 

Distingem n continuare doua cazuri.


Daca   , avem


    ln  

 

si notand constanta din membrul drept prin


critica a celui mai puternic test este

     
Daca



,

 

 

   ln  

 






, avem ca   . Asadar regiunea


 

    

procedand analog, se ajunge la regiunea critica

     
Pentru determinarea constantei

 

 

 (cazul

    



),

se scrie relatia


    
    
 
     




  

     
sau

  ln  



 

  

300

Verificarea ipotezelor statistice


  



Prin urmare,
se va determina astfel ncat





 

Laplace este cea definita prin





In acest fel, regiunea critica se poate scrie

    

In cazul



,

 
   

de unde

Asadar avem cuantila , ca fiind 


    

 

  



     

  


 

 
     


 

procedand la fel, se ajunge la


    
    

unde functia

  

a lui

.

      

 
     


 
 

 

Observatia 6.3.16. In aplicatia precedenta, regiunea critica


nu depinde de 



numai prin faptul ca 
, respectiv  
. Drept urmare, ipoteza  se

poate nlocui, pentru cele doua situatii prin
 , ceea ce ne conduce

, care ne conduce la testul 

la testul  unilateral dreapta, respectiv

unilateral stanga. Aceasta confirma justetea alegerii regiunilor critice n cazul testului
 unilateral dreapta si respectiv stanga.

 (testul 
Observatia 6.3.17. Cand se considera ipoteza alternativa 
bilateral), utilizand lema NeymanPearson, nu putem construi un cel mai puternic
test. Alta metoda va fi prezentata pentru construirea acestuia n acest caz.
Aplicatia 6.3.18. Vrem sa determinam n continuare puterea testului
Aplicatia 6.3.15.
Din nou distingem cele doua cazuri.
Daca   , avem succesiv






         


      


 




      


stabilit la




6.3. Puterea unui test

301

unde functia a lui Laplace este cea din Aplicatia 6.3.15.



, de asemenea, avem
Daca 




         


      

 
 
 

 





  

 
  

 
 


 , cand  , adica   .

Se vede, nca odata, n ambele cazuri, ca 



Sa ncheiem prin modul de determinare a volumului al selectiei, pentru a se


atinge o putere a testului (sau un risc de speta a doua) apriori fixata. Desigur ca
este considerat de asemenea dat.



In cazul   , din      
    
am determinat

  



 Pe de alta parte,     
rescrie n felul urmator
 
 
 

 





adica

  


   
 
 




de unde se obtine o alta relatie ce l contine pe , anume
parand cele doua relatii ce l contin pe , avem ca 
 

(6.3.4)
In cazul



,



 Com-

avem urmatoarele doua relatii, care l contin pe

  




 



si

de unde se obtine

(6.3.5)

 
















se

de unde se obtine

  




 ,

302

Verificarea ipotezelor statistice

Exemplul 6.3.19. Sa consideram aceleasi date de selectie de la Exemplul 6.3.7. Vom


verifica ipoteza nula 
, cand se considera respectiv ipotezele alternative



. Vom
, 

, iar nivelul de semnificatie este



calcula puterea pentru fiecare din testele considerate, cand



,
iar apoi vom determina volumul optim al selectiei cand se considera alternativa
 

.
, respectiv 
, cu riscul de speta a doua fixat
Cand se considera alternativa 

 se foloseste testul unilateral
   

 
 
dreapta. In acest
caz,
cuantila
se
determin
a
din


  




Deoarece

, rezulta ca ipoteza nula este admisa.
 

Pentru alternativa

se
te testul  unilateral stanga. Se deter
 
    foloses
 

mina
 Deoarece are loc inegalitatea

 din relatia

 
, se admite ipoteza  si n acest ultim caz.
Pentru testul  unilateral dreapta, formula de calcul a puterii este


si prin urmare






   
 

  


In cazul testului




















 
 


 
     


 




 


 unilateral stanga, avem




deci







    
  








  











    
     








Pentru determinarea volumului optim al selectiei, cand folosim testul unilateral


, se utilizeaza formula (6.3.4):
stanga, cu alternativa 



de unde se obtine


.



 





  






 

6.3. Puterea unui test

303

Pentru determinarea volumului optim al selectiei, cand folosim testul unilateral


dreapta, cu alternativa 
, se utilizeaza formula (6.3.5). Astfel volumul
optim al selectiei se calculeaza cu formula:


de unde se obtine





.

 






 






  


Programul 6.3.20. Programul Matlab urmator, efectueaza calculele din exemplul


precedent, iar n plus, reprezinta grafic curbele putere, n cazul celor doua alternative. Punctele de pe curbele putere, care au fost calculate n exemplul precedent, sunt
marcate pe Figura 6.2 prin cerculete.
clear,clf
x=[3.59,4.27,2.83,2.28,3.69,2.81,3.16,3.03,3.65,...
3.84,4.32,3.21,3.20,3.32,3.82,3.27,3.77,3.56,...
3.29,4.08,2.97,3.29,3.78,3.58];
z=(mean(x)-3.5)/(0.5/sqrt(24));
fprintf( z=%6.3f\n,z)
z1=norminv(0,0,1); z2=norminv(0.99,0,1);
fprintf(
m gt 3.5\n)
fprintf( z1=%6.3f, z2=%6.3f\n,z1,z2)
z1=norminv(0.01,0,1); z2=norminv(1,0,1);
fprintf(
m lt 3.5\n)
fprintf( z1=%6.3f, z2=%6.3f\n,z1,z2)
m=3:0.01:4; m1=3.4:0.1:3.7;
c2=norminv(0.99,0,1);
pib=1-normcdf(c2+(3.5-m)./(0.5/sqrt(24)),0,1);
pib1(1,:)=1-normcdf(c2+(3.5-m1)./(0.5/sqrt(24)),0,1);
subplot(2,1,1)
plot(m,pib,k-,m1,pib1(1,:),o), grid on
c1=norminv(0.01,0,1);
pib=normcdf(c1+(3.5-m)./(0.5/sqrt(24)),0,1);
pib1(2,:)=normcdf(c1+(3.5-m1)./(0.5/sqrt(24)),0,1);
subplot(2,1,2)
plot(m,pib,k-,m1,pib1(2,:),o), grid on
len=length(m1);
for i=1:len
for j=1:2
fprintf( pi(%3.1f)=%5.3f
,m1(i),pib1(j,i))
end
fprintf(\n)
end
zb=norminv(0.95,0,1); za=norminv(0.01,0,1);
nr=ceil(0.52*(zb-za)2/(3.5-3.4)2);
zb=norminv(0.05,0,1); za=norminv(0.99,0,1);
nl=ceil(0.52*(zb-za)2/(3.5-3.7)2);
fprintf( nr=%3d, nl=%3d,nr,nl)

304

Verificarea ipotezelor statistice

In urma executarii programului, pe langa graficele curbelor de putere, sunt afisate si


urmatoarele rezultate:
z=-0.567
m gt 3.5
z1= -Inf, z2= 2.326
m lt 3.5
z1=-2.326, z2=
Inf
pi(3.4)=0.000
pi(3.4)=0.089
pi(3.5)=0.010
pi(3.5)=0.010
pi(3.6)=0.089
pi(3.6)=0.000
pi(3.7)=0.357
pi(3.7)=0.000
nr=395, nl= 99

care reprezinta intervalele numerice (z1,z2) si volumul optim, cand se considera


cele doua alternative.
1
0.8
0.6
0.4
0.2
0

3.1

3.2

3.3

3.4

3.5

3.6

3.7

3.8

3.9

3.1

3.2

3.3

3.4

3.5

3.6

3.7

3.8

3.9

1
0.8
0.6
0.4
0.2
0

Figura 6.2: Curbele functiilor putere

6.4 Testul

(Student) privind media teoretica

 , cu ambii parametri  
Fie caracteristica  ce urmeaza legea normala

si   necunoscuti. Relativ la valoarea medie a acestei caracteristici, se face ipoteza
, cu una din alternativele
nula 






, cand obtinem testul  bilateral,

, cand obtinem testul  unilateral dreapta,

6.4. Testul  (Student) privind media teoretica




305

, cand obtinem testul  unilateral stanga.

Pentru verificarea acestei ipoteze se considera o selectie repetata de volum , cu da



 si corespunzator variabilele de selectie     . Contele de selectie  
form Proprietatii 4.2.26, statistica






unde



 
   

   
 





  

  


urmeaza legea Student cu


 grade de libertate.
    dat, se poate determina
Prin urmare, pentru nivelul de semnificatie

intervalul numeric    astfel ncat




   

     




       
 
       

unde

 


este functia de repartitie pentru legea Student cu
grade de libertate (tabelata n
Anexa II, pentru anumite valori).

Intervalul numeric    pentru statistica  nu este determinat n mod unic din
conditia de mai sus. In functie de alternativa  aleasa, se considera suplimentar:




unde

 
 
 




   , daca
 
  , daca

   


 este cuantila de ordin

    

,

a legii Student cu


Corespunzator intervalului
prin:

,

, daca

,

grade de libertate, adica

 

  se considera respectiv regiunea critice


 

 



         
 
  

definite

306

Verificarea ipotezelor statistice


 
  

      

 
 

    

 

    

 

   
 












Aici s-au utilizat notatiile 
  , respectiv      

    
 
Se verifica imediat ca   

 
iar cele trei moduri de
definire a regiunii critice ne conduc respectiv la testul  bilateral, unilateral dreapta
si unilateral stanga.



,
Odata construita regiunea critica , folosind datele de selectie   


  

ipoteza nula  va fi admisa daca   
, iar n caz contrar va fi
respinsa. Remarcam de asemenea ca regiunea critica corespunde multimii comple
mentare intervalului   .
Etapele aplicarii testului
1. Se dau:

   

 



2. Se calculeaza intervalul    astfel ncat


(dupa cum s-a prezentat nainte);
3. Se calculeaza

 


4. Concluzia: daca 
respinsa.

unde


 

 

 





   
  

     


  

  ipoteza  este admisa, n caz contrar ipoteza este

Observatia 6.4.1. Cand numarul gradelor de libertate tinde la infinit, conform teoremei limita centrala, avem ca legea Student converge n repartitie la legea normala
 

 . Prin urmare, daca volumul al selectiei este mare

se poate utiliza


testul  pentru verificarea ipotezei nule

, prin utilizarea statisticii  n
loc de statistica . Toate rezultatele de la testul  raman, asadar, adevarate n acest
caz.
Observatia 6.4.2. Avand n vedere ca functia de repartitie a legii Student este strict

crescatoare, iar pentru determinarea intervalului    este necesara inversarea
acestei functii, se poate renunta la operatia de inversare. Pentru aceasta se determina
ceea ce se numeste valoare critica, ca si la testul , si pe care o notam prin . Vom
analiza pe rand cele trei alternative.

6.4. Testul  (Student) privind media teoretica

307

Daca se considera testul bilateral, facand notatia

 

   adica
    

  

ipoteza nula va fi respinsa daca     , adica
.


 

Pentru testul unilateral dreapta, se noteaza




 



adica

  
 



  , adica, la fel ca mai nainte, daca


iar ipoteza nula este respinsa, daca 

.
Un rationament analog, pentru testul unilateral stanga ne conduce la valoarea critica, calculata dupa formula
  . Drept urmare, ipoteza nula este respinsa,

daca
.
In rezumat, ipoteza nula este respinsa, daca  , unde
 


    



 

   




  


daca
daca
daca













6.4.1 Functia ttest


Sistemul Matlab, prin Statistics toolbox, dispune de functia ttest, cu aplicabilitate
la testul  . Apelarea acestei functii se face prin:
h=ttest(x,m0)
h=ttest(x,m0,alpha)
h=ttest(x,m0,alpha,tail)
[h,c,ci]=ttest(x,m0,alpha,tail)

In urma executarii acestor instructiuni, se efectueaza testul  asupra datelor continute


n vectorul x, folosind nivelul de semnificatie alpha, care are valoarea implicita
alpha=0.05.
Parametrul tail specifica una din cele trei alternative, care conduc la testul bilateral (tail=0, implicit), unilateral dreapta (tail=1) si unilateral stanga
(tail=-1). Daca h=1, atunci ipoteza nula va fi respinsa, respectiv daca h=0, ipoteza nu poate fi respinsa.
Ultima forma de apel permite, de asemenea, obtinerea valorii critice c, precum
si a intervalului de ncredere pentru media teoretica, corespunzator probabilitat ii de
ncredere 1-alpha, obtinut n vectorul cu doua componente ci.
Programul 6.4.3. Programul Matlab, ce urmeaza, aplica testul  , pentru datele
din Exemplul 6.2.2, considerand ca dispersia este necunoscuta. Ipoteza nula este

308

Verificarea ipotezelor statistice


, iar ca ipoteze alternative se considera, pe rand, cele trei, care conduc, respectiv la testele bilateral, unilateral stanga si unilateral dreapta. Programul va
determina, de asemenea, intervalele de ncredere pentru media teoretica, n cele trei
cazuri, folosind alpha=0.01.
x=[11*ones(1,4),13*ones(1,6),15*ones(1,12),...
17*ones(1,10),20*ones(1,8)];
fprintf( h
c
ci
\n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest(x,16,0.01,i);
fprintf( %d %5.4f
(%4.2f,%4.2f) \n,h,c,ci)
end

In urma executarii programului, se obtin rezultatele:


h
c
ci
___________________________
0 0.3261
(-Inf,16.87)
0 0.6522
(14.61,16.99)
0 0.6739
(14.73, Inf)

Se observa ca pentru tail=-1 si tail=1, se construiesc intervale nemarginite,


respectiv la stanga si la dreapta.

6.5 Testul raportului verosimilitatilor


Fie caracteristica  cu legea de probabilitate     , unde parametrul necunoscut
    . Relativ laparametrul , se considera ipoteza nula     cu
alternativa     . Se considera o selectie repetata de volum cu ajutorul
careia se construies te statistica

 

unde



   

   

  



 

    
   




    

este functia de verosimilitate. Din felul cum a fost definita statistica , avem ca
 

, iar ipoteza  va putea fi acceptata daca este apropiata de . Fo 
losind aceasta observatie, pentru un nivel de semnificatie 
 dat, se determina
   



regiunea critica din relatia

unde
este cuantila de ordin ,

pentru legea de probabilitate a statisticii .

6.5. Testul raportului verosimilitat ilor

309

Exemplul 6.5.1. Fie caracteristica  ce urmeaza legea normala


 , unde pa


rametrii
si   sunt necunoscuti. Vrem sa verificam urmatoarea ipoteza
     . Pentru aceasta
    , cu alternativa 
nula 
 
consideram o selectie repetata de volum si nivelul de semnificatie 
 fixat.
Functia de verosimilitate este data prin


 

 
 

 









   


  

 este adevarata, atunci estimatorul de verosimilitate maxima pentru 

Cand ipoteza
este dat prin









    



Obtinem astfel, n acest caz, ca




  

 











 

e



  
   
 


  




Pe de alta parte, pentru determinarea numitorului statisticii , vom cauta estima  si    necunoscuti.
torii de verosimilitate maxima pentru parametrii
Sistemul de verosimilitate maxima









ln

    

    

ln

    

    



ne da estimatorii de verosimilitate maxima pentru




   



si , anume








     

 

310

Verificarea ipotezelor statistice

Obtinem astfel ca

    



 

  


 







 

 
e


   

  

 

Putem scrie acum statistica raportului verosimilitat ilor









        






Folosind formula lui Konig (Observatia 3.3.23):





     
         



avem ca





  

  

 


Daca se introduce statistica  definita prin


 


 

 

  
    


atunci






   , se obtine din


  


, care este

acelasi lucru cu   
 

. Altfel spus, determinarea
cuantilei


   .
 revine la determinarea lui
, astfel ncat   

Dar statistica  , n ipoteza , urmeaza legea Student cu
grade de libertate


 
(Proprietatea
4.2.26),
deci
,
adic
a
cuantila
de
ordin


 a legii Student

 
cu
 grade de libertate. Putem scrie n final regiunea critica:
       
      
    

 
 
 
 
Regiunea critica , pentru

adica chiar regiunea critica de la testul


obtinem testul  bilateral.

bilateral. Prin urmare, cu aceasta metoda

6.5. Testul raportului verosimilitat ilor

311

Teorema
6.5.2. Fie statistica
a raportului verosimilitatilor, atunci statistica

 ,  fiind numarul
ln urmeaza legea  cu  grade de libertate, cand
parametrilor necunoscuti.
Demonstratie. Vom considera numai cazul  .
Folosind formula lui Taylor cu doi termeni avem ca



 


       ln      
             ln  

ln
ln

 
unde    sau

pentru , prin urmare

   



  




Pede alta parte, daca ipoteza 
adevarata, se stie ca
a.s.
 , cand  . Putem scrie atunci este
ca
 ln

 

 


 ln     


 



     ln  


ln

 

este estimator de verosimilitate maxima

      

ln
deci avem ca

. Dar

 ln

a.s. 
, deci

      

 ln 



 

   





Folosind legea numerelor mari avem ca






  ln       a.s.
 
 ln

de unde

sau

 



ln

 

   



  

      

      

Conform Observatiei 5.3.11, statistica

 ln 

cand
, de unde avem ca statistica
grad de libertate, ceea ce trebuia aratat.

    urmeaza legea normala  ,


     

urmeaza legea  cu un

312

Verificarea ipotezelor statistice

6.6 Testul

privind dispersia teoretica

Fie caracteristica  ce urmeaza legea normala


 , unde 
necunoscuta si  , de asemenea necunoscut.
Relativ la dispersia teoretica se face ipoteza nula   
alternativele:


 
 
 





 
 
 

cand obtinem testul

 bilateral,

cand obtinem testul

 unilateral dreapta,

cand obtinem testul

 unilateral stanga.

  este

, cu una din

Pentru verificarea ipotezei nule , cu una din alternativele  precizate, se con




 si coressidera o selectie repetata de volum , cu datele de selectie   



punzator variabilele de selectie   
. Conform Proprietatii 4.2.25, avem
ca statistica

  
  
  
   

    



urmeaza legea  cu
 grade de libertate.
 
Folosind un nivel de semnificatie 
 dat, se poate determina un interval

  
numeric
astfel

nc
a
t







 
     
 


unde





   



  
 



este functia de repartitie pentru legea  cu


grade de libertate (tabelata pentru
anumite valori n Anexa III).


Intervalul numeric   pentru statistica  nu este determinat n mod unic
din conditia de mai sus. In functie de alternativa  aleasa se considera suplimentar:





 


  

unde


  

 



   

 
    daca

   


daca

este cuantila de ordin


.

   

  
 
 

daca

a legii

cu

grade de libertate, adica

6.6. Testul

 privind dispersia teoretica

Cu ajutorul intervalului numeric


tiv regiunile critice:

313

  
 , astfel determinat, se considera respec-



               
  

 


              
    



   
  
 
  

              
    



 
  

 

    

Usor se verifica faptul ca   

 
iar cele trei moduri
    

 

 

de definire a regiunii critice ne conduc respectiv la testul  bilateral, unilateral


dreapta si unilateral stanga.
Odata construita regiunea critica , folosind datele de selectie, ipoteza nula 


  

va fi admisa daca   
, iar n caz contrar va fi respinsa. Remarcam
de asemenea

   ca regiunea critica corespunde multimii complementare intervalului


.
Etapele aplicarii testului
1. Se dau:

   

    

  

 


 astfel ncat      



2. Se determina intervalul
(dupa cum s-a precizat nainte);
3. Se calculeaza

4. Concluzia: daca
respinsa.

     


 


unde

  

 

  
 ipoteza  este admisa, n caz contrar

este

Exemplul 6.6.1. Se consider



a caracteristica  ce urmeaza legea normala


cu parametrii
si   necunoscuti. Relativ la caracteristica  se considera o
selectie repetata de volum
. Fie datele de selectie








 

 











Vrem sa verificam ipoteza nula    , cu fiecare din urmatoarele alternative


  ,     ,     , cand se considera

 
. Vom calcula





apoi valorile functiei putere pentru 
   
 , pentru fiecare din
alternativele considerate.

314

Verificarea ipotezelor statistice




Cand

 

 avem testul

  


  
 

 bilateral. Se calculeaza cuantilele



  
 

si

 


 


Pe de alta parte avem



  

 

  



    


  

Deoarece

      
  



  
 




 


  
 



 



     



 



 
    

ipoteza  este respinsa.


Cand     , avem testul  unilateral dreapta si se calculeaza cuantila
   . Astfel, avand n vedere ca      , ipoteza
  

 
nula este admisa.

Cand  
 , avem testul  unilateral stanga. In acest caz se calculeaza
    si deoarece      , ipoteza nula este
cuantila  


respinsa.
Cand se considera testul  bilateral, puterea se obtine din

  
  
      


   
  
 

   


 




 
 



 
    
  

    

deci


             


 
 
    
  

In cazul de fata , obtinem


 



  
  

 


 
 


    
 
 
 
 



  
 
 

      


 
     


 
     











  


6.6. Testul

 privind dispersia teoretica

 
 



315


 


 
  


 



  
  



      


 
      

  



Pentru testul unilateral dreapta, n mod analog, se ajunge la


 




       
 
   

de unde


  

  

 

 
 



Cand se considera testul




deci
 



  
  















 

 
 

 
 

 
 

 
 


 





  





 





  





  






 


 unilateral stanga, se obtine

 


 
 
 



 
 
 


 
 

 
  
 


   
  

 
 



 


 
 
 


    


  



  

Programul 6.6.2. Programul urmator, efectueaza calculele cerute n exemplul precedent. In plus, reprezinta grafic functia putere, cea din Figura 6.3, n cazul testului
bilateral, marcand prin cerculete punctele curbei putere, care au fost determinate n
exemplu.

316

Verificarea ipotezelor statistice


clf
x=[24.03,25.92,26.92,23.04,25.44,26.31,...
26.13,25.97,24.44,24.82,24.17,25.53,...
23.78,26.06,24.29];
x2=14*var(x)/1.82;
c1=chi2inv(0.025,14); c2=chi2inv(0.975,14);
fprintf( x2=%6.3f\n,x2)
fprintf(
sigma ne 1.8\n)
fprintf( c1=%6.3f, c2=%6.3f\n,c1,c2)
c1=chi2inv(0,14); c2=chi2inv(0.95,14);
fprintf(
sigma gt 1.8\n)
fprintf( c1=%6.3f, c2=%6.3f\n,c1,c2)
c1=chi2inv(0.05,14); c2=chi2inv(1,14);
fprintf(
sigma lt 1.8\n)
fprintf( c1=%6.3f, c2=%6.3f\n,c1,c2)
s=1.2:0.01:2.4; s1=1.5:0.1:1.9;
c1=1.82*chi2inv(0.025,14); c2=1.82*chi2inv(0.975,14);
pib=1-chi2cdf(c2./s.2,14)+chi2cdf(c1./s.2,14);
pib1(1,:)=1-chi2cdf(c2./s1.2,14)+chi2cdf(c1./s1.2,14);
plot(s,pib,k-,s1,pib1(1,:),o), grid on
c1=1.82*chi2inv(0,14); c2=1.82*chi2inv(0.95,14);
pib=1-chi2cdf(c2./s.2,14)+chi2cdf(c1./s.2,14);
pib1(2,:)=1-chi2cdf(c2./s1.2,14)+chi2cdf(c1./s1.2,14);
c1=1.82*chi2inv(0.05,14); c2=1.82*chi2inv(1,14);
pib=1-chi2cdf(c2./s.2,14)+chi2cdf(c1./s.2,14);
pib1(3,:)=1-chi2cdf(c2./s1.2,14)+chi2cdf(c1./s1.2,14);
len=length(s1);
for i=1:len
for j=1:3
fprintf( pi(%3.1f)=%5.3f
,s1(i),pib1(j,i))
end
fprintf(\n)
end

In urma executarii programului sau obtinut rezultatele:


x2= 5.446
sigma ne 1.8
c1= 5.629, c2=26.119
sigma gt 1.8
c1= 0.000, c2=23.685
sigma lt 1.8
c1= 6.571, c2=
Inf
pi(1.5)=0.117
pi(1.5)=0.002
pi(1.6)=0.073
pi(1.6)=0.008
pi(1.7)=0.052
pi(1.7)=0.022
pi(1.8)=0.050
pi(1.8)=0.050
pi(1.9)=0.068
pi(1.9)=0.095

pi(1.5)=0.200
pi(1.6)=0.128
pi(1.7)=0.080
pi(1.8)=0.050
pi(1.9)=0.031

6.6. Testul

 privind dispersia teoretica

317

0.45

0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

1.5

Figura 6.3: Curba functiei putere - cazul bilateral


Observatia 6.6.3. Cand caracteristica  nu urmeaza legea normala, pentru a verifica ipoteza nula de forma dinainte, cu una din alternativele precizate, unde dispersia


teoretica este  
 , se tine seama de faptul ca statistica


  
 

unde

 
    






 
 .
 , cand
urmeaza legea normala

De exemplu, daca ipoteza alternativa este    , se va ajunge la regiunea
critica
      
        
    





 




 
unde   este cuantila de ordin   de la legea normala
.

Observatia 6.6.4. Daca se considera statistica




  
 


    

 
 exista relatia 

atunci ntre statisticile  si


 .

Deoarece se cunoaste legea de probabilitate pentru statistica (legea  cu


grade de libertate), se poate determina si legea de probabilitate a statisticii
. Sunt
manuale care contin tabelata legea de probabilitate a lui . Descrierea testului ,
folosind statistica , urmeaza aceeasi cale ca cea cand se foloseste statistica .

318

Verificarea ipotezelor statistice


  (ceea ce se ntampla mai rar)

Observatia 6.6.5. Cand se cunoaste parametrul


se poate considera statistica


Deoarece
gea  cu
statistica.

 


  
  





  

 

 
 , avem ca statistica  urmeaza leurmeaza legea normala
 de libertate. Cele prezentate mai nainte pot fi rescrise cu aceasta
grade


6.7 Testul (FisherSnedecor)


pentru compararea dispersiilor




Se considera doua populatii independente


si
cercetate din
punct de vedere al


aceleasi caracteristici.
Aceast
a
caracteristic
a
este

pentru
s

i
urmeaz
a legea
nor 


  

mala
 si respectiv  pentru si urmeaza legea normala
 .
Relativ la dispersiile
teoretice ale celor doua caracteristici se face ipoteza nula com


pusa
  , cu una din alternativele:



 

 


 , cand obtinem testul  bilateral,



 , cand obtinem testul  unilateral dreapta,

 , cand obtinem testul  unilateral stanga.









 considerate, se ePentru verificarea ipotezei nule , cu una din alternativele




fectueaz
a cate o selectie repetata de volume
respectiv  si
din celedou
a populat
ii



  
   
    



si . Notam datele de select

ie
prin
s

i
respectiv



 
 
  
 



cu variabilele de selectie  
 si  
 Conform Proprietatii 4.2.30, statistica





 





unde








       
 
  


 
       
 
 

  


  

  



 


 



6.7. Testul  (FisherSnedecor) pentru compararea dispersiilor




319



urmeaza legea FisherSnedecor cu


 grade de libertate.
 si
 
Pentru un nivel de semnificatie 
 fixat, se poate 
determina un interval
 



   
    
numeric   , astfel ca       




unde





 
   


















 
   





este functia de repartitie pentru legea FisherSnedecor cu


si grade de libertate

(tabelata pentru anumite valori n Anexa IV). Intervalul de ncredere    pentru
statistica  nu este unic determinat. In functie de alternativa  aleasa, se considera
suplimentar:
 



          daca  
 

 



    daca    
 



    

daca  

   astfel determinat, se considera respectiv re-

Cu ajutorul intervalului numeric


giunile critice


   

 



 



 



 

     


 


 
 
     


 


 



   

   

S-au folosit notatiile








  


 

      

  

      

  

     

  

 




  



  



 


 
 

Se verifica imediat ca   

  


  
iar
cele trei alternative ne conduc la cele trei regiuni critice, care definesc respectiv testul
 bilateral, unilateral dreapta si unilateral stanga.
Odata construit
critica , folosind
datele de selectie, ipoteza nula va fi

  a regiunea


     
   

  

admisa daca
iar n caz contrar va fi respinsa.

Remarcam de asemenea ca regiunea critica corespunde multimii complementare

intervalului   .


 

 



320

Verificarea ipotezelor statistice

Etapele aplicarii testului


1. Se dau:

   

 

 

 


   

 

2. Se determina intervalul    astfel ncat


(dupa cum s-a prezentat nainte);


      


  unde


3. Se calculeaza







4. Concluzia: daca
pinsa.



 
     




 
    

  









  



  


 


  


 


   ipoteza  este admisa, n caz contrar este res-

, atunci ipoteza nula se poate rescrie


Observatia 6.7.1. Daca se noteaza prin
 


  , iar ipotezele alternative se scriu corespunz
ator   ,    ,

respectiv



, iar statistica

 , se scrie sub forma 

Exemplul 6.7.2. Se cerceteaza precizia cu care doua masini produc conserve de


acelasi tip. Pentru aceasta, se considera cate un esantion din conservele produse de
cele doua masini si se masoara greutatea acestora.
Fie  greutatea n grame a unei

conserve produsa de prima masina, respectiv  pentru a doua masina. Masuratorile
obtinute sunt:


 






  







   
 

  





 
 

 




 

  
    
 
 
 

 






Considerand nivelul
de semnificatie
, vrem sa verificam
ipoteza
nula com
 





pusa    , respectiv cu fiecare din alternativele     ,


 ,

 
 . Vom considera ca cele  dou
a caracteristici   si 
sunt independente

  

si ca urmeaza legile normale
 si respectiv
 .
Se considera statistica





 





6.7. Testul  (FisherSnedecor) pentru compararea dispersiilor



ce urmeaza legea FisherSnedecor cu


 si
care ne conduce la testul  . Pentru aceasta avem

 





 

 
 


 

 



 









 

     

    

 
   

 

 grade de libertate,




 


 

  



  

 
   

 
 


  

    


  

 
 


321





 




  


 este
 

  











Valoarea calculata a statisticii

 
 

 

 

De asemenea, avem calculate, conform Anexei IV, cuantilele




   


     













     

   



 
  








     



Cand se considera alternativa


  

ipoteza  este admisa.


Pentru alternativa 




  






, avem testul  bilateral. Deoarece

     

   



, avem testul  unilateral dreapta. Astfel ca



 
 
    


prin urmare ipoteza  este admisa.


De asemenea, pentru alternativa 
 
stanga. Deoarece avem    

  







, se obtine testul  unilateral


ipoteza  este admisa.

322

Verificarea ipotezelor statistice

Programul 6.7.3. Programul Matlab, care urmeaza, efectueaza calculele din exemplul precedent, dupa care afiseaza valoarea f a statisticii  , precum si intervalele
numerice (f1,f2), pentru fiecare din cele trei alterantive.
x1=[1021,980,988,1017,1005,998,1014,985,995,...
1004,1030,1015,995,1023,1008,1013];
x2=[1003,988,993,1013,1006,1002,1014,997,...
1002,1010,975];
f=var(x1)/var(x2);
fprintf(
Bilateral\n)
f1=finv(0.025,15,10); f2=finv(0.975,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)
fprintf(
Unilateral dreapta\n)
f1=finv(0,15,10); f2=finv(0.95,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)
fprintf(
Unilateral stanga\n)
f1=finv(0.05,15,10); f2=finv(1,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)

In urma executarii programului se obtin rezultatele:


Bilateral
1.567, (f1,f2)=(0.327,3.522)
Unilateral dreapta
f= 1.567, (f1,f2)=(0.000,2.845)
Unilateral stanga
f= 1.567, (f1,f2)=(0.393, Inf)
f=

6.8 Teste pentru compararea mediilor






Se considera doua populatii independente


si , cercetate
din punct de vedere


pentru
si urmeaza legea
al aceleasi caracteristici.
Aceast
a
caracteristic
a
este
 
  
normala
  si respectiv   pentru  si urmeaza legea normala
 .
Relativ la mediile
teoretice
ale celor doua caracteristici independente, se face


ipoteza nula 
, cu una din alternativele:

 








, cand obtinem un test bilateral,


, cand obtinem un test unilateral dreapta,
, cand obtinem un test unilateral stanga.

Ca si n cazul testului  se considera cate o selectie repetata de volum


respectiv . Pastram n continuare notatiile de la testul  .
Distingem trei cazuri.

si

6.8. Teste pentru compararea mediilor

323

6.8.1 Dispersii cunoscute


Dispersiile

si 



sunt cunoscute. In acest caz se considera statistica

       
 




 

(6.8.1)



 
.
care urmeaza legea normala
Se aplica prin urmare testul  pentru compararea celor doua medii teoretice.
 
Pentru nivelul de semnificatie 
 dat, se obtin regiunile critice corespunzatoare celor trei alternative:




  


     
 

 

  
     





 



 


  
     



 



 



   

 



 



 




   


   




Etapele aplicarii testului


1. Se dau:

   

 

 

 


;    

  , 

 







2. Se determina intervalul    astfel ncat
unde  

 
este functia lui Laplace tabelata n Anexa I. Intervalul numeric   este res          
pectiv pentru cele trei alternative considerate:
,
,



;


   



unde







3. Se calculeaza
4. Concluzia: daca
pinsa.



  

 

  



  


 

  ipoteza  este admisa, n caz contrar este res-

Exemplul 6.8.1. La o unitate de mbuteliere a laptelui exista doua masini care efectueaza aceasta operatie n sticle de  litru. Pentru a cerceta reglajul de mbuteliere
la cele doua masini sau efectuat doua selectii relative la sticlele mbuteliate de cele
doua masini si sau obtinut datele de selectie:

324

Verificarea ipotezelor statistice



n ml 


n ml 















,







Folosind nivelul de semnificatie
, vrem sa verificam daca mediile de
umplere a sticlelor
de
c
a
tre
cele
dou
a
mas

ini
sunt
aceleasi, n cazul n care abaterile


standard sunt 
 ml
s

i



ml.


Caracteristicile  si  , ce reprezinta cantitatea de lapte (n ml) continuta de
o sticla mbuteliata de prima masina, respectiv
de a doua masina, se considera ca


 si
urmand legile de probabilitate normale

 .

 


Verificarea ipotezei nule
, cu alternativa 
, se va

face cu testul , deoarece sunt cunoscute abaterile standard.

Folosind nivelul de semnificatie
, se determina din Anexa I valoarea


   
astfel ncat


 


Anume, se obtine ca  
 , care ne da intervalul
tistica , data prin formula (6.8.1).
Se calculeaza succesiv:


 



 

 


 
 

  






 




 



 
 



      



 





 



  






 



      

 



pentru sta-

 


  



  

Deoarece

   , rezulta ca mediile de umplere a sticlelor nu
difera semnificativ pentru cele doua masini.

Programul 6.8.2. Programul Matlab, care urmeaza, efectueaza calculele din exemplul precedent.
x1=[990*ones(1,7),995*ones(1,9),1000*ones(1,11),...
1005*ones(1,8),1010*ones(1,5)];
x2=[985*ones(1,5),990*ones(1,5),995*ones(1,6),...
1000*ones(1,7),1005*ones(1,6),1010*ones(1,4)];
ma1=mean(x1); ma2=mean(x2);
z=(ma1-ma2)/sqrt(62/40+7.52/33);
z2=norminv(0.995); z1=-z2;
fprintf( z=%7.3f\n z1=%6.3f\n z2=%6.3f,z,z1,z2)

6.8. Teste pentru compararea mediilor

325

Rezultatele obtinute n urma executarii programului sunt:


z= 1.209
z1=-2.576
z2= 2.576

6.8.2 Dispersii egale necunoscute


Dispersiile

si 



sunt necunoscute si 

     
 
 
  

(6.8.2)





. Se considera statistica


 

 
    
 

 




care urmeaza, conform Proprietatii 4.2.28, legea Student cu


de libertate.
In acest caz se va aplica testul  . Pentru nivelul de semnificatie
obtin regiunile critice corespunzatoare celor trei alternative:


   

















  


          




   

grade

    dat, se



  


        



     


      


    


   





unde


   

 





   

 


      


   
 


 


    


   
 






  

Etapele aplicarii testului


1. Se dau:

   

 

 

 


;    


 

2. Se determina intervalul    astfel ncat      



unde
  




este functia de repartitie pentru legea Student cu

grade de libertate, iar intervalul numeric    este respectiv, pentru cele trei
             
;
alternative considerate,
  ,
  ,



326

Verificarea ipotezelor statistice

  
  

       
 

unde
 
 


3. Se calculeaza














       
 
  


 
       
 
  

4. Concluzia: daca
pinsa.





  

 


  


 

  ipoteza  este admisa, n caz contrar este res-

Exemplul 6.8.3. Se cerceteaza doua loturi de ulei pentru automobile, din punct de
vedere al vascozitat ii, obtinanduse datele de selectie


 
 
  






pentru primul lot, respectiv














 


 

pentru al doilea lot.


Analizele facanduse cu acelasi aparat, se considera ca abaterile standard sunt

aceleasi. Considerand nivelul de semnificatie
, sa se verifice daca mediile
de vascozitate pentru cele
dou
a
loturi
nu
difer
a
semnificativ.


Caracteristicile  si  , ce reprezinta vascozitatile pentru cele doua loturi
 
de ulei,
se considera ca urmeaza fiecare legea normala, respectiv
 si
 
 , cu abaterea standard    necunoscut
a
.

 

, cu alternativa 
, se va
Verificarea ipotezei nule 
face cu testul  , deoarece abaterea standard  este necunoscuta.

Folosind nivelul de seminficat
ie
, se determina, din Anexa II, valoarea



   , astfel ncat     
  , unde numarul gradelor de libertate este
 
 
  
. Adica, se determina     astfel ncat








   
, obtinanduse    
. In acest mod, sa obtinut

 pentru statistica dat
intervalul
  
a
prin
formula (6.8.2), care urmeaza

  
legea Student cu
grade de libertate.
Se calculeaza pe rand



 

 



       







6.8. Teste pentru compararea mediilor













 

 



 



     

 
   



 




   

  

327

 
       
  


  

        
 

 
 
   
   


 

  




  

  


















  

Deoarece

  , rezulta ca vascozitat ile medii ale celor
doua loturi de ulei nu difera semnificativ.
Programul 6.8.4. Programul Matlab urmator efectueaza calculele de mai sus, dupa
care afiseaza valoarea t a statisticii  , mpreuna cu capetele intervalului (t1,t2).
x1=[10.27*ones(1,3),10.28*ones(1,2),10.29,10.3,10.32];
x2=[10.26,10.26,10.27,10.29,10.3,10.31*ones(1,3)];
ma1=mean(x1); ma2=mean(x2);
v1=var(x1); v2=var(x2);
t=(ma1-ma2)/sqrt(7*v1+7*v2)*sqrt(14/(1/8+1/8));
t2=tinv(0.975,14); t1=-t2;
fprintf( t=%7.3f\n t1=%6.3f\n t2=%6.3f,t,t1,t2)

In urma executarii programului, se obtin rezultatele:


t= -0.372
t1=-2.145
t2= 2.145

6.8.3 Functia ttest2


Sistemul Matlab, prin Statistics toolbox, dispune de functia ttest2, cu aplicabilitate la testul  pentru compararea a doua medii, cand dispersiile sunt egale, dar
necunoscute. Apelarea acestei functii se face prin:
h=ttest2(x,y)
h=ttest2(x,y,alpha)
h=ttest2(x,y,alpha,tail)
[h,c,ci]=ttest(x,y,alpha,tail)

328

Verificarea ipotezelor statistice

In urma executarii acestor instructiuni, se efectueaza testul  asupra datelor continute


n vectorii x si y, folosind nivelul de semnificatie alpha, care are valoarea implicita
alpha=0.05.
Parametrul tail specifica una din cele trei alternative, care conduc la testul bilateral (tail=0, implicit), unilateral dreapta (tail=1) si unilateral stanga
(tail=-1). Daca h=1, atunci ipoteza nula va fi respinsa, respectiv daca h=0, ipoteza nu poate fi respinsa.
Ultima forma de apel permite, de asemenea, obtinerea valorii critice c, precum si
a intervalului de ncredere pentru diferenta mediilor teoretice, corespunzator probabilitatii de ncredere 1-alpha, obtinut n vectorul cu doua componente ci. Valoarea
critica c are aceeasi semnificatie cu cea precizata la Observatia 6.4.2 si se calculeaza
cu formulele prezentate acolo.
Programul 6.8.5. Programul Matlab, ce urmeaza, aplica testul  , pentru datele
din Exemplul 6.8.3. Mai mult, se considera si testele unilateral dreapta si unilateral
stanga, precum si obtinerea intervalelor de ncredere, cand alpha=0.05.
x=[10.27*ones(1,3),10.28*ones(1,2),10.29,10.3,10.32];
y=[10.26*ones(1,2),10.27,10.29,10.3,10.31*ones(1,3)];
fprintf( h
c
ci
\n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest2(x,y,0.05,i);
fprintf( %d %5.4f
(%4.2f,%4.2f) \n,h,c,ci)
end

In urma executarii programului, se obtin rezultatele:


h
c
ci
___________________________
0 0.3577
(-Inf,0.01)
0 0.7154
(-0.03,0.02)
0 0.6423
(-0.02, Inf)

Se observa ca pentru tail=-1 si tail=1, se construiesc intervale nemarginite,


respectiv la stanga si la dreapta.

6.8.4 Dispersii diferite necunoscute


Dispersiile
(6.8.3)

si 



sunt necunoscute si diferite. Se va considera statistica

       
 




 



6.8. Teste pentru compararea mediilor


care urmeaza legea Student cu
se calculeaza cu formula

(6.8.4)

329

grade de libertate. Numarul

al gradelor de libertate

 
 







unde



  





 
Sa ajuns la testul  , care pentru nivelul de semnificatie 
 dat, conduce
la regiunile critice corespunzatoare alternativelor considerate, respectiv:





  


         

 
 


  
     











  

 



  
     





 


 
 



   

 



 



 




   

   

Etapele aplicarii testului


1. Se dau:

   

 

 

 







;    


   astfel nc
at    


2. Se determina intervalul

unde



este functia de repartitie pentru legea Student cu grade de liber
tate calculat cu formula (6.8.4), iar intervalul numeric    este respec
           
tiv, pentru cele trei alternative considerate,
  ,
  ,

;
  

   


unde

 




3. Se calculeaza






4. Concluzia: daca
pinsa.





 
    

     



  





  







  

 


  


 

  ipoteza  este admisa, n caz contrar este res-

330

Verificarea ipotezelor statistice


Exemplul 6.8.6. Se cerceteaza capacitatea fiolelor farmaceutice de  ml, care provin de la doua fabrici. In acest scop, se considera cate o selectie pentru doua loturi
de fiole provenite respectiv de la cele doua fabrici. Selectiile obtinute au distributiile
empirice de selectie
 
 







  

        




 









 
 




respectiv, pentru  :  ,  ,  ,  , ,  ,  , ,  ,  ,  ,  ,
 


,  ,  ,  , ,  , ,  .
 
Folosind nivelul de semnificatie
, vom compara dispersiile celor doua
caracteristici. Apoi, pe baza acestui rezultat, vom compara mediile celor doua carac 
teristici, utilizand acelasi nivel de semnificatie 
.

Vom considera
c
a
cele
dou
a
caractersitici

s

i

sunt repartizate normal, res





pectiv
   si    . Se poate aplica testul  , pentru compararea dispersiilor teoretice  si  .
Calculam pe rand:




Deoarece

 

 



  


 
   





    








avem ca 


Pe de alta parte, pentru

 





 




  



 

  




 , se considera statistica
 


FisherSnedecor cu
Daca se consider
a ipoteza nula

   




 

  




   



 


 care urmeaza legea

   

 
 grade de libertate.



 
  cu alternativa     






 
 
, avem din Anexa IV ca



   

 



  


 

In acest fel, am obtinut intervalul     , pentru statistica 


. 


 

Deoarece   
   , respingem
ipoteza
ca 
 .


Avand n vedere ca dispersiile teoretice  si  sunt necunoscute, iar conform
rezultatului precedent
difera n mod semnificativ, folosim testul  pentru compararea

mediilor
si
. Statistica  , ce se considera, n acest caz, este cea data prin formula (6.8.3), care urmeaza legea Student cu grade de libertate, unde se calculeaza
din relatia (6.8.4).

6.8. Teste pentru compararea mediilor

331

Astfel, pentru determinarea lui , avem succesiv


 
  



 

 

   

 

  
  si









de unde
. Folosind Anexa
ine ca   
 , prin urmare inter II, se obt

valul pentru statistica  este
    .
Pe de alta parte, avem ca
  

    

   
 



 




 
  



 

  

Deoarece
 
    , respingem ipoteza ca mediile teoretice
pentru fiolele produse de cele doua fabrici nu difera semnificativ.

Programul 6.8.7. Calculele din exemplul de mai sus, se pot efectua cu urmatorul
program Matlab:
x1=[100,101,102*ones(1,2),103*ones(1,3),...
104*ones(1,4),105*ones(1,5),106*ones(1,4),...
107,108*ones(1,3),109];
x2=[110,101,112,120,117,105,109,111,118,113,...
106,108,115,113,112,100,116,112,114,112];
f=var(x2)/var(x1);
c1=finv(0.01,19,24); c2=finv(0.99,19,24);
fprintf( f=%6.2f, c1=%5.2f, c2=%5.2f\n,f,c1,c2)
ma1=mean(x1); ma2=mean(x2);
v1=var(x1); v2=var(x2); c=(v1/25)/(v1/25+v2/20);
n=c2/24+(1-c)2/19; n=ceil(1/n);
t=(ma1-ma2)/sqrt(v1/25+v2/20);
t2=tinv(0.99,n); t1=-t2;
fprintf( t=%7.3f, t1=%6.3f, t2=%6.3f,t,t1,t2)

Rezultatele obtinute, n urma executarii programului, sunt:


f= 5.31, c1= 0.34, c2= 2.76
t= -5.116, t1=-2.485, t2= 2.485



Observatia 6.8.8. Daca se noteaza prin


, atunci ipoteza compusa nula
 
  
devine 
, iar ipotezele alternative se rescriu dupa cum urmeaza: 
,
 
  
  s
i respectiv 
iar statisticile care au fost date mai nainte se pot

rescrie cu acest nou parametru necunoscut .
  

Observatia 6.8.9. Cand selectiile  sunt
de volum mare,
  , pentru legi de
 

probabilitate oarecari, respectiv

, pentru legi de probabilitate normale,
statistica

        




 

332

Verificarea ipotezelor statistice




poate fi considerata ca urmand legea normala


aplica testul .

. Asadar n acest caz se poate

6.8.5 Observatii perechi


Dac
a cele dou
ie sunt
perechile
a selectii sunt de tip pereche, adica variabilele de select
 



   ,   ,atunci
se
pot
considera
diferent

ele


,
pentru
care



, oricare a fi
 .
Problema poate fi reformulata.
Se considera o populatie , pentru care se cerceteaza caracteristica , care ur 
meaza legea normala
 , cu    necunoscut.

Vrem sa verificam ipoteza nula 
, cu una din alternativele
 , cand obtinem testul  bilateral,



and obtinem testul  unilateral dreapta,
 , c
 

, cand obtinem testul  unilateral stanga.
Conform Proprietatii 4.2.26, statistica





unde

  
    
 
 





    




  

urmeaza legea Student cu


 grade de libertate.
    dat, se poate determina
Prin urmare, pentru nivelul de semnificatie
 
intervalul numeric   astfel ncat


   

     


       
 
       

unde





 

 
este functia de repartitie pentru legea Student cu
grade de libertate (tabelata n
Anexa II, pentru anumite valori).

Intervalul numeric    pentru statistica  nu este determinat n mod unic din
conditia de mai sus. In functie de alternativa  aleasa, se considera suplimentar:

6.8. Teste pentru compararea mediilor






unde

 
 
 

333




   , daca
 
  , daca

  



, daca

  este cuantila de ordin


,

 ,
 
,

a legii Student cu

 grade de libertate.

Etapele aplicarii testului


1. Se dau:

   

 

      




 



2. Se calculeaza intervalul    astfel ncat


(dupa cum s-a prezentat nainte);
3. Se calculeaza







 
 

4. Concluzia: daca 
respinsa.

 


    


 





   
  

 
    


  

  ipoteza  este admisa, n caz contrar ipoteza este

Programul 6.8.10. Vom scrie un program, care genereaza n vectori aleatori, care
urmeaza legea normala bidimensionala. Folosind testul  pentru perechi, vom verifica ipoteza nula, ca mediile celor doua variabile sunt egale, precum si intervalul de
ncredere pentru diferenta mediilor, respectiv cand se aplica testele bilateral, unilateral dreapta si unilateral stanga. Nivelul de semnificatie folosit este alpha=0.05.
mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); Z=mvnrnd(mu,v,n);
d=diff(Z,1,2);
fprintf( h
c
ci
\n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest(d,0,0.05,i);
fprintf( %d %5.4f
(%4.2f,%4.2f) \n,h,c,ci)
end


Rezultatele obtinute, pentru mu1=mu2=10, v

2 2
si n=30, sunt
2 3

334

Verificarea ipotezelor statistice


h
c
ci
___________________________
0 0.6715
(-Inf,0.35)
0 0.6570
(-0.26,0.41)
0 0.3285
(-0.20, Inf)

Deoarece h=0, pentru fiecare alternativa n parte, testul  nu respinge ipoteza ca cele
doua medii sunt egale. Acest lucru se vede si din faptul ca valoarea critica satisface
inegalitatea c alpha=0.05.
Programul mai calculeaza intervalul de ncredere pentru diferenta celor doua medii. Se observa ca acesta difera, n functie de parametrul tail=-1,0,1. De asemenea, se observa ca am considerat nivelul de semnificatie alpha=0.05, dar acesta
poate fi usor modificat n apelul functiei ttest.

6.9 Testul

pentru concordanta

Se considera colectivitatea cercetata din punct de vedere al caracteristicii  cantitativa sau calitativa. Fie numarul claselor caracteristicii  si
evenimentul ca
un individ luat la ntamplare din colectivitatea sa apartina clasei cu numarul de

ordine .


Notand 
,   , atunci    .





a  
,
 , cu ipoteza
Relativ la caracteristica  facem ipoteza nul




 

 .
alternativa : exista astfel ncat
Pentru a verifica aceasta ipoteza se considera o selectie repetata de volum . Fie



. Folosind aceste date de selectie se obtin frecventele
datele de selectie   
absolute ale claselor caracteristicii  . Vom nota prin
frecventa absoluta a clasei

cu numarul de ordine . Altfel spus, numara de cate ori a aparut evenimentul
n
selectia considerata.


Corespunzator frecvent
elor absolute ,
 , avem variabilele aleatoare (de
  
 , ce iau aceste valori.
selectie) ,
Asadar, pornind de la caracteristica
 , care poate fi si calitativa, s-a ajuns la
 

variabilele de selectie ,
 , care sunt componentele unui vector aleator        
dimensional
, ce urmeaza legea multinomiala. Anume, avem:


      



 




 



  

  


unde
 ,
Daca privim ipoteza nula
legi multinomiale.



  

,
 ,       .
, constatam ca aceasta se refera la parametrii unei


6.9. Testul

 pentru concordanta

335

Proprietatea 6.9.1. Cu notatiile dinainte avem ca statistica

 



 

 cu   grade de libertate, cand

urmeaza legea

Demonstratie. Se porneste de la formula lui Stirling


avem ca





 






 


sau










 

e  . Astfel,

 
e



e

  




  

 






unde este o constanta pozitiva. Logaritmand aceasta relatie obtinem
ln






si notand






ln






 

 
ln



 



adica

rezulta ca



 
ln




 



ln




ln

 

Pastrand primii doi termeni din dezvoltarea n serie a logaritmului avem




ln

 

ln



 

ln

  
   







    

ln

deci



 
ln




 

 





 

336

Verificarea ipotezelor statistice

Dar avem ca

 


deci






       
 
 , obtinem
Daca se noteaza 





 






ln



sau



 



adica vectorul aleator

 


 

 












    
ln


e   

e   




 

 

pentru
, urmeaza o lege normala dimensionala degenerata, deoarece fiecare
componenta  se poate exprima ca si combinatie liniara a celorlalte componente.
Din teoria probabilitat ilor se cunoaste ca suma patratelor componentelor unui
vector aleator ce urmeaza legea normala si ntre care exista o legatura liniara este
o variabila aleatoare ce urmeaza legea  cu numarul gradelor de libertate dat de
numarul componentelor vectorului mai putin unu. Ceea ce trebuie demonstrat.
Pe baza proprietatii precedente, pentru nivelul de semnificatie
poate determina cuantila    astfel ncat
 

   



     
 

    dat, se

unde   noteaza functia de repartitie a legii


cu
 grade de libertate.

Regiunea critica se poate scrie si n acest caz, anume
    

 
       

 

Astfel, pentru mare, are loc relatia




ipoteza  va fi admisa daca  
contrar.

  



     

 




   

  

 


 

, deci
, respectiv va fi respinsa n caz

6.9. Testul

 pentru concordanta

Etapele aplicarii testului


    



 



 
 
 . (sirul datelor de select
ie


 este un sir avand ca elemente evenimentele
,
 , din
 



1. Se dau:

337

care se obtin frecventele absolute


2. Se calculeaza
3.
4.

 


 astfel ncat  



);

  
 



  

 
Se calculeaza   



   ipoteza  este admisa, n caz contrar ipoteza
Concluzia: daca 


este respinsa.

 privind concordanta trebuie ca sa fie nObservatia 6.9.2. La utilizarea testului





 , c
and  , iar daca numarul claselor
, atunci 
deplinite conditiile
sa fie mult mai mare decat . Cand aceste conditii nu sunt ndeplinite, se efectueaza
o regrupare a datelor de selectie.

Exemplul 6.9.3. S-a aruncat un zar de  de ori si s-au obtinut urmatoarele rezultate:


Fata
    
Frecventa


Folosind nivelul de semnificatie
, sa verificam daca zarul respectiv este fals
sau nu.
Se aplica testul , privind parametrii legii multinomiale. Intr-adevar, evenimen 

tul
reprezinta aparitia fetei cu numarul ,
 . Se face ipoteza nula




 



cu alternativa


  astfel ncat

Se calculeaza valoarea statisticii

adica zarul nu este fals




adica zarul este fals

, care are  

 grade de libertate, anume

    
   
   

   
 
 
 



 


 
 
 





 

 



Pe de alta parte, din Anexa III, avem cuantila
 , deci





  , ceea ce conduce la respingerea ipotezei nule,
rezulta
    
adica acceptam ipoteza ca zarul este fals.

338

Verificarea ipotezelor statistice

Programul 6.9.4. Programul Matlab, care urmeaza, efectueaza calculele din exemplul precedent:
x=1:6; f=[15,7,4,11,6,17]; p=1/6*ones(1,6);
x2=sum((f-60*p).2./(60*p));
cuant=chi2inv(0.95,5);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

iar rezultatele obtinute sunt:


x2=
13.6
cuant= 11.07

Aplicatia 6.9.5. (Testul  neparametric privind concordanta). Fie caracteristica  ,


care urmeaza legea de probabilitate cu functia de repartitie  necunoscuta. Relativ
la legea de probabilitate, se face ipoteza nula  
, cu ipoteza alternativa

 
. Cand consideram testul  neparametric, functia de repartitie  nu
depinde de nici un parametru necunoscut.

Daca domeniul valorilor caracteristicii  este, sa zicem, intervalul   si daca




vom considera clasele obtinute prin punctele  

, atunci
apar parametrii necunoscuti






De asemenea, evenimentul
va fi evenimentul ca un individ luat la ntamplare din

colectivitatea cercetata sa apartina clasei    . Prin urmare, s-a ajuns la aplicarea

testului  privind
concordanta. Ipoteza nula, mai sus precizata, devine n acest fel







   ,
 , iar ipoteza alternativa se va rescrie : exista  astfel ncat







  

 , unde 
              

 neparametric

Etapele aplicarii testului


1. Se dau:

     

 



  

2. Se calculeaza frecventele absolute








 


  ;


 , si probabilitat ile



 astfel ncat     




 




functia de repartitie a legii  cu
 grade de libertate;

3. Se calculeaza

 

4. Se calculeaza 

 




  
 


  fiind

6.9. Testul

 pentru concordanta

339

   se admite ipoteza ca legea de probabilitate a


5. Concluzia: daca 
 
caracteristicii  este data de functia de repartitie , n caz contrar ipoteza este
respinsa.


Exemplul 6.9.6. Fie caracteristica  ce reprezinta numarul fetelor dintro familie cu


patru copii. Pentru verificarea ipotezei ca  urmeaza o lege binomiala de parametru



. Distributia selectiei lui  este
 , s-a efectuat o selectie de volum










Folosind nivelul de semnificatie
, sa verificam daca  urmeaza legea bino
miala. Daca  urmeaza legea binomiala cu 
 , atunci are distributia teoretica












Ipoteza privind faptul ca  urmeaza legea binomiala, se scrie sub forma

 


de





 





 neparametric, unde numarul gradelor de libertate este dat


. Valoarea calculata a caracteristicii  este

Seva aplica
 testul





Cum 

  
   
    

   












 
 
 






 




 


 avem ca ipoteza nula este admisa.




Programul 6.9.7. Prin executarea programului Matlab:


x=0:4; f=[4,10,8,7,3];
p=[1/16,1/4,3/8,1/4,1/16];
x2=sum((f-32*p).2./(32*p));
cuant=chi2inv(0.95,4);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

se obtine
x2=
cuant=

4.5
9.49





340

Verificarea ipotezelor statistice

Aplicatia 6.9.8. (Testul  neparametric privind exponentialitatea). Relativ la ca, unde       ,    si


racteristica  se face ipoteza nula  


parametrul  cunoscut, adica  urmeaza legea exponentiala.

, se consiDeoarece domeniul valorilor caracteristicii  este intervalul






dera clasele caracteristicii  date prin

. Astfel
avem:





 


   





  





 



 si  

Etapele aplicarii testului




   

1. Se dau:



     

2. Se calculeaza frecventele absolute






     



3. Se calculeaza

4.

 


Se calculeaza 

 
  

 





 , si probabilitat ile
     


  


 astfel ncat  



 

  
 

  
 


   



   se accepta ipoteza ca  urmeaza legea expo5. Concluzia: daca 


  
nentiala de parametru , n caz contrar ipoteza este respinsa.


Aplicatia 6.9.9. (Testul  parametric privind concordanta). Se considera caracteristica  care urmeaza legea de probabilitate cu functia de repartitie  necunoscuta.
Relativ la legea de probabilitate se face ipoteza nula  
 cu ipoteza alter

nativa  
 . Fata de cazul neparametric, functia de repartit
ie  se consi  

dera ca depinde de parametri necunoscuti. Fie acesti parametri  
, adica






.
     
In acest caz, fata de cazul neparametric, la nceput se estimeaza parametrii necunoscuti, folosind datele de selectie considerate, cu ajutorul metodei verosimilitat ii
maxime. Fie estimatiile de verosimilitate maxima ale parametrilor mai sus precizati,
  

respectiv  
.
In continuare, cele expuse la cazul neparametric raman neschimbate cu doua observatii. In primul rand, probabilitat ile claselor considerate se calculeaza prin formula




pentru
libertate.

           


 . In al doilea rand, legea







, n acest caz, are

  






 grade de

6.9. Testul

 pentru concordanta

 parametric

Etapele aplicarii testului

      

 



  

1. Se dau:

341

  

  
    

2. Se determina estimatiile de verosimilitate maxima


  

metrii  
;
3. Se calculeaza frecventele absolute




   
    

4. Se calculeaza





 

5. Se calculeaza 

6. Concluzia: daca 





pentru para-

 , si probabilitat ile


 

 astfel ncat






  

 

  

  
 

  


 












  se accept
a ipoteza ca  urmeaza legea de
 
       


probabilitate data prin functia de repartitie 
 
n caz

contrar ipoteza este respinsa.
 
Exemplul 6.9.10. O substanta radioactiva este observata n  intervale de timp de
lungimi egale (   secunde). Pentru fiecare interval de timp este nregistrat numarul
particulelor emise. Rezultatele obtinute sunt:











Nr. part.















Notand cu  caracteristica ce reprezinta numarul de particule emise ntr-un interval


de timp de lungime   secunde, vrem sa verificam daca  urmeaza legea lui Poisson,

folosind nivelul de semnificatie
.

Folosim testul
parametric privind concordanta, deoarece parametrul legii lui

, este necunoscut. Asadar, num
Poisson,

arul gradelor de libertate va fi
 
  
   
. Avem ca estimatorul de verosimilitate maxima pentru

este media de selectie. Prin urmare avem






 


  



   

Se calculeaz
at ile de la legea lui Poisson, cu parametrul
 aapoiprobabilit

   

adica

Astfel se obtin valorile:
 




,

342

Verificarea ipotezelor statistice















   

       
 

de unde


  


 







Pe de alta parte, folosind Anexa III, avem cuantila   
  si prin urmare
  









, deci ipoteza ca  urmeaza legea lui Poisson este
acceptata.

Programul 6.9.11. Ilustrarea calculelor este facuta prin programul Matlab


x=0:10;
f=[57,203,383,525,532,408,273,139,45,27,16];
la=sum(f.*x)/2608; p=poisspdf(x,la);
x2=sum((f-2608*p).2./(2608*p));
cuant=chi2inv(0.99,9);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

care prin executare conduce la urmatoarele rezultate:


x2=
14.9
cuant= 21.67

Aplicatia 6.9.12. (Testul  parametric privind normalitatea). Relativ la caracteristica  se considera ipoteza nula   , unde



 



 


 

  

sunt parametri necunoscuti, adica faptul ca  urmeaza legea normala


cu cei doi parametri necunoscuti.
Folosind metoda verosimilitatii maxime se determina, pe baza datelor de selectie

    
, estimatiile de verosimilitate maxima pentru si respectiv , anume
  si

  






si









   


(a se vedea Exemplul 5.3.7).Deoarece domeniul valorilor caracteristicii  este  se






considera clasele date prin
 
Pe de alta parte probabilitat ile corespunzatoare acestor clase se obtin cu formulele





     
     

 

 

6.9. Testul

 pentru concordanta

Avand n vedere ca

unde

  

343




 



este functia lui Laplace, adica


rezulta ca


e 

 







           

 
 




Etapele aplicarii testului


1. Se dau:

   



      

2. Se calculeaza frecventele absolute

si probabilitat ile


   


;

 , estimatiile

 



 

 
         



   
 


              

 
 





 
    


3. Se calculeaza

4. Se calculeaza 








 astfel ncat 



 




  
 




   se accepta ipoteza ca


5. Concluzia: daca 


 

  , n caz contrar
mala
ipoteza este respinsa.


 urmeaza legea nor-

Exemplul 6.9.13. Se considera caracteristica  , ce reprezinta rezistenta, n


,a
unor tronsoane de ceramica acoperite
cu
carbon.
S
a
se
verifice
normalitatea
lui

,

folosind o selectie de volum
 , pentru care sau obtinut datele de selectie
  
 
  
 
   
clasa






frecv.

344

Verificarea ipotezelor statistice

   


  


 







utilizand testul de concordanta , cu nivelul de semnificatie
.
 
Prima data se estimeaza parametrii de la legea normala
 , adica media


teoretica
  si abaterea standard teoretica 
 , folosind metoda
de verosimilitate maxima. Se cunoaste ca estimatiile de verosimilitate maxima pentru
si  sunt respectiv








 








     


(a se vedea Exemplul 5.3.7). Avem distributia empirica de selectie pentru caracteristica 







 
                 
 



















de unde calculam
















    
 


  

Se considera valoarea numerica




unde este numarul claselor (



este dat prin



     

  
 

 


 


 



, n cazul de fata ),  este frecventa clasei , iar
      








subintervalul     definind clasa . Dupa cum


estecunoscut,  este valoarea





unei variabile aleatoare care urmeaza legea  cu
 grade de libertate,
fiind






numarul parametrilor estimati. In cazul de fata avem ca
, deci avem
 
grade de libertate.


6.9. Testul

 pentru concordanta

345

   
, folosind Anexa III.
  , pentru statistica


  , adica intervalul numeric pentru
Anume, se obtine ca    





statistica  este    .
Calculele pentru valoarea numerica  se aranjeaza n urmatorul tabel:
Se determina intervalul




















 




   







 




 




 

 

 






 




  

 














 
















 








 









 

 

 











 

 




 

 




 

 


Valorile functiei lui


 se iau din Anexa I si se are n vedere ca functia
 Laplace

impara, adica
. De asemenea, facem observatia ca
 
 


Deoarece 
risticii  .







 









 

 

este

    , rezulta ca se accepta ipoteza normalitatii caracte-

Programul 6.9.14. Toate calculele din tabelul precedent pot fi efectuate prin programul Matlab:
x=1.625:0.05:2.025; f=[11,14,17,17,18,16,13,10,8];
ma=sum(f.*x)/124; s=sqrt(sum(f.*(x-ma).2)/124);
a=[-inf,1.65:0.05:2,inf];
F=normcdf(a,ma,s); p=diff(F);
x2=sum((f-124*p).2./(124*p));
cuant=chi2inv(0.95,6);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

Rezultatele obtinute n urma executarii programului sunt:


x2=
3.3
cuant= 12.59

346

Verificarea ipotezelor statistice

6.10 Testul
pentru compararea
mai multor caracteristici


Se considera colectivitat ile ,


 , independente, cercetate din punct de vedere al
aceleasi caracteristici (calitative sau cantitative). Fie aceasta caracteristica  pentru


colectivitatea . Relativ la caracteristicile  ,
 , se face ipoteza nula ,

ca acestea urmeaza aceeasi lege de probabilitate. Se noteaza cu numarul claselor
caracteristicii cercetate si
evenimentul ca un individ luat la ntamplare din una din
colectivitat ile cercetate sa apartina clasei cu numarul de ordine  .
Daca se noteaza prin 
 , adica probabilitatea ca un individ luat
la ntamplare din colectivitatea
sa apartina clasei cu numarul de ordine  , atunci
 


  

ipoteza nula se poate rescrie



 .
Probabilitat ile astfel definite satisfac relatiile




 

iar cand ipoteza  este satisfacuta, avem de asemenea   



Pentru a verifica aceasta ipoteza se considera cate o selectie repetata de volum


 . Datele de selectie sunt trecute n tabelul urmator.
Selectia






..
.

..
.





Vol. selectiei

..
.

..
.



Total

Total


..
.

..
.




Elementul
, iar

al tabelului reprezinta frecventa absoluta a aparitiei clasei n selectia




 

 



 







Proprietatea 6.10.1. Estimatiile de verosimilitate maxima pentru parametrii necu


noscuti  ,   , sunt date prin


6.10. Testul

 pentru compararea mai multor caracteristici

Demonstratie. Functia de verosimilitate are expresia












347



 

 
 
   
cand ipoteza nula  este adevarata. Avand n vedere relatia dintre probabilitat ile


 , se obtine ca



 

 



  


sau prin logaritmare, se ajunge la




ln 

ln











ln 



Sistemul ecuatiilor de verosimilitate maxima va fi

ln


  


de unde rezulta ca












 

sau, avand n vedere proprietat i ale sirului de rapoarte egale, se obtine









Observatia 6.10.2. Daca se are n vedere ca



binomiale
, rezulta ca statistica



 

cu




 






S-a ajuns astfel la estimatiile




sunt valorile unor variabile aleatoare



 

 




   

   
 




348

Verificarea ipotezelor statistice

urmeaza o lege . Pentru a stabili numarul al gradelor de libertate se tine seama




de faptul ca numarul variabilelor aleatoare
este , numarul legaturilor ntre 


este , iar numarul parametrilor
i este
urmare, numarul gradelor de

    estimat
.Prin



libertate este



Etapele aplicarii testului
1. Se dau: ;

2. Se calculeaza
3.
4.

 ,



 ;

 ,


  , astfel ncat 

  
Se calculeaza 



   

 
Se calculeaza   


 

5. Concluzia: daca 
respinge.



 ;

,

 se accepta ipoteza nula




 

, n caz contrar se

Observatia 6.10.3. Cand probabiliat ile  , 


 , sunt cunoscute (caz mai rar
ntalnit), deci nu se cere a fi estimate, atunci statistica





 




urmeaza legea  cu
 grade de libertate. Aplicarea testului,
n acest caz, se adapteaza n mod corespunzator.
Exemplul 6.10.4. S-au considerat trei loturi de bolnavi de emfizem pulmonar, n
functie de numarul tigarilor fumate zilnic: mai putin de un pachet, unul sau doua
pachete si respectiv mai mult de doua pachete. Pentru emfizemul pulmonar sunt considerate  stadii notate de la I la IV. Rezultatele cercetarilor sunt trecute n urmatorul
tabel sistematizat
Categoria




Stadiul

pachet
pachete

pachete

II

III

IV













 





 pentru tabele de contingenta

6.11. Testul

349


Vrem sa sa verificam, cu nivelul de semnificatie
, ipoteza ca numarul
de tigari fumate zilnic nu influenteaza repartizarea bolnavilor n cele patru stadii
ale bolii. Verificam ipoteza facuta cu ajutorul testului  privind compararea aceluiasi atribut, dar pentru
iidiferite.
 Numarul gradelor de libertate este dat
  populat
prin formula


  
 pentru care se obtine cuantila
     .

Se calculeaza apoi valoarea


    




 

 




   




 




  



 




 
    
 




 

  , se respinge ipoteza ca repartizarea pe cele


Deoarece     

patru stadii ale bolii nu depinde de numarul tigarilor fumate zilnic.
Programul 6.10.5. Programul Matlab
f=[41,28,25,6;24,116,46,14;4,50,34,12];
fip=sum(f); fpj=sum(f); x2=0;
for i=1:3
for j=1:4
t=fip(i)*fpj(j)/400;
x2=x2+(f(i,j)-t)2/t;
end
end
cuant=chi2inv(0.99,6);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

n urma executarii, conduce la rezultatele din exemplul precedent:


x2=
64.4
cuant= 16.81

6.11 Testul

pentru tabele de contingenta

Se considera colectivitatea cercetata din punct de vedere a doua caracteristici  si


 (calitative sau cantitative). Se pune problema independentei celor doua caracteris
tici. Fie numarul claselor pentru caracteristica  si respectiv pentru caracteristica
 . Notam cu  evenimentul ca un individ luat la ntamplare din colectivitatea sa

apartina clasei cu numarul de ordine n raport cu  si notam cu  evenimentul ca
un individ luat la ntamplare din sa apartina clasei cu numarul de ordine  n raport

350
cu

Verificarea ipotezelor statistice

 . Fie

   , 



 

 ,


 . Daca se noteaza

si



 

atunci ipoteza nula relativa la independenta celor doua caracteristici se scrie

 

 

cu ipoteza alternativa , ca  este falsa.


Pentru verificarea acestei ipoteze se considera datele de selectie 
Datele de selectie sunt sistematizate n tabelul de contingenta

   




 
..
.

..
.


unde

 
 ,

iar

 



..
.

reprezinta frecventa absoluta a clasei

..
.



 .

..
.

  
,



Proprietatea 6.11.1. Estimatiile de verosimilitate maxima pentru parametrii necu




noscuti  ,
 , si  , 
 , sunt date prin formulele:


 

Demonstratie. Functia de verosimilitate are expresia








 

ln

 


cand ipoteza nula


 



 


 




















 este adevarata. Prin logaritmare se obtine

 ln






 




 



ln

 ln





6.11. Testul

 pentru tabele de contingenta

351

de unde se ajunge la sistemul ecuatiilor de verosimilitate maxima

ln


 

sau













Avand n vedere proprietatile unui sir de rapoarte egale se obtine ca







 

deci

In mod analog se obtine si faptul ca






Observatia 6.11.2. Valoarea numerica





 



   

 


 

 

este cea a unei variabile aleatoare ce urmeaza legea  cu



 grade
de libertate. Num
de libertate s-a determinat avand n vedere ca au
arul algradelor


 parametri, iar ntre  si  exista o singura legatura
fost estimati


Asadar






 




Etapele aplicarii testului


1. Se dau: ;
2. Se calculeaza:
3. Se calculeaza

 ,




adica

 
 
 

.

 ;




 ,



  

  , astfel nc
at  



,


 ;

352

4.

Verificarea ipotezelor statistice


Se calculeaza 

   



 


 

5. Concluzia: daca 
respinge.



 se accepta ipoteza nula




 

Observatia 6.11.3. Cand probabilitat ile


ntalnit), avem ca





 





si

, n caz contrar se

sunt cunoscute (caz mai rar




 



este valoarea unei variabile aleatoare ce urmeaza legea  cu
grade 
unei legi 

 de libertate. Aceasta rezulta din faptul ca prima suma corespunde

cu
 grade de libertate, a doua sum
 grade de
  a corespunde unei legi cu

cu
libertate, iar a treia unei legi
 grade de libertate. Prin urmare



 



de unde







Aplicarea testului, n acest caz, se face prin adaptarea corespunzatoare a cazului precedent.
Observatia 6.11.4. Testul  pentru tabele de contingenta si respectiv pentru compararea mai multor caracteristici, pare sa fie acelasi . Dar, remarcam faptul ca problemele de la care se porneste sunt complet diferite.
Exemplul 6.11.5. Pentru cercetarea dependentei dintre culoarea
  a ochilor si cuindivizi. Rezultatele
loarea  a parului, s-a considerat un esantion format din 
sunt trecute n tabelul sistematizat urmator
A

B

Albastri
Gri sau verzi
Caprui

Blonzi

Sateni

Bruneti

Roscati

 




 
 















 



Folosind nivelul de semnificatie
, vom verifica ipoteza ca cele doua caracteristici (atribute) sunt independente.

Se
foloses
 tetestul
 tabele
decontingenta cu numarul gradelor de liber   pentru

tate


  
.

6.12. Testul de concordanta al lui Kolmogorov

353

Pe de o parte avem ca




    


 

 
     


 
 
 



   

  

 
 


 


Pe de alta parte, avem cuantila    


ca cele doua atribute sunt independente.

 
 


 

 


 



 




 

, deci se respinge ipoteza

Programul 6.11.6. Calculele din exemplul precedent pot fi efectuate cu programul


Matlab
f=[1768,807,189,47;946,1387,746,53;115,438,288,16];
fip=sum(f); fpj=sum(f); x2=0;
for i=1:3
for j=1:4
t=fip(i)*fpj(j)/6800;
x2=x2+(f(i,j)-t)2/t;
end
end
cuant=chi2inv(0.99,6);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

In urma executarii acestui program, se obtin rezultatele:


x2= 1073.5
cuant= 16.81

6.12 Testul de concordanta al lui Kolmogorov


Se considera caracteristica  de tip continuu cu functia teoretica de repartitie
necunoscuta. Relativ la functia  se face ipoteza nula   , cu una din
(1)
(2)
(3)


 
 


 






(testul lui Kolmogorov bilateral),


(testul lui Kolmogorov unilateral dreapta),
(testul lui Kolmogorov unilateral stanga).

Pentru verificarea ipotezei nule , cu una din alternativele precizate, se consi




, respectiv
dera o selectie repetata de volum , cu datele de selectie   
variabilele de selectie  , , . . . ,  corespunzatoare. Se considera statisticile

   




 




 

354

Verificarea ipotezelor statistice

  


  




 

   




  


unde    este functia de repartitie de selectie.


Conform teoremei lui Kolmogorov (Teorema 4.2.38) statistica

  



 


 

urmeaza o lege de probabilitate data prin legea lui Kolmogorov, cand


me, avem ca

 


 





  

  e  

 




. Anu-




  a lui Kolmogorov fiind tabelata pentru anumite valori n Anexa V.
functia
De asemenea,


 



 

 




  

 



   

ce poarta numele de lege cu doua grade de libertate.


    fixat, se pot determina cuantilele
Pentru un nivel de semnificatie
si   astfel ncat



  
 


     adica


pentru testul bilateral al lui Kolmogorov,


   

 











, pentru testele unilaterale dreapta si stanga ale lui Kolmo

si

 
adica

gorov.
 va fi admisa cand valorile calcuCorespunz

 ator celor trei alternative, ipoteza
 






 ale statisticilor ,  ,
late ,  , , pe baza datelor de selectie

, satisfac respectiv conditiile

(1)
(2)
(3)






  , c
and



   , cand

   , cand


 ,
 
,
 
,





iar n caz contrar va fi respinsa.
Prezentam, n cele ce urmeaza, mpreuna, cele trei teste (bilateral, unilateral
dreapta, unilateral stanga) ale lui Kolmogorov. Remarcam ca cele trei teste sunt teste
distincte, alegerea unuia dintre ele se face apriori.

6.12. Testul de concordanta al lui Kolmogorov

355

Etapele aplicarii testului lui Kolmogorov




1. Se dau: ;   



;

; 

2. Se determina
(1)
(2)
(3)


   
  astfel nc
at





  astfel nc
 
at





 astfel ncat









, cand




, cand
, cand

 
 
 

 ,

  ,

 ;

3. Se calculeaza
(1)
(2)
(3)





, cand

 , cand
, cand

  ,
 
,
 
;




4. Concluzia: daca
(1)
(2)
(3)

  
ipoteza  este admisa, cand
 
 este admisa, cand
  ipoteza
 
 este admisa, cand
  ipoteza



 
 


  ,

 ,

 ,


 

Observatia 6.12.1. Avand n vedere ca functiile (de repartit


sunt mo ie) si
noton crescatoare si ca pentru determinarea cuantilelor   si   este necesara


inversarea acestor functii de repartitie, se poate evita aceasta operatie. Pentru aceasta
se determina valorile functiilor
si
ale statisticilor
pe valorilecalculate
  ,,
 ,  


,

,
adic
a
se
calculeaz
a
respectiv


 . Astfel, se va respinge ipoteza nula , daca  , numindu

se valoare critica.

 

Observatia 6.12.2. Pentru calculul valorilor statisticilor ,  ,  putem con 


 
,
sidera ca datele de selectie sunt ordonate crescator, adica  
 
altfel se poate
face o astfel de ordonare. De asemnea, remarcam faptul ca are loc
       .
aceste precizari, precum si faptul ca atat functia de repartitie de selectie
, Folosind
cat si functia de repartitie  sunt functii nedescrescatoare, obtinem urmatoarele

356

Verificarea ipotezelor statistice

formule de calcul



  




 





        


     


     
        
       


  




   
   


Observatia 6.12.3. Cand datele sunt grupate, avand clasele date prin punctele


atunci se folosesc formulele






     




        



       




       


Exemplul 6.12.4. Rezultatele masuratorilor asupra diametrului


piese de acelasi tip (n mm), sunt cele ce urmeaza
Diam.
Frecv.

 , pentru  de

  

    

    





 



    

    



 







 

Folosind nivelul de semnificatie
, stiind


 mm si


abaterea standard 
   mm, se cere verificarea normalitatii caracteristicii  , cu ajutorul testului lui Kolmogorov bilateral, iar apoi cu ajutorul testului
 neparametric.
Ipoteza care se face este ca functia de repartitie a lui  este





   
  


 

  

6.12. Testul de concordanta al lui Kolmogorov

357

 
unde
. Pentru verificarea acestei ipoteze, folosind criteriul lui

, 
Kolmogorov, se calculeaza



 



       
 

 , iar   
  este functia de repartitie



 





  
 
 ,
unde 
de selectie.
Pentru calculul valorilor functiei de repartitie  se tine seama de faptul ca
 




       



      
 



 
  
 
cu functia lui Laplace
tabelata n Anexa I.
Pe de alta parte, valorile functiei de repartitie de selectie se calculeaza cu formula







pentru



Calculele sunt aranjate n urmatorul tabel.





 


 

  






















 

 







 



 



 



 

 









 

 

 







 













 









 










 

 






 








Din calculele facute avem ca  





  
 , de unde rezulta ca

    


     
 


Din Anexa V, se determina cuantila  



normalitate pentru caracteristica  , deoarece


 

 
 

  si admitem ipoteza de
  
 .
   


358

Verificarea ipotezelor statistice

 , cu testul  neparametric, cal-

Pentru a verifica normalitatea caracteristicii


culam prima data probabilitat ile




unde





     

si  






. Astfel avem







 


 

 

 



 




  



Pe de alta parte, avem cuantila


 



Deoarece 
acceptata.

  
    


 
 

de unde



 



 

 
 



 
 

 




  






  

 , conform Anexei III.
 
  , rezult
a ca ipoteza de normalitate este


Programul 6.12.5. Vom scrie un program Matlab, pentru aplicarea testului lui Kolmogorov si a testului , n cazul datelor din exemplul precedent.
% Testul lui Kolmogorov
a=97.75:0.5:102.75;
n=[0,21,47,87,158,181,201,142,97,41,25];
F0=normcdf(a,100.25,1); Fn=cumsum(n)/1000;
dn=max(abs(F0-Fn)); ks=sqrt(1000)*dn;
fprintf( ks=
%6.4f\n,ks)
% Testul chi2
F0(1)=0; F0(end)=1;n=n(2:end);
p0=diff(F0); x2=sum((n-1000*p0).2./(1000*p0));
cuant=chi2inv(0.95,9);
fprintf( x2= %6.4f\n,x2)
fprintf( cuant=%6.2f,cuant)

Rezultatele obtinute n urma executarii programului sunt:


ks=
0.1964
x2= 3.2117
cuant= 16.92

Ceea ce confirma rezultatele mai sus obtinute.


Exemplul 6.12.6. Se tin sub observatie
 motoare electrice pana la defectarea
ultimului dintre ele. Se considera caracteristica  , ce reprezinta numarul miilor de
ore de functionare pana la defectare. Rezultatele observatiilor sunt date n tabelul
urmator

6.12. Testul de concordanta al lui Kolmogorov


  


Durata
Frecv.

  


  

359

  



   

   

  


Sa se cerceteze exponentialitatea caracteristicii  , folosind testul  cu nivelul



de semnificatie
, iar apoi folosind testul lui Kolmogorov cu acelasi nivel de
semnificatie.
Legea exponentiala are functia de repartitie
 

e



parametru necunoscut

Folosind metoda verosimilitatii maxime avem estimatia pentru

      


 


 





Se calculeaza prima data probabilitat ile:






unde



        
      
  


Rezultatele sunt trecute n tabelul urmator



  
  
 

 






 

 

 

 

 

 




si care conduce la


 




  



    
  
   
 

       






  . Deoarece avem valoaDin Anexa III obtinem cuantila    



   

  accept
rea calculata 
  
am ipoteza exponentialitatii.
 
Pentru
aplicarea
testului
lui
Kolmogorov,
din
Anexa
V se determina cuantila
  
 . Ipoteza exponentialitatii lui  va fi acceptata daca


  

Aici 
, iar
n tabelul urmator.


 

 

    


 este functia de repartitie de selectie. Calculele sunt efectuate

360

Verificarea ipotezelor statistice

 




 



















 







 

 



 

 






 

 







 
 

  

  


  
Asadar avem ca
exponentialitatea lui  este admisa.



 

 deci


Programul 6.12.7. Vom scrie un program Matlab, care efectueaza calculele din
exemplul precedent:
% Testul chi2
clear
a=[0:30:180,300]; f=[13,10,5*ones(1,4),7];
mij=[15:30:165,240]; mu=sum(mij.*f)/50;
F0=expcdf(a,mu);F0(end)=1; p0=diff(F0);
x2=sum((f-50*p0).2./(50*p0));
cuant=chi2inv(0.95,5);
fprintf( x2= %6.4f\n,x2)
fprintf( cuant= %4.2f\n,cuant)
% Testul lui Kolmogorov
F0=F0(2:end);F0(end)=expcdf(a(end),mu);
Fn=cumsum(f)/50;
dn=max(abs(F0-Fn)); ks=sqrt(50)*dn;
fprintf( ks=
%6.4f,ks)

In urma executarii programului se obtine:


x2= 2.8770
cuant= 11.07
ks=
0.4181

6.12.1 Functia kstest


Statistics toolbox contine functia kstest, care efectueaza testul lui Kolmogorov.
Apelul functiei se poate face cu una din instructiunile:
h=kstest(x)
h=kstest(x,cdf)
h=kstest(x,cdf,alpha)
h=kstest(x,cdf,alpha,tail)
[h,c,ks]=kstest(x,cdf,alpha,tail)

Comenzile de acest tip lanseaza executia testului lui Kolmogorov bilateral (cand
tail=0, valoare implicita), unilateral dreapta (cand tail=1), respectiv unilateral
stanga (cand tail=-1), prin considerarea datelor continute de vectorul x, iar functia

6.12. Testul de concordanta al lui Kolmogorov

361

de repartitie ipotezata fiind precizata prin prametrul cdf. Implicit se considera cdf
corespunzand legii normale standard.
Daca parametrul cdf este prezent, trebuie sa fie o matrice cu doua coloane, care
contine n coloana a doua valorile functiei de repartitie ipotezate pe punctele precizate
n prima coloana. Ar fi de dorit ca prima coloana a matricei cdf sa coincida cu
vectorul x, altfel functia va efectua un proces de interpolare pentru calculul valorilor
functiei ipotezate pe punctele lui x, folosind punctele precizate prin matricea cdf.
Din acest motiv, se impune ca toate componentele lui x sa aiba valorile continute n
intervalul determinat de valoare minima si valoarea maxima a componentelor primei
coloane a lui cdf.
Parametrul alpha (implicit alpha=0.05) reprezinta nivelul de semnificatie.
Rezultatele obtinute au urmatoarele semnificatii. Daca h=1 ipoteza nula se res
pinge, ceea ce corespunde faptului ca valoarea critica c satisface relatia c alpha,
iar daca h=0, ipoteza nula nu poate fi respinsa. Mai
remarcam faptul ca ks va


contine respectiv
valoarea
calculat
a
a
statisticilor
,
si , 
si verific
iile
   
anrelat
  si,
c

n
,
pentru
testul
bilateral,
respectiv
c

n pentru testele unilaterale.
c 




Programul 6.12.8. Sa aplicam testele lui Kolmogorov (bilateral, unilateral dreapta


si unilateral stanga) pentru datele x=-2:1:4, considerand legea ipotezata ca fiind
legea normala standard si nivelul de semnificatie alpha=0.05. Programul ce urmeaza, sa reprezinte grafic si functia de repartitie de selectie, mpreuna cu functia de
repartitie ipotezata.
x=-2:4;
fprintf( h
c
ks\n)
fprintf(__________________\n)
for i=-1:1
[h,c,ks]=kstest(x,[],0.05,i);
fprintf( %d %5.4f
%4.2f \n,h,c,ks)
end
cdfplot(x), hold on, title([])
t=-3:0.01:3; plot(t,normcdf(t,0,1),k--)

In urma executarii programului, se obtin rezultatele:


h
c
ks
__________________
0 0.0682
0.41
0 0.1363
0.41
0 0.7753
0.13

respectiv graficele din Figura 6.4 Se observa, n mod surprinzator, ipoteza nula nu
poate fi respinsa. Acest lucru se datoreaza faptului ca testul lui Kolmogorov este bazat
pe un rezultat asimptotic, adica se aplica pentru valori mari ale volumului selectiei.

362

Verificarea ipotezelor statistice

0.9

0.8

0.7

F(x)

0.6

0.5

0.4

0.3

0.2

0.1

0
3

Figura 6.4: Testul lui Kolmogorov

6.12.2 Functia lillietest


Functia lillietest efectueaza testul Lilliefors, care reprezinta o modificare a
testului lui Kolmogorov, n care ipoteza nula presupune ca functia de repartitie este
cea de la legea normala, dar parametrii nu mai sunt precizati, ci sunt estimati folosind
datele de selectie.
Apelul functiei se poate face cu una din comenzile
h=lillietest(x)
h=lillietest(x,alpha)
[h,c,ls]=lillietest(x,alpha)

Comenzile de acest tip lanseaza executia testului Lilliefors, prin considerarea datelor
continute de vectorul x, iar functia de repartitie ipotezata fiind cea de la legea normala

 .
Parametrul alpha (implicit alpha=0.05) reprezinta nivelul de semnificatie.
Rezultatele obtinute au urmatoarele semnificatii. Daca h=1 ipoteza nula se res
pinge, ceea ce corespunde faptului ca valoarea critica c satisface relatia c alpha,
iar daca h=0, ipoteza nula nu poate fi respinsa.
Mai remarcam faptul ca ls va contine respectiv valoarea calculata a statisticii
, iar c este valoarea critica, care se calculeaza cu ajutorul lui ls, folosinduse
tabelele construite de Lilliefors. Daca n aceste tabele nu se afla valoarea corespunzatoare, atunci c=NaN, dar h indica nca daca ipoteza nula este respinsa sau nu.
Programul 6.12.9. Sa aplic
am testul lui Lilliefors pentru n numere aleatoare ce urmeaza legea normala
 , continute de vectorul x, cu nivelul de semnificatie

6.13. Testul KolmogorovSmirnov

363

alpha=0.05. Programul ce urmeaza sa reprezinte grafic si functia de repartitie de


selectie, mpreuna cu functia de repartitie ipotezata, adica cea de la legea normala
 
.
clf
n=input(n=); mu=input(mu=); s=input(sigma=);
x=normrnd(mu,s,1,n);
[h,c,ls]=lillietest(x);
fprintf( h=%d\n c= %5.4f\n ls=%5.4f,h,c,ls)
ma=mean(x); va=sqrt(var(x));
cdfplot(x), hold on, title([])
t=ma-3*va:0.01:ma+3*va;
plot(t,normcdf(t,ma,va),k--)

In urma executarii programului pentru n=10, mu=100 si sigma=2, se obtin rezultatele:


h=0
c= 0.1433
ls=0.1093

si graficele din Figura 6.5


1

0.9

0.8

0.7

F(x)

0.6

0.5

0.4

0.3

0.2

0.1

10
x

12

14

16

Figura 6.5: Testul Lilliefors

6.13 Testul KolmogorovSmirnov

Se considera doua caracteristici independente  si


de tip continuu cu functiile
teoretice de repartitie  si  necunoscute. Privind cele doua caracteristici vrem

sa verificam daca sunt identic repartizate. Astfel, consideram ipoteza nula data prin
   , cu una din alternativele:

364

Verificarea ipotezelor statistice


 

 



(1)
(2)
(3)

 




(testul KolmogorovSmirnov bilateral),



(testul KolmogorovSmirnov unilateral dreapta),



(testul KolmogorovSmirnov unilateral stanga).

Pentru verificarea ipotezei nule , cu una din alternativele precizate, se considera cate o selectie repetata de volum  si respectiv , cu datele de selectie

    
  si variabilele de selectie        , corespunzatoare pen  


tru caracteristica  si datele de selectie  
      , corespunzatoare pentru caracteristica  . si variabilele de selectie

Se considera statisticile



 

 





     




    




    


 
  
  


unde  si  sunt functiile de repartitie de selectie.


 
Pentru  
, functiile de repartitie ale acestor functii de selectie au
urmatoarele comportari asimptotice:
 

 
     









 e

   


 
 

 , fiind tabelata pentru anumite valori n Anexa V, resfunctia lui Kolmogorov
pectiv



   



 


   


   





  

 

 
 e 



ce poarta numele de lege cu doua grade de libertate.


    fixat, se pot determina cuantilele  ,
Pentru
un nivel de semnificatie

  s
i   astfel ncat
  
 

 

 
      
 


adica


  



pentru testul bilateral KolmogorovSmirnov,








    


 
 

adica

 


6.13. Testul KolmogorovSmirnov

365

pentru testul unilateral dreapta KolmogorovSmirnov,





   



 
 

adica

 


pentru testul unilateral stanga KolmogorovSmirnov,


Corespunza tor celor trei alterantive, ipoteza  va fi admisa cand valorile cal

  si      , ale
culate   ,   ,   pe baza datelor de selectie  
statisticilor   ,   , satisfac respectiv conditiile

   

(1)

   

(2)

   

(3)

   ,

  ,




  ,

, cand


, cand

, cand


iar n caz contrar va fi respinsa.


Prezentam, n cele ce urmeaza, mpreuna cele trei teste (bilateral, unilateral
dreapta si unilateral stanga) KolmogorovSmirnov. Remarcam ca cele trei teste sunt
teste distincte, alegerea unuia dintre ele se face apriori.
Etapele aplicarii testului lui KolmogorovSmirnov


1. Se dau: ;   



  ;     



 ;

2. Se determina
(1)
(2)
(3)


   
  astfel nc
at


 
  astfel nc
at







3. Se calculeaza

(1)
(2)
(3)

astfel ncat

  
     , cand
  

     , cand
  
    , cand

4. Concluzia: daca







 

 



, cand
, cand
, cand

  ,




 ;
 ;

 
 

 


 ,
  ;


 ;

366

Verificarea ipotezelor statistice


 este admisa, cand
  ipoteza
 
 este admisa, cand
  ipoteza
 
  ipoteza  este admisa, cand


(1)
(2)
(3)


 

 



  ,




 ,
 ,

 

Observatia 6.13.1. Avand n vedere ca functiile (de repartit


ie) si sunt monoton crescatoare si ca pentru determinarea cuantilelor  ,   si   este ne


cesara inversarea acestor functii de repartitie, se poate evita aceasta operatie. Pentru
aceasta se determina valorile functiilor si
pe valorile calculateale statisticilor


     
  ,   ,  , adica se calculeaza, respectiv 
   ,

 

     
    , 

ipoteza nula



 daca valoarea critica

    
    . Astfel, se va respinge

satisface inegalitatea

6.13.1 Functia kstest2


Statistics toolbox contine functia kstest2, care efectueaza testul Kolmogorov
Smirnov. Apelul functiei se poate face cu una din instructiunile:
h=kstest(x,y)
h=kstest(x,y,alpha)
h=kstest(x,y,alpha,tail)
[h,c,ks]=kstest(x,y,alpha,tail)

Comenzile de acest tip lanseaza executia testului KolmogorovSmirnov bilateral


(cand tail=0, valoare implicita), unilateral dreapta (cand tail=1), respectiv unilateral stanga (cand tail=-1), prin considerarea datelor continute n vectorii x si y.
Parametrul alpha (implicit alpha=0.05) reprezinta nivelul de semnificatie.
Rezultatele obtinute au urmatoarele semnificatii. Daca h=1, ipoteza nula se res
pinge, ceea ce corespunde faptului ca valoarea critica c satisface relatia c alpha,
iar daca h=0, ipoteza nula nu poate fi respinsa. Mai remarc
am faptul ca ks va contine

   ,    si   ,si verifica relat
respectivvaloarea
calculat
a
a
statisticilor
n , pentru testul bilateral, respectiv c 
n iilesi

c
n, pentru testele unilaterale.
c 

Programul 6.13.2. Sa aplicam testele KolmogorovSmirnov (bilateral, unilateral


dreapta si unilateral stanga) pentru datele x=-1:1:5 si y reprezentand 20 de numere aleatoare, ce urmeaza legea normala standard, iar nivelul de semnificatie sa fie
alpha=0.05. Programul ce urmeaza, sa reprezinte grafic si cele doua functii de
repartitie de selectie.
clf
x=-1:5; y=randn(1,20);
fprintf( h
c
ks\n)
fprintf(__________________\n)
for i=-1:1

6.13. Testul KolmogorovSmirnov

367

[h,c,ks]=kstest2(x,y,[],i);
fprintf( %d %5.4f
%4.2f\n,h,c,ks)
end
h1=cdfplot(x); hold on, h2=cdfplot(y);
title(Functiile de repartitie de selectie)
set(h1,linestyle,--)
set(h2,linestyle,-)

In urma executarii programului, se obtin rezultatele:


h
c
ks
__________________
1 0.0110
0.61
1 0.0219
0.61
0 0.9783
0.04

respectiv graficele din Figura 6.6. Testul KolmogorovSmirnov este bazat pe un reFunctiile de repartitie de selectie
1

0.9

0.8

0.7

F(x)

0.6

0.5

0.4

0.3

0.2

0.1

0
2

Figura 6.6: Testul KolmogorovSmirnov


zultat asimptotic, adica se aplica pentru valori mari ale volului selectiei, dar aici sau
folosit selectii de volum mic, n mod special pentru a urmari pe figura modul de calcul
a celor trei statistici    ,    si   .

368

Verificarea ipotezelor statistice

Anexe

369

Anexa I (Functia lui Laplace)














































 


 
 







 
 
 
 








 
 





 

 
 


 
 
 
 


 
 
 



 




 
 





 





 

 
 




 



 



 

 
 


 
 
 








 

 





 

 




 
 
 


 

 
 
 

 
 
 

 
 





 
 


 













 

 

 



 

 


 
 
 
 
 
 
 
 

 
 





  e  


Sutimi ale lui


 
 
 
 


 














 


 
 
 

 

 


 


 
 
 


 

 
 





 
 




 










 
 

 

 



 


 
 
 
 
 
 


 

 
 











 

 
 




 



 
 
 
 



 
 
 
 
 
 
 
 


 

 
 





 
 



 



 



 







 



 

 


 


 

 
 
 




 
 


 

 





 












 






 


 

 
 
 

 
 
 
 



 
 






 


 



 


 

 


 

 
 
 



 
 
 
 
 



 
 




370

Anexe
Anexa II (Legea Student) 































 


  
 
  










 





 
 



 
 
 
 

 

 
 


 
 







 
 
 
 
 
 
 


























 

 


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 
 
 
 
 
 

 
 
 
 


 







 





 
 

 
 
 




 
 


 







 


 

 











 

 

 
 

 
 
 





 










 




 
 
 



 
 
 
 

 










 
 
 
 
 
 
 
 
 











 







 

 






 



 














 
 
 
 
 
 
 
 



 


 




 







 




 



 






 



 


















 

 











 









 





 




 

 




 



 

 

 

 

 

 




 

 

 









 



 

 





 

 

 

 



 



 








 

 




 



 



 





 











 






 

 

 

 

 

Anexe

371

Anexa III (Legea


  

)







 


































 
 
 




 

 

 







 









 
 











 










 










 
 









 

 





 



 
















 



 






 
 

 
 
 












 





 
 



 



 






 
 

 
 

 




 

  

  


  
  



 




  

 


  
  
  
  

  
  




 
 
 










 



 


  

   


 
  

  

  

 





 


  

 


    

 

 

 











  
 

 
  



 



 







 








 


 
 

 



 





 

 





 




















 

 

  



 




 
 

 
 




 









 





 



 

 
 
  
 


 






 



 











 












 





 
 


  


 
 

 


372

Anexe
Anexa IV (Legea FisherSnedecor)

 


  
 











 
 



   


 


 


 


 


 


 


 


 


 


 


 















 



 












 

 



 







 








 




 


 



 

 




 




 

 












 






 

 





 



 
 





 


















 






 
 
  




 



 








 

    





  









 



























 






 


 

 





 


 


 



 


 
 









 

 
 














 








 











 






 











  







 







 


 
















Anexe

373

Anexa IV (continuare)




 


 


 


 


 


 


 


 


 


 


 


 


 













 


 
 

 


 








 


 











 
















 



 
 















 









 









 







 





















 



 




















   


 
 
 

 


 
 

 
  
 


  
 



 
   



   
  

 

 
  



  

 


 
 

  




 

  


 
 

 




  


 





 



 







 















 

 



 












 


 

 
 
 






 













 



 



 



 





 
 








 
 




 


 
 



 






 













 










 





 






 







374

Anexe
Anexa IV (continuare)




 


 


 


 


 


 


 


 


 


 


 


 


 
















 







 


 





 
 






 






 

 








 











 
















 




 





 






 


 
 

 




 

 

 






 



 




 

 
 




 


 

















 





    
 
 
 
 



  
 

 
  


 

  
  


  
  
 

 


 
   
 
 
 

 


 
 



 
  




 

 

 
 
 

  


 
 
 



 










 



 
 

 











 





 










 


 















 



 
 
 































 







 


 

 







 












 



 



 

 

 





Anexe

375

Anexa IV (continuare)




 


 


 


 


 


 


 


 


 


 











 





 
 




 









 




 





 

 








 













 

 






 


 

 







 



 


 













 




 




 






 














 

 





   







  

 





 

 
 



  

 





 
  






 
 







 
 
 






 








 

 




 
 

 








 















 















 

 















 




 







 









 

 











 





 








 















 





 













376

Anexe

Anexa V (Functia lui Kolmogorov)



  

 


Sutimi ale lui






























 



 



 







 



 




 

 

 





 





 















 











 






 

 

 



 







 



 



 

 



 



 

 







 



 

 

 











 

 






 



 











 





 



 



 

 







 





 



 







 

















 











 

Bibliografie
[1] Abramowitz, M., Stegun, I. A., Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables, tenth ed., Dover Publications, Inc.,
New York, 1972.
[2] Blaga, P., Calculul probabilitat ilor. Culegere de probleme, Universitatea
BabesBolyai, ClujNapoca, 1984.
[3]

, Metode statistice n modelarea cu calculatorul. Lucrari de laborator,


Universitatea BabesBolyai, ClujNapoca, 1993.

[4]

, Calculul probabilitat ilor si statistica matematica. Vol. II. Curs si culegere de probleme, Universitatea BabesBolyai, ClujNapoca, 1994.

[5]

, Statistica matematica. Lucrari de laborator, Universitatea Babes


Bolyai, ClujNapoca, 1999.

[6]

, Statistica matematica, Universitatea BabesBolyai, ClujNapoca,


2000.

[7]

, Statistica matematica (editia II), Universitatea BabesBolyai, Cluj


Napoca, 2001.

[8] Blaga, P., Lupas, A., Muresan A. S., Matematici aplicate, Vol.III, Promedia
Plus, ClujNapoca, 1999.
[9] Blaga, P., Muresan A. S., Matematici aplicate n economie, Vol.III, Transilvania Press, ClujNapoca, 1996.
[10] Blaga, P., Radulescu, M., Calculul probabilitat ilor, Universitatea Babes
Bolyai, ClujNapoca, 1987.
[11] Ciucu, G., Elemente de teoria probabilitat ilor si statistica matematica, Editura
didactica si pedagogica, Bucuresti, 1963.
377

378

Bibliografie

[12] Ciucu, G., Craiu, V., Probleme de statistica matematica, Editura didactica si
pedagogica, Bucuresti, 1968.
[13]

, Teoria estimatiei si verificarea ipotezelor statistice, Editura didactica


si pedagogica, Bucuresti, 1968.

[14]

, Introducere n teoria probabilitat ilor si statistica matematica, Editura


didactica si pedagogica, Bucuresti, 1971.

[15]

, Inferenta statistica, Editura didactica si pedagogica, Bucuresti, 1974.

[16] Ciucu, G., Craiu, V., Stefanescu, A., Statistica matematica si cercetari operationale, Vol. I, Editura didactica si pedagogica, Bucuresti, 1974.
[17] Ciucu, G., Tudor, C., Probabilitat i si procese stochastice. Vol. I, Editura Academiei, Bucuresti, 1978.
[18] Craiu, V., Verificarea ipotezelor statistice, Editura stiintifica si enciclopedica,
Bucuresti, 1972.
[19] Craiu, V., Enache, R., Basca, O., Teste de concordanta cu programe n FORTRAN, Editura stiintifica si enciclopedica, Bucuresti, 1974.
[20] Cramer, H., Mathematical methods of statistics, Princeton University Press,
Princeton, 1951.
[21] DacunhaCastelle, D., Duflo, M., Exercises de probabilites et statistiques.
1. Probl`emes a` temps fixe. Tome 1, Masson, Paris, 1990.
[22]

, Probabilites et statistiques. 1. Probl`emes a` temps fixe. Tome 1, Masson, Paris, 1990.

[23] Deak, I., Random number generators and simulation, Akademiai Kiado, Budapest, 1990.
[24] Dumitrescu, M., Florea, D., Tudor, C., Probleme de teoria probabilitat ilor si
statistica matematica, Editura Tehnica, Bucuresti, 1985.
[25] Enders, W., Applied econometric. Time series, John Wiley & Sons, 1995.
[26] Ermakov, S. M., Metoda Monte Carlo si probleme nrudite, Editura Tehnica,
Bucuresti, 1976.
[27] Feller, W., An introduction to probability theory and its applications. Vol. I,
John Wiley, New York, 1957.

Bibliografie
[28]

379

, An introduction to probability theory and its applications. Vol. II, John


Wiley, New York, 1966.

[29] Gnedenko, B. V., The theory of probability, Mir Publishers, Moscow, 1976.
[30] Good, Ph. I., Resampling Methods. A Practical Guide to Data Analysis,
Birkhauser, Boston Basel Berlin, 1999.
[31] Griffiths, D. F., An Introduction to Matlab, Version 2.1, University of Dundee,
1997.
[32] Grinstead, Ch. M., Snell, J. L., Introduction in probability, Second edition, American Mathematical Society, 1997.
[33] Gurski, E. I., Culegere de probleme pentru teoria probabilitat ilor si statistica
matematica (l. rusa), Edit. Inv. superior Minsk, Minsk, 1984.
[34] Hoel, P. J., Introduction to mathematical statistics, Fourth edition, John Wiley
& Sons, New YorkLondonSydneyToronto, 1971.
[35]

, Statistique mathematique, Tome II, Armand Colin, Paris, 1991.

[36] HoffmannJrgensen, J., Probability with a view toward statistics, Vol. I-II,
Chapman & Hall, New YorkLondon, 1994.
[37] Iosifescu, M., Mihoc, Gh., Theodorescu, R., Teoria probabilitat ilor si statistica
matematica, Editura Tehnica, Bucuresti, 1966.
[38] Iosifescu, M., Moineanu, C., Trebici, V., Ursianu, E., Mica enciclopedie de statistica, Editura stiintifica si enciclopedica, Bucuresti, 1985.
[39] Jansson, B., Random number generators, Victor Petterson Bokindustri Aktiebolag, Stockholm, 1966.
[40] Johnson, N. L., Kotz, S., Distributions in statistics. Discrete distributions, Houghton Mifflin Company, Boston, 1969.
[41] Kendall, M. G., Stuart, A., The advanced theory of statistics. Vol. 1. Distribution
theory, Second edition, Charles Griffin & Company Limited, London, 1961.
[42]

, The advanced theory of statistics. Vol. 2. Inference and relationship,


Charles Griffin & Company Limited, London, 1963.

[43]

, The advanced theory of statistics. Vol. 3. Design and analysis, and


timeseries, Charles Griffin & Company Limited, London, 1966.

380

Bibliografie

[44] Knuth, D. E., The art of computer programming, Vol. II. Seminumerical algorithms, Addison-Wesley, Mass., 1969.
[45] Lebart, L., Morineau, M. G., Fenelon, J.-P., Traitment des donnees statistiques.
methodes et programmes, Dunod, Paris, 1982.
[46] Lecoutre, J.-P., Tassi, Ph., Statistique non parametrique et robustesse, Economica, Paris, 1987.
[47] Lehmann, E. L., Testing statistical hypotheses, Second edition, Springer, New
YorkBerlin, 1997.
[48] Malita, M., Zidaroiu, C., Incertitudine si decizie, Editura stiintifica si enciclopedica, Bucuresti, 1980.
[49] Mihoc, Gh., Ciucu, G., Craiu, V., Teoria probabilitat ilor si statistica matematica, Editura didactica si pedagogica, Bucuresti, 1970.
[50] Mihoc, Gh., Ciucu, G., Muja, A., Modele matematice ale asteptarii, Editura
Academiei, Bucuresti, 1973.
[51] Mihoc, Gh., Craiu, V., Tratat de statistica matematica. Vol. I. Selectie si
estimatie, Editura Academiei, Bucuresti, 1976.
[52]

, Tratat de statistica matematica. Vol. II. Verificarea ipotezelor statistice, Editura Academiei, Bucuresti, 1977.

[53] Mihoc, Gh., Firescu, D., Statistica matematica, Editura didactica si pedagogica,
Bucuresti, 1966.
[54] Mihoc, I., Calculul probabilitat ilor si statistica matematica. Part. I, II, lito.
Univ. BabesBolyai, ClujNapoca, 1994,1995.
[55] Nakamura, S., Numerical Analysis and Graphic Visualization with MATLAB,
Prentice Hall PTR, Upper Saddle River, New Jersey, 1996.
[56] Oancea, E., Radulescu, M., Calculul probabilitat ilor si statistica matematica,
lito. Univ. BabesBolyai, ClujNapoca, 1974.
[57] Ogden, R. T., Essential wavelets for statistical applications and data analysis,
Birkhauser, Boston Basel Berlin, 1997.
[58] Onicescu, O., Numere si sisteme aleatoare, Editura Academiei, Bucuresti, 1962.

Bibliografie

381

[59] Onicescu, O., Botez, M. C., Incertitudine si modelare economica (econometrie


informationala), Editura stiintifica si enciclopedica, Bucuresti, 1985.
[60] Parzen, E., Modern probability theory and its applications, John Wiley, New
YorkLondon, 1960.
[61] Press, W. H., Flannery, B. P., Teukolsky, S. A., Vetterling, W. T., Numerical
Recipes. The Art of Scientific Computing, Cambridge University Press, Cambridge, 1986.
[62] Rancu, N., Tovissi, L., Statistica matematica cu aplicatii n productie, Editura
Academiei, Bucuresti, 1963.
[63] Rao, M. M., Probability theory with applications, Academic Press, New York,
1984.
[64] Renyi, A., Probability theory, Akademiai Kiado, Budapest, 1970.
[65] Rumsiski, L. Z., Prelucrarea matematica a datelor experimentale, Editura Tehnica, Bucuresti, 1974.

[66] Saporta, G., Probabilites, analyse des donnees et statistique, Editions


Technip,
Paris, 1990.
[67] Schervish, M. J., Theory of statistics, Springer, New YorkBerlin, 1995.
[68] Shiryaev, A. N., Probability, Springer, New YorkBerlin, 1995.
[69] Sigmon, K., Matlab Primer, Third edition, University of Florida, 1993.
[70] Snedecor, G. W, Cochran, W. G., Statistical methods, Iowa State University
Press, 1989.
[71] Stapleton, J. H., Linear statistical models, John Wiley & Sons, New York
ChichesterBrisbane, 1995.
[72] Stark, H., Woods, J. W., Probability, random processes, and estimation theory
for engineers, Prentice-Hall, New Jersey, 1986.
[73] Stoyanov, J., Mirazchiiski, I., Ignatov, Z., Tanushev, M., Exercise manual in
probability theory, Kluwer Academic Publishers, DordrechtBostonLondon,
1988.
[74] Sacuiu, I., Zorilescu, D., Numere aleatoare. Aplicatii n economie, industrie si
studiul fenomenelor naturale, Editura Academiei, Bucuresti, 1978.

382

Bibliografie

[75] Sveshnikov, A. A., Problems in probability theory, mathematical statistics and


theory of random functions, W. B. Saunders Company, PhiladelphiaLondon
Toronto, 1968.

[76] Tassi, Ph., Methodes statistiques, e dition, Economica, Paris, 1989.
[77] Vaduva, I., Analiza dispersionala, Editura Tehnica, Bucuresti, 1970.
[78]

, Modele de simulare cu calculatorul, Editura Tehnica, Bucuresti, 1977.

[79] Wahba, G., Spline models for observational data, Society for Industrial and
Applied Mathematics, Philadelphia, 1990.
[80] Yule, G. U., Kendall, M. G., Introducere n teoria statisticii, Editura stiintifica,
Bucuresti, 1969.

Index
Abatere
cuartilica, 152
medie absoluta, 152
medie patratica, 152
standard, 107, 152
abs, 9
acos, 9
acosh, 9
acot, 9
acoth, 9
acsc, 9
acsch, 9
all, 15
Amplitudinea, 152
clasei, 120
and, 14
angle, 9
ans, 12
any, 14
asec, 9
asech, 9
Asimetrie, 103, 154
asin, 9
asinh, 9
atan, 9
atan2, 9
atanh, 9
Atribut, 114
axis, 23

bar3h, 58
barh, 31
beta, 80
betafit, 282
betalike, 280
bino, 68
binofit, 282
boxplot, 164
Camp de evenimente, 62
Camp de probabilitate, 62
calendar, 6
Cantitate de informatie, 232
Caracteristica, 114
calitativa (atribut), 114
cantitativa, 114
continua, 115
discreta, 115
caseread, 127
casewrite, 127
cd, 4, 10
cdf, 65, 66, 74, 107
cdfplot, 223
ceil, 9
Centile, 104, 151
Centru de greutate, 174
chi2, 83
cla, 23
Clase, 120
clear, 11
clf, 23
clock, 6

bar, 31, 65, 134, 138


bar3, 58
383

384
Coeficientii
lui Fisher, 154
lui Pearson, 154
Coeficient de asimetrie
intercuartil, 154
Coeficient de corelatie, 95
al lui Pearson, 167
al rangurilor, 187
de selectie, 207
Coeficient de regresie, 174
Coeficient de variatie, 154
intercuartil, 154
Coeficientul
lui Kendall, 189
lui Spearman, 187
Coeficientul de concordanta
al lui Kendall, 194
Colectivitate, 114
colormap, 27
combnk, 10
Concatenare, 9
conj, 9
contour, 54
contourf, 55
Convergenta
n probabilitate, 108
n repartitie, 108
Corectiile
Sheppard, 158
Corelatie, 95, 165
Corp borelian, 62
corrcoef, 180
cos, 9
cosh, 9
cot, 9
coth, 9
cov, 179
Covarianta , 95
crosstab, 126

Index
csc, 9
csch, 9
Cuantila, 104
Cuartila, 104, 150
inferioara, 104, 150
superioara, 104, 150
cumprod, 157
cumsum, 157
Curba de regresie, 103, 170
date, 6
Date de selectie, 198
dbclear, 16
dbcont, 16
dbdown, 16
dbmex, 17
dbquit, 17
dbstack, 16
dbstatus, 16
dbstep, 16
dbstop, 16
dbtype, 16
dbup, 17
Decile, 104, 151
delete, 17
demo, 4
Densitate de probabilitate, 73, 74
marginala, 89
det, 10
diag, 10
Diagrama
cumulativa ascendenta, 129
integrala cumulativa, 132
prin batoane (bare), 129
diary, 11, 43
diff, 157
dir, 4
disp, 10
Dispersie, 95, 152
conditionata, 101, 170

Index
de selectie, 206
Distributie, 64
statistica, 123
Distributie marginala, 88
disttool, 107
Drepte de regresie, 173
Esantion, 197
echo, 48
edit, 16
Eficienta , 242
eps, 6
eq, 14
erf, 76
Eroare
de speta ntai, 291
de speta a doua, 291
Estimatie, 236
absolut corecta, 237
consistenta, 236
corecta, 239
cu  minim, 256
de verosimilitate maxima, 252
nedeplasata, 236
Estimator, 236
absolut corect, 237
consistent, 236
corect, 239
cu  minim, 256
de verosimilitate maxima, 252
nedeplasat, 236
optimal, 247
Eveniment
cert, sigur, 62
Exces, 103
exit, 2
exp, 9, 79
Experiment, 62
expfit, 282
eye, 6

385
ezcontour, 56
ezcontourf, 57
ezmesh, 57
ezmeshc, 57
ezplot, 35
ezplot3, 51
ezpolar, 25
ezsurf, 57
ezsurfc, 57
f, 85
factor, 10
factorial, 10
feval, 47
Fisiere script, 15, 43
figure, 23
file, 17
fill, 35
fix, 9
floor, 9
flops, 48
format, 5
Formula lui Daniels, 193
fplot, 33
fprintf, 13
Frecventa
absoluta, 120, 124
cumulata
ascendenta, 123
descendenta, 123
relativa, 123
Functia eroare, 76
Functia Laplace, 76, 77
Functia lui Euler
de speta ntai, 80
de speta a doua, 78
Functie caracteristica, 103
Functie de estimatie, 236
absolut corecta, 237
corecta, 239

386
eficienta, 242
nedeplasata, 236
Functie de probabilitate, 65
Functie de repartitie, 6365, 74
conditionata, 89
de selectie, 216
marginala, 88
Functie de selectie, 198
Functie de supravietuire, 93
Functie de verosimilitate, 229
Functie hazard, 93
Functie nucleu, 131
Gaussian, 131
parabolic (Epanechnikov), 131
Functie wavelet, 29
mama, 29
Functii Matlab, 43
Functiile lui Haar, 29
gam, 78
gamfit, 282
gamlike, 280
gcd, 10
ge, 14
geo, 73
geomean, 149
ginput, 13
gline, 181
global, 44
gplotmatrix, 146
grid, 24
grpstats, 163
Grupare, 120
gscatter, 144
gt, 14
gtext, 24
harmmean, 149
help, 2, 44
helpdesk, 4

Index
helpwin, 3
hist, 138, 139
histc, 139, 140
histfit, 278
Histograma, 129
hold, 22
hyge, 69
i, 6
icdf, 104, 107
imag, 9
Indicatorul
de verosimilitate, 257
lui Berkson, 257
lui Kullbach, 257
lui Neyman, 257
lui Pearson, 257
Indice
de dilatare, 29
de translatare, 29
inf, 6
input, 13
Instructiunea
break, 42
de atribuire, 12
error, 43
for, 40
if, 37
pause, 42
return, 42
switch, 38
try...catch, 41
while, 39
Instructiuni
de citire, 13
de scriere, 13
Interval
intercuartilic, 152
Interval de ncredere, 185, 187, 257
inv, 10

Index
Ipoteza statistica, 285
alternativa, 285
compusa, 285
nula, 285
simpla, 285
iqr, 155
j, 6
kstest, 360
kstest2, 366
kurtosis, 155
lcm, 10
ldivide, 8
le, 14
Lege de probabilitate
de tip continuu, 74
clasica, 74
statistica, 81
de tip discret, 64
clasica, 67
Legea
, 83
necentrata, 85
arcsin, 80
Bernoulli, 67
beta, 80
binomiala, 68
binomiala negativa, 72
Cauchy, 81
evenimentelor rare, 71
exponentiala, 71, 79
F (FisherSnedecor), 85
necentrata, 86
gamma, 78
geometrica, 73
hipergeometrica, 69
lognormala, 78
normala, 76
normala multidimensionala, 90

387
Pascal, 72
Poisson, 70
Rayleigh, 80
t (Student), 81
necentrata, 82
uniforma, 74
discreta, 68
Weibull, 80
Legea numerelor mari, 109
legend, 24
length, 10
lillietest, 362
load, 11
log, 9
log10, 9
log2, 9
logn, 78
lookfor, 3, 44
lsline, 181
lt, 14
mad, 155
magic, 6
Matrice vida, 12
Matricea covariantelor, 95
Matricea informatiei lui Fisher, 232
max, 156
mean, 149
median, 150
Mediana, 104, 149
Medie
aritmetica, 148
armonica, 149
geometrica, 148
Medie de selectie, 199
mesh, 52
meshgrid, 52
Metoda ferestrei mobile, 130
Metode de selectie
nerepetate, 198

388
repetate(bernoulliene), 198
min, 156
minus, 8
mkdir, 4, 10
mldivide, 8
mle, 278
Mod, 151
Moment, 151, 166
centrat, 103, 152, 167
centrat de seletie, 203
de seelctie, 201
initial, 103
moment, 155
mpower, 8
mrdivide, 9
mtimes, 8
mvnrnd, 117
mvtrnd, 117
NaN, 6
nanmax, 158
nanmean, 158
nanmedian, 158
nanmin, 158
nanstd, 158
nansum, 158
nargin, 44
nargout, 44
nbin, 72
ncf, 86
nchoosek, 10
nct, 82
ncx2, 85
ndims, 10
ne, 14
Nivel de semnificatie, 286
nlinfit, 185
nlintool, 186
Nor statistic, 133
norm, 76

Index
normfit, 282
normlike, 280
normspec, 87
not, 14
Numere
aleatoare, 116
pseudoaleatoare, 117
Observare
curenta, 115
partiala, 115
periodica, 115
totala, 115
ones, 6
or, 14
pdf, 65, 66, 74, 107
perms, 10
pi, 6
pie, 147
pie3, 147
plot, 17, 25, 28, 65, 74, 138
plot3, 49
plotmatrix, 145
plus, 8
poiss, 70
poissfit, 282
polar, 25
poly, 183
polyfit, 182
polytool, 184
polyval, 183
polyvalm, 183
Populatie, 114
power, 8
prctile, 151
primes, 10
Proba, 62
Probabilitate, 62
Probabilitate de ncredere, 185

Index
Proceduri Matlab, 43
prod, 157
Puterea unui test, 291
quit, 2
rand, 118
randn, 118
random, 117
randperm, 119
randtool, 147
range, 155
rank, 10
Raport de corelatie, 171
rayl, 80
raylfit, 282
rdivide, 8
real, 9
realmax, 6
realmin, 6
refcurve, 182
refline, 181
Regiune critica, 286
Regula lui Sturges, 120
rem, 9
Repartitie, 64
reshape, 7
Risc
de speta ntai, 291
de speta a doua, 291
roots, 183
round, 9
save, 11, 43
scatter, 142
scatter3, 143
sec, 9
sech, 9
Selectie, 197
cu probabilitat i egale, 198
sistematica, 197

389
stratificata, 198
tipica, 198
shading, 53
sign, 9
sin, 9
sinh, 9
Sistemul ecuatiilor
de verosimilitate maxima, 253
size, 10
skewness, 155
Sondaj, 197
sort, 156
sortrows, 156
Spatiul probelor, 62
sqrt, 9
stairs, 28, 65, 134
Statistica, 198
completa, 249
suficienta, 229
std, 155
Subfunctii Matlab, 45
subplot, 32
sum, 157
surf, 52
t, 81
Tabel de contingenta , 124, 349
Tabel de corelatie, 124
Tabel statistic
nesistematizat, 119
sistematizat, 119, 120
tabulate, 125
tan, 9
tanh, 9
tblread, 128
tblwrite, 128
Teorema limita
centrala, 110
MoivreLaplace, 110
Test, 285

390
cel mai puternic, 297
nedeplasat, 297
neparametric, 285
parametric, 285
Testul
 , 318, 321
bilateral, 318, 321
unilateral dreapta, 318, 321
unilateral stanga, 318, 321
 , 304, 325, 329
bilateral, 304, 310, 332
unilateral dreapta, 304, 332
unilateral stanga, 304, 332
, 286, 323
bilateral, 286
unilateral dreapta, 286
unilateral stanga, 286
, 312, 334, 346, 349
bilateral, 312
neparametric, 338
parametric, 340, 342
unilateral dreapta, 312
unilateral stanga, 312
FisherSnedecor, 318
bilateral, 318
unilateral dreapta, 318
unilateral stanga, 318
Kolmogorov, 353
bilateral, 353
unilateral dreapta, 353
unilateral stanga, 353
Kolmogorov-Smirnov, 363
bilateral, 363
unilateral dreapta, 364
unilateral stanga, 364
raportului verosimilitatilor, 308
Student, 304
bilateral, 304, 332
unilateral dreapta, 304, 332

Index
unilateral stanga, 304, 332
text, 24
tic, 49
times, 8
title, 24
toc, 49
trace, 10
transpose, 10
trimmean, 149
ttest, 307
ttest2, 327
unid, 68
unif, 74
unifit, 282
Valoare medie, 94, 95
conditionata, 99, 170
Valoarea functiei de selectie, 198
var, 155
Variatie
intercuartilica, 152
Variabila
nominala, 114
ordinala, 114
Variabila aleatoare, 62
(absolut) continua, 73
de tip continuu, 63
de tip discret, 63
simpla, 63
Variabile aleatoare
independente, 64
Variabile de selectie, 198
Varianta , 95
conditionata, 101
Vector aleator, 63
(absolut) continuu, 74
version, 4
Volumul
colectivitat ii, 114

Index
weib, 80
weibfit, 282
weiblike, 280
what, 17
which, 17
who, 11
whos, 11
workspace, 43
xlabel, 24
xor, 14
ylabel, 24
zeros, 6
zoom, 25
zscore, 290
ztest, 290

391

392

Index

You might also like