0% found this document useful (0 votes)

180 views

Stat Matlab PDF

This document provides an introduction to using Matlab. It discusses topics like launching and closing Matlab sessions, help commands, constants and variables, arithmetic expressions, assignment statements, input/output instructions, relational and logical operators, script files, two-dimensional and three-dimensional plotting commands, control flow statements like if/else, while loops and for loops, function definitions and calls, and commands for evaluating efficiency. It also provides overviews of probability theory, descriptive statistics, and other statistical concepts relevant for data analysis in Matlab.

Uploaded by

Maria Bothaza

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

180 views

Stat Matlab PDF

Uploaded by

Maria Bothaza

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 402

Cuprins

Prefata
1

vii

Introducere n Matlab
1.1 Gestionarea unei sesiuni Matlab . . . . . . . . . . . . . . . . . . .
1.1.1 Lansarea si nchiderea unei sesiuni Matlab . . . . . . . . .
1.1.2 Comenzi help . . . . . . . . . . . . . . . . . . . . . . . .
1.1.3 Comenzi sistem . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Constante. Variabile. Expresii aritmetice . . . . . . . . . . . . . . .
1.2.1 Constante . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Instructiunea format . . . . . . . . . . . . . . . . . . . .
1.2.3 Constante speciale . . . . . . . . . . . . . . . . . . . . . .
1.2.4 Variabile . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.5 Operatori aritmetici . . . . . . . . . . . . . . . . . . . . . .
1.2.6 Functii predefinite . . . . . . . . . . . . . . . . . . . . . .
1.2.7 Comenzi pentru gestiunea variabilelor si a spatiului de lucru
1.3 Instructiuni de atribuire . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Instructiuni de citire si scriere . . . . . . . . . . . . . . . . . . . . .
1.4.1 Instructiunea input . . . . . . . . . . . . . . . . . . . . .
1.4.2 Instructiunea ginput . . . . . . . . . . . . . . . . . . . .
1.4.3 Instructiunea fprintf . . . . . . . . . . . . . . . . . . .
1.5 Operatori relationali si operatori logici . . . . . . . . . . . . . . . .
1.5.1 Operatori relationali . . . . . . . . . . . . . . . . . . . . .
1.5.2 Operatori logici . . . . . . . . . . . . . . . . . . . . . . . .
1.6 Fisiere script (mfile) . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.1 Comenzi pentru gestionarea fisierelor . . . . . . . . . . . .
1.7 Grafica bidimensionala . . . . . . . . . . . . . . . . . . . . . . . .
1.7.1 Instructiunea plot . . . . . . . . . . . . . . . . . . . . . .
1.7.2 Comenzi si instructiuni de gestionare a graficelor . . . . . .
1.7.3 Instructiunile polar si ezpolar . . . . . . . . . . . . . .
i

1
2
2
2
4
4
5
5
6
7
8
9
10
12
13
13
13
13
14
14
14
15
17
17
17
22
25

Cuprins
1.7.4 Instructiunea stairs . . . . . . . . . . . . . . . . . . .
1.7.5 Instructiunile bar si barh . . . . . . . . . . . . . . . . .
1.7.6 Instructiunea subplot . . . . . . . . . . . . . . . . . .
1.7.7 Instructiunea fplot . . . . . . . . . . . . . . . . . . . .
1.7.8 Instructiunea ezplot . . . . . . . . . . . . . . . . . . .
1.7.9 Instructiunea fill . . . . . . . . . . . . . . . . . . . . .
1.8 Instructiuni de ciclare si control . . . . . . . . . . . . . . . . . .
1.8.1 Instructiunea if . . . . . . . . . . . . . . . . . . . . . .
1.8.2 Instructiunea switch . . . . . . . . . . . . . . . . . . .
1.8.3 Instructiunea while . . . . . . . . . . . . . . . . . . . .
1.8.4 Instructiunea for . . . . . . . . . . . . . . . . . . . . .
1.9 Instructiuni de ntrerupere . . . . . . . . . . . . . . . . . . . . . .
1.9.1 Instructiunea try. . . catch . . . . . . . . . . . . . . . .
1.9.2 Instructiunea pause . . . . . . . . . . . . . . . . . . . .
1.9.3 Instructiunea return . . . . . . . . . . . . . . . . . . .
1.9.4 Instructiunea break . . . . . . . . . . . . . . . . . . . .
1.9.5 Instructiunea error . . . . . . . . . . . . . . . . . . . .
1.10 Functii (proceduri) n Matlab . . . . . . . . . . . . . . . . . . . .
1.10.1 Definirea si structura unei functii Matlab . . . . . . . . .
1.10.2 Apelul unei functii (proceduri) Matlab . . . . . . . . . . .
1.10.3 Subfunctii . . . . . . . . . . . . . . . . . . . . . . . . . .
1.10.4 Functia feval . . . . . . . . . . . . . . . . . . . . . . .
1.10.5 Comanda echo . . . . . . . . . . . . . . . . . . . . . . .
1.11 Instructiuni de evaluare a eficientei . . . . . . . . . . . . . . . . .
1.11.1 Instructiunea flops . . . . . . . . . . . . . . . . . . . .
1.11.2 Instructiunile tic si toc . . . . . . . . . . . . . . . . .
1.12 Grafica tridimensionala . . . . . . . . . . . . . . . . . . . . . . .
1.12.1 Instructiunea plot3 . . . . . . . . . . . . . . . . . . . .
1.12.2 Instructiunea ezplot3 . . . . . . . . . . . . . . . . . .
1.12.3 Instructiunile meshgrid, mesh si surf . . . . . . . . .
1.12.4 Instructiunile contour si contourf . . . . . . . . . .
1.12.5 Instructiunile ezcontour si ezcontourf . . . . . . .
1.12.6 Instructiunile ezmesh, ezsurf, ezmeshc si ezsurfc
1.12.7 Instructiunile bar3 si bar3h . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

28
31
32
33
35
35
36
37
38
39
40
41
41
42
42
42
43
43
44
45
45
47
48
48
48
49
49
49
51
51
54
56
57
58

Elemente de teoria probabilitatilor

2.1 Camp de probabilitate . . . . . . .
2.2 Variabile aleatoare . . . . . . . .
2.3 Functie de repartitie . . . . . . . .
2.4 Legi de probabilitate de tip discret

.
.
.
.

61
62
62
63
64

.
.
.
.

Cuprins

2.5

2.6

2.7

iii
2.4.1 Functiile Matlab pdf si cdf . . . . . . . . . . . . . . . . .
2.4.2 Legi de probabilitate de tip discret clasice . . . . . . . . . .
Legi de probabilitate continue . . . . . . . . . . . . . . . . . . . .
2.5.1 Legi de probabilitate continue clasice . . . . . . . . . . . .
2.5.2 Legi de probabilitate continue statistice . . . . . . . . . . .
2.5.3 Functia Matlab normspec . . . . . . . . . . . . . . . . .
2.5.4 Distributie marginala . . . . . . . . . . . . . . . . . . . . .
2.5.5 Functie de repartitie conditionata . . . . . . . . . . . . . . .
2.5.6 Functie de supravietuire. Functie hazard . . . . . . . . . . .
Caracteristici numerice . . . . . . . . . . . . . . . . . . . . . . . .
2.6.1 Valoare medie. Dispersie (varianta ). Covarianta . . . . . . .
2.6.2 Functii Matlab pentru valoare medie si dispersie . . . . . .
2.6.3 Valoare medie conditionata. Dispersie (varianta ) conditionata
2.6.4 Functie caracteristica . . . . . . . . . . . . . . . . . . . . .
2.6.5 Momente . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.6 Mediana. Cuartile. Cuantile . . . . . . . . . . . . . . . . .
2.6.7 Functia Matlab icdf . . . . . . . . . . . . . . . . . . . . .
2.6.8 Functia Matlab disttool . . . . . . . . . . . . . . . . .
Siruri de variabile aleatoare . . . . . . . . . . . . . . . . . . . . . .
2.7.1 Inegalitatea lui Cebsev . . . . . . . . . . . . . . . . . . . .
2.7.2 Tipuri de convergenta . . . . . . . . . . . . . . . . . . . . .
2.7.3 Legea numerelor mari . . . . . . . . . . . . . . . . . . . .
2.7.4 Teoreme limita . . . . . . . . . . . . . . . . . . . . . . . .

65
67
73
74
81
87
88
89
92
94
94
99
99
103
103
104
104
107
107
107
108
109
109

Statistica descriptiva
113
3.1 Concepte de baza ale statisticii . . . . . . . . . . . . . . . . . . . . 114
3.2 Culegerea, prezentarea si prelucrarea datelor statistice . . . . . . . . 115
3.2.1 Generarea numerelor aleatoare n Matlab . . . . . . . . . . 115
3.2.2 Tabele statistice . . . . . . . . . . . . . . . . . . . . . . . . 119
3.2.3 Functiile tabulate si crosstab . . . . . . . . . . . . . 125
3.2.4 Functiile caseread, casewrite, tblread si tblwrite 127
3.2.5 Reprezentari grafice . . . . . . . . . . . . . . . . . . . . . 129
3.2.6 Functii Matlab pentru reprezentarea grafica a datelor statistice 134
3.2.7 Functia randtool . . . . . . . . . . . . . . . . . . . . . 147
3.2.8 Functiile pie si pie3 . . . . . . . . . . . . . . . . . . . . 147
3.3 Parametrii distributiilor statistice . . . . . . . . . . . . . . . . . . . 148
3.3.1 Parametri statistici ce masoara tendinta . . . . . . . . . . . 148
3.3.2 Functiile mean, geomean si harmean . . . . . . . . . . 149
3.3.3 Functia trimmean . . . . . . . . . . . . . . . . . . . . . 149
3.3.4 Functia median . . . . . . . . . . . . . . . . . . . . . . . 150

Cuprins
3.3.5
3.3.6
3.3.7
3.3.8
3.3.9
3.3.10
3.3.11
3.3.12
3.3.13
3.3.14

3.4

Parametri statistici ce masoara dispersarea . . . . . . . . . .

Functia prctile . . . . . . . . . . . . . . . . . . . . . .
Functia moment . . . . . . . . . . . . . . . . . . . . . . .
Functiile var si std . . . . . . . . . . . . . . . . . . . . .
Functiile range, iqr, mad, skewness si kurtosis . .
Functiile max si min . . . . . . . . . . . . . . . . . . . . .
Functiile sort si sortrows . . . . . . . . . . . . . . . .
Functiile sum, prod, cumsum si cumprod . . . . . . . .
Functia diff . . . . . . . . . . . . . . . . . . . . . . . . .
Functiile nanmean, nanmedian, nanstd, nanmin,
nanmax si nansum . . . . . . . . . . . . . . . . . . . . .
3.3.15 Corectiile lui Sheppard . . . . . . . . . . . . . . . . . . . .
3.3.16 Functia grpstats . . . . . . . . . . . . . . . . . . . . .
3.3.17 Functia boxplot . . . . . . . . . . . . . . . . . . . . . .
Corelatie si regresie . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Functiile cov si corrcoef . . . . . . . . . . . . . . . . .
3.4.2 Functiile lsline, refline si gline . . . . . . . . . .
3.4.3 Functiile polyfit si refcurve . . . . . . . . . . . . . .
3.4.4 Functiile polyval, polyvalm, poly si roots . . . . .
3.4.5 Functia polytool . . . . . . . . . . . . . . . . . . . . .
3.4.6 Functia nlinfit . . . . . . . . . . . . . . . . . . . . . .
3.4.7 Functia nlintool . . . . . . . . . . . . . . . . . . . . .
3.4.8 Coeficientii Spearman si Kendall . . . . . . . . . . . . . . .

Teoria selectiei
4.1 Tipuri de selectie . . . . . . . . . . . . .
4.2 Functii de selectie . . . . . . . . . . . . .
4.2.1 Media de selectie . . . . . . . . .
4.2.2 Momente de selectie . . . . . . .
4.2.3 Coeficient de corelatie de selectie
4.2.4 Functie de repartitie de selectie . .
4.2.5 Functia cdfplot . . . . . . . .

.
.
.
.
.
.
.

Teoria estimatiei
5.1 Functie de verosimilitate . . . . . . . . . .
5.2 Functii de estimatie . . . . . . . . . . . . .
5.2.1 Functii de estimatie absolut corecte
5.2.2 Functii de estimatie corecte . . . .
5.2.3 Functii de estimatie eficiente . . . .
5.2.4 Estimatori optimali . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.

150
151
155
155
155
156
156
157
157
158
158
163
164
165
179
181
182
183
184
185
186
187

.
.
.
.
.
.
.

197
197
198
199
201
207
216
223

.
.
.
.
.
.

229
229
236
237
239
241
247

Cuprins
5.3

v
Metode pentru estimarea parametrilor . . . . . . . . . . . .
5.3.1 Metoda momentelor . . . . . . . . . . . . . . . . .
5.3.2 Metoda verosimilitatii maxime . . . . . . . . . . . .
5.3.3 Metoda minimului . . . . . . . . . . . . . . . .
5.3.4 Metoda intervalelor de ncredere . . . . . . . . . . .
5.3.5 Metoda intervalelor de ncredere pentru selectii mari
5.3.6 Functii Matlab privind estimatia . . . . . . . . . . .

Verificarea ipotezelor statistice

6.1 Concepte de baza . . . . . . . . . . . . . . . . . . . . . .
6.2 Testul privind media teoretica . . . . . . . . . . . . . .
6.2.1 Functiile zscore si ztest . . . . . . . . . . . .
6.3 Puterea unui test . . . . . . . . . . . . . . . . . . . . . . .
6.4 Testul (Student) privind media teoretica . . . . . . . . .
6.4.1 Functia ttest . . . . . . . . . . . . . . . . . . .
6.5 Testul raportului verosimilitatilor . . . . . . . . . . . . . .
6.6 Testul privind dispersia teoretica . . . . . . . . . . . .
6.7 Testul (FisherSnedecor) pentru compararea dispersiilor
6.8 Teste pentru compararea mediilor . . . . . . . . . . . . .
6.8.1 Dispersii cunoscute . . . . . . . . . . . . . . . . .
6.8.2 Dispersii egale necunoscute . . . . . . . . . . . .
6.8.3 Functia ttest2 . . . . . . . . . . . . . . . . . .
6.8.4 Dispersii diferite necunoscute . . . . . . . . . . .
6.8.5 Observatii perechi . . . . . . . . . . . . . . . . .
6.9 Testul pentru concordanta . . . . . . . . . . . . . . . .
6.10 Testul pentru compararea mai multor caracteristici . . .
6.11 Testul pentru tabele de contingenta . . . . . . . . . . .
6.12 Testul de concordanta al lui Kolmogorov . . . . . . . . . .
6.12.1 Functia kstest . . . . . . . . . . . . . . . . . .
6.12.2 Functia lillietest . . . . . . . . . . . . . . .
6.13 Testul KolmogorovSmirnov . . . . . . . . . . . . . . . .
6.13.1 Functia kstest2 . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

251
251
252
256
257
275
277

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

285
285
286
290
291
304
307
308
312
318
322
323
325
327
328
332
334
346
349
353
360
362
363
366

Anexa I

369

Anexa II

370

Anexa III

371

Anexa IV

372

Cuprins
Anexa V

376

Bibliografie

377

Index

383

Prefata
Aspecte primare ale statisticii se pierd n negura timpului. Astazi, putem spune, fara
a gresi, ca statistica facem fiecare dintre noi, cu stiinta sau fara. Gandul la ziua de
maine, cum ne organizam si cum folosim timpul si mijloacele materiale de care dispunem, are la baza date (statistice) retinute (culese) si prelucrate n mod simplu sau
mai complex. Ne dam seama, prin urmare, ca statistica are o larga raspandire, de la
utilizarea ei n mod empiric, pana la apelarea la metodele fundamentate matematic.
Statistica faceau chinezii antici, care dispuneau de date relative la populatie,
pamanturi si recolte, dar si egiptenii, care efectuau cadastrari (operatii de determinare a unor proprietat i agricole si imobiliare cu toate caracteristicile lor) si numarari
de populatie. Numararea populatiei era cunoscuta si la evrei, de exemplu, n texte
biblice sunt mentionate numarari de populatie, ca cea efectuata de Moise, privind
barbatii buni de oaste. La grecii antici erau, de asemenea, efectuate numarari de
populatie, ale bunurilor necesare pentru scopuri militare, pentru asezarea impozitelor si evaluarea bogatiilor. Toate acestea au culminat cu recensamintele si anchetele
romane .
Culegerea de date privind resursele umane si materiale aveau la baza o gandire
practica, folosirea acestora n scopuri fiscale, militare sau administrative. Putem
spune ca toate acestea erau utilizate n descrierea statului.
Tratarea stiintifica a datelor relative la descrierea statului se ntalneste n Germania (sec. XVIIXVIII), iar denumirea de statistica apare n cursul lui Martin Schmeitzel (16791757), intitulat Collegium politico-statisticum (Universitatea din Halle). Unii istorici atribuie ntaietate privind aceasta denumire lui Gottfried Achenwall
(1719-1772), care a introdus nvata mantul Staatskunde la Universitatea din Gottingen.
In Anglia, n aceeasi perioada, n afara universitatilor, exista ca disciplina descriptiva a statului ceea ce se numea aritmetica politica. Aritmetica politica se ocupa n
special de cercetarea fenomenelor demografice.
Un moment important n dezvoltarea statisticii l reprezinta cristalizarea calculului probabilitat ilor.
Calculul probabilitat ilor si fundamentarea riguroasa din punct de vedere matemavii

viii

Prefata

tic a teoriei probabilitat ilor reprezinta o problema fundamentala n stabilirea locului

si rolului acestei discipline matematice n evantaiul larg al matematicii, precum si al
fundamentarii teoretice a statisticii matematice.
Desigur, faptul ca cineva, cu diferite ocazii, foloseste cuvantul probabil, nu
nseamna ca este o persoana initiata n calculul probabilitat ilor. Am putea, eventual,
accepta ca sunt percepute anumite aspecte empirice ale calculului probabilitat ilor,
cand, relativ la un anumit fenomen care prezinta un anumit grad de nedeterminare,
se emit afirmatii de forma: este putin probabil ca..., este foarte probabil ca..., este
improbabil ca.... De la astfel de afirmatii si pana la cunoasterea si ntelegerea n profunzime a teoriei probabilitat ilor este un drum lung, care este de un larg interes atat
din punct practic cat si teoretic, si care prezinta o atractie deosebita, nu numai pentru
matematicieni, dar si pentru specialisti din alte discipline ale cunoasterii umane: fizica, chimie, biologie, economie, medicina, inginerie etc. Aceste aspecte, de-a lungul
timpului, se regasesc n aparitia, dezvoltarea si fundamentarea axiomatica a teoriei
probabilitat ilor, care se mbina si se continua cu diferite domenii de aplicabilitate,
dintre care statistica ocupa un rol privilegiat.
Este unanim acceptat ca notiunea de probabilitate si are originea n jocurile de
noroc. In antichitate, la egipteni, greci si romani erau cunoscute jocuri de noroc cu
zaruri, care s-au perpetuat pana n zilele de astazi. Se pare ca cel mai vechi zar dateaza

din jurul anilor .e.n. si avea fetele numerotate la ntamplare de la la , fata de
zarul actual, care are fetele numerotate astfel ca suma numerelor de pe fetele opuse
sa fie . Proliferarea jocurilor de noroc s-a produs nu numai prin aria de raspndire,
dar si prin diversitatea acestora. Ajunge sa amintim doar jocurile de ruleta care sunt
instalate n marile metropole ale lumii.
Problemele teoretice relative la jocurile de noroc, n special privind sansele partenerilor, au atras atentia savantilor timpului. Astfel, fundamentarea elementara a
calculului probabilitat ilor poate fi atribuita francezilor P. de Fermat (16011665) si
B. Pascal (16231662). Corespondenta din anul 1654, purtata de cei doi, contine primele aspecte privind calculul sanselor n jocurile de noroc. O parte din problemele
considerate au fost formulate si prezentate lui Pascal de catre Cavalerul de Mere, un
renumit amator al jocurilor de noroc din acea vreme.
Prima carte de introducere n calculul probabilitat ilor este De Ratiociniis in Aleae
Ludo (Cum se rationeaza n jocurile cu zarul), aparuta n anul si are ca autor pe
olandezul Ch. Huygens (16291695).
Totusi, se remarca faptul ca italianului G. Cardano (15011576) i se datoreaza
lucrarea intitulata Liber de Ludo Aleae (Cartea despre jocurile cu zarul), care a fost
cunoscuta si publicata la mai bine de o suta de ani de la disparitia sa.
Un destin asemanator a avut si lucrarea lui James Bernoulli (16541705), Ars
Conjectandi (Arta de a face presupuneri), care a fost publicata de catre fratele sau

Prefata

John Bernoulli n anul . Se remarca n continutul cartii, ceea ce se numeste azi
legea numerelor mari, unul din rezultatele stralucitoare ale teoriei probabilitat ilor.
Un alt rezultat de aceeasi dimensiune, teorema limita centrala, se gaseste n cartea
Doctrine of Chances, aparuta n anul si care este opera lui A. de Moivre (1667
1754), ceea ce, se cunoaste, este strans legata de legea normala de probabilitate.
Descoperirea legii normale de probabilitate este atribuita, de cele mai multe ori,
lui K. F. Gauss (17771855), si care este considerata ca fiind specifica erorilor de
masurare. Trebuie remarcat faptul ca n anul 1808, cu un an nainte de descoperirea
lui Gauss, topograful american Robert Adrain (17751843) publicase o lucrare n
care a sugerat utilizarea legii normale pentru descrierea erorilor de masurare.
Rezultatele lui Moivre, privind teorema limita centrala, sunt extinse de catre P. S. de Laplace (17701820), stabilind de asemenea legatura cu legea normala de probabilitate, n cartea Theorie Analytique des Probabilites (Teoria analitica a probabi
litatilor), aparuta n anul .
Un statistician belgian de seama al sec. XIX, unanim recunoscut pentru rezultatele de pionerat n domeniul statisticii matematice este A. Quetelet (17961874). De
numele lui se leaga notiuni ale statisticii ca: repartitie, medie, dispersie, observare de
masa, regularitate. Pentru el, statistica reprezenta singura metoda ce se poate aplica
fenomenelor de masa.
Un salt remarcabil n dezvoltarea teoria probabilitat ilor a fost facut prin contributia matematicienilor rusi L. P. Cebsev (18211884), A. A. Markov (18561922)
si A. M. Leapunov (18571918). Primul a introdus notiunea de variabila aleatoare,
reformuland si generalizand legea numerelor mari n limbajul variabilelor aleatoare.
Folosind notiunea de variabila aleatoare, A. A. Markov si A. M. Leapunov au obtinut
apoi alte rezultate privind legea numerelor mari si teorema limita centrala.
Pasul decisiv privind fundamentarea moderna a teoriei probabilitat ilor este facut
prin lucrarea matematicianului rus A. N. Kolmogorov (19031989), aparuta n anul
1933. A. N. Kolmogorov, folosind teoria masurii, reuseste sa construiasca modelul
axiomatic al teoriei probabilitat ilor.
Se remarca de asemenea preocupari si rezultate importante obtinute de alti ma Borel (18711956), S. N. Bernstein
tematicieni ca: S. D. Poisson (17811840), E.
(18801968), R. von Mises (18831953), A. I. Hincin (18941959).
Sfarsitul sec. XIX si nceputul sec. XX se considera a fi nceputul statisticii moderne. Este momentul cand se trece de la etapa descriptiva, la interpretarea analitica a
fenomenelor de masa si obtinerea de concluzii inductive pe baza observatiilor empirice. Statisticieni de renume, care au pus bazele statisticii matematice sunt considerati
a fi englezii F. Galton (18221911) si K. Pearson (18571936). Opera acestora este
continuata de celebrul statistician R. A. Fisher (18901962). Dintre reprezentantii
scolii engleze de statistica amintim pe G. U. Yule (18711951), W. S. Gosset (1876

Prefata

1937), C. E. Spearman (18831945), M. Kendall (19071983).

Pentru detalii privind istoricul statisticii recomandam lucrarea [38].
Astazi, statistica matematica, avand un suport teoretic al teoriei probabilitat ilor,
are o dezvoltare si aplicabilitate deosebita. Care este motivul aplicarii statisticii matematice pe o scara larga si n atatea domenii ale cunoasterii umane? Am putea da
doua raspunsuri principale. In primul rand, fiecare cercetator sau persoana care analizeaza fenomene ale lumii reale, modeleaza astfel de fenomene, cauta sa puna la baza
metodelor sale de cercetare stiintifica, de evaluare a fenomenelor reale, un instrument
de investigare obiectiv. Si este cvasiunanim recunoscut ca matematica are astfel de
instrumente de investigare, inclusiv prin metodele statisticii matematice. In al doilea
rand, metodele statisticii matematice sunt usor de aplicat. Greutatea consta numai
n fundamentarea riguroasa din punct de vedere matematic a acestora. Acest aspect
este ascuns celui care aplica statistica matematica. In materialul pe care l prezentam,
consideram notiunile (conceptele) de baza n initierea studiului si aplicarii statisticii
matematice. Se considera partea ascunsa a statisticii matematice, adica fundamentarea teoretica, cat de cat riguroasa, a statisticii matematice, dar si partea care prezinta
modul de aplicare a metodelor statisticii matematice.
Daca n tot acest demers avem la dispozitie si mijlocul modern de lucru, reprezentat astazi printrun calculator performant sau mai putin performant, atunci statistica
devine foarte atractiva. De aceea au fost elaborate o serie de produse soft, care prezinta ntro conceptie unitara reprezentarea, prelucrarea si studiul datelor statistice.
Amintim aici cateva astfel de produse soft: Statgraphics, Statistica, SPlus, SAS, StatXact, SPSS, Stata, GraphPad, ViSta etc. Remarcam de asemenea ca unele produse
soft elaborate n alte scopuri decat cel al prelucrarii datelor statistice, contin proceduri
privind prelucrarea mai elementara sau mai complexa a datelor statistice. In aceasta
categorie se ncadreaza si produsul Matlab, care va fi invocat n prezenta lucrare, dar
tot n aceasta categorie putem aminti si Mathematica, Maple etc.

Capitolul 1

Introducere n Matlab
MATLAB (MATrix LABoratory) este un sistem interactiv de nivel si performanta
nalte pentru efectuarea de calcule stiintifice si tehnice, precum si de analiza si vizualizare a datelor si care dispune de un limbaj propriu de programare.

Prima versiune a fost realizata n anii de catre Cleve Moler, iar versiunea
utilizata n cele ce urmeaza este Matlab 6.0.
Se pare ca acest produs are o larga raspandire din mai multe motive:
interactivitatea sistemului;
elementele de baza sunt matricele, dupa cum spune si denumirea, ale caror
tipuri si dimensiuni nu se declara;
grafica puternica si foarte usor de utilizat;
posibilitatea integrarii unor proceduri proprii n limbaje de programare cum ar
fi Fortran, C;
arhitectura modulara, care permite adaugarea unor proceduri si functii proprii,
ceea ce a permis deja elaborarea unor pachete de proceduri si functii, numite
toolboxuri, orientate pe anumite domenii, cum ar fi
Statistica Statistics Toolbox;
Functii spline Spline Toolbox;
Analiza wavelet Wavelet Toolbox;
Procesarea semnalelor Signal Processing Toolbox;
Procesarea imaginilor Image Processing Toolbox;
Modelare, simulare si analiza sistemelor dinamice Simulink;
1

Introducere n Matlab
Calcul simbolic Symbolic/Extended Symbolic Math Toolbox;
Ecuatii cu derivate partiale PDE Toolbox;
Optimizare Optimization Toolbox.

1.1 Gestionarea unei sesiuni Matlab

1.1.1 Lansarea si nchiderea unei sesiuni Matlab
Trebuie sa remarcam de la nceput ca sistemul Matlab dispune de o puternica baza de
helpuri, dar care poate fi activata doar dupa ce sistemul Matlab a fost lansat.
Lansarea sistemului Matlab se efectueaza prin comenzi ce sunt specifice sistemului de operare pe care este instalat. Vom considera n continuare sistemul de operare
Windows, caz n care lansarea se face prin activarea
icon-ului Matlab sau
aplicatiei Matlab din directorul n care a fost instalat sistemul Matlab.
In urma efectuarii acestei comenzi se deschide o fereastra n care apare prompterul
specific sistemului Matlab
>>

Sistemul Matlab devine n acest fel interactiv, adica la fiecare comanda sau functie
tastata si acceptata de Matlab (editarea comenzii sau functiei ncheinduse prin
Enter), sistemul o executa si afiseaza pe ecran rezultatul, daca este cazul.
Exista posibilitatea de trecere de la modul interactiv la cel programat, prin tastarea numelui unui fisier (cu extensia m), care contine un program n sistemul Matlab
(succesiune de instructiuni Matlab) si care mod se ncheie odata cu terminarea executarii programului respectiv, dupa care se revenie la modul interactiv.
Incheierea unei sesiuni Matlab se poate face, fie prin comenzi specifice sistemului
de operare Windows, fie prin tastarea uneia din comenzile
>>quit
>>exit

1.1.2 Comenzi help

Comanda help permite utilizatorilor sa aiba acces la o mare cantitate de informatie
(n limba engleza) relativa la ntreg sistemul Matlab.
Exista diferite variante pentru lansarea comenzii help, anume prin:
tastarea comenzii help urmata de domeniul (topic) n care suntem interesati, adica

1.1. Gestionarea unei sesiuni Matlab

>>help topic

Remarcam faptul ca parametrul topic poate lipsi. Astfel, lansarea comenzii

>>help

are ca efect afisarea pe ecran a unei liste ce cuprinde domeniile care opereaza n
versiunea curenta Matlab
HELP topics:
matlab\general
matlab\ops
matlab\lang
matlab\elmat
matlab\elfun
matlab\specfun
matlab\matfun
matlab\datafun
matlab\audio
matlab\polyfun
matlab\funfun
matlab\sparfun
matlab\graph2d
matlab\graph3d
matlab\specgraph
matlab\graphics
matlab\uitools
matlab\strfun
matlab\iofun
matlab\timefun
matlab\datatypes
matlab\verctrl
matlab\winfun

matlab\demos
toolbox\local
toolbox\stats

General purpose commands.

Operators and special characters.
Programming language constructs.
Elementary matrices and matrix manipulation.
Elementary math functions.
Specialized math functions.
Matrix functions - numerical linear algebra.
Data analysis and Fourier transforms.
Audio support.
Interpolation and polynomials.
Function functions and ODE solvers.
Sparse matrices.
Two dimensional graphs.
Three dimensional graphs.
Specialized graphs.
Handle Graphics.
Graphical user interface tools.
Character strings.
File input/output.
Time and dates.
Data types and structures.
Version control.
Windows Operating System Interface Files
(DDE/ActiveX)
Examples and demonstrations.
Preferences.
Statistics Toolbox.

For more help on directory/topic, type "help topic".

tastarea comenzii lookfor urmata de un cuvant cheie (key), n care suntem

interesati, adica
>>lookfor key

va lista prima linie de comentariu din fiecare fisier cu extensia .m, care contine
cuvantul cheie key, precedata de numele fisierului.

Introducere n Matlab
tastarea comenzii helpwin urmata de un domeniu (topic) n care suntem
interesati, adica
>>helpwin topic

produce deschiderea unei ferestre cu informatii relative la domeniul precizat.

tastarea comenzii helpdesk, adica
>>helpdesk

produce deschiderea unei ferestre prin care se permite cautarea n baza helpului
Matlab.

1.1.3 Comenzi sistem

Sistemul Matlab opereaza cu o multime de comenzi pe care le ntalnim si n alte
sisteme. Enumeram o parte dintre acestea:
mkdir deschiderea unui subdirector nou n directorul curent;
cd schimarea directorului curent;
dir lista continutului directorului curent;
version afisarea versiunii sistemului Matlab instalat;
!com iesire temporara din sistemului Matlab instalat si executia comenzii
Windows precizata prin com;
demo lansarea executiei de programe demonstrative.
Inainte de nceperea unei sesiuni este de dorit sa se creeze un director prin comanda mkdir, pentru salvarea fisierelor, iar apoi trecerea n acest director prin comanda cd.

1.2 Constante. Variabile. Expresii aritmetice

Avand n vedere ca sistemul Matlab opereaza numai cu un singur tip de obiect, matrice numerica, care ar putea avea elemente numere complexe, rezulta ca orice scalar
este considerat ca o matrice cu o linie si o coloana. In plus, reprezentarea interna
a elementelor matricelor si operatiile cu acestea se fac n dubla precizie. Deoarece
reprezentarea interna este prestabilita, avem doar posibilitatea de precizare a tipului
(formatului) de afisare (iesire) respectiv de intrare a datelor.

1.2. Constante. Variabile. Expresii aritmetice

1.2.1 Constante
Introducerea constantelor se poate face:
de la tastatura;
prin generarea cu ajutorul unor instructiuni Matlab;
dintrun fisier creat cu ajutorul unui editor.
La intrare constantele numerice pot fi de tipul:
ntreg: 2002, -2002;
real: 3.14159, 0.314e1, -.314e+01, 31.4e-1, 31.4e-01;
complex: a+bi, unde a si b sunt
doua constante ntregi sau reale, iar i reprezinta unitatea imaginara (i
).

1.2.2 Instructiunea format

Sistemul Matlab dispune de cateva sabloane (formatari) standard pentru afisarea (extragera) datelor numerice. Instructiunea format prin care se precizeaza formatul
standard are sintaxa
>>format tip

unde tip poate lua una din valorile short, long, short e, long e, short g,
long g, hex, +, bank, rat, loose, compact.
Formatele short si long afiseaza pe ecran datele numerice n virgula fixa,
respectiv cu 5 cifre zecimale si 15 cifre zecimale (precedate de semnul minus, daca
sunt negative).
Formatele short e si long e afiseaza pe ecran datele numerice n virgula flotanta, respectiv cu 5 cifre zecimale si 15 cifre zecimale (precedate de semnul minus,
daca sunt negative).
Formatele short g si long g afiseaza pe ecran datele numerice cu cea mai
potrivita reprezentare, virgula fixa sau virgula flotanta, respectiv cu 5 cifre zecimale
si 15 cifre zecimale (precedate de semnul minus, daca sunt negative).
Formatele rat, bank, hex si + afiseaza pe ecran respectiv datele numerice sub
forma de fractie ordinara, sub forma bancara (cu doua zecimale), sub forma hexazecimala, iar n ultimul caz, prin + daca numarul este pozitiv, respectiv -, daca numarul
este negativ si spat
iu daca este zero.
Formatele loose si compact permite afisare datelor la doua randuri (format
implicit), respectiv la un rand n cazul al doilea.
Pentru a afla la un moment dat, care format este n functie se poate apela la
comanda
>>get(0,Format)

Introducere n Matlab

1.2.3 Constante speciale

Sistemul Matlab are cateva constante speciale, care au denumiri specifice (identificatori specifici):
inf rezultatul mpartirii la 0;
NaN (Not a Number) rezultatul operatiei de tipul

;

realmax cel mai mare numar real pozitiv reprezentat pe dublu cuvant
(1.7977e+308);
realmin cel mai mic numar real pozitiv reprezentat pe dublu cuvant
(2.2251e-308);
pi =3.14159... (valoarea reprezentata pe dublu cuvant);
eps epsilonul masinii (eps=2.2204e-16=254 );
date data curenta;
clock timpul curent;
calendar calendarul lunii curente;
i, j unitatea imaginara (i,j=

);

zeros(n) si zeros(m,n) genereaza matricea patratica de ordin n, respectiv matricea cu m linii si n coloane, avand toate elementele nule;
ones(n) si ones(m,n) genereaza matricea patratica de ordin n, respectiv
matricea cu m linii si n coloane, avand toate elementele 1;
eye(n) si eye(m,n) genereaza matricea patratica de ordin n, respectiv
matricea cu m linii si n coloane, avand pe diagonala principala 1 si 0 n rest
(cand matricea este patratica avem matricea unitate);
magic(n) genereaza matrice magica patratica de ordin n.
Pentru introducerea elementelor unei matrice, linie cu linie, elemente ce pot fi exprimate si prin expresii aritmetice, acestea sunt incluse ntre paranteze drepte. Elementele fiecarei linii sunt separate prin spatiu sau virgula, iar liniile sunt separate prin
punctvirgula (;) sau prin trecerea la randul urmator.
Astfel matricea

se poate introduce de la tastatura prin

1.2. Constante. Variabile. Expresii aritmetice

>>[3 5 2;9 1 4]

sau
>>[3,5,2;9,1,4]

Daca elementele matricei prezinta regularitatea, ca elementele unei linii sunt date
printro progresie aritmetica, atunci avem o introducere prescurtata. De exemplu,
introducerea matricei

se poate face de la tastatura prin
>>[3:2:9;9:-3:0]

1.2.4 Variabile
Variabilele sunt matrice ce sunt utilizate ntrun program Matlab sau n mod interactiv si ale caror valori pot fi modificate. Numele lor fiind precizate prin identificatori,
care sunt dati de orice combinatie de litere, cifre zecimale si liniuta de subliniere, din
care primul caracter este litera: Matrice1, mat, Cluj Napoca.
Apelarea si vizualizarea unui element al unei variabile (matrice) se face prin specificarea numelui variabilei urmat de lista indicilor corespunzatori, separati prin virgula, nchisa ntre paranteze. De exemplu, A(i,j ) pune n evidenta elementul din
linia i si coloana j al matricei A.
Facem observatia ca matricele n sistemul Matlab nu accepta decat indici strict
pozitivi.
Utilizand operatorul doua puncte (:) se pot obtine submatrice ale unei matrice.
De exemplu, A(1:3,4:5) extrage submatricea formata din primele trei linii si coloanele 4 si 5 ale matricei A, iar A(:,4) si A(1,:) extrag respectiv coloana a patra
a matricei A si prima linie a matricei A. O forma mai generala de obtinere a unei
submatrice se realizeaza prin apelul de forma A([l],[c]), unde l si c reprezinta
liste de indici de linie si indici de coloane, separati prin virgula sau spatiu. Astfel va fi
obtinuta submatricea formata din liniile si coloanele precizate prin l, respectiv c ale
matricei A. Daca se introduce comanda A(:), atunci matricea A este transformata
ntrun vector coloana, ce contine coloanele matricei.
Alte combinatii ale acestor tipuri de specificare ale elementelor unei matrice pot
fi considerate.
Mai remarcam aici comanda
>>reshape(A,m,n)

care transforma matricea A ntro matrice cu m linii si n coloane. Daca A nu are m n

elemente, atunci apare eroare la executare.

Introducere n Matlab

1.2.5 Operatori aritmetici

Expresiile aritmetice se construiesc dupa cunoscutele reguli ale limbajelor de programare evoluate, folosind operatorii aritmetici cunoscuti, desigur cu unele operatii
speciale specifice sistemului Matlab.
Ordinea executiilor operatiilor aritmetice este de asemenea cea cunoscuta si pe
care o reamintim aici, ncepand cu cel mai nalt nivel :
prima data sunt executate operatiile aritmetice dintre paranteze;
urmeaza ridicarea la putere, iar daca sunt mai multe operatii consecutive de
acest tip, atunci ordinea executiei este de la dreapta la stanga;
urmatorul nivel de prioritate include operatiile de nmultire si mpartire, iar
daca sunt mai multe operatii consecutive de acest tip, atunci ordinea executiei
este de la stanga la dreapta;
ultimul nivel de prioritate contine operatiile de adunare si scadere, iar daca sunt
mai multe operatii consecutive de acest tip, atunci ordinea executiei este de la
stanga la dreapta.
Operatorii aritmetici matriceali de care dispune sistemul de baza Matlab sunt:
A+B, A-B sau plus(A,B), minus(A,B) aduna, respectiv face diferenta matricelor A si B de aceleasi dimensiuni, iar daca unul dintre operanzi e
un scalar, acesta este extins la matricea constanta data prin scalarul respectiv,
avand dimensiunile celeilalte matrice, dupa care se efectueaza operatia;
A*B sau mtimes(A,B) nmulteste matricele A si B, pentru care numarul
coloanelor matricei A este acelasi cu numarul liniilor matricei B, iar daca una
din matrice e un scalar, acesta va nmulti toate elementele celeilalte matrice;
AB sau mpower(A,B) daca B este un scalar p ntreg pozitiv, atunci se obtine puterea p a matricei patratice A, iar daca A este un scalar , atunci se ridica
scalarul la puterea B, matricea
BB fiind patratica, adica, pentru exemplificare,

B

daca
e, atunci e

A
B, A B, A B, A /B, sau formele echivalente, respectiv times(A,B),
power(A,B), ldivide(A,B), rdivide(A,B) efectueaza operatiile
de nmultire, de ridicare la putere, mpartire inversa, mpartire directa, toate de
tipul element cu element (ca la operatiile de adunare si scadere), pentru matricele de aceleasi dimensiuni, iar daca una dintre matrice e un scalar, aceasta este
extinsa la matricea constanta data prin scalarul respectiv, avand dimensiunile
celeilalte matrice, dupa care este efectuata operatia;

1.2. Constante. Variabile. Expresii aritmetice

A B sau mldivide(A,B) are ca rezultat matricea ce reprezinta solutia

ecuatiei matriceale A*X=B, cand matricea patratica A este inversabila, iar daca
B este un vector coloana se obtine solutia sistemului liniar corespunzator;
A/B sau mrdivide(A,B) are ca rezultat matricea ce reprezinta solutia
ecuatiei matriceale X*B=A, cand matricea patratica B este inversabila;
[A B], [A;B] (concatenarea) produce concatenarea matricelor A si B pe
orizontala, respectiv pe verticala, cu conditia ca la concatenarea pe orizontala
trebuie ca numarul liniilor celor doua matrice sa fie acelasi, iar la concatenarea
pe verticala se impune ca numarul coloanelor celor doua matrice sa fie acelasi.

1.2.6 Functii predefinite

Sistemul Matlab dispune de numeroase functii matematice. Remarcam faptul ca toate
acestea, avand n vedere ca matricele sunt obiectele de baza n Matlab, actioneaza
asupra matricelor.
Incercam o clasificare a acestora:
abs (modul), sqrt (radical), sign (semn), conj (conjugat), angle (argument al numarului complex), imag (parte imaginara), real (parte reala);
sin (sinus), cos (cosinus), tan (tangenta), cot (cotangenta), csc (cosecanta), sec (secanta);
asin (arcsinus), acos (arccosinus), atan (arctangenta), acot (arccotangenta), acsc (arccosecanta), asec (arcsecanta), sinh (sinus hiperbolic),
cosh (cosinus hiperbolic), tanh (tangenta hiperbolica), coth (cotangenta hiperbolica), csch (cosecanta hiperbolica), sech (secanta hiperbolica), asinh
(arcsinus hiperbolic), acosh (arccosinus hiperbolic), atanh (arctangenta hiperbolica), acoth (arccotangenta hiperbolica), acsch (arccosecanta hiperbolica), asech (arcsecanta hiperbolica);
exp (exponentiala), log (logaritm natural), log10 (logaritm zecimal), log2
(logaritm n baza doi);

round (rotunjire la cel mai apropiat ntreg), floor (rotunjire spre

(rotunjire spre zero), ceil (rotunjire spre
).

), fix

Facem observatia ca pentru functiile trigonometrice se impune ca argumentele sa fie

date n radiani.
Daca argumentul functiilor predefinite este matrice, atunci functia se aplica
fiecarui element al matricei.

Introducere n Matlab

atan2(A,B) (are acelasi efect cu atan(A. B)), rem(A,B) (restul mpartirii lui A la B).
Daca A si B sunt matrice, atunci trebuie sa fie de aceeasi dimensiune, iar functia se
aplica element cu element.
size(A) (dimensiunea matricei A), length(A) (lungimea vectorului A),
ndims(A) (numarul dimensiunilor matricei A), disp(A) (afiseaza elementele matricei A fara numele matricei), det(A) (determinantul matricei
patratice A), inv(A) (inversa matricei patratice A), rank(A) (rangul matricei A), A sau transpose(A) (transpusa matricei A, daca matricea este cu
elemente numere reale, daca are elemente numere complexe, atunci se efectueaza matricea transpusa a conjugatelor elementelor), A (transpusa matricei
A), diag(A) (diagonala matricei patratice A, iar daca A este vector, genereaza matricea patratica diagonala cu elementele diagonalei date de vector),
trace(A) (urma matricei patratice A, adica ).

Trebuie sa remarcam ca daca A este un vector linie,

atunci A este un vector coloana

si invers, daca A este un vector coloana, atunci A este un vector linie.
factorial(n) (factorialul lui n), perms(1:n) sau perms(v) (genereaza toate pemutarile primelor n numere naturale, respectiv genereaza toate
permutarile componentelor vectorului v), nchoosek(n,k) sau varianta
nchoosek(v,k) (calculeaza numarul combinarilor de n elemente luate cate
k, respectiv genereaza toate combinarile elementelor vectorului v luate cate k),
combnk(v,k) (genereaza toate combinarile elementelor vectorului v luate
cate k), factor(n) (factorii primi ai lui n repetati de atatea ori cat reprezinta puterea acestora), primes(n) (numerele prime mai mici decat n), gcd
(cmmdc), lcm (cmmmc).

1.2.7 Comenzi pentru gestiunea variabilelor si a spatiului de lucru

Sistemul Matlab se poate lansa din orice director, acesta devenind directorul curent.
Desigur este de dorit ca utilizatorul sa lucreze ntrun director propriu. Asa cum am
vazut, un astfel de director poate fi creat pana nu se intra n sistemul Matlab, ca apoi
acesta sa fie lansat din acest director sau se poate lansa la nceput sistemul Matlab,
iar apoi prin comenzile cd si mkdir sa se ajunga ntrun director al utilizatorului
sau sa se creeze un director propriu nou.
Toate operatiile sunt executate n directorul curent.
Daca se doresc informatii relative la variabilele existente la un moment dat n
directorul curent se pot lansa una din comenzile:

1.2. Constante. Variabile. Expresii aritmetice

who produce lista variabilelor curente;

whos produce lista variabilelor curente, mpreuna cu informatii privind
aceste variabile (dimensiune, numar de elemente, memorie ocupata, tipul);
clear sterge variabilele si functiile temporare din directorul curent (stergerea unei singure variabile se realizeaza prin comanda clear urmata de numele
variabilei);
diary file salveaza toate informatiile aparute pe ecran n timpul derularii unei sesiuni n fisierul file, cu exceptia graficelor;
save salveaza variabilele de lucru pe disc;
load ncarca variabilele de lucru de pe disc.
Comenzile
>>save file
>>save file x y z

vor salva n fsierul file.mat toate variabilele din sesiune curenta, respectiv numai
variabilele x, y, z.
Diferenta dintre comanda diary si comanda save este ca fisierul obtinut prin
diary se poate modifica (edita) cu ajutorul unui editor, pe cand celalalt nu se poate
edita.
De asemenea, remarcam faptul ca n fisierul creat prin comanda diary contine
toate informatiile pana la ntalnirea comenzii
>>diary off

Daca nainte de nchiderea unei sesiuni Matlab nu se executa o comanda save, atunci
toate variabilele mpreuna cu continutul lor se pierd.
Intro alta sesiune Matlab, se pot recupera variabilele din sesiunea precedenta,
daca au fost salvate prin comanda save, prin lansarea comenzii load. Anume, daca
fisierul salvat este file.mat atunci comanda
>>load file

va ncarca varaibilele cu continutul lor pentru sesiunea curenta.

Comanda load poate fi utilizata si pentru ncarcarea unui fisier ASCII creat cu
alt editor. Astfel comanda
>>load A.dat -ascii

va avea ca efect pentru sesiunea curenta a generarii unei variabile cu numele A si care
contine ca valori datele din fisierul A.dat.

Introducere n Matlab

1.3 Instructiuni de atribuire

Sistemul Matlab dispune de trei tipuri de instructiuni de atribuire:
expresie
variabila = expresie
[lista de variabile] = func

Expresia se compune, dupa reguli cunoscute n programare, cu ajutorul operatiilor

aritmetice si al functiilor, prin operarea asupra constantelor si asupra variabilelor.
Daca se considera prima forma a instructiunii de atribuire, atunci rezultatul este
pastrat ntro variabila de lucru numita ans si care ramane nemodificata pana la
executia unei alte instructiuni de atribuire de aceasta forma. Forma a doua face
aceasta atribuire, variabilei din partea stanga a semnului de egalitate.
Forma a treia este specifica pentru cazul n care se apeleaza o procedura (functie
Matlab), care returneaza mai mult de o valoare.
Exista expresii specifice sistemului Matlab, care nu au corespondent n alte limbaje evoluate. Daca vrem sa atribuim unei variabile valori care sunt obtinute ca si
elemente ale unei progresii aritmetice, atunci putem folosi una din instructiunile de
atribuire
>>vi:pas:vf
>>x = vi:pas:vf

unde vi, pas, vf sunt expresii aritmetice, care pot fi evaluate la momentul executarii instructiunii. In urma executarii acestor instructiuni variabila ans respectiv x
va contine valorile numerice ncepand cu vi pana la vf cu pasul pas.
Daca valoarea lui vf este mai mica decat cea a lui vi si pas are valaore negativa,
atunci rezultatul instructiunii de atribuire este matricea vida, avand sintaxa [].
Daca pas=1, atunci se pot considera formele echivalente
>>vi:vf
>>x = vi:vf

Un alt tip specific de instructiune de atribuire a sistemului Matlab este acela cand
variabila primeste valoarea unei submatrice. De exemplu, instructiunile de atribuire
>>x = A(:,2)
>>y = A(end,1:10)

au ca efect obtinerea n x a vectorului coloana format din coloana a doua a matricei A,

iar y va fi un vector linie format din primele 10 elemente ale ultimei linii a matricei A.
Orice instructiune poate fi continuata pe linia urmatoare prin trei puncte (. . . ) .
O linie poate sa contina mai multe instructiuni separate prin virgula sau prin
punct-virgula (;).
Daca o instructiune este urmata de punct-virgula (;), atunci valoarea variabilei nu
este afisata dupa executarea instructiunii, n caz contrar valoarea curenta a variabilei
va fi afisata.

1.4. Instructiuni de citire si scriere

1.4 Instructiuni de citire si scriere

1.4.1 Instructiunea input
Sintaxa comenzii input este:
>>v = input(s)

Prin executarea acestei instructiuni se afiseaza pe ecran sirul de caractere dat prin s,
asteptanduse tastarea datelor ce se doresc a fi atribuite pentru variabila v. Cand
se ncheie operatiunea de tastarea datelor, se tasteaza Enter, drept consecinta se
efectueaza operatia de atribuire.

1.4.2 Instructiunea ginput

Instructiunea ginput permite introducerea de date cu ajutorul mouse-ului dintr-o
fereastra ce are trasate axele de coordonate.
Exista urmatoarele forme ale instructiunii ginput:
>>[x,y] = ginput(n)
>>[x,y] = ginput
>>[x,y,buton] = ginput(n)

Executarea unei astfel de instructiuni produce introducerea coordonatelor unor

puncte din figura curenta, n cand se folosesc prima si ultima varianta, respectiv un
numar nedefinit, cand se foloseste varianta a doua. La nceput apare pe ecran n fereastra figurii curente cursorul realizat prin doua drepte verticale. Prin pozitionari
succesive, cu ajutorul mouse-ului, ale cursorului pe anumite puncte, urmate de clickuri, coordonatele acestora sunt introduse respectiv n vectorii x si y. Pentru prima si
ultima forma trebuie efectuate astfel de operatii succesive n numar de n, iar pentru a
doua succesiunea de operatii se ncheie prin tastarea comenzii Enter. Forma a treia
va returna si vectorul buton, care specifica ce buton al mouselui a fost folosit la
fiecare operatie (1, 2 sau 3, ncepand de la stanga).

1.4.3 Instructiunea fprintf

Afisarea pe ecran si nu numai, folosind un format propriu, se face cu ajutorul
instructiunii fprintf. Vom prezenta n continuare numai modul de afisare pe ecran
folosind aceasta instructiune.
Cea mai simpla sintaxa a acestei instructiuni este
>>fprintf(f,x)

prin care valoarea variabilei x este afisata pe ecran conform formatului f.

Formatul
f poate fi, de exemplu: %md, %md n, %m.zf, %m.zf n, %m.ze,

%m.ze n, unde md, m.zf si m.ze exprima respectiv faptul ca valoarea lui x se
afiseaza pe m pozitii ca un ntreg, ca un real cu z cifre zecimale, ca un real normalizat

Introducere n Matlab

cu z cifre zecimale. Parametrul n specifica faptul ca dupa afisare se trece la randul

urmator (tine locul comenzii Enter).

1.5 Operatori relationali si operatori logici

1.5.1 Operatori relationali
A==B sau eq(A,B), A=B sau ne(A,B), A<B sau lt(A,B), A>B sau
gt(A,B), A<B sau lt(A,B), A>B sau gt(A,B), A<=B sau le(A,B),
A>=B sau ge(A,B) compara element cu element matricele de aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, cand conditia este
adevarata respectiv falsa, iar daca unul din operanzi este un scalar, acesta este
extins la matricea constanta data prin scalarul respectiv, avand dimensiunile
celeilalte matrice, dupa care se efectueaza operatia relationala.

1.5.2 Operatori logici

A B sau and(A,B) (conjunctia) compara element cu element matricele de
aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, cand
ambele elemente sunt diferite de zero, respectiv cel putin unul din cele doua
elemente este zero;
A B sau or(A,B) (disjunctia) compara element cu element matricele de
aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, cand cel
putin unul din cele doua elemente este zero, respectiv ambele elemente sunt
zero;
xor(A,B) (disjunctia exclusiva) compara element cu element matricele de
aceleasi dimensiuni A si B si produce o matrice ce are valorile 1 si 0, cand unul
si numai unul din cele doua elemente este zero, respectiv ambele elemente sunt
zero sau ambele sunt diferite de zero;
Daca unul din operanzi este un scalar, acesta este extins la matricea constanta data
prin scalarul respectiv, avand dimensiunile celeilalte matrice, dupa care se efectueaza
operatia logica.
A sau not(A) (negatia) produce o matrice de aceleasi dimensiuni cu cele
ale matricei A avand valorile 1 si 0, cand elementul corespunzator al matricei
A este zero, respectiv cand este diferit de zero.
any(A) daca A este vector, returneza valoarea 1, daca exista componente ale
vectorului diferite de zero si 0 n caz contrar, iar daca A este o matrice, opereaza

1.6. Fisiere script (mfile)

asupra fiecarei coloane a matricei si returneaza corespunzator un vector de 1 si

0 cu lungimea egala cu cea a numarului coloanelor matrcei A;
all(A) daca A este vector, returneza valoarea 1, daca toate componentele
vectorului sunt diferite de zero si 0 n caz contrar, iar daca A este o matrice, opereaza asupra fiecarei coloane a matricei si returneaza corespunzator un vector
de 1 si 0 cu lungimea egala cu cea a numarului coloanelor matrcei A.

1.6 Fisiere script (mfile)

Pentru a executa o secventa de instructiuni Matlab (program), fara interventia utilizatorului, se editeaza un fisier ASCII cu extensia .m, numit (fisier script) sau mfile,
care sa contina instructiunile programului. Lansarea executiei programului se face
prin tastarea numelui (fara extensia .m), dupa care se tasteaza Enter. Astfel, daca
utilizatorul sia creat un fisier script cu numele exemplu.m, atunci linia de comanda
prin care se lanseaza executia este
>>exemplu

Fsierul exemplu.m ar putea avea urmatorul continut

m = input(m (nr. natural > 0):);
A = magic(m);
d = ndims(A)
[l c] = size(A)
B = A*ones(m,1);
C = B

In urma lansarii executiei acestui program, fara a putea interveni pana la ncheierea
executiei, se produc urmatoarele operatii:
executa instructiunea din prima linie, prin afisarea pe ecran a mesajului
m (nr. natural > 0):

si se asteapa tastarea unui numar ntreg pozitiv, dupa care prin comanda Enter
se trece la instructiunea din linia urmatoare;
instructiunea din linia a doua va genera matricea magica patratica A de ordin
m, care nu va fi afisata pe ecran deoarece instructiunea se termina cu simbolul
punctvirgula;
se executa functia ndim, iar rezultatul este atribuit variabilei d, care va avea
valoarea 2 si va fi afisat pe ecran, deoarece instructiunea nu se termina cu
punctvirgula, pe doua randuri
d =
2

Introducere n Matlab
urmatoarea instructiune atribuie variabilelor l si c numarul liniilor si coloanelor matricei A, care n cazul de fata coincid cu valoarea lui m, iar valorile lui l
si c vor fi afisate pe ecran;
B va fi un vector coloana cu m componente si contine produsul dintre matricea
A si vectorul coloana de m componente, toate avand valoarea 1, iar daca avem
n vedere ca A este o matrice magica, toate componentele lui B vor fi egale;
ultima instructiune ajuta la afisarea pe ecran a componentelor vectorului linie
C, care este vectorul transpus al vectorului coloana B.

Editarea unui fisier script se poate face cu orice editor de text, dar sistemul Matlab
dispune de un editor propriu.
Editorul Matlab se poate lansa din fereastra de lucru Matlab prin comenzi specifice sistemului Windows, alegand din meniul File optiunea New sau Open, daca
se doreste crearea uni nou fisier, respectiv se doreste editare unui fisier deja existent.
Acelasi rezultat se obtine prin comanda
edit file.m

n care file.m este optional. Daca lipseste acest argument atunci urmeaza crearea
(editarea) unui fisier nou, iar daca acest argument este prezent, fisierul cu acest nume
urmeaza sa fie reactualizat (editat).
Editorul sistemului Matlab poate fi lansat din orice alta parte prin activarea unui
fisier cu extensia .m.
Editorul Matlab are capacitatea de a efectua unele verificari sintactice, de exemplu corespondent a paranteza deschisa paranteza nchisa, dar este prevazut si cu un
set de comenzi (debuger) pentru depanarea programului prin evaluarea si modificarea
unor variabile si expresii, crearea si stergerea unor puncte de ntrerupere etc.
Comenzile specifice sistemului de depanare Matlab sunt:
dbstop crearea unui punct de ntrerupere (breakpoint);
dbclear stergerea unui punct de ntrerupere;
dbstatus listeaza punctele de ntrerupere;
dbstack listeaza stiva apelurilor;
dbcont reluarea executiei programului;
dbstep executia uneia sau mai multe instructiuni;
dbtype genereaza lista fisierelor cu extensia .m, mpreuna cu numarul liniilor acestora;

1.7. Grafica bidimensionala

dbup schimba spatiul de lucru curent, cu cel al unui fisier cu extensia .m,
care a fost apelat;
dbdown efectueaza operatia inversa comenzii dbup;
dbmex execua depanarea unui fisier cu extensia .mex (creat cu unul din
limbajele Fortran si C);
dbquit ncheierea depanarii.

1.6.1 Comenzi pentru gestionarea fisierelor

type file listeaza continutul fisierului file din directorul curent;
delete file sterge fisierului file din directorul curent;
what listeaza fisierele cu extensiile .m din directorul curent;
which numef listeaza calea directorului n care se afla functia numef;
Comanda
>>what director

extrage lista fisierelor directorului specificat ... toolbox matlab director

Lista acestor directoare poat fi vizualizata prin comanda help fara nici un parametru.

1.7 Grafica bidimensionala

Sistemul Matlab dispune de o larga gama de instructiuni sau proceduri (functii) pentru reprezentarea grafica a datelor, care permit o apelare simpla si eficienta.

1.7.1 Instructiunea plot

Formele acceptate de sistemul Matlab pentru instructiunea plot, privind reprezentarea grafica n plan sunt
plot(y)
plot(x,y)
plot(x1,y1,x2,y2,...)
plot(y,s)
plot(x,y,s)
plot(y1,s1,y2,s2,...)
plot(x1,y1,s1,x2,y2,s2,...)

In cazul primei forme, daca y este un vector de lungime m, se reprezinta grafic

linia poligonala ce trece prin punctele de coordonate
,
m.

Introducere n Matlab

Programul 1.7.1. Sa consideram programul,

care
reprezinta grafic linia poligonala

ce uneste punctele de coordonate
,
m, unde y reprezinta elementele diagonalei unei matrice magice de ordin m:
m = input(m:);
y = diag(magic(m));
plot(y)

In urma executiei programului, pentru m=10, se obtine graficul din Figura 1.1.
100

Figura 1.1: Linie poligonala

Daca y este o matrice de tipul (m,n), atunci se reprezinta grafic n linii poligo m

nale, corespunzand celor n coloane ale matricei y, anume
, n.
Programul 1.7.2. Sa consideram programul,
care reprezinta grafic liniile poligonale

ce unesc respectiv punctele de coordonate
, pentru fiecare n, unde y
este o matrice magica de ordin m, iar n este un numar ntreg pozitiv cel mult m:
m = input(m:);
n = input(n (n<=m):);
y = magic(m);
plot(y(:,1:n))

In urma executiei programului, pentru m=10 si n=2, se obtine graficul din Figura 1.2.
Daca y este de tip complex, atunci prima forma este echivalenta cu a doua forma
a instructiunii plot, adica cu
plot(real(y),imag(y))

1.7. Grafica bidimensionala

100

Figura 1.2: Linii poligonale

Programul 1.7.3. Saconsider

am programul, care reprezinta grafic functia cu valori

complexe
m = input(m:);
h =1/m; x = 0:h:1;
z = x.*cos(2*pi*x)+i*x.2.*sin(2*pi*x);
plot(z)

In urma executiei programului, pentru m=100, se obtine graficul din Figura 1.3.
Remarcam faptul ca pentru toate celelalte forme, daca avem parametri complecsi,
partea imaginara este ignorata.
Daca se utilizeaza a doua forma, iar x si y sunt vectori de aceasi lungime m, atunci

se reprezinta grafic linia poligonala ce trece prin punctele de coordonate
,

m.

Programul
1.7.4. Fie programul care reprezinta grafic functia pe intervalul
:
m = input(m:);
h = 1/m; x = 0:h:1;
plot(x,sin(2*pi*x))

Executia programului, pentru m=200, genereaza graficul din Figura 1.4.

In cazul n care x si y sunt matrice avand acelasi tip (m,n), se reprezinta grafic
m
n linii poligonale, corespunzand celor n coloane ale matricelor, adica
,

pentru fiecare
n. Daca x este un vector de lungime m, iar y este un vector de
lungime m sau matrice de tipul (m,n), se reprezinta grafic liniile poligonale ce trec

Introducere n Matlab
2

4
2

1.5

0.5

Figura 1.3:

0.5

1.5

0.4

0.6

0.8

0.6

0.4

0.2

0.4

0.6

0.8

0.1

0.2

0.3

Figura 1.4:

0.5

0.7

0.8

0.9

1.7. Grafica bidimensionala

m, respectiv n linii poligonale ce trec respectiv

prin punctele de coordonate

m, pentru fiecare
prin punctele date prin
n.
Forma a treia a instructiunii plot implica reprezentarea grafica pe aceeasi figura,
conform formei precedente, a grupelor de date (x1,y1), (x2,y2) s.a.m.d.

Programul 1.7.5. Vom prezenta dou

a pe
programe, care reprezint

a variante de
aceeasi figura graficele functiilor si pe intervalul :
m = input(m:);
h = 1/m; x = 0:h:1;
y = 2*pi*x;
plot(x,sin(y),x,cos(y))

respectiv
m = input(m:);
h = 1/m; x = 0:h:1;
y = 2*pi*x;
y = [sin(y) cos(y)]; x=[x x];
plot(x,y)

Executand una din cele doua variante, cu m=200, se genereaza graficul din Figura 1.5.
Remarcam faptul ca prima varianta ar fi potrivita daca cele doua functii se reprezinta grafic pe acelasi domeniu, iar a doua varianta cand cele doua functii sunt
reprezentate grafic pe domenii diferite.
1

0.8

0.6

0.4

0.2

0.4

0.6

0.8

0.1

0.2

0.3

Figura 1.5:

0.4

0.5

0.6

0.7

0.8

0.9

Pentru o reprezentare neteda este de dorit ca numarul punctelor ce genereaza

liniile poligonale sa fie suficient de mare.

Introducere n Matlab

Pe de alta parte, observam ca prin primele trei tipuri de instructiune plot nu

se specifica nici o caracteristica a liniilor reprezentate grafic. Sistemul Matlab face o
alegere implicita a acestor caracteristici.
Ultimele patru forme ale instructiunii plot permit utilizatorului specificarea
unor caracteristici ale liniilor reprezentate grafic cu ajutorul parametrului s.
Parametrul de tipul s este un sir de cel mult trei caractere, prin care se precizeaza
culoarea, tipul de marcaj al punctelor si tipul de linie.
Culoarea este specificata cu unul din simbolurile urmatoare: y galben (yellow),
m violet (magenta), c ciclamen (cyan), r rosu (red), g verde (green), b
albastru (blue), w alb (white), k negru (black).
Tipul de marcaj este dat prin unul din simbolurile: punct (point), o cerculet
(circle), x cruciulita diagonala (xmark), + cruciulita (plus),
steluta (star), s
patratel (square), d romb (diamond), v triunghi cu varf n jos (triangle down),

triunghi cu varf n sus (triangle up), triunghi cu varf spre stanga (triangle
left), triunghi cu varf spre dreapta (triangle right), p steluta n cinci colturi
(pentagram), h steluta n sase colturi (hexagram).
Urmatoarele patru tipuri de linie sunt disponibile: continua (solid) (-), punctata
(dotted) (:), ntrerupta (dashed) (--), linie-punct (dashdot) (-.).
De exemplu, daca s=c:, graficul este trasat cu linie punctata ciclamen, iar
daca s=bd punctele sunt marcate prin semnul romb de culoare albastra, dar nu
sunt unite ntre ele.

Programul
1.7.6. Vom reprezenta grafic functiile si pe interva

, prima functie prin linie continua, iar a doua prin
lul
linie ntrerupa, iar punctele

de pe cele doua curbe, care au abscisele multipli de , sa fie marcate prin cerculete,
respectiv prin stelute.
m = input(m:);
h = 1/m; x = 0:h:1; y = 2*pi*x;
y = [sin(y) cos(y)];
h = 1/m; p = 0:1/6:1; pp = 2*pi*p;
plot(x,y,p,sin(pp),o,p,cos(pp),*)

Pentru m=200, graficul este cel din Figura 1.6.

1.7.2 Comenzi si instructiuni de gestionare a graficelor

Sistemul Matlab dispune de comenzi si instructiuni prin care sunt gestionate si specificate anumite caracteristici ale graficelor produse privind titlul, etichetarea axelor,
inserarea unor texte, marcarea unor retele, delimitarea graficului etc:
hold on pastreaza graficul curent, un nou grafic va fi supraimprimat;
hold off graficul curent este abandonat, fara a fi sters;

1.7. Grafica bidimensionala

0.8

0.6

0.4

0.2

0.4

0.6

0.8

0.1

0.2

0.3

Figura 1.6:

0.4

0.5

0.6

0.7

0.8

0.9

hold trece la modul off, daca sistemul se afla n modul on, respectiv la
modul on, cand sistemul se afla n modul off;
clf sterge graficul curent;
cla sterge graficul curent, pastrand axele;
figure(n) activeaza fereastra cu graficul n anterior obtinut;
axis([xmin xmax ymin ymax]) fixeaza limitele pentru axele absciselor si ordonatelor pentru figura curenta;
v = axis ntoarce un vector linie ce contine cele patru limite pentru axele
de coordonate, care pot fi si -Inf, Inf;
axis auto considera forma implicita a limitelor axelor de coordonate;
axis manual pastreaza limitele curente, astfel daca este utilizata instructiunea hold, figurile urmatoare vor avea aceleasi limite pentru axele de coordonate;
axis tight atribuie pentru limitele axelor cele mai apropiate valori ce
rezulta din datele ce se reprezinta grafic;
axis ij configureaza axele n modul matrix, adica originea axelor de
coordonate este coltul din stanga sus, axa i fiind verticala si marcata de sus n
jos, iar axa j este orizontala si este marcata de la stanga la dreapta;

Introducere n Matlab
axis xy configureaza axele n modul cartezian, mod implicit;
axis equal unitatile de masura pe cele doua axe au aceeasi marime;
axis image la fel cu axis equal, cu exceptia ca figura este restransa
la domeniul datelor;
axis square pune unitatile de masura pe cele doua axe de coordoante
astfel ncat figura sa fie prezentata ntrun patrat;
axis normal rearanjeaza axele n forma implicita;
axis off elimina axele de coordoante;
axis on insereaza axele de coordoante;
title(text) afiseaza textul specificat n partea de sus a graficului;
legend(str1,str2,...) afiseaza legenda prin care se efectueaza corespondenta dintre fiecare tip de curba a graficului si textele specificate
prin str1, str2 etc.;
legend(str1,str2,...,p) afiseaza legenda de tipul precizat
n pozitiile respectiv nafara axelor (p=-1), n interiorul axelor, dar pe cat e
posibil sa nu acopere figurile trasate (p=0), n partea dreapta sus (p=1), care
este pozitia implicita, n partea stanga sus (p=2), n partea stanga jos (p=3), n
partea dreapta jos (p=4);
legend off elimina legenda;
xlabel(text) eticheteaza axa abscielor cu textul precizat;
ylabel(text) eticheteaza axa ordonatelor cu textul precizat;
text(x,y,text) insereaza textul precizat prin text, n punctul de
coordonate (x,y), iar daca x si y sunt vectori (de aceeasi lungime), atunci

insereaza textul respectiv n toate punctele de coordoante
,

,
pe cand daca textul este dat printr-o matrice cu acelasi numar de linii cu cel al
lungimilor vectorilor x si y, atunci textul din linia i este inserat n punctul de

coordonate
,

gtext(text) afiseaza graficul, mpreuna cu cursorul plus, unde urmeaza sa fie inserat textul, cursorul putand fi pozitionat cu ajutorul mouse-ului sau
tastele cu sageti, dupa care prin apasarea oricarei taste (mouse sau keyboard),
se obtine inserarea textului;

1.7. Grafica bidimensionala

grid adauga pe grafic o retea rectangulara;

grid off grafic fara retea rectangulara;
zoom permite marirea unei parti a figurii pentru urmarirea anumitor detalii.
Se fixeaza cursorul mouse-ului pe pozitia n care suntem interesati a fi marita. Prin
dubluclick pe butonul din stanga se produce o marire a zonei de doua ori, iar prin
dubluclick pe butonul din dreapta se produce o micsorare a zonei de doua ori. Daca
se pastreaza apasat butonul din dreapta si se deplaseaza cursorul, se obtine un dreptunghi, care prin eliberarea butonului mouseului, va umple ntreaga figura.
Prin instructiunile
zoom off
zoom out

se dezactiveaza instructiunea zoom, respectiv se revine la dimensiunile initiale ale

figurii.
Comenzile de tip axis se impun a fi inserate dupa instructiunea plot.
Mentionam ca textele introduse pe grafic admit sintaxa sistemului LATEX simplificat.
Programul 1.7.7. Vom considera un exemplu de reprezentare grafica prin mascarea
unor parti a graficului. Sa reprezentam grafic cu linie continua pe intervalul [0,6]
functia care coincide cu , cand valorile acestei functii sunt pozitive, iar n rest
sa fie zero. Pe aceasi figura, sa reprezentam prin linie ntrerupa si .
m = input(m:);
h = 1/m; x = 0:h:6;
y = sin(pi*x); Y=ge(y,0).*y;
plot(x,y,k--,x,Y,k-)

Pentru m=200, graficul este cel din Figura 1.7.

1.7.3 Instructiunile polar si ezpolar

Instructiunea polar este analoga cu instructiunea plot, numai ca este considerata
reprezentarea curbei n coordoante polare, iar instructiunea ezpolar are sintaxa
ezpolar(f,[a,b])

si are ca efect reprezentarea grafica a functiei n coordonate polare, data prin expresia algebrica f, pe intervalul [a,b]. Al doilea parametru este optional. Valoarea
implicita este [0,2 ].
De exemplu, comanda
ezpolar(1+cos(theta))

va produce graficul din Figura 1.8. Mai remarcam faptul ca parametrul f poate fi
numele unei functii Matlab predefinite sau a utilizatorului.

Introducere n Matlab

0.8

0.6

0.4

0.2

0.4

0.6

0.8

Figura 1.7:

120

60
1.5

150

0.5

180

330

210

300

240
270
r = 1+cos()

Figura 1.8:

1.7. Grafica bidimensionala

Programul 1.7.8. Urmatorul program

clf; t=0:0.01:pi;
r=sin(3*t).*exp(-0.3*t);
polar(t,r,k-), grid

are ca efect graficul din Figura 1.9.

90
1
120

60
0.8
0.6

150

30
0.4
0.2

180

330

210

300

240
270

Figura 1.9:

Instructiunea colormap
Sistemul Matlab dispune de un set de gestiune a culorilor n reprezentarile grafice.
Intructiunea colormap permite definirea unui set propriu pentru gestiunea culorilor.
Lansarea unei instructiunii se face prin comanda
colormap(map)
colormap(default)

A doua comanda seteaza setul de culori la forma standard (implicita).

Parametrul map este o matrice cu trei coloane, fiecare linie continand elemente
numere din intervalul [0,1], prin care se defineste cate o culoare. Modul de definire a culorii, dupa aceasta regula, se numeste RGB (Red-Green-Blue), si specifica n
cadrul culorii, respectiv intensitatile culorilor rosu, verde si albastru.
Sistemul Matlab dispune de asemenea de unele seturi de culori, care pot fi selectate si specificate de utilizator. O parte din acestea sunt obtinute prin:

Introducere n Matlab
colormap spring

genereaza nuante de culori ntre violet (magenta) si galben;

colormap summer

genereaza nuante de culori ntre verde si galben;

colormap autumn

genereaza nuante de culori ntre rosu, trecand prin portocaliu spre galben;
colormap winter

genereaza nuante de culori ntre albastru si verde;

colormap gray

genereaza nuante de culori gri.

1.7.4 Instructiunea stairs

Sistemul Matlab dispune de procedura stairs pentru reprezentarea grafica a
functiilor n scara si care accepta formele instructiunii plot.
Instructiunea de forma
stairs(y)

reprezinta grafic functia n scara cu valorile precizate prin vectorul y de lungime m,

iar abscisele sunt considerate numerele de la 1 la m. Daca y este o matrice de tipul
(m,n) vor fi reprezentate grafic n functii n scara, cate una pentru fiecare coloana a
matricei y.
Daca se considera instructiunea de forma
stairs(x,y)

se va reprezenta grafic functia n scara cu valorile precizate prin vectorul y si cu

abscisele corespunzatoare date prin vectorul x (componentele lui x trebuie sa fie
crescatoare).
Daca y si x sunt matrice de acelasi tip (m,n), atunci se vor reprezenta grafic n
functii n scara, cate una pentru fiecare din coloanele celor doua matrice (elementele
coloanelor matricei x trebuie sa fie crescatoare). Daca matricea x este un vector coloana cu m componente crescatoare, atunci functiile n scara corespunzatoare celor n
coloane ale matricei y se considera ca au aceleasi abscise precizate prin vectorul x.
Instructiunea de tipul
stairs(x,y,s)

permite prezentarea tipului liniei cu care se traseaza graficul cu ajutorul parametrului

s si care are sintaxa cea precizata la instructiunea plot.
Prin urmare, putem spune ca toate variantele folosite n cadrul instructiunii plot
au corespondente pentru instructiunea stairs.

1.7. Grafica bidimensionala

Programul 1.7.9. Fie functia lui Haar, numita n analiza wavelet functie wavelet
mama

daca

Folosind functia

daca

n rest

se defineste familia de functii wavelet

unde si se numesc indice de dilatare, respectiv indice de translatare. Daca se are

n vedere formula de definitie pentru functia , putem scrie

daca

daca

n rest

Vom scrie un program

definita segementar cu aju care sa reprezinte grafic
functia

torul functiilor ,
, unde , si sunt fixati (
).

Functia este o functie n scara, avand punctele de discontinuitate , pen

tru
corespunzatoare acestor puncte,
, pentru par,
, cu valorile

, pentru impar.
respectiv
Cu aceste precizari, avem urmatorul program Matlab pentru reprezentarea grafica
a functiei :

j = input(j=);
r = input(r=);
s = input(s (>r)=);
rs = 2*s-2*r+3;
fprintf(rs=2s-2r+3=%2d\n,rs);
y = input(rs valori alternative [1, -1 ... 1]:);
y = 2(j/2)*y;
x = 1/2j*[r:1/2:s+1];
stairs(x,y)

Executia programului, pentru j=1, s=1, r=-2, produce graficul din Figura 1.10.
Singurul inconvenient la executia acestui program este legat de instructiunea
input prin care se initializeaza vectorul y. Cand numarul functiilor prin care
se defineste functia este mare, atunci rs este mare si introducerea listei lui y este
anevoioasa.

Introducere n Matlab
1.5

0.5

1.5
1

0.8

0.6

0.4

Figura 1.10:

0.2

0.4

0.6

0.8

O varianta a programului precedent, pentru care nu este necesara initializarea lui

y de la tastatura, ar putea fi urmatorul program:
j = input(j=);
r = input(r=);
s = input(s (>r)=);
rs = 2*s-2*r+3;
y = (-ones(1,rs)).[2*r:2*s+2];
y = 2(j/2)*y;
x = 1/2j*[r:1/2:s+1];
stairs(x,y)

Programul 1.7.10. Sa reluam reprezentarea grafica a functiilor wavelet Haar si sa

scriem un program care sa reprezinte pe aceeasi figura doua secvente de functii wavelet, pentru doua valori
ale indicelui de dilatare
consecutive
j, iar secvent

ele alese sa

acopere intervalul . Pentru aceasta trebuie ca r=
, iar s=
. Totodata
sa trasam graficul primei secvente cu linie continua si punctele sa le marcam prin
cerculete, iar pentru a doua secventa sa alegem linie punctata pentru reprezentarea
grafica, iar punctele sa fie marcate cu stelute n cinci colturi:
clf, hold on, axis off
plot([-1.2 1.2],[0 0],k:)
j = input(j=);
r = -2\{}j; s=-r-1;
rs = 2*s-2*r+3;
y = (-ones(1,rs)).[2*r:2*s+2];
y = 2(j/2)*y;
x = 1/2j*[r:1/2:s+1];
stairs(x,y,ko-)

1.7. Grafica bidimensionala

j = j+1; r = -2j; s=-r-1;

rs = 2*s-2*r+3;
y = (-ones(1,rs)).[2*r:2*s+2];
y = 2(j/2)*y;
x = 1/2j*[r:1/2:s+1];
stairs(x,y,kp--)

Executia programului, pentru j=0, produce graficele din Figura 1.11. Se observa

Figura 1.11:

ca programul mai elimina axele sistemului Matlab, dar adauga axa absciselor trasata
punctat.

1.7.5 Instructiunile bar si barh

Aceste doua instructiuni, dupa cum spun si denumirile, reprezinta anumite date numerice cu ajutorul barelor (batoanelor) verticale si respectiv orizontale.
Forme ale acestor instructiuni sunt:
bar(y,w,tip,color)
bar(x,y,w,tip,color)
barh(y,w,tip,color)
barh(x,y,w,tip,color)

argumentele w, tip si color sunt optionale, dar cand sunt specificate, trebuie
sa pastreze aceasta ordine.
Parametrul x este un vector de lungime m.
Daca y este un vector de aceeasi lungime ca si x, atunci vor fi reprezentate grafic

n fiecare din punctele de abscise x ,
m, cate o bara de naltimile date prin y ,

Introducere n Matlab

m, care pot sa fie si negative. Daca parametrul x lipseste, atunci se considera

implicit ca x are componentele ca fiind primele m numere naturale.
Daca y este o matrice de tipul (m,n), reprezentarile sunt efectuate pentru fie

care din cele n coloane ale matricei, adica n fiecare punct x ,
, de pe axa
absciselor vor fi reprezentate cate n bare (batoane).

Parametrul w specifica latimea barelor, implicit fiind w
, iar pentru w
barele se suprapun.
Daca parametrul tip=grouped, care este valoarea implicita, atunci avem reprezentarile precizate mai sus, iar daca tip=stacked barele (batoanele) vor fi stivuite pe verticala.
Parametrul color specifica culoarea barelor (batoanelor) si are una din urmatoarele valori: r (rosu), g (verde), b (albastru), y (galben), m (violet), c (ciclamen),
k (negru), w (alb).
Tot ce sa spus despre bar se poate spune si pentru barh, numai ca orientarea
barelor este pe orizontala.

1.7.6 Instructiunea subplot

Sistemul Matlab are posibilitatea de a mparti o fereastra, pentru reprezentare grafica,
n m n zone (ferestre), cu ajutorul instructiunii subplot.
Forma generala a instructiunii este
subplot(m,n,p)

unde m, n si p sunt numere naturale, care exprima faptul ca fereastra initiala se

mparte n m n ferestre aranjate pe m linii si n coloane, iar reprezentarea grafica,
la momentul executiei instructiunii, se va face n fereastra p, numerotarea ferestrelor
facanduse pe linii.
Programul 1.7.11. Reprezentarea grafica poate fi facuta si cu ajutorul reprezentarilor
parametrice ale curbelor.
Pentru reprezentarea grafica a unui cerc cu centrul n originea axelor de coordoante am putea folosi secventa de instructiuni:
r = input(raza=);
t = 0:0.01:2*pi;
x = r*sin(t); y=r*cos(t);
subplot(2,1,1), plot(x,y)
axis normal
subplot(2,1,2), plot(x,y)
axis square

Pentru r=2, graficul din partea stanga a Figurii 1.12, se obtine cand nu sa impus ca
unitatile de masura pe cele doua axe de coordoanate sa fie aceleasi, iar graficul din
partea dreapta sa obtinut dupa ce sa nlaturat acest neajuns cu instructiunea axis
square.

1.7. Grafica bidimensionala

1.5

1.5
1

0.5

0.5
0

0
0.5

0.5

1
1.5

2
2

1.5

2
2

Figura 1.12:

Programul 1.7.12. Pentru exemplificarea instructiunilor bar, barh si subplot,

facem din nou apel la o matrice magica de ordin m si sa reprezentam n patru ferestre
de tipul 2 2, prin bare verticale grupate si prin bare verticale stivuite, valorile primelor doua coloane ale matricei, respectiv prin bare orizontale grupate si prin bare
orizontale stivuite valorile ultimelor doua coloane:
m=input(m:); A=magic(m);
subplot(221), bar(A(:,[1 2]),grouped)
title(Primele doua coloane - grupate)
subplot(222), bar(A(:,[1 2]),stacked)
title(Primele doua coloane - stivuite)
subplot(223), barh(A(:,[m-1 m]),grouped)
title(Ultimele doua coloane - grupate)
subplot(224), barh(A(:,[m-1 m]),stacked)
title(Ultimele doua coloane - stivuite)
colormap summer

Reprezentarea grafica, pentru m=4, este data n Figura 1.13.

1.7.7 Instructiunea fplot

Pentru reprezentarea grafica a unei functii definite cu ajutorul unei proceduri Matlab,
se pot folosi una din urmatoarele variante ale instructiunii fplot:
fplot(numef,lim)
fplot(numef,lim,s)
fplot(numef,lim,tol)

Introducere n Matlab
Primele doua coloane grupate

Primele doua coloane stivuite

Ultimele doua coloane grupate

Ultimele doua coloane stivuite

Figura 1.13: Bare verticale si bare orizontale

fplot(numef,lim,tol,s)
fplot(numef,lim,n)
[X,Y] = fplot(numef,lim,...)

In toate cazurile se reprezinta grafic functia numef, cu limitele pentru axa absciselor specificate prin lim=[xmin xmax] sau lim=[xmin xmax ymin ymax].
Tipul liniei folosit n reprezentarea grafica este specificat prin parametrul s, ca si
n cazul instructiunii plot, iar eroarea relativa folosita n reprezentarea grafica este
precizata prin parametrul tol, care are valoarea implicita tol=2e-3. Parametrul n
specifica faptul ca graficul se traseaza cu ajutorul a n+1 puncte, valoarea implicita a
xmin
lui n este n=1, iar valoarea maxima a pasului nu depaseste xmax

n
Remarcam faptul ca parametrii optionali s, tol si n pot fi luati n orice ordine.
Functia numef poate sa ntoarca, pentru un vector x, un vector y de aceeasi
lungime ca si x sau o matrice cu mai multe coloane si numar de linii ca si lungimea
lui x. In primul caz, se va reprezenta grafic o singura curba, iar n al doilea caz, pentru
fiecare coloana a matricei y cate o curba. Parametrul numef poate fi nlocuit si cu un
sir de caractere de tipul [f(x),g(x),...], unde f, g,... sunt nume de functii
Matlab, caz n care, pe aceeasi figura, se vor reprezenta grafic functiile respective.
De exemplu, instructiunea
fplot([sin(2*pi*x), cos(2*pi*x)],[0 1])

si , pe intervalul

va reprezenta
grafic,
pe
aceeas

i
figur
a
,
funct

iile
.

1.7. Grafica bidimensionala

Ultima forma a instructiunii fplot nu produce nici un grafic, ci pastreaza

punctele graficului n X si Y, care pot fi apoi folosite efectiv, prin instructiunea
plot(X,Y), la reprezentarea grafica.

1.7.8 Instructiunea ezplot

Sintaxa instructiunii ezplot poate fi:
ezplot(f)
ezplot(f,[a,b])
ezplot(f,[a,b,c,d])
ezplot(x,y)
ezplot(x,y,[a,b])

Parametrul f reprezinta o expresie algebrica de una sau doua variabile.

Daca f este o expresie algebrica de o singura variabila, atunci este reprezentata
grafic functia definita de aceasta expresie, pe intervalul [a,b]. Valoarea implicita a
acestui parametru este [-2 ,2 ].
Daca f este o expresie algebrica de doua variabile, atunci este reprezentata grafic
functia implicita definita prin f=0, pe domeniul [-2 ,2 ] [-2 ,2 ], daca se
foloseste prima forma de apel, pe domeniul [a,b] [a,b], pentru a doua forma,
respectiv pe [a,b] [c,d], pentru a treia forma. Cele doua variabile sunt considerate ca fiind ordonate lexicografic.
Ultimele doua forme sunt folosite pentru reprezentarile parametrice, x reprezentand abscisa, iar y ordonata. Argumentul acestor parametri variaza n intervalul
[a,b], iar daca acesta lipseste, atunci se considera intervalul implicit [0,2 ].
De exemplu, instructiunea
ezplot(sin(3*t)*cos(t),sin(3*t)*sin(t),[0,pi])

produce graficul din Figura 1.14. Mai remarcam faptul ca parametrii f, x si y, pot fi
numele unor functii Matlab predefinite sau ale utilizatorului.

1.7.9 Instructiunea fill

Instructiunea fill este folosita pentru umbrirea interiorului unui poligon specificat
prin varfurile sale:
fill(x,y,c)

unde x si y specifica varfurile poligonului, iar c reprezinta culoarea dorita pentru

interiorul poligonului.
Instructiunea poate fi utilizata pentru umbrirea unei parti dintro figura.
Programul 1.7.13. Sa scriem un program care sa umbreasca aria cuprinsa ntre axa
absciselor, curba lui Gauss si dreptele perpendiculare pe axa absciselor n punctele a

si b (-3 a b 3).

Introducere n Matlab
x = sin(3 t) cos(t), y = sin(3 t) sin(t)

0.4

0.2

0.4

0.6

0.8

Figura 1.14:

0.6

0.4

0.2

0
x

0.2

0.4

0.6

0.8

Curba lui Gauss este data prin functia

a = input{a=}; b = input(b=);
xmin = -3; xmax = 3;
fplot{1/sqrt(2*pi)*exp(-x2/2),[xmin xmax]}
x = a; y = 0;
t = a:0.01:b;
x = [x,t]; y = [y,1/sqrt(2*pi)*exp(-t.2/2)];
x = [x,b]; y = [y,0];
fill(x,y,c)

Pentru a=-2 si b=1.5, se obtine graficul din Figura 1.15.

1.8 Instructiuni de ciclare si control

Ca si n celelalte limbaje de programare evoluate, sistemul Matlab dispune de
instructiuni, care permit repetarea unei secvente de instructiuni de un numar definit sau indefinit de ori, precum si de instructiuni, care permit iesirea din executarea
secventiala a instructiunilor unui program.

1.8. Instructiuni de ciclare si control

0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
3

Figura 1.15: Curba lui Gauss

1.8.1 Instructiunea if
Trei forme de baza ale instructiunii if sunt:
if exp
secv
end
%%%%%%%%%%%%%%
if exp
secv
else
secv1
end
%%%%%%%%%%%%%%
if exp
secv
elseif exp1
secv1
else
secv2
end

unde exp si exp1 sunt expresii logice ce pot fi evaluate n acest punct, iar secv,
secv1 si secv2 sunt secvente de instructiuni Matlab.
Instructiunea if sub prima forma face sa se execute secventa de instructiuni
secv numai daca valoarea expresiei logice exp este adevarata, dupa care se trece la
prima instructiune ce urmeaza liniei end.

Introducere n Matlab

A doua forma de instructiune if are ca efect executarea uneia dintre secventele

de instructiuni secv si secv1, n functie de faptul ca expresia logica exp este
adevarata, respectiv falsa, dupa care se trece la instructiunea ce urmeaza dupa linia
end.
Ultima forma are ca rezultat executarea uneia dintre secventele de instructiuni
secv, secv1 si secv2, dupa cum valoarea lui exp este adevarata, a lui exp este
falsa si a lui exp1 este adevarata, respectiv valorile expresiilor logice exp si exp1
sunt false si exp2 are valoare adevarata.
De exemplu secventa de instructiuni ce urmeaza stabileste daca elementele unui
vector v cu m componente ntregi sunt toate numere pare, toate impare sau sunt si
pare si impare:
if rem(v,2)==0
p=0;
elseif rem(v,2)==1
p=1;
else
p=2;
end
p

Rezultatul executiei acestei secvente atribuie lui p una din valorile 0, 1, 2, n functie
de faptul ca vectorul v are toate componentele numere pare, toate impare, respectiv
si pare si impare.

1.8.2 Instructiunea switch

Aceasta instructiune are ca rezultat trecerea executiei, n functie de valoarea unei
expresii, n diferite puncte ce urmeaza.
Forma generala a instructiunii switch este:
switch exp
case val1
secv1
case val2
secv2
. . . . .
otherwise
secv
end

unde exp este o expresie aritmetica sau de tip caracter, iar secv1, secv2, . . . ,
secv sunt secvente de instructiuni Matlab. Daca valoarea expresiei exp coincide cu
cu una din valorile val1, val2, . . . atunci se executa secventa de instructiuni corespunzatoare secv1, secv2, . . . , iar n caz contrar se executa secventa de instructiuni
secv.
De exemplu, secventa de instructiuni

1.8. Instructiuni de ciclare si control

m=input(m=);
switch expr
case ones
A=ones(m)
case eye
A=eye(m)
case magic
A=magic(m)
otherwise
A=zeros(m)
end

genereaza matricea patratica A de ordin m, care poate fi de la caz la caz, respectiv

matrice cu toate elementele 1, matrice unitate, matrice magica, matrice cu toate elementele zero.

1.8.3 Instructiunea while

Instructiunea while este o instructiune de ciclare prin care se repeta executia unei
secvente de instructiuni Matlab pana cand o conditie este satisfacuta. Forma generala
a instructiuni este:
while exp
secv
end

si are ca efect executarea secventei de instructiuni secv atata timp cat valoarea expresiei logice exp este adevarata.
De exemplu, daca vrem sa calculam valoarea aproximativa a solutiei ecuatiei

, folosind metoda iterativa, impunand conditia de oprire prin aceea ca
numarul iteratiilor sa nu depaseasca o valoare data n si distanta dintre doua iterate
consecutive sa nu fie mai mare decat un epsilon 0 dat, atunci avem programul
n=input(n=);
epsilon=input(epsilon=);
xv=pi/4; k=1; d=1;
while d>epsilon & k<n
k=k+1; xn=cos(xv);
d=abs(xn-xv); xv=xn;
end
fprintf(k=%2d\n,k)
fprintf(d=%10.4f\n,d)
fprintf(x=%10.4f\n,xn)

Astfel, pentru valorile la intrare n=50 si epsilon=1e-5, sunt afisate rezultatele:

k=25
d=
x=

0.0000
0.7391

Introducere n Matlab

1.8.4 Instructiunea for

Fata de instructiunea while, instructiunea de ciclare for are fixat numarul repetarilor unei secvente de instructiuni.
Forma generala a instructiunii este:
for v=vi:pas:vf
secv
end

unde v este variabila de ciclare, care ia toate valorile, ncepand cu valoarea expresiei
aritmetice vi pana la valoarea expresiei vf, folosind pasul dat prin expresia aritmetica pas. Pentru fiecare din aceste valori ale lui v se executa succesiv secventa secv
de instructiuni Matlab.
Daca pas=1, atunci putem folosi urmatoarea forma a instructii for:
for v=vi:vf
secv
end

Mai remarcam faptul ca n interiorul unui ciclu for poate exista un alt ciclu for
s.a.m.d.
De exemplu, secventa urmatoare va genera matricea h de tipul (m,n), numita
matricea lui Hilbert:
m=input(m=);
n=input(n=);
h=[];
for i=1:m
for j=1:n
h(i,j)=1/(i+j-1);
end
end
format rat
disp(h)

In urma executarii acestui program, cu valorile m=3 si n=6, se obtin rezulatele

m=3
n=4
1
1/2
1/3

1/2
1/3
1/4

1/3
1/4
1/5

1/4
1/5
1/6

Mai consideram un exemplu de folosire a instructiunii for. Vrem sa construim

matricea Vandermonde V, corespunzatoare numerelor ,
, care sunt date

1.9. Instructiuni de ntrerupere

prin vectorul a. Reamintim ca forma generala a aceastei matrice este

Matricea V poate fi generata prin secventa de program urmatoare:

m=input(m=);
for i=1:m
a(i)=input(a(i)=);
end
V=[];
for i=0:m-1
V=[V;a.i];
end
disp(V)

Se observa ca matricea V a fost intializata cu matricea vida, care este specificata prin
[], iar constructia efectiva sa facut prin operat
ia
de concatenare.

,
, se obtine
Executand programul pentru m=4 si a
m=4
a(i)=1
a(i)=2
a(i)=3
a(i)=4
1
1
1
1

1
2
4
8

1
3
9
27

1
4
16
64

1.9 Instructiuni de ntrerupere

1.9.1 Instructiunea try. . . catch
Forma generala a instructiunii este:
try
secv
catch
secv1
end

si are ca efect executia primei secvente de instructiuni, secv, pana la aparitia unei
erori, dupa care se executa a doua secventa de instructiuni, secv1. Daca nici o

Introducere n Matlab

eroare nu apare n executia secventei secv, dupa executarea acesteia, se trece la

prima instructiune dupa linia end. Daca la executia secventei de instructiuni secv1
apare o eroare, executia programului este oprita, daca o alta instructiune de tipul
try...catch nu exista.

1.9.2 Instructiunea pause

Instructiunea pause are ca efect ntreruperi temporare ale executiei programelor.
Instructiunea pause are urmatoarele forme:
pause(n)
pause
pause off
pause on

Prima forma are ca efect ntreruperea executarii programului timp de n secunde (n

este numar pozitiv), cand se ajunge cu executarea n acest punct.
A doua forma, pause fara argument, ntrerupe executarea programului, reluarea
executarii facanduse prin apasarea oricarei taste.
Instructiunea pause cu argumentul off are ca efect inhibarea tuturor instructiunilor pause si pause(n) ce urmeaza, iar daca are argumentul on, atunci se
produce reactivarea acestora.

1.9.3 Instructiunea return

Instructiunea
return

are ca efect ntoarcerea n programul de pe nivelul imediat superior (programul care

apeleaza unitatea n care se afla instructiunea). Nivelul cel mai nalt este cel care
corespunde modului interactiv de lucru, prin urmare instructiunea return, la acest
nivel nu are niciun efect.

1.9.4 Instructiunea break

Instructiunea
break

are efecte diferite n functie de locul unde este pozitionata.

Daca instructiunea break se afla ntrun ciclu while, se produce iesirea fortata
din ciclul respectiv, iar daca se afla ntrun ciclu for se produce la fel o iesire fortata
din ciclu, cu observatia ca daca exista un ciclu for superior, se continua cu executarea acestuia.

1.10. Functii (proceduri) n Matlab

Daca instructiunea break se afla ntro instructiune de tipul if, switch sau
try...catch, atunci se abandoneaza executia acestei instructiuni, iar daca este
pozitionata n oricare alta parte, se ncheie executarea programului.

1.9.5 Instructiunea error

Instructiunea
error(mesaj)

are ca efect abandonarea executiei si afisarea mesajului precizat prin mesaj.

1.10 Functii (proceduri) n Matlab

Toate programele scrise pana aici, numite fisiere script, ar putea fi considerate ca
fiind programe principale. Un astfel de program principal poate sa apeleze alte programe, pe care le numim functii sau proceduri, care la randul lor pot face apel la alte
proceduri.
Un program principal (fisier script), nu poate fi apelat de o alta unitate de program. Lansarea executiei unui astfel de program, se poate face numai cand sistemul
Matlab este n mod interactiv, adica avem pe ecran cursorul al sistemului Matlab.
Lansarea se face n doua moduri:
prin tastarea, dupa cursorul

, a numelui sau, fara extensia .m;

prin copierea, dupa cursorul , a continutului fisierului ce contine programul,

un exemplu fiind cuplul de comenzi Copy Paste,
dupa care se tasteaza comanda Enter.
Remarcam faptul ca toata istoria unei sesiuni se afla pe ecran, chiar daca unele
secvente mai vechi nu sunt vizibile la un momnet dat, dar cu ajutorul mouseului,
folosind bara din dreapta a ecranului se poate aduce secventa dorita n partea vizibila a ecranului. Mai mult, cu ajutorul sistemului de sageti pot fi readuse comenzi
mai vechi sau mai noi, care pot fi reeditate (modificate) si lansate dupa o astfel de
reeditare. Exista chiar o cautare mai rapida a unor instructiuni din lista de instructiuni
ce au fost utlizate ntro sesiune Matlab, anume se tasteaza nceputul instructiunii
urmata de sageata n sus.
Inca ceva, toate variabilele folosite n timpul unei sesiuni Matlab, fie n mod
interactiv, fie prin executia unui program principal (scriptfile) au un caracter global
si sunt pastrate ntrun spatiu de lucru (workspace), care la ncheierea sesiunii
Matlab sunt pierdute. De aceea, avem la dispozitie comenzile pe care le-am prezentat,
diary si save care permit, prin lansarea lor, salvarea acestor informatii.

Introducere n Matlab

1.10.1 Definirea si structura unei functii Matlab

Colectia de programe ale sistemului Matlab este constituita, n mare parte, din functii
(proceduri) scrise n limbajul propriu. Acestea sunt fisiere cu extensia .m avand
urmatoarea structura:
function [lista1] = numef(lista2)
% linia H1 (help line)
% comentariu
%
corp

unde lista1 si lista2 reprezinta respectiv lista variabilelor de iesire (despartite

prin spatii sau virgule) si lista parametrilor de intrare (despartiti prin spatii sau virgule), corp este secventa de instructiuni ale functiei cu numele numef.
Variabilele din corpul procedurii au un caracter local, prin urmare la ntoarcerea
n unitatea care face apelul valorile acestora se pierd, desigur cu exceptia valorilor
din lista1. Exista posibilitatea schimbarii caracterului local, prin instructiunea
global lista

care are ca efect obtinerea caracterului global pentru variabilele din lista.
In corpul unei functii Matlab variabilele nargin si nargout specifica numarul
parametrilor de intrare, adica lungimea listei lista2, respectiv a parametrilor de
iesire, adica lungimea listei lista1.
Daca ntrun fisier script sau de la tastatura se da una din comenzile
nargin(numef)
nargout(numef)

atunci se obtin numarul parametrilor de intrare si respectiv numarul parametrilor de

iesire pentru functia Matlab cu numele numef.
Liniile dinaintea corpului procedurii, care ncep cu % sunt linii de comentariu si
vor fi listate cand se lanseaza comanda
help numef

Din acest motiv, partea de comentariu de la nceputul procedurii este bine sa contina
informatii, care sa descrie pe scurt cum trebuie sa fie apelata si folosita functia respectiva.
Mai remarcam prima linie de comentariu, notata cu H1, care are o nsusire aparte.
Cand se lanseaza comanda
lookfor key

care cauta cuvantul cheie key, aceasta se face numai n liniile H1 ale fisierelor cu
extensia .m, dupa care se listeaza numele fisierelor ce contin cuvantul cheie precizat.
In cadrul liniilor ce alcatuiesc corpul functiei pot exista de asemenea linii de
comentariu, care ncep cu simbolul %, dar care nu vor fi afisate odata cu lansarea
comenzii help. Mai mult aparitia simbolului % n interiorul unei linii face ca tot ce
urmeaza pe linia respectiva sa fie considerat comentariu.

1.10. Functii (proceduri) n Matlab

Numele unei functii Matlab, numef, scrisa de utilizator, este de dorit sa fie diferit de numele functiilor deja existente n sistemul Matlab, iar numele fisierului, cu
extensia .m, ce va contine functia sa fie numef.m.
Daca lista parametrilor de intrare, lista2, este vida, atunci linia de definitie a
functiei este de forma
function [lista1] = numef

Daca lista variabilelor de iesire, lista1, este formata dintro singura variabila,
atunci se poate renunta la parantezele drepte, iar daca este vida se poate elimina
complet.
Cu aceste precizari, cea mai simpla linie de defintie a unei functii (proceduri) este
function numef

1.10.2 Apelul unei functii (proceduri) Matlab

Apelarea unei functii se poate face n doua moduri.
Primul mod este cel interactiv, de exemplu, prin una din formele
[apel1] = numef(apel2)
numef(apel2)

unde apel2 este lista parametrilor actuali, care poate fi vida sau formata din cel
mult atatea elemente cat are lista parametrilor formali, lista2, din linia de definitie
a functiei numef, de fiecare data facanduse legatura de tipul: primul parametru din
apel2 corespunde primului parametru din lista2, al doilea element din apel2
corespunde celui de al doilea parametru din lista2,..., corespondenta ncheindu
se cand se termina lista apel2. Desigur, daca apel2 are mai putine elemente decat
lista2, atunci trebuie gestionata aceasta situatie n corpul functiei numef cu ajutorul varaibilei nargin.
Rezultatele executarii functiei numef, se pastreaza n lista apel1 n primul caz,
respectiv n ans n al doilea caz. O discutie analoga asupra corespondentei dintre
apel2 si lista2, se face si n cazul apel1 si lista1.
O alta cale de apel a unei functii este dintrun alt program sau procedura Matlab, prin aparitia ntro instructiune Matlab a numelui functiei, mpreuna cu lista
parametrilor actuali de tipul listei apel2, mai sus precizata.

1.10.3 Subfunctii
Functiile pot avea n corpul lor apeluri la alte functii. Totdeauna ntoarcerea n unitatea care cheama se face, cand se ajunge la linia finala a corpului unitatii chemate
sau cand se ntalneste instructiunea return.
Exista doua situatii mai speciale n constructia functiilor n Matlab.

Introducere n Matlab

In primul rand, exista posibilitatea ca dupa corpul unei functii sa fie definite
una sau mai multe functii, pe care le numim subfunctii si care pot fi apelate din
corpul functiei. Forma unei astfel de functii ar fi:
function [lista1] = numef(lista2)
%
% comentariu
%
corp
function [list1] = numef1(list2)
%
% comentariu1
%
corp1

n secventa de instructiuni corp facanduse apel la functia numef1. Functiile de

tipul functiei numef1 nu se pot apela din exteriorul fisierului numef.m. Drept
consecinta nici comentariu1 nu este vizibil din exteriorul functiei numef.

Functia 1.10.1. Sa scriem o procedura, care reprezinta grafic pe intervalul

o multime finita precizata de polinoame ale lui Cebsev de speta I. Daca numarul
acestora este par, atunci sa fie reprezentate pe doua coloane, iar n caz contrar pe o
singura coloana.
function cebisev(lista)
% Polinomul Cebisev
% lista -- contine gradele polinoamelor Cebisev
%
care vor fi reprezentate grafic;
% daca lista are un numar par de elemente,
% polinoamele se vor reprezenta pe doua coloane;
% daca lista are un numar impar de elemente,
% polinoamele se vor reprezenta pe o coloana;
%
clf, x=-1:0.001:1; r=length(lista);
if rem(r,2)==0
m=fix(r/2); n=2;
else
m=r; n=1;
end
for i=1:r
y=cos(lista(i)*acos(x));
splots(m,n,i,x,y,lista(i))
end
function splots(m,n,k,u,v,gr)
subplot(m,n,k), plot(u,v,k-)
title([Polinom Cebisev de gradul n=,num2str(gr)])

Daca se apeleaza functia cebisev prin

cebisev([2:5])

se obtin graficele din Figura 1.16.

1.10. Functii (proceduri) n Matlab

Polinomul Cebisev de gradul n=2

Polinomul Cebisev de gradul n=3

0.5

1
1

0.5

1
1

Polinomul Cebisev de gradul n=4

0.5

Polinomul Cebisev de gradul n=5

1
1

0.5

1
1

0.5

Figura 1.16: Polinoamele lui Cebsev de grad

0.5

1.10.4 Functia feval

Un alt caz special este acela cand printre parametrii formali de intrare din lista2
exista si parametri ce pot lua valori nume ale unor functii. La apelul unei astfel de
functii pe pozitia parametrului actual corespunzator din lista apel2 trebuie sa se afle
un sir de caractere ce denumeste functia actuala.
Functia 1.10.2. Functia cu numele opmatrix opereaza prin operatorii Matlab
cunoscuti asupra a doua matrice:
function Z = opmatrix(op,X,Y)
%
% Efectueaza operatia definita prin op
% asupra matricelor X si Y.
% Rezultatul este returnat in Z
%
Z = feval(op,X,Y);

Folosind aceasta functie, de exemplu prin comenzile

opmatrix(plus,A,B)
opmatrix(minus,A,B)
opmatrix(and,A,B)

sau
opmatrix(+,A,B)
opmatrix(-,A,B)
opmatrix(&,A,B)

Introducere n Matlab

se obtin suma, diferenta si respectiv conjunctia matricelor A si B.

1.10.5 Comanda echo

Instructiunea echo are un comportament putin diferit pentru cele doua tipuri de
fisiere cu extensia .m.
Daca suntem n cazul unui fisier script, atunci instructiunile
echo on
echo off
echo

au respectiv urmatoarele efecte: prima are ca efect afisarea pe ecran a fisierului n derulare, a doua anuleaza acest efect, iar a treia are efectul primei forme, daca sistemul
se afla n mod off, iar daca se afla n mod off se va face trecerea la modul on.
Daca suntem n cazul functiilor Matlab cu extensia .m, atunci avem formele
echo
echo
echo
echo
echo

numef on
numef off
numef
on all
off all

Primele trei forme sunt analoge celor trei din cazul script, numai ca se mai specifica si
numele functiei la care se refera. Celelalte doua actioneaza asupra tuturor functiilor.

1.11 Instructiuni de evaluare a eficientei

Compararea eficientei algoritmului este posibila n sistemul Matlab fie prin numararea opertiilor n virgula flotanta, fie prin determinarea duratei, n secunde, a executiei
unei secvente de instructiuni, CPU (Central Processor Unit).

1.11.1 Instructiunea flops

Instructiunea flops este ncorporata n Matlab 6 prin pachetul LAPACK. Prin urmare este functionala numai daca sistemul contine si LAPACK.
Obtinerea numarului operatiilor n virgula flotanta efectuate pentru executia unei
secvente secv de instructiuni Matlab se realizeaza prin:
flops(0)
secv
flops

La ncheierea executiei acestei succesiuni de instructiuni n variabila flops se afla

numarul acestor operatii.

1.12. Grafica tridimensionala

1.11.2 Instructiunile tic si toc

Pentru obtinerea duratei executiei unei secventte secv de instructiuni Matlab avem
urmatoarea succesiune de instructiuni:
tic
secv
toc

unde tic marcheaza nceputul contorizarii timpului, iar toc anunta ncheierea contorizarii, variabila toc continand timpul masurat n secunde.

1.12 Grafica tridimensionala

Grafica tridimensionala sau altfel numita 3D este axata n sistemul Matlab pe doua
directii: reprezentarea curbelor n spatiu si reprezentarea suprafetelor.

1.12.1 Instructiunea plot3

Instructiunea plot3 este utilizata pentru reprezentarea curbelor n spatiu si n principiu nu se deosebeste mult de instructiunea plot din grafica bidimensionala.
Formele ntalnite pentru aceasta instructiune sunt:
plot3(x,y,z)
plot3(x,y,z,s)
plot3(x1,y1,z1,x2,y2,z2,...)
plot3(x1,y1,z1,s1,x2,y2,z2,s2,...)

Daca x, y, z sunt vectori de acceasi lungime m, atunci se unesc punctele de coordo

nate x y z ,
m, printro linie poligonala de tipul precizat prin parametrul
s, de la instructiunea plot, iar n lipsa acestui parametru, sistemul Matlab efectueaza o alegere implicita a tipului curbei. Desigur ca netezimea curbei este cu atat
mai buna cu cat numarul punctelor este mai mare.
Daca x, y, z sunt matrice de acelasi tip (m,n), atunci pentru fiecare coloana se
obtine cate o linie poligonala, adica n liniipoligonale. Acestea sunt generate respectiv

m

n, cu aceeasi
de punctele de coordonate x y z pentru fiecare
observatie privind parametrul s, care precizeaza tipul curbei. In acest caz pe aceeasi
figura vor fi obtinute mai multe grafice.
Ultimele doua forme sunt extinderi ale primelor doua, pentru a putea controla
mai bine n special tipul curbelor cu ajutorul parametrilor de tip s.
Remarcam de asemenea extinderea actiunilor comenzilor ce controleaza un grafic
din cazul bidimensional pentru cazul tridimensional.
Programul 1.12.1. Prezentam un program care ilustreaza miscarea unei particule din
punctul A pe o spirala pana n punctul B.

Introducere n Matlab
pas=input(pas=); h=input(h=);
t=0:pas:h; r=exp(-0.2*t); th=pi*t*0.5;
x=r.*cos(th); y=r.*sin(th); z=t;
plot3(x,y,z), hold on
plot3([1,1],[-0.5,0],[0,0])
text(1,-0.7,0,A), n=length(t);
text(x(n),y(n),h+2,B)
xlabel(x), ylabel(x), zlabel(z)

Sa explicam pe scurt o parte a instructiunilor acestui program.

Figura este obtinuta n doua etape, din cauza aceasta a fost introdusa instructiunea
hold on. Prima instructiune plot3 traseaza efectiv graficul spiralei, care se
mai completeaza prin segmentul din planul xoy delimitat de punctele de coordonate (1,-0.5,0) si (1,0,0), trasat cu a doua instructiune plot3. Cele doua
instructiuni au acelasi rezultat ca si instructiunea
plot3(x,y,z,[1,1],[-0.5,0],[0,0])

doar ca spirala va fi trasata cu o anumita culoare, iar segmentul din planul xoy cu
alta. Daca vrem ca ntreaga curba sa fie trasata cu aceeasi culoare se poate apela la
parametrul de tip s.
Se mai observa ca pozitia initiala A a punctului si pozitia finala B sunt afisate
cu instructiunile text, iar etichetele celor trei axe de coordoante sunt date prin
instructiunile de tip label.
Dupa executarea programului, cu h=20 si pas=0.01, sa obtinut graficul din
Figura 1.17.

0
1

A
1

0.5
0.5

0
0
0.5
y

0.5
1

Figura 1.17: Miscarea pe spirala

1.12. Grafica tridimensionala

1.12.2 Instructiunea ezplot3

Pentru reprezentarea grafica a curbelor n spatiu, poate fi folosita instructiunea
ezplot3, care se lanseaza prin una din comenzile:
ezplot3(x,y,z)
ezplot3(x,y,z,[a,b])
ezplot3(x,y,z,animate)
ezplot3(x,y,z,[a,b],animate)

Parametrii x, y si z, contin expresii algebrice ale reprezentarilor curbei n functie de

un parametru t, din [a,b]. Valoarea implicita a acestui interval este [0,2 ].
Prezenta parametrului animate produce pe figura un buton cu numele repeat,
care prin activare prezinta modul de deplasare a unui punct pe curba reprezentata
grafic.
De exemplu, daca se considera comanda
ezplot3(sin(t),cos(t),t,[0,10*pi],animate)

se va obtine graficul din Figura 1.18, n care se observa si butonul repeat.

x = sin(t), y = cos(t), z = t

35
30
25

20
15
10
5
0
1
1

0.5
0.5

0
0
0.5

0.5
1

Figura 1.18:

1.12.3 Instructiunile meshgrid, mesh si surf

Reprezentarea grafica a unei suprafete, data prin functia

, cuprinde dou
a etape.

, pe domeniul

Introducere n Matlab

Prima data se realizeaza o retea rectangulara de puncte, cu ajutorul instructiunii

meshgrid, care are sintaxa
[X,Y]=meshgrid(x,y)

unde x si y sunt vectori, n general de lungimi diferite, m si n, care contin puncte

de pe axele ox si oy si care sunt folosite la generarea retelei rectangulare x y

m, n.
Rezultatul executarii instructiunii meshgrid, are ca efect generarea matricelor
X si Y avand acelasi tip (n,m). Fiecare linie a matricei X este formata din componentele vectorului x, iar fiecare coloana a matricei Y esteformata din componentele

vectorului y. In acest fel punctul de coordonate x y al retelei rectangulare, se
poate exprima, cu ajutorul matricelor X si Y, prin perechea (X(j,i),Y(j,i)).
Inainte de a trece la a doua etapa, sa facem observatia ca daca x coincide cu y,
atunci se poate utiliza
[X,Y]=meshgrid(x)

Reprezentarea grafica a functiei

mesh, care are una din formele:

, se face cu ajutorul instructiunii

mesh(Z)
mesh(Z,C)
mesh(x,y,Z)
mesh(x,y,Z,C)
mesh(X,Y,Z)
mesh(X,Y,Z,C)

De la nceput, sa remarcam faptul ca parametrul C precizeaza scara culorilor. Cand

lipseste acest parametru, scara culorilor este data de parametrul Z, care reprezinta

valorile functiei
pe o reteaua rectangular
a. In acest ultim caz culoarea

va fi proportionala cu naltimea din punctul
.
De asemenea, trebuie sa remarcam faptul ca reprezentarea grafica a suprafetei
este de forma unei retele curbilinii sprijinita pe naltimile date prin matricea Z.
Parametrii X, Y si Z sunt matrice de aceleasi dimensiuni, daca avem n vedere
cum au fost obtinute matricele X si Y, atunci toate aceste trei matrice sunt de tipul
(n,m).
Parametrii x si y sunt vectori de tipul celor ce genereaza matricele X si Y prin
instructiunea meshgrid, adica daca acestia au lungimile m si respectiv n, matricea Z
va fi de tipul (n,m), iar punctele pe care se sprijina reteaua curbilinie, care reprezinta
graficul functiei, au coordonatele (x(j),y(i),Z(i,j)).
Daca primii doi parametri lipsesc, adica suntem n cazul primelor doua forme
ale instructiunii mesh, acestea sunt echivalente respectiv cu urmatoarele doua, prin
considerarea valorilor implicite x=1:m si y=1:n.
Instructiunea surf are aceeasi sintaxa ca instructiunea mesh, adica
surf(Z)
surf(Z,C)

1.12. Grafica tridimensionala

surf(x,y,Z)
surf(x,y,Z,C)
surf(X,Y,Z)
surf(X,Y,Z,C)

unde parametrii au aceleasi caracteristici. Deosebirea n reprezentarea grafica este ca

prin instructiunea surf se produce o colorare a patrulaterelor obtinute prin curbele

.
care genereaza suprafata corespunzatoare functiei
Programul 1.12.2. Vom scrie un program care sa reprezinte grafic functia

, n doua figuri alaturate, odata cu instructiunea
pe domeniul
mesh si apoi cu instructiunea surf.
clear, clf
m=input(m=);
h=1/m; x=-1:h:1;
[X,Y]=meshgrid(x);
Z=1/(2*pi)*exp(-0.5*(X.2+Y.2));
subplot(1,2,1), mesh(X,Y,Z)
title(Grafica prin MESH)
xlabel(x), ylabel(y), zlabel(z)
subplot(1,2,2), surf(X,Y,Z)
title(Grafica prin SURF)
xlabel(x), ylabel(y), zlabel(z)

Executarea programului, cu

, conduce la reprezentarile grafice din Figura 1.19.

In ncheierea acestui paragraf, amintim ca exista posibilitatea de umbrire a unei

suprafete cu ajutorul comenzii
shading tip

unde tip poate fi:

faceted (implicit) umbreste fiecare patrulater de pe suprafata trasata cu o
intensitate fixa si traseaza laturile patrulaterelor;
flat umbreste fiecare patrulater de pe suprafata trasata cu o intensitate fixa,
fara trasarea laturilor patrulaterelor;
interp umbrirea fiecarui patrulater de pe suprafata trasata se face n mod
gradat, printrun procedeu de interpolare, care asigura o trecere neteda de la
un patrulater la altul, fara trasarea laturilor patrulaterelor.
Programul 1.12.3. Sa scriem un program care efectueaza umbrirea suprafetei reprezentata grafic prin Programul 1.12.2:

Introducere n Matlab
Grafica prin SURF

0.16

0.14

0.12

0.1

Grafica prin MESH

0.08

0.06

0.04

1
1

0.5

0
0.5
y

0
0.5

0.5
1

Figura 1.19:

0.5
1

m=input(m=);
h=1/m; x=-1:h:1;
[X,Y]=meshgrid(x);
Z=1/(2*pi)*exp(-0.5*(X.2+Y.2))
subplot(1,3,1), surf(X,Y,Z),
shading faceted
title(Umbrire - faceted)
subplot(1,3,2), surf(X,Y,Z),
shading flat
title(Umbrire - flat)
xlabel(x), ylabel(y), zlabel(z)
subplot(1,3,3), surf(X,Y,Z),
shading interp
title(Umbrire - interp)

Rezultatul executarii programului este n Figura 1.20.

1.12.4 Instructiunile contour si contourf

Reprezentarea curbelor de nivel ale suprafetei, data prin functia
face cu una din urmatoarele forme ale instructiunii contour:
contour(Z)
contour(Z,n)
contour(Z,v)
contour(X,Y,Z)

, se poate

1.12. Grafica tridimensionala

Umbrire faceted

Umbrire flat

Umbrire interp

0.16

0.14

0.12

0.1

0.08

0.06

0.04

1
1

0.5
0

1
1

0.5

0.5
1

0.5

0
0.5

Figura 1.20: Umbrirea unei suprafete

contour(X,Y,Z,v)
contour(Z,[w w])
contour(X,Y,Z,[w w])

unde parametrii X, Y si Z au aceleasi interpretari ca si n cazul instructiunilor mesh

si surf.
Parametrul v este un vector prin care se specifica nivelurile curbelor de nivel ce
urmeaza a fi reprezentate grafic, iar n absenta sa, valorile acestui parametru sunt
automat calculate. Numarul curbelor de nivel se poate preciza prin parametrul n.
Formele instructiunii contour cu parametrul de tipul [w w] are ca efect trasarea curbei de nivel precizata prin w. Aceste forme permit reprezentarea grafica a
functiilor date sub forma implicita. Astfel, daca vrem sa reprezentam grafic functia

data prin
, atunci graficul functiei
va fi dat de curba

de nivel pentru functia

, considerand w=0.
Instructiunea contourf difera de contour doar prin faptul ca ariile delimitate
de curbele de nivel sunt umbrite.
Programul 1.12.4. Sa reprezentam n curbe de nivel pentru functia considerata
n Programul 1.12.2. Reprezentarile acestor curbe de nivel sa fie facute atat cu
instructiunea contour, cat si cu contourf.
clear, clf
m=input(m=); n=input(n=);
h=1/m; x=-1:h:1;

Introducere n Matlab
[X,Y]=meshgrid(x);
Z=1/(2*pi)*exp(-0.5*(X.2+Y.2));
subplot(1,2,1), contour(Z,n)
title([n=,num2str(n), curbe de nivel])
subplot(1,2,2), contourf(Z,n)
title([n=,num2str(n), curbe de nivel umbrite])

si n=5, conduce la reprezentarile grafice din

Executarea programului, cu
Figura 1.21.
n=5 curbe de nivel

n=5 curbe de nivel umbrite

Figura 1.21: Curbe de nivel

1.12.5 Instructiunile ezcontour si ezcontourf

O forma simplificat
a
a, pentru reprezentarea curbelor de nivel, pentru o functie dat
prin
, se obtine cu ajutorul instructiunii ezcontour, avand una din
formele:
ezcontour(f)
ezcontour(f,lim)
ezcontour(f,n)

unde f este expresia matematica a unei functii de doua variabile, privita ca un sir de
caractere.
Parametrul lim este fie un vector de forma [xmin,xmax], fie de forma
[xmin,xmax,ymin,ymax]. Daca lipseste, se ia implicit [-2 ,2 ,-2 ,2 ],
iar daca este de prima forma se ia [xmin,xmax,xmin,xmax].
Parametrul n specifica faptul ca n reprezentarea grafica se foloseste o retea de
n n puncte (implicit se considera n=60).
De exemplu,

1.12. Grafica tridimensionala

f=sqrt(x2+y2)
ezcontour(f,[-2,2])

are acelasi efect cu

ezcontour(sqrt(x2+y2),[-2,2])

, pe domeniul
si produc
curbele de nivel pentru functia

.
Instructiunea ezcontourf, fata de ezcontour executa si umbrirea ariilor
generate de curbele de nivel.

1.12.6 Instructiunile ezmesh, ezsurf, ezmeshc si ezsurfc

Sintaxa apelurilor functiilor ezmesh, ezsurf, ezmeshc si ezsurfc este aceeasi,
iar efectul executarii lor este reprezentarea grafica a unei suprafete, respectiv a unei
suprafete, mpreuna cu sau fara curbele de nivel corespunzatoare. De aceea prezentam
modurile de apelare, numai pentru una dintre ele.
ezmesh(f)
ezmesh(f,lim)
ezmesh(x,y,z)
ezmesh(x,y,z,lim)

Parametrul f reprezinta o expresie algebrica, ce defineste suprafata, care urmeaza

sa fie reprezentata grafic, pe domeniul definit prin lim. Implicit, n absenta parametrului lim, domeniul este [-2 ,2 ] [-2 ,2 ]. Daca lim=[a,b], atunci
domeniul va fi [a,b] [a,b], iar daca lim=[a,b,c,d], atunci domeniul va fi
[a,b] [c,d].
Parametrii x, y, z, reprezinta expresii algebrice ce definesc suprafata n modul
parametric. In acest caz, corespunzator, parametrul lim, precizeaza domeniul n care
iau valori parametrii cu ajutorul carora se defineste n mod parametric suprafata ce
urmeaza a fi reprezentata.
Remarcam faptul ca formele mai sus prezentate, mai pot avea doi parametri.
Unul, n, de tip ntreg pozitiv, care precizeaza numarul n n al punctelor retelei. Implicit se considera n=60. Un altul este circ, care prin prezenta sa atrage reprezentarea lui f pe un disc centrat n domeniul mai sus precizat.
Pentru exemplificare, daca se executa programul Matlab format din urmatoarele
instructiuni:
subplot(1,2,1)
ezmesh(sin(x)*sin(y),[-pi,pi],circ)
subplot(1,2,2)
ezmeshc(sin(x)*sin(y),[-pi,pi],circ)
colormap spring

se obtin graficele din Figura 1.22.

Mai remarcam faptul ca f, x, y, z pot fi numele unor functii predefinite sau scrise
de utilizator.

Introducere n Matlab
sin(x) sin(y)

0.5

sin(x) sin(y)

0.5

5
5

0
0

0
y

Figura 1.22: Suprafata fara si cu curbe de nivel

Pentru a ilustra ca cele doua instructiuni de tipul ezmesh si ezsurf au de
regula acelasi efect, programul urmator reprezinta grafic aceeasi suprafata , respectiv
cu ezmesh si ezsurf.
clf
subplot(1,2,1),
ezsurf(x*exp(-x2 - y2),[-2,2],20)
title(Reprezentare cu ezsurf)
subplot(1,2,2)
ezsurf(x*exp(-x2 - y2),[-2,2],20)
colormap autumn
title(Reprezentare cu ezmesh)

Graficele sunt prezentate n Figura 1.23.

1.12.7 Instructiunile bar3 si bar3h

Instructiunile bar3 si bar3h corespund instructiunilor bar si respectiv barh din
grafica bidimensionala.
Forme ale acestor instructiuni sunt:
bar3(z,w,tip,color)
bar3(y,z,w,tip,color)
bar3h(y,w,tip,color)
bar3h(y,z,w,tip,color)

1.12. Grafica tridimensionala

Reprezentare cu ezsurf

Reprezentare cu ezmesh

0.5

2
2

0
1
y

0
1

1
2

Figura 1.23: Suprafata reprezentata

1
2

argumentele w, tip si color sunt optionale, dar cand sunt specificate, trebuie
sa pastreze aceasta ordine.
Parametrul y este un vector de lungime m, avand componentele ordonate
crescator sau descrescator. Daca y lipseste, atunci se considera implicit y=1:m.
Daca z este un vector de aceeasi lungime cu y, atunci vor fi reprezentate grafic m

m, de pe axa oy. Daca z este o mabare de lungimi z n dreptul punctelor y ,
trice de tipul (m,n), reprezentarile sunt efectuate pentru fiecare din cele n coloane

ale matricei, adica n fiecare punct y ,
m, de pe axa oy, vor fi reprezentate cate
n bare (batoane).

Parametrul w specifica grosimea barelor, implicit fiind w
, iar pentru w
barele se suprapun.
Daca parametrul tip=detached, care este valoarea implicita, atunci barele
din punctele y de pe axa oy vor fi detasate n adancime dupa axa ox. Daca
tip=grouped, barele (batoanele) vor fi grupate n punctele y , de pe axa oy, iar
daca tip=stacked, atunci barele vor fi stivuite n aceste puncte.
Parametrul color specifica culoarea barelor (batoanelor) si are una din urmatoarele valori: r (rosu), g (verde), b (albastru), y (galben), m (violet), c (ciclamen),
k (negru), w (alb).
Deosebirea ntre bar3 si bar3h este ca prima instructiune actioneaza pe verticala, iar a doua pe orizontala.

Introducere n Matlab

Programul
1.12.5. Sa scriem un program care genereaza o matrice magica de ordin

. Folosind primele trei coloane ale matricei magice, s
a reprezentam prin bare
verticale valorile acestora cu fiecare din tipurile detached, grouped si stacked.
Folosind ultimele trei coloane sa se faca astfel de reprezentari cu ajutorul barelor
orizontale.
m=input(m:); A=magic(m);
subplot(2,3,1), bar3(A(:,1:3),.6,detached)
title(Bar3 - detached)
subplot(2,3,2), bar3(A(:,1:3),grouped)
title(Bar3 - grouped)
subplot(2,3,3), bar3(A(:,m-2:m),.6,stacked)
title(Bar3 - stacked)
subplot(2,3,4), bar3h(A(:,m-2:m),.6,detached)
title(Bar3h - detached)
subplot(2,3,5), bar3h(A(:,m-2:m),grouped)
title(Bar3h - grouped)
subplot(2,3,6), bar3h(A(:,1:3),.6,stacked)
title(Bar3h - stacked)
colormap spring

Executarea acestui program, pentru m=4, produce graficele din Figura 1.24.
Bar3 grouped

Bar3 detached

Bar3 stacked
40

10
10

5
0

0
1

1
2

4
1

Bar3h detached

2
3

3
4

Bar3h grouped

Bar3h stacked

2
1

0
10

10
20

20
20

Figura 1.24: Bare verticale si bare orizontale n 3D

Capitolul 2

Elemente de teoria probabilitatilor

Teoria probabilitat ilor are ca obiect de studiu fenomene nedeterministe sau aleatoare (ntamplatoare). Un fenomen nedeterminist este rezultatul imposibilitat ii
cunoasterii exacte si complete a tuturor elementelor care concura la realizarea acestuia. Astfel de fenomene aleatoare ar putea fi apelurile dintr-o centrala telefonica,
accidentele de circulatie dintr-o intersectie, extragerile numerelor loto, rezultatele
de la ruleta, noii nascuti la o maternitate, numarul particulelor dezintegrate dintro substanta radioactiva, miscarea browniana a particulelor unei substante dizolvata
ntr-un fluid, sosirea clientilor ntr-o statie de servire, raspandirea erorilor de tipar
dintr-o carte, vanzarea painii la o unitate alimentara si n fine raspandirea stafidelor
n prajitura cumparata de la o cofetarie. Toate aceste fenomene sunt fenomene aleatoare prin faptul ca nu sunt cunoscute toate conditiile n care sunt realizate, sau daca
o parte din aceste conditii pot fi precizate, ele nu sunt cunoscute cu exactitate. Factorii necunoscuti, care se regasesc n fenomenul real, conduc la astfel de fenomene
aleatoare (nedeterministe).
Teoria probabilitat ilor vine sa dea metode unitare pentru analiza si studiul unor
astfel de fenomene nedeterministe si care provin dintro gama larga a activitatii si
cunoasterii umane. Pentru aceasta este necesar sa fie formalizat limbajul prin care
se trateaza fenomenele aleatoare, ca apoi prin particularizari sa fie obtinute rezultate
specifice fenomenului considerat.
Vom presupune ca avem anumite cunostinte de relative la teoria probabilitat ilor.
Reamintim n acest capitol doar o parte din notiunilor de baza ale teoriei probabilitat ilor, pentru stabilirea unui limbaj comun n abordarea capitolelor urmatoare.
Tinand seama de aceasta motivatie recomandam celor neinitiati n aceasta disciplina
a teoriei probabilitat ilor lucrarile [10], [6], [9], [8].
61

Elemente de teoria probabilitat ilor

2.1 Camp de probabilitate

Daca se considera fenomenul aleator ( experimentul ) , vom numi probe rezultatele
experimentului, iar multimea probelor relative la experimentul o numim spatiul
probelor si pe care l notam prin .

Definitia 2.1.1. Spunem ca submultimea nevida

borelian, -algebra) daca satisface urmatoarele conditii:

este un corp (corp

(2.1.1)

se numeste camp de evenimente.

Multimea de indici este o multime cel mult numarabila.

iar perechea

Definitia 2.1.2. Fiind dat campul de evenimente

, se numeste probabilitate o

, care verific
aplicatie
a urmatoarele trei axiome:

(i)

(ii)

(iii)

fiind evenimentul sigur (cert),

iar tripletul

se numeste camp de probabilitate.

2.2 Variabile aleatoare

Fie campul de probabilitate
, respectiv pe si .

algebrele

Definitia 2.2.1. Numim variabila aleatoare, aplicatia

masurabila, adica

(2.2.1)

multimilor Borel

, daca este

Observat
Avand n vedere ca poate fi generat de familia de intervale
ia 2.2.2.

, conditia (2.2.1) de masurabilitate poate fi nlocuita prin

(2.2.2)

2.3. Functie de repartitie

Observatia 2.2.3. Cardinalul multimii a valorilor unei variabile aleatoare ,

conduce la o clasificarea a multimii variabilelor aleatoare:
variabile aleatoare de tip discret, daca
cel mult numarabila de valori;
variabile aleatoare simple, daca
de valori;

variabile aleatoare de tip continuu, daca

valori de puterea continuumului.

, adica are o multime

, adica are o multime finita

, adica are o multime

Definitia 2.2.4. Numim vector aleator (dimensional), aplicatia

daca este masurabila, adica

sau avand n vedere Observatia 2.2.2

unde si ,

ale vectorului .

, reprezinta respectiv componentele vectorului aleator

2.3 Functie de repartitie

si variabila aleatoare .
Definitia 2.3.1. Numim functie de repartitie atasata variabilei aleatoare , aplicatia

definita prin
Fie campul de probabilitate

(2.3.1)

Observatia 2.3.2. Marea majoritate a tratatelor de teoria probabilitat ilor definesc

functia de repartitie prin formula

dar avand n vedere ca sistemul Matlab foloseste formula (2.3.1), n definirea functiei
de repartitie, vom considera aceasta abordare n cele ce urmeaza.

Elemente de teoria probabilitat ilor

Definitia 2.3.3. Numim funct

ie de repartitie atasata vectorului aleator dimensional , aplicatia
definita prin

Fie vectorul aleator cu functia de repartitie si fie notata respectiv prin

functia de repartitie a variabilei aleatoare , care este componenta a vectorului

aleator, pentru fiecare
.
Definitia 2.3.4. Spunem ca variabilele aleatoare
daca

, sunt independente

2.4 Legi de probabilitate de tip discret

Daca variabila aleatoare este de tip discret, adica are un numar cel mult numarabil

de valori, fie acestea , , atunci functia de repartitie atasata este o functie
n scara si este data prin:

(2.4.1)

unde

Definitia 2.4.1. Numim distributia sau repartitia variabilei aleatoare de tip discret,
tabloul

unde , , sunt valorile pe care le ia variabila aleatoare

probabilitatea cu care variabila aleatoare ia valoarea , adica

pentru fiecare .

, iar

este
,

Deoarece evenimentele , , formeaza un sistem complet de evenimente, avem ca

. Remarcam de asemenea ca , reprezinta marimea

saltului functiei de repartitie n punctul de discontinuitate , pentru fiecare .
In teoria probabilitat ilor si n aplicatiile sale, se ntalnesc clase de variabile aleatoare de tip discret. Forma cea mai generala a unei variabile aleatoare apartinand unei
clase se numeste lege de probabilitate de tip discret.

2.4. Legi de probabilitate de tip discret

2.4.1 Functiile Matlab pdf si cdf

Distributia variabilei aleatoare poate fi precizata prin ceea ce numim functie de
probabilitate ( pdf probability distribution function, n Matlab) definita prin:

sau prin functia de repartit

ie ( cdf cumulative distribution function).
Daca valorile , , sunt calculate, atunci folosind instructiunile plot,
bar si stairs, se pot reprezenta grafic functia de probabilitate (pdf) si functia
de repartitie (cdf). Anume, daca vectorul x contine valorile variabilei aleatoare ,
iar p probabilitat ile corespunzatoare, atunci intructiunile
plot(x,p,s)
bar(x,p)
stairs(x,p)

vor reprezenta grafic respectiv functia de probabilitate prin simbolul precizat prin s,
functia de probabilitate prin bare si functia de repartitie (functie n scara).
Remarcam faptul ca daca ia o infinitate numarabila de valori, atunci trebuie
sa ne limitam la un numar finit de valori ale variabilei aleatoare, iar reprezentarile
grafice se vor face pe domeniul cuprins ntre valorile minima si maxima ale acestora.
Programul 2.4.2. Sa consideram variabila aleatoare

care are distributia

si vrem sa reprezentam grafic functia de probabilitate (prin puncte si bare) si functia

de repartitie pe aceeasi figura.
Am putea presupune ca variabila aleatoare se refera la aruncarea unui zar.
Anume, daca n urma arunc
arii zarului se obtine un numar compus (4 sau 6), atunci
se pierde o miza (
), daca se obtine un numar prim (2, 3 sau 5) se castiga o

miza ( ), altfel nu se castiga si nu se pierde nimic (
).
Urmatorul program
x = [-1:1]; p = [1/3,1/6,1/2];
pc = [1/3,1/2,1];
subplot(1,3,1), plot(x,p,o)
axis([-1.5 1.5 0 1])
title(Functia de probabilitate)
subplot(1,3,2), bar(x,p)
axis([-1.5 1.5 0 1])
title(Functia de probabilitate)
subplot(1,3,3), stairs(x,pc)
title(Functia de repartitie)

produce reprezentarile grafice din Figura 2.1.

Elemente de teoria probabilitat ilor

Functia de probabilitate

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

Functia de repartitie
1

0.9

0.8

0.7

0.6

0.5

0.4

0.3
1

Figura 2.1: Functia de frecventa si functia de repartitie

Sistemul Matlab dispune de functii (instructiuni) care calculeaza valorile functiei
de probabilitate si ale functiei de repartitie pentru legile de probabilitate implementate
prin Statistics toolbox.
Functia pdf
Doua moduri de apel pentru calculul valorilor functiei pdf avem:
p=pdf(legea,x,par1,par2,...)
p=numef(x,par1,par2,...)

2.4. Legi de probabilitate de tip discret

cp=cdf(legea,x,par1,par2,...)
cp=numef(x,par1,par2,...)

2.4.2 Legi de probabilitate de tip discret clasice

Vom prezenta n continuare legile de probabilitate de tip discret recunoscute de sistemul Matlab, prin pachetul de programe Statistics toolbox. In paranteza, pentru fiecare
lege de probabilitate sunt trecute si denumirile acceptate de sistemul Matlab. Facem
observatia ca pentru unele functii sunt acceptate si alte denumiri.

Legea lui Bernoulli

Variabila aleatoare
distributia

urmeaza legea lui Bernoulli, pe care o notam

(2.4.2)

unde
,

, daca are

Legea lui Bernoulli modeleaza un fenomen aleator n desfasurarea caruia suntem

interesati n aparitia unui eveniment fixat , pe care l vom numi succes, respectiv

a lui numit insucces. Probabilitatea obtinerii succesului este , iar valoarea corespunzatoare a variabilei aleatoare este 1, respectiv
este probabilitatea
producerii insuccesului, cu valoarea 0 corespunzatoare pentru .
Functia de probabilitate este

Elemente de teoria probabilitat ilor

Legea uniforma discreta (unid)

Variabila aleatoare
distributia

urmeaza legea uniforma discreta, notam

(2.4.3)

unde

, daca are

Functia de probabilitate este

Legea binomiala (bino)

Spunem ca variabila aleatoare
distributia

(2.4.4)

urmeaza legea binomiala, notam

unde

, daca are

iar
si
.
Variabila aleatoare reprezinta numarul succeselor obtinute n repetari independente ale unui experiment.
Descoperirea legii binomiala este atribuita lui James Bernoulli si care se afla n

cartea Ars Conjectandi (1713). Pascal a considerat cazul particular

Functia de probabilitate este

Remarcam faptul ca variabila aleatoare se obtine ca suma a variabile aleatoare independente, ce urmeaza fiecare legea lui Bernoulli . Prin urmare, putem

spune si faptul ca legea lui Bernoulli se obtine din legea binomiala
,
pentru
.
Programul 2.4.3. Sa scriem un program Matlab care sa reprezinte grafic functia de
probabilitate (prin puncte si prin bare) si functia de repartitie ale legii de probabilitate
.
Executarea programului

2.4. Legi de probabilitate de tip discret

n = input(n=);
p = input(p=); x = 0:n;
f = pdf(bino,x,n,p);
subplot(1,3,1), plot(x,f,o)
axis([-0.5 n+0.5 0 max(p)+0.02])
title(Functia de probabilitate)
subplot(1,3,2), bar(x,f)
axis([-.5 n+0.5 0 max(p)+0.02])
title(Functia de probabilitate)
f = cdf(bino,x,n,p);
subplot(1,3,3), stairs(x,f)
title(Functia de repartitie)
axis([0 n 0 1])

pentru n=7 si p=0.3, realizeaza graficele din Figura 2.2.

Functia de probabilitate

Functia de repartitie
1

0.3

0.3
0.9

0.25

0.2

0.15

0.1

0.05

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

Figura 2.2: Legea binomiala

Legea hipergeometrica (hyge)

Spunem ca variabila aleatoare urmeaza legea hipergeometrica si vom nota prin

, daca are distributia

(2.4.5)

unde

iar

Variabila aleatoare reprezinta numarul succeselor obtinute n extrageri dintr

o populatie de volum , fara ntoarcere, daca numarul indivizilor cu proprietatea
cercetata este .

Elemente de teoria probabilitat ilor

Functia de probabilitate corespunzatoare este:

, adica probabilitat ile ca la

Observatia 2.4.4. Daca se noteaza
si
, atunci
prima extragere sa se obtina succes, respectiv insucces, iar

adica se obtine distributia binomiala.

Programul 2.4.5. Pentru a ilustra afirmatia precedenta, sa scriem un program Matlab

care sa reprezinte grafic prin bare functiile de probabilitate pentru
si

, cu
Executarea programului

clf;
M = input(M:);
K = input(K(K<=M):);
n = input(n(n<=K):)
x = 0:n; p=K/M;
fh = pdf(hyge,x,M,K,n);
fb = pdf(bino,x,n,p);
bar(x,[fh,fb])
colormap winter

pentru M=100, K=40 si n=10, realizeaza graficul din Figura 2.3.

Legea lui Poisson (poiss)
Variabila aleatoare
distributia

(2.4.6)

urmeaza legea lui Poisson, vom nota

unde

Functia de probabilitate corespunzatoare este

e , iar

, daca are

Variabila aleatoare , care urmeaza legea lui Poisson, numara de cate ori apare
un anumit eveniment ntrun interval de tip, pe o distanta , pe o suprafata etc. Poisson

2.4. Legi de probabilitate de tip discret

0.35

0.3

0.25

0.2

0.15

0.1

0.05

Figura 2.3: Legea hipergeometrica

si legea binomiala

(1837) a aratat ca legea, carei poarta numele, este un caz limita a legii binomiale,
, pentru . Altfel spus, cand este mare, trebuie sa
anume cand
fie mic, adica probabilitatea producerii evenimentului considerat este mica, de aici
denumirea de lege a evenimentelor rare.
Mai remarcam un rezultat cunoscut, care stabileste legatura dintre legea lui Poisson si legea exponentiala, care va fi prezentata mai ncolo. Anume, pe cand legea lui
Poisson numara evenimentele ce apar ntrun interval de timp, legea exponentiala da
lungimea intervalului dintre doua aparitii consecutive ale evenimentelor.
Programul 2.4.6. Vom scrie un program Matlab, care sa reprezinte grafic prin bare

functiile de probabilitate pentru
si
cu
.

Avand n vedere comportarea legii
, cand
, graficele functiilor de
probabilitate pentru cele doua legi de probabilitate trebuie sa se apropie.
are o infinitate (numarabila) de valori, prin
Mai remarcam faptul ca legea
urmare n reprezentarea grafica pentru aceasta lege de probabilitate ne vom limita la
un numar finit de valori.
Anume, vom considera numai valorile ntregi din intervalul

, alegere care va fi justificata mai tarziu.
Programul

clf;
n = input(n=); p = input(p=);
lambda = n*p;
vi = fix(lambda-3*sqrt(lambda));
vf = fix(lambda+3*sqrt(lambda));
x = vi:vf;

Elemente de teoria probabilitat ilor

fb = binopdf(x,n,p);
fl = poisspdf(x,lambda);
colormap autumn
bar(x,[fb,fl])

pentru n=100 si p=0.05, realizeaza graficul din Figura 2.4.

0.2

0.18

0.16

0.14

0.12

0.1

0.08

0.06

0.04

0.02

Figura 2.4: Legea binomiala

si legea Poisson

Legea binomiala negativa (nbin)

Spunem ca variabila aleatoare urmeaza legea binomiala negativa sau legea lui

Pascal, notata
, daca are distributia

cu

iar
si
. Variabila aleatoare ce urmeaza legea
reprezinta numarul insucceselor pana la aparitia succesului de rang , daca repetarile sunt
considerate independente.

Functia de probabilitate corespunzatoare legii
este

Observatia 2.4.7. Unele tratate considera ca o variabila aleatoare ce urmeaza

legea lui Pascal reprezinta rangul repetarii la care se produce succesul cu numarul .

2.5. Legi de probabilitate continue

Daca se are n vedere aceasta definitie se obtine distributia

(2.4.7)

Legea geometrica (geo)

Legea geometrica, notata
, se obtine ca si caz particular,

gii
. Prin urmare variabila aleatoare urmeaza legea
distributia

, al le, daca are

si reprezinta numarul insucceselor pana la aparitia primului succes.

Functia de probabilitate pentru legea
este

De remarcat faptul ca daca se aduna variabile aleatoare independente, fie

care urmand legea
, atunci se obtine o variabila aleatoare ce urmeaza legea

.
Observatia 2.4.8. Corespunzator observatiei de la legea lui Pascal, avem ca unele
tratate considera ca o variabila aleatoare ce urmeaza legea geometrica reprezinta
rangul repetarii la care se produce primul succes. Daca se are n vedere aceasta
definitie se obtine distributia

(2.4.8)

2.5 Legi de probabilitate continue

Definitia 2.5.1. Fie variabila aleatoare avand functia de repartitie . Vom spune
ca este variabila aleatoare (absolut) continua, daca functia de repartitie este
absolut continua, sau echivalent se poate reprezenta sub forma

functia
toare .

pentru orice

numinduse densitatea de probabilitate a variabilei alea-

Elemente de teoria probabilitat ilor

Definitia 2.5.2. Fie vectorul aleator avand functia de repartitie . Spunem ca

este vector aleator de tip continuu, daca functia de repartitie se poate reprezenta
sub forma

, numinduse densitatea de probabilitate a vectorului aleator .
functia

Ca la variabilele aleatoare de tip discret si la cele de tip continuu exista clase

de variabile aleatoare. Forma cea mai generala a densitatii de probabilitate a unei
variabile aleatoare din clasa respectiva, ne da o lege de probabilitate de tip continuu.
Functiile Matlab pdf si cdf
Distributia variabilei aleatoare de tip continuu poate fi precizata prin functie densitate de probabilitate (pdf probability density function) sau prin functia de
repartitie (cdf cumulative distribution function).
Reprezentarile grafice ale densitatii de probabilitate si functiei de repartitie n
Matlab se fac folosind instructiunea de tip plot.
Valorile densitatii de probabilitate si ale functiei de repartitie , pentru legile
de probabilitate implementate prin Statistics toolbox, ca si n cazul discret, se obtin
cu ajutorul functiilor Matlab pdf si respectiv cdf. Trebuie nsa sa tinem seama ca
este continua (eventual cu o multime cel mult numarabila de puncte de discontinuitate), iar nu mai este o functie n scara. Prin urmare, pentru asigurarea netezimii
graficelor se impune sa fie considerat un numar suficient de puncte ale graficelor
acestor functii.

2.5.1 Legi de probabilitate continue clasice

Prezentam si n acest caz legile de probabilitate de tip continue recunoscute de sistemul Matlab, prin pachetul de programe Statistics toolbox.
Legea uniforma (unif)

Spunem ca variabila aleatoare urmeaza legea uniforma pe intervalul , si vom

nota
, daca are densitatea de probabilitate

daca

daca

2.5. Legi de probabilitate continue

Functia de repartit
ie pentru variabila aleatoare

tervalul , este

(2.5.1)

, ce urmeaza legea uniforma pe in-

daca

Denumirea de lege uniform

a este legata de faptul ca daca se considera subinter
vale ale intervalului de lungimi egale, sa zicem ca au lungimea , atunci proba
bilitatea ca variabila aleatoare sa ia valori ntrun astfel de interval este
.
Adica, aceasta probabilitate nu depinde de pozitia subintervalului, ci numai de lungimea lui. Intuitiv, am putea spune ca valorile nt
amplatoare (aleatoare) ale functiei

sunt uniform raspandite pe intervalul
. Acest lucru nu se ntampla la alte
legi de probabilitate, cand aceste valori sunt grupate n jurul uneia sau mai multor
valori pe care le ia variabila aleatoare .
Programul 2.5.3. Sa reprezentam grafic densitatea de probabilitate

repartitie pentru legea
.
Programul Matlab care urmeaza

si functia de

clf;
a = input(a=); b = input(b=);
x = a-1:0.01:b+1;
f = pdf(unif,x,a,b);
F = cdf(unif,x,a,b);
subplot(1,2,1), plot(x,f,k-)
axis([a-1 b+1 -0.1 1/(b-a)+0.1])
title(Densitatea de probabilitate)
subplot(1,2,2), plot(x,F,k-)
axis([a-1 b+1 -0.1 1.1])
title(Functia de repartitie)

pentru a=1 si b=4, realizeaza graficele din Figura 2.5.

Putem remarca faptul ca functia de repartitie este continua. Astfel valorile ar s
gumentului
i
n formula (2.5.1) pot fi atasate respectiv la cazurile

si
. Prin urmare intervalul pe care densitatea de probabilitate
este diferita de zero poate fi interval nchis la ambele capete, nchis la un capat si
deschis la celalalt, respectiv deschis la ambele capete. In toate aceste cazuri vom

considera ca avem legea uniforma de probabilitate
.
Proprietatea
2.5.4. Daca variabila aleatoare urmeaza legea uniforma pe inter

valul
, adica
, numita si lege uniforma standard, si daca
, atunci
variabila aleatoare

Elemente de teoria probabilitat ilor

Functia de repartitie

Densitatea de probabilitate
0.4

0.35
0.3

0.8

0.25
0.6

0.2
0.15

0.4
0.1
0.05
0.2
0
0.05
0.1

Figura 2.5: Legea uniforma pe

urmeaza legea uniforma

Legea normala (norm)

Spunem ca variabila aleatoare urmeaza legea normala (legea GaussLaplace) de

si , notam aceasta prin
parametri
, daca are densitatea de
probabilitate

pentru orice

Functia de repartitie pentru legea normala standard

este

si se numeste functia lui Laplace.

In Matlab (si nu numai) exista o functie erf (functia eroare):

erf e

care verifica relatia

erf

2.5. Legi de probabilitate continue

Remarcam ca functia

se numeste de asemenea functia lui Laplace. Intre cele doua functii Laplace exista
relatia

Folosind cele doua functii ale lui Laplace avem:

Programul 2.5.5. Vom reprezenta grafic densitatea de probabilitate

si functia de repartitie corespunzatoare.
Executia programului

pentru legea

clf;
m = input(mu=); s = input(sigma=);
x = m-3*s:0.01:m+3*s;
f = pdf(norm,x,m,s);
F = cdf(norm,x,m,s);
subplot(1,2,1), plot(x,f,k-)
title(Densitatea de probabilitate)
subplot(1,2,2), plot(x,F,k-)
title(Functia de repartitie)

pentru mu=0 si sigma=1, produce graficele din Figura 2.6.

Observatia 2.5.6. Daca se considera variabilele aleatoare ,

, indepen , atunci combinatia liniara
dente, fiecare urmand respectiv legile normale

este o variabila aleatoare ce urmeaza legea normala

unde

Elemente de teoria probabilitat ilor

Densitatea de probabilitate

Functia de repartitie

0.4

0.9

0.35

0.8
0.3
0.7
0.25

0.6

0.2

0.5

0.4

0.15

0.3
0.1
0.2
0.05

0.1

0
4

Figura 2.6: Legea normala standard

Legea lognormala (logn)
Variabila aleatoare urmeaza legea lognormala de probabilitate si vom nota aceasta

prin
, daca are densitatea de probabilitate

Daca

urmeaza legea lognormala de parametri

ln urmeaza legea normala ( e ).

si , atunci variabila aleatoare

Legea gamma (gam)

Variabila aleatoare urmeaza legea gamma, notam aceasta prin
densitatea de probabilitate

unde

daca are

este functia lui Euler de speta a doua, adica

Cand
, legea gamma tinde la legea normala. Adica, daca urmeaza legea

, variabila aleatoare poate fi considerata ca urmand

, atunci pentru

legea
, cu si .

2.5. Legi de probabilitate continue

Programul 2.5.7. Pentru a ilustra aceasta ultima afirmatie, sa reprezentam grafic, pe

aceeasi figura, densitatile de probabilitate pentru cele doua legi, parametrii acestora
satisfacand relatiile precizate mai sus.
Executand programul
clf;
a = input(a=); b = input(b=);
m = a*b; s = b*sqrt(a);
x = m-3*s:0.01:m+3*s;
fn = pdf(norm,x,m,s);
fg = pdf(gam,x,a,b);
plot(x,fn,k-.,x,fg,k-)
legend(Legea normala,Legea gamma)

pentru a=100 si b=10, acesta produce graficele din Figura 2.7.

4.5

x 10

Legea normala
Legea gamma
4

3.5

2.5

1.5

0.5

0
700

800

900

1000

Figura 2.7: Legile

1100

1200

1300

Legea exponentiala (exp)

Variabila aleatoare urmeaza legea exponentiala, notam
tea de probabilitate

Observam ca se obtine ca si caz particular al legii

daca are densita-

, cand se ia

Elemente de teoria probabilitat ilor

Legea exponentiala se aplica la modelarea evenimentelor ce apar aleator n timp.

De asemenea are aplicatii n studiile privind durata de viata .
Legea beta (beta)
Variabila aleatoare
probabilitate:

urmeaza legea beta, notata

unde

daca are densitatea de

este functia lui Euler de speta ntai.

Este cunoscut faptul ca daca doua variabile aleatoare independente si ur

urmeaza legile si , atunci variabila aleatoare

meaza legea .

Daca se considera legea , cu
, se obtine legea de probabililate arcsin, care are densitatea de probabilitate

Legea Weibull (weib)

Variabila aleatoare urmeaza legea lui Weibull, notam
de probabilitate

daca are densitatea

Legea a fost descoperita de Weibull (1939) si modeleaza rezistenta la rupere a materialelor. De asemenea se pare ca modeleaza durata de viata mai bine decat legea
exponentiala. Se observa ca legea exponentiala este un caz particular, anume se obtine

cand si
.
Legea Rayleigh (rayl)
Variabila aleatoare urmeaza legea lui Rayleigh de probabilitate, notata prin
daca are densitatea de probabilitate:

2.5. Legi de probabilitate continue

Se observa ca este caz particular al legii Weibull,
,
.

Daca viteza unei particule n directiile si sunt doua variabile aleatoare independente, care urmeaza legi normale de probabilitate, cu mediile zero si dispersiile
egale, atunci distanta parcursa de particula pe unitate de timp urmeaza legea lui Rayleigh.
2.5.2 Legi de probabilitate continue statistice
Prezentam legile de probabilitate de tip continuu, denumite astfel n sistemul Matlab,
prin pachetul de programe Statistics toolbox, deoarece utilizarea lor este strans legata
de statistica.
Legea t (Student) (t)
Variabila aleatoare urmeaza legea t (Student) de probabilitate, notata
are densitatea de probabilitate

daca

(numarul gradelor de libertate).

Gosset (1908) a descoperit aceasta lege de probabilitate. Nu i-a fost permis sa

publice rezultatul, drept urmare a publicato sub pseudonimul Student.
Pentru
, se obtine legea de probabilitatea a lui Cauchy.
Daca , , . . . , sunt independente, fiecare urmand legea normala de para
metri
si , atunci

.
urmeaza legea

Daca urmeaza legea

atunci

urmeaza legea .
, se ajunge la legea normala standard
Cand

Programul 2.5.8. Pentru ilustrarea ultimei afirmatii, vom scrie un program care sa

reprezinte pe aceeasi figura graficele densitat ilor de probabilitate pentru legile

si
.
Prin executarea programului Matlab

Elemente de teoria probabilitat ilor

clf;
n = input(n=); x = -3:0.01:3;
fn = normpdf(x,0,1); fs = tpdf(x,n);
plot(x,fn,k-.,x,fs,k-)
legend(Legea normala, Legea Student)

pentru n=10, acesta produce graficele din Figura 2.8.

0.4
Legea normala
Legea Student
0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
3

si legea

Figura 2.8: Legea

Legea t (Student) necentrata (nct)

Legea t (Student) necentrata, notata

sitatea de probabilitate

unde

si are den-

, generalizeaza legea

Programul 2.5.9. Programul Matlab ce urmeaza reprezinta grafic functiile de

si
:
repartitie pentru legile

2.5. Legi de probabilitate continue

clf;
n = input(n=); d = input(delta=);
x = -5:0.01:5;
Fc = tcdf(x,n); Fnc = nctcdf(x,n,d);
plot(x,Fc,k-.,x,Fnc,k-)
legend(Legea Student,..
Legea Student necentrata,2)

Pentru n=10 si d=1, se obtin graficele din Figura 2.9.

1
Legea Student
Legea Student necentrata
0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0
5

si legea

Figura 2.9: Legea

Legea

(chi2)

Variabila aleatoare urmeaza legea sau legea HelmertPearson, vom nota prin
, daca are densitatea de probabilitate:

(numarul gradelor de libertate).

Legea este un caz particular al legii , cand , iar
.

Daca , , . . . , sunt independente, fiecare urmand legea normala de para
metri
si , atunci variabila aleatoare

Elemente de teoria probabilitat ilor

urmeaza legea
respectiv legile

iar daca variabilele aleatoare independente

si , atunci variabila aleatoare

urmeaza

, varia-

.
urmeaza legea
Daca variabila aleatoare urmeaza legea

bila aleatoare urmeaza legea
, cu

atunci,
pentru
.

Programul 2.5.10. Pentru ilustrarea afirmatiei, scriem un program care sa repre si

zinte pe
i figura graficele densitatilor de probabilitate pentru legile

aceeas
.
Prin executarea programului Matlab
clf;
n = input(n=); s = sqrt(2*n);
x = n-3*s:0.01:n+3*s;
fn = normpdf(x,n,s); fchi = chi2pdf(x,n);
plot(x,fn,k-.,x,fchi,k-)
legend(Legea normala, Legea chi2,2)

pentru n=10, se obtin graficele din Figura 2.10.

0.06
Legea normala
Legea chi2

0.05

0.04

0.03

0.02

0.01

Figura 2.10: Legea

si legea

2.5. Legi de probabilitate continue

necentrata (ncx2)

Legea

Sa notam prin o variabila aleatoare ce urmeaza legea . Spunem ca variabila

aleatoare urmeaza legea necentrata, daca are functia de repartitie:

Programul 2.5.11. Programul Matlab ce urmeaz

a reprezinta grafic densitatile de

si legea
necentrata corespunzatoare:
probabilitate pentru legea
clf;
n = input(n=); d = input(delta=);
x = 0:0.01:15;
c = chi2pdf(x,n); fnc = ncx2pdf(x,n,d);
plot(x,fc,k-.,x,fnc,k-)
legend(Legea chi2, Legea chi2 necentrata)

Pentru n=4 si d=2, se obtin graficele din Figura 2.11.

0.2
Legea chi2
Legea chi2 necentrata
0.18

0.16

0.14

0.12

0.1

0.08

0.06

0.04

0.02

Figura 2.11: Legea

si legea

Legea F (FisherSnedecor) (f)

Variabila aleatoare urmeaza legea F (FisherSnedecor), notata
densitatea de probabilitate:

daca are

Elemente de teoria probabilitat ilor

(numarul gradelor de libertate)

Daca variabilele aleatoare independente

atunci

si urmeaza legile

.
urmeaza legea
, atunci va urma legea
Daca variabila aleatoare urmeaza legea

.

, atunci transformata lui FiDaca variabila aleatoare urmeaza legea

sher, adica log , urmeaza legea
, cand , unde

(2.5.2)

Programul 2.5.12. Programul care urmeaza reprezinta pe aceeasi figura graficele

densitat ilor de probabilitate pentru transformata lui Fisher si legea
, unde
si au valorile date prin (2.5.2).
Remarcam faptul ca densitatea de probabilitate a variabilei aleatoare este

e e

clf
m = input(m=); n = input(n=);
mu = (1/n-1/m)/2; s = sqrt((1/n+1/m)/2);
x = mu-3*s:0.01:mu+3*s;
f1 = normpdf(x,mu,s);
f2 = 2*exp(2*x).*fpdf(exp(2*x),m,n);
plot(x,f1,k-.,x,f2,k-)
legend(Legea normala,Transformata Fisher,2)

Pentru m=20 si n=30, se obtin graficele din Figura 2.12.

Legea F (FisherSnedecor) necentrata (ncf)
Daca variabilele aleatoare independente

necentrata si
necentrata, atunci

urmeaza respectiv legile

urmeaza legea F (FisherSnedecor) necentrata, notata prin

Functia de repartitie pentru variabila aleatoare legea

e

.
este

2.5. Legi de probabilitate continue

2
Legea normala
Transformata Fisher
1.8

1.6

1.4

1.2

0.8

0.6

0.4

0.2

0
0.8

0.6

0.4

0.2

0.4

0.6

Figura 2.12: Transformata Fisher si legea normala corespunzatoare

unde

este

functia Beta incompleta de parametrii

Programul 2.5.13. Programul

ce urmeaz
a grafic densitatile de

Matlab
a reprezint
si
probabilitate pentru legile
:
clf;
m = input(m=); n = input(n=);
d = input(delta=);
x = 0:0.01:10.01;
Fc = fpdf(x,m,n); Fnc = ncfpdf(x,m,n,d);
plot(x,Fc,k-.,x,Fnc,k-)
legend(Legea F, Legea F necentrata)

Pentru m=5, n=20 si d=10, se obtin graficele din Figura 2.13.

2.5.3 Functia Matlab normspec

Avand n vedere ca legea normala joaca un rol important n teoria probabilitat ilor
si n statistica, sistemul Matlab i acorda la randul sau o atentie speciala. Astfel, n
sistemul Matlab de baza exista functia normspec, cu urmatoarele moduri de apel:
normspec(sp,mu,sigma)
p = normspec(sp,mu,sigma)

Functia normspec reprezinta grafic densitatea de probabilitate a legii normale de

parametrii mu si sigma si umbreste aria marginita de dreptele perpendiculare pe
axa absciselor ce trec prin punctele axei precizate prin cele doua componente ale
vectorului sp, curba ce reprezinta graficul densitatii de probabilitate si axa absciselor.
Parametrul p, dupa executia functiei normspec, contine valoarea ariei umbrite,
adica probabilitatea ca variabila aleatoare sa ia valori din intervalul precizat prin sp.

Elemente de teoria probabilitat ilor

0.8
Legea F
Legea F necentrata
0.7

0.6

0.5

0.4

0.3

0.2

0.1

Figura 2.13: Legea

si legea

Programul 2.5.14. Programul

a va reprezenta grafic densitatea
Matlab ce urmeaz

s

i
va
umbri
aria
cuprins
a ntre dreptele de ecuatii
de probabilitate a legii

s
i
(
), curba ce reprezinta graficul densitatii de probabilitate si axa
absciselor.
m = input(mu=); s = input(sigma=);
a = input(a:); b = input(b (b>a):);
p = normspec([a,b],m,s);
xlabel([a= ,num2str(a),
b= ,num2str(b)])
ylabel(Densitatea de probabilitate)
title([Probabilitatea intre a si b : ,num2str(p)])

Executand acest program cu valorile de intrare mu=0, sigma=1, a=-1.5 si b=2,

se obtine graficul din Figura 2.14.
Se observa ca instructiunea title contine parametrul num2str(p), care
transforma valoarea numerica a lui p ntrun sir de caractere.

2.5.4 Distributie marginala

Fie vectorul
aleator
unde
, iar

si vectorul aleator

Definitia 2.5.15. Numim distributie marginala a vectorului distributia vectorului

Daca este functia de repartitie a vectorului , iar este functia vectorului
aleator , numinduse functie de repartitie marginala, atunci

2.5. Legi de probabilitate continue

Probabilitatea intre a si b : 0.91044

0.4

0.35

Densitatea de probabilitate

0.3

0.25

0.2

0.15

0.1

0.05

0
4

0
a= 1.5

b= 2

Figura 2.14: Legea

adica, pentru obtinerea functiei de repartitie a vectorului se fac sa tinda la toate

argumentele functiei de repartitie , cu exceptia argumentelor , . . . , .
Daca vectorul aleator este de tip continuu, avand densitatea de probabilitate ,
iar vectorul aleator are densitatea de probabilitate , care se numeste densitate
de probabilitate marginala, atunci

adica se obtine integrand densitatea de probabilitate pe , n raport cu
toate variabilele independente, cu exceptia variabilelor , . . . , .

2.5.5 Functie de repartitie conditionata

, avand functia de repartitie .

Fie vectorul aleator bidimensional

Definitia 2.5.16. Numim functie de repartitie conditionata a variabilei aleatoare

de catre variabila aleatoare , functia
, data prin

pentru fiecare

fixat.

Trebuie sa remarcam faptul ca formula de definitie se poate scrie sub forma

Elemente de teoria probabilitat ilor

Daca vectorul aleator
este de tip discret, adica are distributia data prin tabloul
sau

bidimensional

..
.

atunci distributia variabilei aleatoare conditionata de

.

unde
Remarcam de asemenea ca are loc formula

(2.5.3)

este

data prin

unde
.
Daca vectorul aleator este de tip continuu, adica are densitatea de probabilitate , atunci densitatea de probabilitate a variabilei aleatoare conditionata de
este data prin

pentru

Are loc formula (2.5.3) n varianta continua:

Exemplul 2.5.17 (Legea normala multidimensionala). Vectorul aleator, notat prin

, urmeaza legea normala multidimensionala, notam aceasta prin
, daca
are densitatea de probabilitate

(2.5.4)

det

2.5. Legi de probabilitate continue

unde este o matrice patratica de ordin pozitiv definita, iar este inversa matri
cei .

Daca
si notam prin vectorul aleator bidimensional corespunzator,
densitatea de probabilitate devine

(2.5.5)

unde si .

Se cunoaste ca fiecare din componentele si ale vectorului aleator urmeaza

s
legea normala respectiv
i
.
Densitatea de probabilitate conditionata se exprima n acest fel prin:

(2.5.6)

unde
normale

, adica se obtine densitatea de probabilitate a legii

Programul 2.5.18. Scriem n cele ce urmeaza un program Matlab, care reprezinta

grafic densitatea de probabilitate a legii normale bidimensionale.
clf, clear
m1 = input(mu1=); m2 = input(mu2=);
s1 = input(sigma1=); s2 = input(sigma2=);
r = input(r(-1<r<1):);
x = m1-3*s1:.2:m1+3*s1; y = m2-3*s2:.2:m2+3*s2;
[X,Y] = meshgrid(x,y);
Z = 1/(2*pi*s1*s2*sqrt(1-r2))*exp(-1/(2*(1-r2))...
*((X-m1).2/s12-2*r*(X-m1).*(Y-m2)/(s1*s2)...
+(Y-m2).2/s22));
mesh(X,Y,Z)
title(Legea normala bidimensionala)

Prin executarea acestui program, pentru m1=m2=0, s1=1, s2=2 si r=-0.5, se

obtine graficul din Figura 2.15.
Programul 2.5.19. Programul Matlab care urmeaza reprezinta grafic densitatea de
probabilitate conditionata n cazul unui vector aleator ce urmeaza legea normala bidimensionala.
clf, clear
m1 = input(mu1=); m2 = input(mu2=);
s1 = input(sigma1=); s2 = input(sigma2=);

Elemente de teoria probabilitat ilor

Legea normala bidimensionala

0.1

0.08

0.06

0.04

0.02

0
6
4

2
0

1
0

2
6

Figura 2.15: Legea

r = input(r(-1<r<1):);
Y(1:3) = input(Y(trei valori):);
m = m1+s1*r*(Y-m2)/s2; s = sqrt(1-r2)*s1;
MM = max(m); mm = min(m);
X = []; X = mm-3*s:0.01:MM+3*s;
hold on
for i=1:3
P = []; P = normpdf(X,m(i),s);
if i==1 plot(X,P,k-.), end
if i==2 plot(X,P,k-), end
if i==3 plot(X,P,k--), end
end
title(Legea normala conditionata)

Prin executarea acestui program, pentru m1=1, m2=0, s1=1, s2=2, r=-0.5 si
Y=[-2,0,2], se obtin graficele din Figura 2.16. Graficul marcat prin punctlinie
este pentru prima valoare a lui Y, cel cu linie continua, pentru a doua valoare, iar prin
linie ntrerupta, pentru a treia.

2.5.6 Functie de supravietuire. Functie hazard

In aplicatii tehnice si nu numai, sunt utilizate si alte functii atasate variabilelor aleatoare, pentru exprimarea mai potrivita a fenomenului aleator cercetat.
Definitia 2.5.20. Daca variabila aleatoare are functia de repartitie , se numeste

2.5. Legi de probabilitate continue

Legea normala conditionata

0.5

0.45

0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
2

Figura 2.16: Legea normala conditionata pentru

functia definita prin:

functie de supravietuire atasata variabilei aleatoare

Se observa ca daca reprezinta durata de viata a unui individ, atunci

reprezinta probabilitatea ca durata de viata sa depaseasca un prag dat.

Definitia 2.5.21. Daca variabila aleatoare de tip continuu are functia de repartitie
si densitatea de probabilitate , se numeste functie hazard sau functie de risc
instantaneu atasata variabilei aleatoare functia definita prin:

Avand n vedere definitia densitatii de probabilitate putem scrie

de unde

adica

Elemente de teoria probabilitat ilor

Prin urmare ar reprezenta probabilitatea ca valoarea variabilei aleatoare sa

ramana neschimbata ntrun interval imediat urmator, de lungime mica, daca valoarea
ei a depasit pragul .

2.6 Caracteristici numerice

2.6.1 Valoare medie. Dispersie (varianta ). Covarianta
Fie variabila aleatoare avand functia de repartitie .
Definitia 2.6.1. Numim valoare medie sau speranta matematica, caracteristica numerica

(2.6.1)

unde integrala Stieltjes se impune sa fie absolut convergenta pentru ca valoarea medie sa existe.

Observat
ia 2.6.2. Daca variabila aleatoare este de tip discret, adica are distributia

, atunci integrala Stieltjes se reduce la o suma, anume

care exista pentru cazul cand este variabila aleatoare simpla, altfel se impune ca
seria ce apare n aceasta formula sa fie absolut convergenta.
Daca variabila aleatoare este de tip continuu, adica are densitatea de probabilitate , atunci

este un vector aleator dimensional, iar functia
Mai remarcam faptul ca daca
sa fie o variabila aleatoare, atunci
este astfel ncat

care n cazul continuu devine

2.6. Caracteristici numerice

Definitia 2.6.3. Numim dispersie sau varianta caracteristica numerica atasata variabilei aleatoare definita prin:

(2.6.2)

Remarcam formula de calcul

Definitia 2.6.4. Daca se considera vectorul aleator bidimensional

covarianta sau corelatie, caracteristica numerica

(2.6.3)

respectiv coeficient de corelatie, raportul

(2.6.4)

, numim

Observatia 2.6.5. Pentru suma unui numar finit de variabile aleatoare avem:

iar daca variabilele aleatoare sunt independente doua cate doua

Definitia 2.6.6. Daca avem vectorul aleator

medie, vectorul

, numim valoare

respectiv matrice a covariantelor, matricea

Observatia 2.6.7. Din cauza simetriei covariantei, avem ca matricea covariantelor

este simetrica.
Daca componentele vectorului aleator sunt independente doua cate doua,
atunci matricea covariantelor este o matrice diagonala, pe diagonala principala
aflanduse dispersiile componentelor vectorului aleator.
Avand n vedere extinderea naturala a valorii medii la matrice aleatoare, putem
scrie:

Elemente de teoria probabilitat ilor

Teorema 2.6.8. Fie vectorul aleator

si matricea
, de tipul

, cu elemente numere reale. Daca se considera vectorul
, atunci

(i)

este un vector aleator;

(ii) valoarea medie a vectorului aleator

este

(iii) matricea covariantelor vectorului aleator

(2.6.5)

este data prin

Demonstratie. (i) Transformarea liniara a unui vector aleator este vector aleator.
(ii) Avand n vedere proprietati ale valorii medii, pentru o componenta a vectoru, se poate scrie
lui

de unde rezulta

In mod analog se arata si a doua relatie.
(iii) Se poate proceda ca si pentru valoarea medie, daca se tine seama de proprietati ale corelatiei. Se scrie succesiv:

de unde se obtine relatia (2.6.5).

Acelasi lucru se poate obtine si prin folosirea relatiei de la punctul (ii). Anume,

2.6. Caracteristici numerice

se poate scrie:

de unde se obtine din nou relatia (2.6.5).

Proprietatea 2.6.9. Daca

este matricea covariantelor vectorului aleator
atunci aceasta este o matrice pozitiv semidefinita, adica

Demonstratie. Pornind din membrul drept al relatiei ce se doreste a fi demonstrata,

putem scrie succesiv:

de unde se obtine relatia din enunt.

Proprietatea 2.6.10. Daca matricea
adica
atunci

este o matrice patratica pozitiv definita,

poate fi considerata matricea covariantelor unui vector aleator.

Demonstratie. Din algebra liniara este cunoscut faptul ca o matrice pozitiv definita
admite decompunerea

fiind matricea unitate, iar este o matrice diagounde
nala cu elementele numere pozitive. Putem face precizarea ca diagonala matricei

contine valorile proprii ale matricei
, iar matricea este formata din vectorii proprii ortonormati corespunzatori.

Elemente de teoria probabilitat ilor

Consideram vectorul aleator avand matricea covariantelor . Un astfel de vector aleator exista, avand n vedere de exemplu vectorul aleator care are ca si compo
nente variabile aleatoare independente ce urmeaza fiecare legea normala
.

Vectorul aleator
va avea ca matrice a covariantelor chiar matri
cea
.
Intradevar, daca se tine seama de relatia (2.6.5), se obtine:

Din aceeasta succesiune de egalitati se obtine afirmatia facuta n enunt.

a unui vector aleator este

Corolarul 2.6.11. Daca matricea covariantelor

pozitiv definita, atunci exista o transformare

.

aleator sa avem
si

astfel ncat pentru noul vector

Demonstratie. Folosinddescompunerea
si alegand

obtinem ca

este vectorul aleator cautat.
Pe de o parte avem

Pe de alta parte

are valoarea medie

satisface conditiile dorite.

a unui vector aleator este

Din cel doua succesiuni de relatii se obtine ca vectorul

Corolarul 2.6.12. Daca matricea covariantelor

pozitiv definita, atunci variabila aleatoare

Demonstratie. Cu notatiile din demonstratia corolarului precedent avem

Prin urmare, avem succesiv:

Dar avem ca
si

fiecare
, ceea ce conduce la

, astfel ca
.

, pentru

2.6. Caracteristici numerice

2.6.2 Functii Matlab pentru valoare medie si dispersie

Sistemul Matlab dispune de proceduri pentru calulul valorilor medii si ale dispersiilor
legilor de probabilitate implementate prin Statistics toolbox.
Pentru calculul valorilor acestor caracteristici numerice se foloseste apelul
[m,v]=numef(x,par1,par2,...)

unde numef este un sir de caractere, care definesc legea de probabilitate, din care
ultimele patru sunt stat, iar cele ce le preced sunt cele care dau numele legii.
In urma executarii instructiunii, se calculeaza matricele m si v ale valorilor medii
si ale dispersiilor pentru legea considerata, avand parametrii precizati prin matricele
par1, par2, ... Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca
daca unele sunt scalari, acestia se extind la matricele constante de aceleasi dimensiuni
cu celelalte si care iau valorile scalarilor corespunzatori.
Valorile medii si dispersiile se calculeaza, pentru fiecare lege de probabilitate n
parte, folosinduse formulele din Tabelul 2.1.

2.6.3 Valoare medie conditionata. Dispersie (varianta ) conditionata

Fie vectorul aleator bidimensional

conditionata de .

functia de repartitie a lui

Definitia 2.6.13. Numim valoare medie conditionata a variabilei aleatoare

catre , variabila aleatoare

Daca vectorul aleator

este de tip discret, cu distributia

..
.

atunci variabila aleatoare

fiind

o realizare a variabilei aleatoare

..
.

va avea distributia

100

Elemente de teoria probabilitat ilor

Legea

Denumirea

gam

logn

norm

weib
rayl

nct

ncx2

chi2

beta

exp

unif

geo

hyge
nbin

e e e

,

,

bino
poiss

unid

Valoarea medie si dispersia

ncf

Tabelul 2.1: Tabelul valorilor medii si dispersiilor

2.6. Caracteristici numerice

101

Daca vectorul aleator este de tip continuu, avand densitatea de probabilitate , atunci o realizare a variabilei aleatoare
este data prin

unde

Proprietatea 2.6.14.

Demonstratie. Demonstram proprietatea n cazul continuu. Cazul discret se demonstreaza analog.

Folosind definitia valorii medii avem succesiv:

Demonstratia se ncheie daca se retin extremitatile acestui sir de egalitati.

Definitia 2.6.15. Fie vectorul aleator

varianta conditionata a variabilei aleatoare

Proprietatea 2.6.16.

. Numim dispersie conditionata sau

de catre , variabila aleatoare

Demonstratie. Pornind de la definitia variantei si folosind proprietat i ale ei, putem

scrie:

Vom calcula pe rand cei trei termeni din partea dreapt

relatii.
a a acestei
Pentru primul termen, daca se noteaza

si se aplica proprietatea valorii medii conditionate avem:

102

Elemente de teoria probabilitat ilor

de unde se obtine ca

Pentru al doilea termen, daca se noteaza

de unde

, se poate scrie:

A mai ramas sa aratam ca al treilea termen este

si avand n vedere ca zero.
Fixam

const., putem scrie:

Ceea ce a mai ramas de aratat.

Exemplul 2.6.17. Sa consideram vectorul aleator , care urmeaza legea normala, avand densitatea data prin (2.5.5). Este cunoscut ca parametrii acestei legi de
probabilitate au urmatoarele interpretari probabilistice:

iar

este coeficientul de corelatie dintre si .

Mai mult, pentru legea normala multidimensionala, avand densitatea de probabilitate data prin (2.5.4), se arata ca este valoarea medie a vectorului aleator ce

urmeaza legea normala multidimensionala, iar este matricea covariantelor.
Sa revenim la cazul bidimensional si sa constatam ca

In mod analog, avem ca

2.6. Caracteristici numerice

103

Curbele de ecuatii

se numesc curbele de regresie a lui n raport cu

, respectiv a lui n raport cu .

2.6.4 Functie caracteristica

Fie variabila aleatoare

si vectorul aleator

dimensional

Definitia 2.6.18. Numim functie caracteristica atasata variabilei aleatoare

pectiv vectorului aleator , functia definita prin

, res-

e
e

Utilitatea functiei caracteristice este data de netezimea ei, care este superioara
functiei de repartitie, aceasta din urma putand fi discontinua, pe cand functia caracteristica este uniform continua. In plus, pe baza formulei de inversiune, exista o
caracterizare completa a distributiei unei variabile aleatoare sau a unui vector aleator
cu ajutorul functiei caracteristice.

2.6.5 Momente
Definitia 2.6.19. Fie variabila aleatoare . Numim moment (initial) si respectiv
moment centrat de ordin , caracteristicile numerice

Remarcam ca n statistica sunt folosite n primul rand primele patru momente.

Astfel momentele centrate de ordinele doi si trei se folosesc pentru definirea asimetriei (skewness)

iar momentele centrate de ordinele doi si patru se folosesc pentru definirea excesului
(kurtosis)

sau

In sistemul Matlab, excesul este definit cu prima formula.

104

Elemente de teoria probabilitat ilor

2.6.6 Mediana. Cuartile. Cuantile

Definitia 2.6.20. Fie variabila aleatoare , care are functia de repartitie . Numim
mediana, caracteristica numerica , care satisface conditiile
(2.6.6)

Avand n vedere proprietat i ale functiei de repartitie, conditiile (2.6.6) se pot scrie
echivalent sub forma

Daca variabila aleatoare este de tip continuu, relatiile (2.6.6) se reduc la relatia

, adica
.
In cazul discret, folosind (2.6.6) sar putea ca mediana sa nu fie determinata n

mod unic, de aceea se alege ca fiind cel mai mic numar pentru care

Definitia 2.6.21. Fie variabila aleatoare , care are functia de repartitie . Numim

cuantila de ordin
, caracteristica numerica , care satisface conditiile
(2.6.7)

Ca si n cazul medianei, aceste conditii se pot scrie echivalent sub forma

care se reduce la relatia

, adica , n cazul continuu.

In cazul discret, cuantila se ia ca fiind cel mai mic numar pentru care are loc
inegalitatea .

Unele cuantile au denumiri speciale. Iata de exemplu, cuantila de ordin

este chiar mediana.

Daca
, se obtin ceea ce se numesc cuartile, respectiv cuartila inferioara, mediana si cuartila superioar
a.

,
, se obtin ceea ce poarta denumirile
Daca
,
,
decile si respectiv centile.

2.6.7 Functia Matlab icdf

Am vazut ca pentru calculul cuantilelor este necesara inversarea functiei de repartitie.
Sistemul Matlab prin Statistics toolbox dispune de functii pentru inversarea functiilor
de repartitie ale legilor de probabilitate implementate.
Apelarea acestor functii se face cu una din urmatoarele forme:
x = icdf(legea,P,p1,p2,...)
x = numef(P,p1,p2,...)

2.6. Caracteristici numerice

105

unde legea este un sir de caractere predefinit pentru fiecare din legile de probabilitate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt inv, iar cele ce le preced sunt cele care dau numele predefinit al legii de
probabilitate (ca si cele din parametrul legea).
In urma executarii uneia din cele doua instructiuni, se calculeaza matricea x a
cuantilelor legii precizata prin parametrii legea, respectiv numef, corespunzatoare
valorilor date prin matricea P si avand parametrii dati prin matricele par1, par2,...
Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca daca unele sunt
scalari, acestia se extind la matricele constante de aceleasi dimensiuni cu celelalte si
care iau valorile scalarilor corespunzatori.
Programul 2.6.22. Pentru a ilustra grafic modul de calcul al cuantilelor, vom da un
program care calculeaza mediana pentru legea uniforma discreta si reprezinta grafic
acest lucru pentru doua valori distincte ale parametrului N, precum si cuartilele legii
normale.
clf, clear
N1 = input(N1=); N2 = input(N2=);
m = input(mu=); s = input(sigma=);
xu1 = 0:N1+1; yu1 = unidcdf(xu1,N1);
xu2 = 0:N2+1; yu2 = unidcdf(xu2,N2);
xn = m-3*s:0.01:m+3*s; yn = normcdf(xn,m,s);
me1 = icdf(unid,1/2,N1);
me2 = icdf(unid,1/2,N2);
Q = icdf(norm,[1/4,2/4,3/4],m,s);
subplot(3,1,1), stairs(xu1,yu1)
set(gca,Xlim,[0,N1+1]), set(gca,xtick,[me1])
set(gca,xticklabel,[me1]), hold on
plot([0,me1],[1/2,1/2],k:,me1,1/2,o)
plot([me1,me1],[0,1/2],k-.)
subplot(3,1,2), stairs(xu2,yu2)
set(gca,Xlim,[0,N2+1]), set(gca,xtick,[me2])
set(gca,xticklabel,[me2]), hold on
plot([0,me2],[1/2,1/2],k:,me2,1/2,o)
plot([me2,me2],[0,1/2],k-.)
subplot(3,1,3),
plot(xn,yn,[Q(1),Q(2),Q(3)],[1/4,2/4,3/4],o)
set(gca,xtick,[Q(1),Q(2),Q(3)])
set(gca,xticklabel,[Q(1),Q(2),Q(3)])
hold on
X = [m-3*s,Q(1);m-3*s,Q(2);m-3*s,Q(3)];
plot(X,[1/4,1/4;1/2,1/2;3/4,3/4],k:)
plot([Q(1),Q(1)],[0,1/4],k-.)
plot([Q(2),Q(2)],[0,2/4],k-.)
plot([Q(3),Q(3)],[0,3/4],k-.)

Executarea programului pentru N=5 si N=6, respectiv pentru mu=0 si sigma=2, are
ca rezulatat graficele din Figura 2.17.

106

Elemente de teoria probabilitat ilor

0.5

1.34898

Figura 2.17: Medianele pentru

1.34898

si cuartilele pentru

2.7. Siruri de variabile aleatoare

107

2.6.8 Functia Matlab disttool

Functia (comanda) disttool este un program de demonstrativ. Lansarea acestuia
se face prin:
>>disttool

n urma careia se produce o fereastra grafica interactiva (demonstrativa) privind

functiile de repartitie (cdf) si functiile de probabilitate (pdf).
Fixarea (stabilirea) legii de probabilitate n scop demonstrativ se face prin alegerea din meniul legilor de probabilitate situat n partea stanga sus a ferestrei, iar
una din alternativele pdf si cdf se face folosind meniul din partea dreapta sus a
ferestrei. Pentru stabilirea valorilor parametrilor legii de probabilitate considerate se
poate proceda n doua moduri. Fie prin introducerea n ferestrele corespunzatoare ale
valorilor dorite, fie prin deplasarea barelor atasate acestora. In plus, limite pentru parametrii legii de probabilitate considerate pot fi precizate prin introducerea acestora
n ferestrele considerate.
Determinarea valorii functiei pdf respectiv cdf ntrun punct, se poate obtine
prin introducerea argumentului functiei n fereastra de pe axa absciselor sau prin
deplasarea dreptei verticale afisata pe grafic, cu ajutorul mouselui, pana cand aceasta
trece prin punctul respectiv. Inversa functiei de repartitie (icdf) se poate obtine de
asemenea, prin introducerea valorii functiei de repartitie (cdf) n fereastra de pe
axa ordonatelor sau prin deplasarea dreptei orizontale afisata pe grafic, cu ajutorul
mouselui, pana cand aceasta trece prin punctul respectiv.

2.7 Siruri de variabile aleatoare

2.7.1 Inegalitatea lui Cebsev
Fie variabila aleatoare , pentru care exista valoarea medie si dispersia.
Inegalitatea lui Cebsev este cunoscuta sub una din formele

Observatia 2.7.1. Daca n inegalitatea lui Cebsev se ia

abaterea standard, atunci aceasta devine

, unde sa notat

108

Elemente de teoria probabilitat ilor

Astfel, pentru
se obtine
ceea ce
nseamna ca probabilitatea ca valorile lui sa se abata de la valoarea medie

mai putin de trei ori abaterea standard este mai mare decat

Observatia 2.7.2. Fie variabilele aleatoare ,

, independente si identic

repartizate,
and valorile medii si dispersiile

, , pentru
av

fiecare
cu ajutorul carora construim variabila aleatoare

Daca se aplica inegalitatea lui Cebsev se obtine

Cele doua inegalitati dau evaluari ale probabilitat ilor ca media aritmetica a variabilelor aleatoare sa se abata de la valoarea medie mai putin, respectiv mai mult, decat

fixat.

2.7.2 Tipuri de convergenta

Sa consideram sirul de variabile aleatoare
corespunzatoare .

cu sirul functiilor de repartitie

converge n proba
bilitate la variabila aleatoare , si vom nota
, daca pentru orice ,
avem ca

Definitia 2.7.3. Spunem ca sirul de variabile aleatoare

Definitia 2.7.4. Spunem ca sirul de variabile aleatoare converge n repar

titie la variabila aleatoare , si vom nota
, daca avem ca

unde este functia de repartitie a variabilei aleatoare , iar limita considerata

exista pentru orice punct de continuitate al functiei .

Observatia 2.7.5. Daca

, atunci . Implicatia inversa nu are loc,
dar daca este o constanta , atunci afirmat
ia inversa are loc de asemenea, adica

.
daca
, pentru
, atunci

2.7. Siruri de variabile aleatoare

109

2.7.3 Legea numerelor mari

Sa consideram sirul de varaibile aleatoare

Definitia 2.7.6. Spunem ca sirul de variabile aleatoare

ba) a numerelor mari, daca pentru orice avem ca

adica

Observatia 2.7.7. Daca variabilele aleatoare ale sirului

si identic repartizate, iar
, atunci

urmeaza legea (sla-

adica

sunt independente

unde .
Prin urmare, media aritmetica a primelor variabile aleatoare din sirul considerat
.
si pierde caracterul aleator, pentru
Evident, deoarece
convergenta n probabilitate implica convergenta n repartitie,

, dar vom vedea imediat ca exista chiar un rezultat mai bun n
avem si
ceea ce priveste convergenta n repartitie.

2.7.4 Teoreme limita

Am vazut ca legea numerelor mari este n stransa legatura cu convergenta n probabilitate, chiar si cu asa numita convergenta tare, dar care nu a fost prezentata n
sectiunea precedenta.
Teoremele limita abordeaza problematica comportarii asimptotice a sirurilor de
varaibile aleatoare din perspectiva convergentei n repartitie.
Teorema 2.7.8 (LindebergLevy). Fie sirul de variabile aleatoare independente si
identic repartizate , pentru care se introduc notatiile

110

Elemente de teoria probabilitat ilor

Daca se construies te sirul de variabile aleatoare

, cu termenul general

atunci

, unde este o variabila aleatoare ce urmeaza legea normala

, adica

fiind functia de repartitie a variabilei aleatoare .

Observatia 2.7.9. Teorema limita de acest tip, n care legea de probabilitate limita
este legea normala se numeste teorema limita centrala.
Teoremele limita au un rol aparte n statistica, unde sunt privite n urmatoarea
), atunci variabila aleatoare poate fi considemaniera. Daca este mare (
rata ca urmand o lege de probabilitate cunoscuta, n cazul teoremei precedente legea

normala
.

, urmeaza legea normala

Mai observ
a
m ca variabila aleatoare , cand

Teorema 2.7.10 (MoivreLaplace). Daca variabila aleatoare

binomiala, adica are distributia

atunci

unde

urmeaza legea

este o variabila aleatoare ce urmeaza legea normala

Rezultatul teoremei se exprima de regula sub forma

(2.7.1)
e

Observatia 2.7.11. Teorema limita MoivreLaplace este o consecinta imediata a
Teoremei LindebergLevy, daca se are n vedere ca variabila aleatoare este suma

2.7. Siruri de variabile aleatoare

111

a variabile aleatoare independente

Bernoulli, adica avand distibutia

, fiecare urmand aceeasi lege a lui

unde

Mai remarcam faptul ca variabila aleatoare , care urmeaza legea binomial

, ca urmand legea normala
. a
, poate fi privita, pentru

Observatia2.7.12 (Regula celor trei ). Daca n formula MoivreLaplace se con

sidera
, atunci

Prin urmare, rezulta ca

Deoarece, abaterea medie
, avem
patratica a variabilei aleatoare ce urmeaza legea binomiala este
regula urmatoare cunoscut
a sub denumirea de regula celor trei : probabilitatea ca

frecventa absoluta sa se abata de la valoarea medie
mai putin de trei

ori abaterea medie patratica este mai mare decat
.
Observatia 2.7.13 (Corectie de continuitate). Avand n vedere procesul de aproximare a unei legi de tip discret (legea binomiala) cu una de tip continuu (legea
normala), pentru obtinerea unor rezultate mai bune n aplicarea formulei (2.7.1), se
impune aplicarea unei corectii de continuitate, data prin

unde

reprezinta functia lui Laplace.

Folosind aceasta corectie de continuitate avem urmatoarele formule de aproxi-

112

Elemente de teoria probabilitat ilor

mare:

Programul 2.7.14. Pentru a ilustra rezultatele Teoremei MoivreLaplace, programul Matlab care urmeaza, reprezinta grafic prin bare functia de probabilitate a legii

binomiale
mpreun
densitatea de probabilitate a legii normale cores
a cu
.
punzatoare, adica
clf
n = input(n=); p = input(p=);
m = n*p; s = sqrt(n*p*(1-p));
x = 0:n; xx = -1:0.01:n+1;
P = binopdf(x,n,p); y = normpdf(xx,m,s);
bar(x,P,0.3), hold, plot(xx,y)

Executarea programului pentru n=15 si p=0.4, produce graficul din Figura 2.18.
0.25

0.2

0.15

0.1

0.05

0
2

Figura 2.18: Legea

si legea

Capitolul 3

Statistica descriptiva
Statistica se ocupa cu descrierea si analiza numerica a fenomenelor de masa,
dezvaluind particularitat ile lor de volum, structura, dinamica, conexiune, precum si
regularitat ile sau legile care le guverneaza.
Etapele principale ce se disting n cercetarea statistica a unui fenomen aleator se
pot considera ca fiind:
a). Definirea (conceptia) obiectului studiat, care contine definirea unitatilor statistice, conceperea chestionarului (ntrebarilor), planificarea culegerii datelor.
b). Observarea fenomenului (culegerea datelor) conform criteriilor stabilite la
etapa precedenta.
c). Descrierea statistica, ce cuprinde reprezentarea grafica a datelor statistice,
sistematizarea acestora, precum si calcularea indicatorilor numerici pentru punerea
n evidenta a unor proprietati si pentru sugerarea unor ipoteze referitoare la legile
care guverneaza fenomenul cercetat.
d). Modelarea probabilistica a fenomenului cercetat, care are ca obiectiv principal cercetarea fenomenului folosind ca instrument de lucru teoria probabilitat ilor
relativ la datele statistice obtinute conform etapelor precedente.
Daca primele doua etape pot fi considerate ca preliminare, etapa a treia conduce
la ceea ce numim statistica descriptiva, iar a patra etapa conduce la statistica matematica sau statistica inferentiala.
Desigur, nu se poate face o delimitare exacta ntre statistica descriptiva si statistica matematica, mai mult o descriere statistica fundamentata matematic va conduce la realizarea unei modelari a fenomenului, care pune n evidenta proprietatile
esentiale ale acestuia si legaturile dintre acestea. Ca o componenta de baza a statisticii descriptive, care s-a dezvoltat n mod impresionant odata cu explozia utilizarii
calculatoarelor n statistica, o reprezinta analiza datelor. Printre capitolele mai importante ale analizei datelor amintim metodele de clasificare si metodele factoriale.
113

114

Statistica descriptiva

Pe de alta parte, statistica matematica cuprinde ca si capitole principale teoria

selectiei, teoria estimatiei si verificarea ipotezelor statistice, strans legat de teoria
deciziilor.
Din cele prezentate putem spune ca statistica descriptiva are ca obiectiv principal
culegerea si clasificarea datelor statistice n vederea descrierii numerice si grafice a
fenomenului cercetat. Statistica matematica elaboreaza modelul matematic, folosind
datele statistice, estimeaza parametrii modelului, stabileste metode pentru validarea
ipotezelor statistice, toate acestea avand la baza teoria probabilitat ilor.
Amintim ca studiul statistic al fenomenelor economice face obiectul statisticii
economice, iar studiul statistic al fenomenelor ce pot constitui riscuri asigurate reprezinta obiectul statisticii actuariale.

3.1 Concepte de baza ale statisticii

Definitia 3.1.1. Numim colectivitate (populatie) o multime de elemente cercetata din punct de vedere a uneia sau mai multor proprietati, elementele componente
numindu-se indivizi sau unitati statistice, iar numarul elementelor lui se numeste
volumul colectivitat ii.
Definitia 3.1.2. Numim caracteristica sau variabila a colectivitat ii proprietatea supusa investigarii statistice relativa la . Cand o caracteristica poate fi masurata o
numim caracteristica cantitativa sau numerica, iar daca aceasta se exprima printr-o
nsusire o numim caracteristica calitativa sau atribut.
In unele tratate de statistica variabilele (caracteristicile) calitative sunt numite
variabile nominale. O clasa intermediara de variabile (caracteristici) este formata de
asa numitele variabile (caracteristici) ordinale.
Observatia 3.1.3. Daca se considera colectivitatea a studentilor dintr-un an de studiu, atunci naltimea, greutatea, media obtinuta la sfarsitul anului sunt caracteristici
cantitative (numerice), pe cand sexul, culoarea ochilor, grupa sanguina sunt caracteristici calitative (nominale). Un exemplu de caracteristica ordinala ar fi gradul de
pregatire (foarte bun, bun, satisfacator, nesatisfacator). Se observa ca relativ la o variabila ordinala se poate face ordonarea indivizilor, ca si pentru o variabila numerica,
ceea ce nu se ntampla pentru o variabila nominala, dar nu se pot face operatii aritmetice, cum se ntampla si la variabilele nominale, pe cand pentru o variabila numerica
astfel de operatii sunt posibile.
Observatia 3.1.4. Din punct de vedere al teoriei probabilitat ilor o caracteristica a
unei populatii este o variabila aleatoare . Scopul principal al cercetarii statistice

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

115

este de a stabili legea de probabilitate pe care o urmeaza caracteristica , utilizand

observatiile (datele statistice) relative la colectivitatea cercetata.
Daca avem n vedere mai multe caracteristici ,. . . ,, acestea reprezinta componentele unui vector aleator , iar cercetarea fenomenului aleator modelat prin ,
se poate extinde si la determinarea legaturilor ce exista ntre componentele vectorului
aleator.
Definitia 3.1.5. O caracteristica ce ia o multime cel mult numarabila de valori o
numim caracteristica de tip discret, iar daca ia valori dintr-un interval finit sau infinit
o numim caracteristica de tip continuu.
Observatia 3.1.6. Daca se considera colectivitatea a bolnavilor externati dintr
un spital pe parcursul unei saptamani, atunci caracteristica ce reprezinta numarul

zilelor de internare este o caracteristica de tip discret, pe cand greutatea a bolnavilor externati reprezinta o caracteristica de tip continuu. Remarcam faptul ca pentru
caracterul continuu este estompat prin imposibilitatea masurarii ecaracteristica
xacte a acestei caracteristici, de aceea, practic, se considera ca fiind de asemenea de
tip discret.

3.2 Culegerea, prezentarea si prelucrarea

datelor statistice
Modurile de culegere (observare) a datelor statistice cele mai des utilizate sunt:
a). Observarea totala (exhaustiva, recensamant), cand toti indivizii colectivitat ii
sunt nregistrati.
b). Observare partiala (sondaj, selectie), cand dupa criterii bine stabilite sunt
nregistrati o parte din indivizii colectivitat ii , numita esantion sau selectie.
c). Observare curenta, cand nregistrarea indivizilor se efectueaza odata cu aparitia (producerea) lor.
d). Observarea periodica, cand nregistrarea fenomenului se efectueaza la intervale de timp stabilite.

3.2.1 Generarea numerelor aleatoare n Matlab

Matematica, si prin teoria probabilitat ilor si statistica matematica, printre multiplele
si larg raspanditele aplicatii, poseda, poate, una legata de modelarea matematica, care
se distinge n mod special prin vastul domeniu de aplicabilitate. Modelarea matematica, dupa cum spune si numele, are drept scop construirea de modele matematice
asociate unor fenomene sau sisteme pe care le ntalnim n diferite domenii: fizica,
chimie, biologie, demografie, medicina, geografie, geologie, economie etc. Desigur,

116

Statistica descriptiva

astfel de modele matematice depind de niste parametri, fie aleatori, fie nealeatori.
Odata modelul matematic construit se are n vedere realizarea practica a acestuia.
Dar, apare o mare problema, este acest model matematic (teoretic) construit viabil? Avem doua alternative, sau realizam practic modelul respectiv si urmarim cum
functioneaza acesta (ceea ce, n general, nu e de dorit), sau simulam functionarea
modelului respectiv prin diferite particularizari ale parametrilor modelului si alegem
varianta convenabila. Daca relativ la parametrii nealeatori care intervin n modelul
teoretic nu se ridica probleme speciale, n privinta parametrilor aleatori apare o noua
problema, anume obtinerea valorilor acestor parametri. Deoarece parametrii aleatori
sunt, din punct de vedere al teoriei probabilitat ilor, variabile aleatoare, apare asadar
problema generarii de valori numerice ale acestor variabile aleatoare si care vor purta
denumirea de numere aleatoare. Desigur ca ntr-un fel vor fi generate aceste numere
aleatoare daca parametrul urmeaza, sa zicem, legea uniforma pe un anumit interval si
altfel cand urmeaza legea normala.
Deoarece pentru prezentarea notiunilor si rezultatelor teoretice ale statisticii matematice sunt necesare exemplificari ale acestora, iar culegerea unor date statistice
reale nu este ntodeauna la ndemana, de multe ori vom considera numerele aleatoare
ca fiind date statistice carora li se vor aplica metodele cercetarii statisticii.
Putem sa amintim de asemenea ca testarea programelor pe calculator, determinarea statistica a caracteristicilor numerice ale variabilelor aleatoare, care ne conduce
la metoda Monte Carlo, fac de asemenea necesara generarea numerelor aleatoare.
Metodele de generare a numerelor aleatoare se mpart n trei categorii:
tabelele cu numere aleatoare (uniforme) obtinute, de exemplu, din aruncarea
monedei, aruncarea zarului, jocul de ruleta, tabele matematice, tabele de recensamant etc.
procedeele fizice, care au la baza fenomene fizice, cum ar fi emiterea particulelor de o sursa radioactiva, intensitatea curentului la diferite momente, zgomotul
electronic etc.
procedeele aritmetice (analitice), care utilizeaza o formula de calcul de forma

Deoarece, de regula, se foloseste un volum mare de numere aleatoare, s-a impus generarea acestora cu ajutorul procedeelor aritmetice. Inconvenientul acestor procedee
analitice este legat de faptul ca nu poseda caracterul strict aleator, din moment ce
exista o legatura functionala ntre acestea. Dar exista posibilitatea de a alege astfel
de procedee analitice care produc siruri de numere pseudoaleatoare, foarte apropiate
din punct de vedere statistic de numerele aleatoare propriuzise.

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

117

In lucrarile [3] si [5] sunt prezentate proceduri pentru generarea de numere aleatoare pentru diferite legi de probabilitate.
Sistemul Matlab are implementate astfel de proceduri pentru generarea numerelor
aleatoare, fie prin Statistics toolbox, fie prin sistemul de baza din Matlab.
Functia random
Instructiunile prin care sunt generate numere aleatoare ce urmeaza una din legile de
probabilitate recunoscute de sistemul Matlab prin Statistics toolbox sunt de forma:
x=random(legea,par1,par2,...,m,n)
x=numef(par1,par2,...,m,n)

unde legea este un sir de caractere predefinit pentru fiecare din legile de probabilitate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt rnd, iar cele ce le preced sunt cele care dau numele predefinit al legii de
probabilitate (ca si cele din parametrul legea).
Executarea uneia din cele doua forme ale instructiunii random, are ca efect generarea matricei x, cu m linii si n coloane, de numere aleatoare ce urmeaza legea
de probabilitate corespunzatoare cu parametrii precizati prin matricele p1, p2, . . . .
Aceste matrice trebuie sa aiba aceleasi dimensiuni cu matricea x, cu exceptia cand
unele sunt scalari, caz n care acestea sunt extinse la matricele constante de aceleasi
dimensiuni cu celelalte si care iau valorile corespunzatoare scalarilor. Daca toti parametrii legii de probabilitate sunt scalari, cand lipsesc parametrii m si n se genereaza
un numar aleator, cand lipseste n, atunci trebuie ca m sa fie un vector cu doua componente, care contine dimensiunile matricei x. Daca cel putin unul din parametrii legii
probabilitate nu este scalar si daca parametrii m si n sunt prezenti, acestia trebuie sa
coincida cu dimensiunile matricelor.
Functiile mvnrnd si mvtrnd
Functiile mvnrnd si mvtrnd sunt singurele functii din Statistics toolbox, prin care
se genereaza legi de probabilitate multidimensionale, respectiv legile normala si t
(Student).
Apelurile acestor functii se pot face respectiv prin:
x=mvnrnd(mu,v,m)
x=mvtrnd(r,n,,m)

In primul caz, sunt generati m vectori aleatori ce urmeaza legea normala multidimensionala, avand vectorul valorilor medii mu si matricea covariantelor v (matrice
patratica pozitiv definita). Cei m vectori aleatori generati sunt obtinuti n matricea x,
care n consecinta va avea m linii, iar numarul coloanelor este dat de dimensiunea legii de probabilitate si care trebuie sa coincida cu lungimea vectorului mu si cu ordinul
matricei patratice v.

118

Statistica descriptiva

In al doilea caz, vor fi generati m vectori aleatori ce urmeaza legea Student multidimensionala.
Parametrul r reprezinta matricea coeficientilor de corelatie, care este matrice pozitiv definita avand pe diagonala principala toate elementele . Daca aceasta ultima
conditie nu este ndeplinita, adica daca este matricea covariantelor, atunci sistemul
Matlab calculeaza prima data, din matricea r, matricea coeficientilor de corelatie.
Parametrul n reprezinta numarul gradelor de libertate, putand fi un scalar sau un
vector de lungime m.
Cei m vectori aleatori sunt obtinuti n cele m linii ale matricei x si care are atatea
coloane cat este dimensiunea legii de probabilitate.
Trebuie sa remarcam faptul ca o linie a matricei x se obtine dintrunvector aleator ce urmeaza legea normala multidimensionala, avand valoarea medie si matricea
covariantelor data prin parametrul r, ale carui componente se mpart la un numar
aleator ce urmeaza legea cu n grade de libertate.
Functiile rand si randn
Sistemul Matlab de baza contine doua functii pentru generarea de numere aleatoare

, prin rand, respectiv legea normala standard
ce urmeaza legea uniforma

, prin randn.
Apelul acestor functii se poate face prin instructiuni de forma:
x=rand
x=rand(m)
x=rand(m,n)
x=randn
x=randn(m)
x=randn(m,n)

In urma executarii unor astfel de instructiuni este generat un numar aleator ce ur

meaza legea
respectiv
, cand nu este folosit nici un argument, o matrice patratica de ordin m de numere aleatoare, cand apare un argument si o matrice
de numere aleatoare de tipul (m,n), cand sunt folosite ambele argumente.
Unele situatii impun regasirea unui anumit sir de numere aleatoare generat prin
una din cele doua functii rand si respectiv randn. Pentru aceasta avem la dispozitie
ceea ce se numeste starea generatorului.
Obtinerea starii generatorului rand si randn la un moment dat se poate face
prin:
s=rand(state)
s=randn(state)

Pentru reinitializarea sau schimbarea starii generatorului, se pot utiliza urmatoarele

instructiuni:

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

119

rand(state,s)
randn(state,s)
rand(state,0)
randn(state,0)
rand(state,sum(100*clock))
randn(state,sum(100*clock))

Parametrul s precizeaza starea la care urmeaza sa fie resetat generatorul, daca

acesta este 0, generatorul va fi resetat la starea initiala. Daca apare parametrul
sum(100*clock), generatorul este resetat la fiecare apel n functie de timpul calculatorului.
Instructiuni mostenite din Matlab 4 si Matlab 5 sunt de asemenea active:
rand(seed)
randn(seed)
rand(seed,0)
randn(seed,0)
rand(seed,r)
randn(seed,r)

Functia randperm
Generarea unei permutari a primelor n numere naturale se realizeaza prin instructiunea
perm=randperm(n)

si va avea ca efect obtinerea vectorului perm ce contine o astfel de permutare.

3.2.2 Tabele statistice

Definitia 3.2.1. Numim tabel statistic (simplu, nesistematizat) un tablou n care
nregistrarile sunt trecute n ordinea aparitiei lor.
Observatia 3.2.2. Daca observatiile statistice s-au facut relativ la caracteristici, fie
acestea , , , , asupra a indivizi, atunci tabelul statistic simplu este matri , unde este valoarea caracteristicii pentru individul .
cea
Definitia 3.2.3. Numim tabel statistic (sistematizat) relativ la caracteristica de tip
discret, tabloul n care sunt trecute valorile distincte ale caracteristicii si frecventele
cu care au aparut aceste valori.
Observatia 3.2.4. Avand caracteristica de tip discret,
care ia valorile distincte

, tabelul statistic
, pentru care s-au obtinut datele primare
sistematizat are forma

120

Statistica descriptiva

..
.

n datele primare

unde este frecventa absolut
a
a
aparit

iei
valorii

Prin urmare are loc relatia
.

Definitia 3.2.5. Fie caracteristica de tip continuu , care ia valori din intervalul

, descompus n intervale disjuncte, numite clase, prin punctele care satisfac
relatiile

Numim tabel statistic (sistematizat) relativ la caracteristica , tabloul ce contine

clasele caracteristicii si frecventele cu care au aparut aceste clase.
Observatia 3.2.6. Daca datele
primare
ale caracteristicii continue , care ia valori

n intervalul
, sunt ,
,
, atunci tabelul statistic sistematizat are forma

..
.

unde
este
frecventa absolut
a a aparitiei clasei printre datele primare

Daca se considera varianta din dreapta pentru tabelul
, iar
sistematizat, se obtine aceeasi forma de tabel ca si n cazul caracteristicii discrete.
In acest fel s-a ajuns la o unificare a prezentarii prin tabele sistematizate a tipurilor
discrete si continue de caracteristici.

Observatia 3.2.7. Prin stabilirea claselor unei caracteristici continue (care pot fi de
lungimi egale sau nu) s-a efectuat o grupare a datelor statistice primare, si care se
efectueaza si n cazul caracteristicilor de tip discret, daca au un numar mare de valori
distincte.

Definitia 3.2.8. Numim amplitudinea

clasei definita de intervalul lungimea

.
acestui interval,

Observatia 3.2.9. Cand amplitudinile claselor sunt egale, doua reguli de stabilire a
numarului claselor sunt utilizate mai des:

lg
(regula lui Sturges) si

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

unde

In acest fel, din prima regula, se obtine ca

Cand

este

infinit, atunci

121

Exemplul 3.2.10. Se considera un lot de becuri din punct de vedere al caracteristicii , ce reprezinta durata de viata n mii ore. Datele statistice obtinute sunt:
1.318
3.426
3.972
2.128
1.548
1.937
2.500

3.128
1.690
2.637
2.465
2.298
1.977
2.641

2.758
3.537
0.842
2.316
1.875
2.206
1.631

1.583
2.214
2.256
2.262
3.394
1.681
1.864

2.517
2.219
1.708
1.962
1.931
1.960
2.015

2.304
2.072
1.628
1.802
1.179
3.281
2.502

1.155
2.726
2.345
2.230
1.946
2.838
2.444

3.156
1.403
1.855
3.460
1.355
2.525
2.636

2.807
2.493
1.546
1.493
3.006
1.553
2.337

2.879
1.560
3.852
3.093
2.455
2.676
1.966

Vrem sa scriem tabelul sistematizat al datelor statistice, considerand clase de

amplitudini egale.
Folosind regula lui Sturges avem ca numarul al claselor poate fi calculat cu

ajutorul numarului al datelor statistice prin

lg

de unde rezulta ca

. In acest fel avem ca amplitudinea a claselor este

Cand se foloseste formula

pentru calculul amplitudinii claselor, se obtine
. In acest caz numarul

claselor va fi

de unde
.

122

Statistica descriptiva

Se observa ca folosind cele doua metode s-au obtinut valori distincte pentru
numarul claselor. Aceste formule au mai mult rolul de a da o prima informatie relativa la numarul claselor.

In continuare vom considera numarul claselor

,
,
,

si
.
Folosind aceasta grupare se obtine tabelul sistematizat

Programul 3.2.11. In urma executarii urmatorului program Matlab

load x.dat -ascii
N=length(x);
ns=fix(1+10/3*log10(N));
ds=(max(x)-min(x))/ns;
fprintf(
ns= %2d,
ds= %4.2f\n,ns,ds)
da=8*(max(x)-min(x))/100;
na=fix((max(x)-min(x))/da);
a=0.7:0.3:4; n=length(a)-1;
fprintf(
na= %2d,
da= %4.2f\n,na,da)
for i=1:N
for j=1:n
if (a(j)<=x(i))&(x(i)<a(j+1))
cl(i)=j;
end
end
end
t=tabulate(cl);
fprintf( Tabelul sistematizat\n)
for j=1:n
t(j,1)=(a(j)+a(j+1))/2;
fprintf(%10.2f | %2d\n,t(j,1),t(j,2))
end

se obtin rezultatele:
ns= 7,
ds= 0.45
na= 12,
da= 0.25
Tabelul sistematizat

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

0.85
1.15
1.45
1.75
2.05
2.35
2.65
2.95
3.25
3.55
3.85

|
|
|
|
|
|
|
|
|
|
|

123

1
2
9
9
10
15
10
5
4
3
2

Se observa ca prima comanda citeste datele statistice din fisierul x.dat, care este un
fisier ascii.

Definitia 3.2.12. Numim frecventa relativa a clasei raportul

Definitia 3.2.13. Numim frecvente cumulate ascendente, respectiv frecvente cumulate descendente frecventele date de relatiile

unde

Observatia 3.2.14. Pentru frecventele relative are loc relatia

iar pentru cele cumulate au loc relatiile

Definitia 3.2.15. Numim distributie statistica a caracteristicii

tabloul de forma

unde ,
, sunt clasele considerate, iar
frecventele absolute si frecventele relative.

, sunt respectiv

Exemplul 3.2.16. Consideram datele statistice de la Exemplul 3.2.10. Atunci distributia statistica a caracteristicii poate fi scrisa, fie cu ajutorul frecventelor absolute,
fie cu ajutorul frecventelor relative. Astfel avem ca

124

Statistica descriptiva

..
.

Tabelul 3.1: Tabel de contingenta

Definitia 3.2.17. Fie colectivitatea relativ la care sunt cercetate doua caracteristici
si . Numimtabel de contingenta , un tablou care contine clasele caracteristicilor
si respectiv , mpreuna cu frecventele absolute ale acestor clase.

Observatia 3.2.18. Daca pentru cele doua caracteristici si avem respectiv cla

,
sele date prin
, si ,
, iar datele primare sunt date prin pere

, atunci tabelul de contingenta este Tabelul 3.1
chile
n datele primare ,
unde
este frecventa absoluta a aparitiei clasei
. Dupa cum se vede tabelul a fost completat cu o linie si o coloana ale caror
elemente sunt date prin formulele

Observatia 3.2.19. Cand caracteristicile si sunt caracteristici cantitative si ntre

ele exista o relatie de dependenta , tabelul de contingenta se numeste tabel de corelatie.
Exemplul 3.2.20.
Un astfel de tabel
de corelatie este prezentat pentru datele statistice
ce reprezinta de copii de ani cercetati din punct de vedere al naltimii
(n centimetri) si al greutatii (n kilograme). Datele au fost trecute n tabelul de
corelatie care urmeaza

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

126
127
128
129
130
131
132
133
134
135
136
137

1
3
4
1

3
4
5
2
1
1

1
1
7
6
7
6
2

1
9
36
27
10
1

1
2
6
17
56
16
7
1

106

1
4
6
39
26
10
2
1

1
2
18
7
11
4
2

1
4
2
6
7
3
1
24

125

1
1
2
3
1
2
1
11

1
1
1
2
2
7

1
1
2

6
9
21
29
70
152
64
38
18
8
6
4
425

3.2.3 Functiile tabulate si crosstab

Obtinerea de tabele sistematizate, n Matlab, este posibila cu ajutorul acestor doua
functii din Statistics toolbox.
Functia tabulate
Apelul functiei tabulate se poate face prin:
tabulate(x)
t=tabulate(x)

unde x este un vector cu valori pozitive. Prin executarea unei astfel de instructiune,
se obtine pe ecran respectiv n t un tabel statistic sistematizat avand trei coloane.
Prima coloana contine valorile distincte ale lui x, a doua contine frecventele absolute
ale acestor valori distincte, iar ultima reprezinta frecventele relative n procente.
Programul 3.2.21. Vom scrie un program Matlab, care genereaa N numere aleatoare
, dup

ce urmeaza legea uniforma
a care construies te tabelul sistematizat, considerand numarul claselor n dat prin regula lui Sturges, iar clasele fiind identificate
prin mijloacele lor.
clear
a=input(a:); b=input(b (a<b):);
N=input(N=); n=fix(1+10/3*log10(N));
xx=unifrnd(a,b,1,N); c=a:(b-a)/n:b;
for i=1:N
for j=1:n
if c(j)<=xx(i) & xx(i)<c(j+1)
x(i)=j;
end
end
end

126

Statistica descriptiva
t=tabulate(x);
for j=1:n
t(j,1) =(c(j)+c(j+1))/2;
end
fprintf( Clasa
f
frel\n)
fprintf( ______________________\n)
fprintf(%7.3f %5d %8.2f%%\n,t)

Executarea programului, cu datele de intrare a=0, b=5 si N=200, produce tabel

sistematizat:
Clasa
f
frel
______________________
0.313
22
11.00%
0.938
27
13.50%
1.563
27
13.50%
2.188
32
16.00%
2.813
27
13.50%
3.438
23
11.50%
4.063
25
12.50%
4.688
17
8.50%

Functia crosstab
Apelul functiei crosstab se poate face prin:
crosstab(x,y,z,...)
t=crosstab(x,y,z,...)

unde x, y, z, ... sunt vectori cu valori nntregi pozitive avand aceleasi lungimi. Prin
executarea unei astfel de instructiune, se obtine pe ecran respectiv n t un tabel statistic sistematizat t, cu atatea intrari cati parametri (vectori) exista. Daca sunt doi
parametri, x si y, se obtine tabelul de contingenta .
Programul 3.2.22. Programul Matlab care urmeaza, genereaza N vectori aleatori ce
urmeaza legea normala bidimensionala, dupa care construies te tabelul de corelatie cu
m clase n raport cu prima variabila, respectiv n clase n raport cu a doua variabila.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
N=input(N=); m=input(m=); n=input(n=);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
X=mvnrnd(mu,v,N); xx=X(:,1); yy=X(:,2);
xmin=min(xx); xmax=max(xx);
ymin=min(yy); ymax=max(yy);
cx =xmin:(xmax-xmin)/m:xmax;
cy =ymin:(ymax-ymin)/n:ymax;

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

for k=1:N
for i=1:m-1
if (cx(i)<=xx(k))
x(k)=i;
end
end
if (cx(m)<=xx(k)) &
x(k)=m;
end
for j=1:n-1
if (cy(j)<=yy(k))
y(k)=j;
end
end
if (cy(n)<=yy(k)) &
y(k)=n;
end
end
t=crosstab(x,y);
disp(t)

127

& (xx(k)<cx(i+1))

(xx(k)<=cx(m+1))

& (yy(k)<cy(j+1))

(yy(k)<=cy(n+1))

2 1
m=6 si n=4, se obtine tabelul de
1 3

Pentru N=100, mu=(5,10), v

corelatie:
1
2
5
2
1
1

2
7
14
17
12
1

0
0
6
8
12
1

0
0
1
1
3
3

3.2.4 Functiile caseread, casewrite, tblread si tblwrite

Pentru completarea tabelului de contingenta construit prin functia crosstab, se
poate face apel la aceste functii.
Functia casewrite
Apelul functiei casewrite are sintaxa
casewrite(obs,file)

si are ca efect scrierea datelor din matricea obs de tip caracter n fisierul cu numele
file.
Functia caseread
Apelul functiei caseread are sintaxa
obs=caseread(file)

si are ca efect citirea datelor din fisierul cu numele file n matricea obs de tip
caracter.

128

Statistica descriptiva

Functia tblwrite
Sintaxa functiei tblwrite este:
tblwrite(t,va,obs,file)

si are ca efect scrierea n fisierul cu numele file a matricelor va, obs de tip
caracter si a datelor din matricea numerica t.
Matricele va si obs trebuie sa aiba atatea linii cate coloane, respectiv cate linii are matricea t. Liniile celor doua matrice de tip caracter vor reprezenta etichete
pentru coloanele, respectiv liniile matricei t, si drept urmare vor fi asezate n dreptul
coloanelor si liniilor corespunzatoare.
Functia tblread
Sintaxa functiei tblread este:
[t,va,obs]=tblread(file)

si are ca efect citirea din fisierul cu numele file a matricelor va, obs de tip caracter
si a datelor din matricea numerica t.
Programul 3.2.23. Programul care urmeaza completeaza Programul 3.2.22, pentru
obtinerea n tabelul de contingenta si a mijloacelor claselor pentru cele doua variabile.
. . . . . . . . . . . . . .
t=crosstab(x,y);
fy=fopen(ly.txt,w+);
for j=1:n
laby(j)=(cy(j)+cy(j+1))/2;
ly=num2str(laby(j));
fprintf(fy,%s\n,ly);
end
fx=fopen(lx.txt,w+);
for i=1:m
labx(i)=(cx(i)+cx(i+1))/2;
lx=num2str(labx(i));
fprintf(fx,%s\n,lx);
end
va=caseread(ly.txt); obs=caseread(lx.txt);
tblwrite(t,va,obs,clase.txt);
type clase.txt, fclose(all);

In urma executarii programului cu aceleasi date de intrare folosite n Programul 3.2.22, prin instructiune type este afisat pe ecran tabelul de contingenta :
2.5895
3.8424
5.0952
6.348
7.6008
8.8537

7.5244
4
4
1
2
1
0

9.7152
6
16
13
12
1
0

11.906
2
7
12
9
4
1

14.0967
0
0
0
1
3
1

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

129

Se observa ca datele din tabelul obtinut nu sunt aceleasi cu cele obtinute prin executarea Programului 3.2.22, desi se dau aceleasi date de intrare. Lucru de asteptat,
avand n vedere ca se genereaza un alt set de numere aleatoare.
Se observa de asemenea, n noul program, ca apar instructiunile fopen,
fclose, caseread, tblwrite.
Instructiunea fopen este folosita pentru deschiderea fisierelor lx.txt si
ly.txt, care vor contine etichetele claselor celor doua variabile. Acestea sunt
date de mijloacele claselor si sunt transformate n siruri de caractere prin comanda
num2str. Parametrul w+, are ca efect crearea unui fisier nou sau actualizarea
unuia deja existent, dupa ce a fost anulat continutul sau, n vederea scrierii sau citirii
n respectivul fisier. Evident instructiunea fclose este folosita n vederea nchiderii
fisierelor.
Prin instructiunile caseread sunt citite etichetele claselor din fisierele lx.txt
si ly.txt, care apoi sunt folosite pentru scrierea acestora n fisierul clase.txt,
cu ajutorul comenzii tblwrite, mpreuna cu elementele tabelului de contingenta .

3.2.5 Reprezentari grafice

Definitia 3.2.24. Numim diagrama prin batoane (bare) a unei distributii statistice
de tip discret, reprezentarea
a ntr-un sistem
axe rectangulare a segmentelor
grafic
de

(batoanelor) date prin
, fiind un factor de
,
proportionalitate, iar este frecventa absoluta a valorii .
Definitia 3.2.25. Numim diagrama cumulativa (ascendenta) a unei distributii statistice de tip discret, linia poligonala care uneste punctele de coordonate
, , , , , , unde este

este un factor de
frecventa cumulata (ascendenta) atasata valorii , iar
proportionalitate.
Definitia 3.2.26. Numim histograma unei distributii statistice de tip continuu,
diagrama obtinuta prin construirea de dreptunghiuri avand drept baze clasele
distributiei statistice si naltimile astfel considerate ncat ariile dreptunghiurilor sa
fie proportionale cu frecventele claselor.
Observatia 3.2.27. Cand clasele distributiei statistice sunt de amplitudini egale,
atunci naltimile dreptunghiurilor histogramei sunt proportionale cu frecventele

claselor. Daca factorul de proportionalitate este , atunci se obtine histograma
frecventelor relative.
Se stie ca aria delimitata de curba ce reprezinta graficul unei densitati de probabilitate si axa absciselor este 1. Din acest motiv, este de preferat ca factorul de
proportionalitate n construirea histogramei frecventelor relative sa fie astfel ales nct

130

Statistica descriptiva

aria totala a dreptunghiurilor histogramei sa fie de asemenea 1. Severifica

usor ca

,
daca
este volumul datelor, iar clasa are amplitudinea

pentru
, atunci functia n scara ce delimiteaza aceste dreptunghiuri este data
prin:

Exemplul 3.2.28. Daca se considera datele statistice din Exemplul 3.2.10, si avand
n vedere sistematizarea acestora, atunci histograma frecventelor absolute este prezentata n Figura 3.1.
16

0
0.4

0.7

1.3

1.6

1.9

2.2

2.5

2.8

3.1

3.4

3.7

4.3

Figura 3.1: Histograma frecventelor absolute

Metoda ferestrei mobile

Histograma frecventelor relative a distributiei statistice reprezinta o aproximare destul de rudimentara a graficului densitatii de probabilitate a caracteristicii . O ameliorare a acestei aproximari se obtine daca se aplica metodaferestrei

mobile.
Metoda ferestrei mobile consta n construirea clasei

, , pen
tru fiecare , si determinarea frecventei a acestei clase, cu ajutorul careia

se obtine curba data prin

Daca se considera functia indicatoare a intervalului
, adica

(3.2.1)

,

,

daca
daca

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

atunci

131

Pentru a obtine o forma mai regulara pentru se pot considera si alte tipuri de
functie nucleu , care de regula este o densitate de probabilitate simetrica.
Mai des se utilizeaza nucleul Gaussian

(3.2.2)

sau nucleul parabolic (Epanechnikov)

(3.2.3)

daca
,
daca

Alte nuclee ce sar putea folosi sunt:

(3.2.4)

(3.2.5)

(3.2.6)

daca ,

daca

daca ,

daca ,

daca ,

daca .

Programul 3.2.29. Programul ce urmeaza genereaza N numere aleatoare ce urmeaza

legea normala
, dupa care, folosind acelasi pas h pozitiv, reprezinta grafic
functia mpreuna cu densitatea de probabilitate a legii normale, pentru fiecare din
cele sase nuclee, mai sus definite.
Calculul valorilor celor sase nuclee se face cu urmatoarea functie Matlab:
function y = K(k,x)
switch k
case 1
y=(abs(x)<1/2);
case 2
y=1/(sqrt(2*pi))*exp(-x.2/2);
case 3
y=(abs(x)<sqrt(5));

132

Statistica descriptiva
y=3/(4*sqrt(5))*(1-x.2/5).*y;
case 4
y=(abs(x)<1);
y=15/16*(1-x.2).2.*y;
case 5
y=((x>0)&(x<1));
y=(1+cos(2*pi*x)).*y;
case 6
y=(abs(x)<1); y=abs(x).*y;
otherwise
error(Eroare)
end

iar programul Matlab este

clf,clear
N=input(N=); h=input(h=);
X=randn(1,N); x=-3:0.01:3;
n=length(x); p=pdf(norm,x,0,1);
for ka=1:6
s=zeros(1,n);
for i=1:N
s=s+K(ka,(x-X(i))/h);
end
f=s/(N*h);
subplot(3,2,ka), plot(x,f,-,x,p,--)
end

In urma executarii programului, cu valorile N=500 si h=1, se obtin graficele din

Figura 3.2.
Definitia 3.2.30. Numim poligonul frecventelor al unei distributii statistice de tip

continuu, poligonul obtinut prin unirea punctelor de coordonate
,
,
unde este factor de proportionalitate, iar este frecventa clasei .
Exemplul 3.2.31. Daca se considera datele statistice din Exemplul 3.2.10, si avand n
vedere sistematizarea acestora, atunci poligonul frecventelor absolute este prezentata
n Figura 3.3.
Definitia 3.2.32. Numim diagrame integrale (cumulative) ale frecventelor cumulate
ascendente, respectiv descendente, relative la distributia statistica de tipcontinuu,

liniile poligonale obt
inute prin unirea punctelor de coordonate ,
,

si respectiv
.
Exemplul 3.2.33. Daca se considera datele statistice din Exemplul 3.2.10, si avand n
vedere sistematizarea acestora, atunci diagramele integrale ale frecventelor cumulate
(ascendente si descendente) sunt prezentate n Figura 3.4.

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

0.4

0.3

0.2

0.1

0
4

0.4

0.3

0.2

0.1

0
4

0.4

0.3

0.2

0.1

0
4

Figura 3.2: Grafice pentru

133

Pentru trasarea diagramelor integrale, n tabelul urmator calculam frecventele absolute ascendente si respectiv descendente, conform formulelor

Definitia 3.2.34. Numim nor statistic atasat caracteristicilor si , punctele din

plan obtinute prin reprezentarea grafica a datelor primare ,
.
Observatia 3.2.35. Norul statistic este utilizat pentru observarea formei legaturii
functionale care exista ntre cele doua caracteristici. Amintim cateva legaturi mai
des ntalnite:

134

Statistica descriptiva
16

0
0.55

0.85

1.15

1.45

1.75

2.05

2.35

2.65

2.95

3.25

3.55

3.85

4.15

Figura 3.3: Poligonul frecventelor absolute

Daca legatura liniara
este usor de observat din norul statistic, pen
, prin logaritmare se
tru celelalte se ncearca liniarizarea. De exemplu, daca

, , si se

. Se noteaza

ajunge la

obtine legatura liniara
, pentru si . Pentru
se va repre aceasta

zenta grafic norul statistic dat de punctele
,
. Daca punctele
din acest nor statistic sunt situate n jurul unei drepte, atunci se poate considera ca

legatura dintre si este de forma
.

3.2.6 Functii Matlab pentru reprezentarea grafica a datelor statistice

Sistemul Matlab, atat prin sistemul de baza, cat si prin Statistics toolbox, dispune de
functii pentru reprezentarea grafica a datelor statistice.
Cazul discret
Daca n cercetare se considera o caracteristica (variabila) de tip discret, functiile
Matlab, deja prezentate, bar si stairs se pot utiliza cu succes.

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

135

0
0.4

0.7

1.3

1.6

1.9

2.2

2.5

2.8

3.1

3.4

3.7

4.3

Figura 3.4: Diagramele integrale ale frecventelor absolute

Pentru exemplificarea modului de utilizare a acestor functii Matlab, vom scrie
doua functii Matlab pentru construirea diagramei prin batoane si respectiv pentru
construirea diagramei cumulative ascendente.
Functia 3.2.36. Functia Matlab pe care o scriem, va genera N numere aleatoare ce
urmeaza o lege de probabilitate de tip discret, va construi diagrama prin batoane pentru datele astfel obtinute, iar pe aceeasi figura va reprezenta, pentru comparatie, tot
prin batoane, functia de probabilitate a legii de probabilitate considerate. Pentru o
vizualizare corecta a comparatiei, se impune, fie amplificarea functiei de probabilitate cu factorul N, fie mpartirea frecventelor distributiei statistice cu N, adica prin
considerarea frecventelor relative. In cele ce urmeaza vom considera prima varianta.
function diag1(N,lege)
% Functia diag1 produce diagrama prin batoane
% N - reprezinta volumul datelor ce urmeaza a fi generate
% lege - reprezinta denumirea Matlab a legii de probabilitate
clf, colormap spring
switch lege
case unid
n = input(n (parametrul legii uniforme discrete):);
x = random(lege,n,1,N);
t = tabulate(x);
P =N*pdf(lege,t(:,1),n);
bar(t(:,1),[t(:,2),P])
legend(Frecvente observate, Frecvente teoretice,1)
return
case bino
n = input(n=); p = input(p=);
x = random(lege,n,p,1,N);

136

Statistica descriptiva
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,n,p);
case hyge
M = input(M=); K = input(K=);
n = input(n=);
x = random(lege,M,K,n,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,M,K,n);
case poiss
lambda = input(lambda=);
x = random(lege,lambda,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,lambda);
case nbin
r = input(r=); p = input(p=);
x = random(lege,r,p,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,r,p);
case geo
p = input(p=);
x = random(lege,p,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,p);
otherwise
error(Lege discreta necunoscuta)
end
bar(t(:,1),[t(:,2),P])
legend(Frecvente observate, Frecvente teoretice,1)

Apelul functiei diag1 se face prin

>>diag1(N,lege)

unde valorile pentru N si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>diag1(50,poiss)

are ca efect apelul functiei pentru legea lui Poisson, iar pe ecran se va cere introducerea parametrului lambda, dupa care pe ecran va fi reprezentat graficul din Figura 3.5,
n cazul n care lambda=7. Sa remarcam totusi ca la un nou apel, cu aceeasi parametri, graficul difera, deoarece sunt generate alte numere aleatoare.
Functia 3.2.37. Urmatoarea functie Matlab, va genera N numere aleatoare ce urmeaza o lege de probabilitate de tip discret, va construi diagrama cumulativa ascendenta pentru datele astfel obtinute, iar pe aceeasi figura va reprezenta, pentru
comparatie, functia de repartitie a legii de probabilitate considerate. Pentru o vizualizare corecta a comparatiei, se impune, fie amplificarea functiei de repartitie cu factorul N, fie mpartirea frecventelor cumulate ale distributiei statistice cu N, adica prin
considerarea frecventelor relative cumulate. In cele ce urmeaza vom considera a doua
varianta.

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

137

9
Frecvente observate
Frecvente teoretice
8

Figura 3.5: Legea

function diag2(N,lege)
% Functia diag2 produce diagrama cumulativa
% N - reprezinta volumul datelor generate
% lege - reprezinta denumirea legii de probabilitate
clf
switch lege
case unid
n=input(n (parametrul legii uniforme discrete):);
x=random(lege,n,1,N);
t=tabulate(x);
xx=[t(1,1)-1;t(:,1);t(end,1)+1];
cf=[0;cumsum(t(:,2));N]/N;
P=cdf(lege,xx,n);
stairs(xx,cf,k-),hold on,
stairs(xx,P,k-.),return
case bino
n=input(n=); p=input(p=);
x=random(lege,n,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,n,p);1];
case hyge
M=input(M=); K=input(K=);
n=input(n=);
x=random(lege,M,K,n,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];

138

Statistica descriptiva
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,M,K,n);1];
case poiss
lambda=input(lambda=);
x=random(lege,lambda,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,lambda);1];
case nbin
r=input(r=); p=input(p=);
x=random(lege,r,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,r,p);1];
case geo
p=input(p=);
x=random(lege,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,p);1];
otherwise
error(Lege discreta necunoscuta)
end
stairs(xx,cf,k-),hold on,
stairs(xx,P,k-.)

Apelul functiei diag2 se face analog apelului functiei diag1 prezentata n

Functia 3.2.36:
>>diag2(N,lege)

De exemplu, comanda
>>diag2(50,bino)

are ca efect apelul functiei pentru legea binomiala, iar pe ecran se vor cere introducerea parametrilor n si p, dupa care pe ecran va fi reprezentat graficul din Figura 3.6,
n cazul n care n=7 si p=0.4. Diagrama cumulativa este reprezentata prin line continua, iar functia de repartitie teoretica prin linie-punct. Si aici remarcam ca la un
nou apel, cu aceeasi parametri, graficul difera, deoarece sunt generate alte numere
aleatoare.
Cazul continuu
Reprezentari grafice pentru distributia statistica a unei caracteristici (variabile) de tip
continuu se obtin, fie prin utilizarea functiei plot si bar, fie prin functiile hist,

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

139

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0
1

Figura 3.6: Legea

histc. Remarcam faptul ca hist si histc sunt functii specifice sistemului de

baza Matlab.
Functia hist
Modurile de apel ale functiei hist sunt:
hist(y)
hist(y,nb)
hist(y,x)
n=hist(y)
n=hist(y,nb)
n=hist(y,x)
[n,x]=hist(y)
[n,x]=hist(y,nb)

Primele trei forme au ca efect reprezentarea grafica a histogramei corespunzatoare

datelor continute de vectorul y. Parametrul nb reprezinta numarul claselor de amplitudini egale, iar daca acesta lipseste, se considera nb=10. Amplitudinea acestor clase
este obtinuta prin mpartirea lungimii intervalului definit prin valoarea minima si valoarea maxima ale componentelor vectorului y la nb. Cand se utilizeaza parametrul
x, acesta trebuie sa contina mijloacele claselor.
Celelalte forme nu produc reprezentari grafice pentru histograme, ci doar calculeaza frecventele absolute si respectiv mijloacele claselor n vectorii n si x, care au
lungimea data prin nb.

140

Statistica descriptiva

Toate formele accepta parametrul y ca fiind matrice, caz n care operatia se executa pentru fiecare coloana a matricei.
Functia histc
Apelul functiei histc se poate face prin:
n=histc(y,a)
[n,nb]=hist(y,a)

care au ca efect, pentru datele vectorului y, obtinerea n n a frecventelor claselor

precizate prin componentele vectorului a, care se impune a fi ordonate crescator.
Valorile lui y care sunt nafara componentelor lui a nu sunt luate n considerare.
De aceea e de dorit ca sa fie folosite valorile -inf si inf pentru a fi incluse toate
valorile lui y.
Daca y este o matrice, atunci functia opereaza pentru fiecare coloana n parte.
Parametrul nb va contine numerele de ordine ale claselor n care au intrat fiecare
din elementele lui y. Pentru elementele care nu au fost clasificate se obtine valoarea 0.
Sa remarcam ca Figura 3.1, Figura 3.3 si Figura 3.4 au fost realizate, respectiv cu
programele Matlab:
clear, clf, load x.dat -ascii2
N=length(x);
a=0.7:0.3:4; n=length(a)-1;
for j=1:n
mij(j)=(a(j)+a(j+1))/2;
end
fr=histc(x,a); fr=fr(1:end-1);
bar(mij,fr,1)
axis([0.4 4.3 0 16])
set(gca,xtick,[0.4:0.3:4.3]), colormap spring
clear, clf, load x.dat -ascii
N=length(x);
a=0.7:0.3:4; n=length(a)-1;
for j=1:n
mij(j)=(a(j)+a(j+1))/2;
end
fr=histc(x,a); fr=fr(1:end-1);
plot(mij,fr,k-o)
axis([0.55 4.15 0 16])
set(gca,xtick,[0.55:0.3:4.15]), grid on
clear, clf, load x.dat -ascii
N=length(x);
a=0.7:0.3:4; n=length(a)-1;
fr=histc(x,a); fr=fr(1:end-1);
FA=[0;cumsum(fr)], FD=N-FA,

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

141

plot(a,FA,k-o,a,FD,k-o)
axis([0.4 4.3 0 70])
set(gca,xtick,[0.4:0.3:4.3]), grid on

care utilizeaza functiile histc si bar.

Functia 3.2.38. Urmatoarea functie Matlab, va genera N numere aleatoare ce urmeaza o lege de probabilitate de tip continuu si va construi histograma pentru datele
astfel obtinute. Intro figura alaturata se va construi histograma folosind functia bar,
mpreuna cu densitatea de probabilitate a legii de probabilitate considerate. Pentru o
vizualizare corecta a comparatiei, se impune, mpartirea frecventelor absolute cu Nh,
unde h este amplitudinea claselor.
function hist0(N,lege)
% Functia hist0 produce histograma
% N - reprezinta volumul datelor generate
% lege - reprezinta denumirea legii de probabilitate
clf, colormap spring
n=fix(1+10/3*log10(N));
switch lege
case unif
a=input(a:); b=input(b(a<b):);
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case norm
mu=input(mu=); s=input(sigma=);
x=random(lege,mu,s,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,mu,s);
case logn
mu=input(mu=); s=input(sigma=);
x=random(lege,mu,s,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,mu,s);
case gam
a=input(a=); b=input(b=);
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case exp
mu=input(mu=);
x=random(lege,mu,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,mu);

142

Statistica descriptiva
case beta
a=input(a=); b=input(b=);
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case weib
a=input(a=); b=input(b=)
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case rayl
b=input(b=);
x=random(lege,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a);
otherwise
error(Lege continua necunoscuta)
end
subplot(1,2,1), hist(x,n)
subplot(1,2,2), bar(c,f/(N*h),1)
hold on, plot(t,y,k-)

Apelul functiei hist0 se face prin

>>hist0(N,lege)

De exemplu, comanda
>>hist0(500,norm)

are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introducerea parametrilor mu si sigma, dupa care pe ecran va fi reprezentat graficul din
Figura 3.7, n cazul n care mu=0 si sigma=1.
Functia scatter
Sistemul Matlab este prevazut cu functia scatter pentru reprezentarea norului statistic n cazul bidimensional. Apelul functiei se face prin:
scatter(x,y)
scatter(x,y,s)
scatter(x,y,s,c)
scatter(x,y,s,c,m)
scatter(x,y,s,c,m,filled)

Efectul executarii unei astfel de instructinui este producerea norului statistic precizat
prin vectorii x si y, care au aceeasi lungime.
Parametrul optional s specifica marimea marcajelor (cerculete) punctelor norului. Acesta poate sa fie un scalar, n care caz toate marcajele vor avea aceleasi marimi

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

140

143

0.45

0.4
120
0.35
100
0.3
80

0.25

0.2

0.15
40
0.1
20
0.05

0
4

Figura 3.7: Legea

0
4

sau poate sa fie un vector de aceeasi lungime cu x si y, caz n care se pot specifica
marimi diferite pentru puncte diferite.
Parametrul c specifica culoarea marcajelor si poate lua una din cele opt culori
folosite si la functia plot. Daca c este vector, atunci trebuie sa aiba aceeasi lungime
cu ceilalti parametri de tip vector, caz n care se pot specifica culorile fiecarui marcaj
n parte.
Parametrul m permite nlocuirea marcajului implicit (cerculet), prin marcajul precizat prin m.
Prezenta optiunii filled atrage dupa sine umbrirea interiorului marcajului.
Remarcam faptul ca se poate folosi cu succes functia plot, daca se foloseste un
singur tip de marcaj.

Functia scatter3
Sistemul Matlab este prevazut cu functia scatter3 pentru reprezentarea norului
statistic n cazul tridimensional. Apelul functiei se face cu aceleasi instructiuni ca si
n cazul functiei scatter, doar ca se mai insereaza nca un parametru z, a treia
dimensiune, dupa primii doi parametri x si y.

144

Statistica descriptiva

Functia gscatter
Statistics toolbox dispune de functia gscatter pentru reprezentarea norului statistic n cazul bidimensional pe grupe de puncte. Apelul functiei se face prin:
gscatter(x,y,g)
gscatter(x,y,s)
gscatter(x,y,c,m,s)
gscatter(x,y,c,m,s,leg)
gscatter(x,y,c,m,s,leg,xl,yl)

Efectul executarii unei astfel de instructinui este producerea norului statistic precizat
prin vectorii x si y, care au aceeasi lungime, folosind gruparea specificata prin vectorul g de aceeasi lungime. Punctele norului vor fi marcate la fel pentru valori identice
corespunzatoare ale lui g.
Parametrul c specifica culorile marcajelor si are valoarea implicita data
prinbgrcmyk.
Parametrul optional m este un tablou de tip caractere recunoscute de functia
plot, valoarea implicita fiind caracterul . (punct).
Parmetrul s specifica marimea marcajelor punctelor norului. Acesta poate sa fie
un scalar, n care caz toate marcajele vor avea aceleasi marimi sau poate sa fie un
vector.
Daca nu sunt specificate valori suficiente pentru toate grupele, sistemul Matlab
efectueaza o ciclare a valorilor specificate.
Parametrul leg precizeaza daca se doreste afisarea unei legende (implicit acesta
este on), sau nu se doreste legenda, cand se va specifica valoarea off.
Parametrii xl si yl precizeaza etichetele pentru cele doua axe de coordoante. Daca acesti parametri lipsesc, sistemul Matlab eticheteaza axele de coordoante cu denumirile variabilelor x si respectiv y.
Programul 3.2.39. Programul ce urmeaza genereaza n vectori aleatori ce urmeaza
legea normala bidimensionala si n numere aleatoare ce urmeaza legea uniforma discreta. Folosind aceste date, se va reprezenta norul vectorilor aleatori bidimensionali,
efectuand gruparea conform numerelor aleatoare uniforme generate.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N(parametrul legii uniforme):);
n=input(n=); X=mvnrnd(mu,v,n);
x=X(:,1); y=X(:,2); g=unidrnd(N,n,1);
gscatter(x,y,g,k,o*.+)

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

145

2 -1
si N=4, se obtine Figura 3.8.
-1 3

Pentru n=25, mu=(5,10), v

1
2
3
4

6
x

Figura 3.8: Nor statistic pe grupe

Functia plotmatrix
Sistemul de baza Matlab contine functia plotmatrix, care reprezinta pe aceeasi
figura mai multi nori statistici. Formele de apel ale functiei sunt
plotmatrix(x)
plotmatrix(x,y)
plotmatrix(x,y,s)

unde x si y sunt matrice cu aceleasi numar de linii, dar numarul coloanelor poate fi
diferit, fie acesta m si respectiv n. Executarea unei instructini de acest tip, produce
m n nori statistici, pentru fiecare coloana a matricei x cu fiecare coloana a matricei
y, cu marcajele specificate prin parametrul optional s, care are sintaxa de la functia
plot.
Prima forma este echivalenta cu
plotmatrix(x,x)

cu exceptia ca pe diagonala principala a matricei norilor statistici vor fi reprezentate

histogramele coloanelor matricei x.
Programul 3.2.40. Programul urmator va genera o matrice x de tipul (N,3), care
contine vectori aleatori ce urmeaza legea normala tridimensionala, dupa care se va
aplica functia plotmatrix.

146

Statistica descriptiva
clear, mu(1)=input(m1=);
mu(2)=input(m2=); mu(3)=input(m3=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(3,3)=input(sigma32=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
v(1,3)=input(Cov(X,Z)=); v(3,1) =v(1,3);
v(2,3)=input(Cov(Y,Z)=); v(3,2) =v(1,3);
N=input(N=); X=mvnrnd(mu,v,N);
plotmatrix(X,o)

Pentru N=10, mu=(5,10,15) si v

2 -1 1
-1 3 0
1
0 1

se obtine Figura 3.9.

10
8
6
4
15

5
18
16
14
12
0

Figura 3.9: Functia plotmatrix

Functia gplotmatrix
Statistics toolbox contine functia gplotmatrix, care are n principal acelasi efect
ca si functia plotmatrix, avand nsa posibilitatea afisa rii punctelor norului statisitic n functie de grupele la care apartin.
Formele de apel sunt cele de la functia gscatter, doar ca x si y, n acest caz,
sunt matrice cu acelasi numar de linii, iar numarul coloanelor putand fi diferite.

3.2. Culegerea, prezentarea si prelucrarea datelor statistice

147

3.2.7 Functia randtool

Avand la dispozitie functiile random si hist, putem sa prezentam functia demonstrativa randtool. Lansarea acestei functii se face prin:
>>randtool

n urma careia se produce o fereastra grafica interactiva (demonstrativa) privind generarea numerelor aleatoare si ilustrarea acestora cu ajutorul histogramelor.
Fixarea (stabilirea) legii de probabilitate n scop demonstrativ se face prin alegerea din meniul legilor de probabilitate situat n partea stanga sus a ferestrei.
Volumul numerelor aleatoare, ce urmeaza a fi generate, se precizeaza prin introducerea acestuia n fereastra din partea dreapta sus.
Pentru stabilirea valorilor parametrilor legii de probabilitate considerate se poate
proceda n doua moduri. Fie prin introducerea n ferestrele corespunzatoare ale valorilor dorite, fie prin deplasarea barelor atasate acestora. In plus, limite pentru parametrii legii de probabilitate considerate pot fi precizate prin introducerea acestora n
ferestrele considerate.
Activarea butonului output are ca efect salvarea numerelor aleatoare curente n
varaibila ans sau n variabila precizata de utilizator, iar butonul resample permite
repetarea generarii de numere aleatoare cu acelasi volum si aceeasi parametri.

3.2.8 Functiile pie si pie3

Reprezentari ale datelor prin sectoare circulare n plan, respectiv n spatiu, se obtin
prin functiile pie si pie3, care se apeleaza prin formele:
pie(x,ex,label)
pie3(x,ex,label)

unde x este un vector avand componentele pozitive si normalizate, adica astfel ncat
suma acestora sa fie 1. Daca suma acestora va fi mai mica decat 1, atunci numai o
parte a cercului va fi reprezentata grafic.
Parametrul ex este optional si specifica sectoarele de cerc ce urmeaza sa fie
detasate pe figura, acesta, daca este prezent, trebuie sa fie un vector numeric de
aceeasi lungime cu vectorul x.
Parametrul optional label, specifica etichetele sectoarele de cerc, acesta, daca
este prezent, trebuie sa fie un vector de aceeasi lungime cu vectorul x, dar care contin
numai siruri de caractere.
Programul 3.2.41. Programul
ce urmeaza genereaza n numere aleatoare ce urmeaza
legea uniforma discreta
, construies te tabelul sistematizat, dupa care reprezinta
datele sistematizate folosind functiile pie si pie3.
n=input(n=); N=input(N=);
x=unidrnd(N,1,n);
t=tabulate(x); d=length(t(:,3));

148

Statistica descriptiva
ex=zeros(1,d); ex(1)=1;
subplot(2,1,1), pie(t(:,3)/100,ex)
subplot(2,1,2), pie3(t(:,3)/100,ex)
colormap summer

Prin executia acestui program, cu datele n=50 si N=4, se obtin reprezentarile grafice
din Figura 3.10.
28%

32%

28%

32%

22%
18%

22%

18%

Figura 3.10: Diagrame circulare

3.3 Parametrii distributiilor statistice

Se considera datele statistice primare
care se obtine distributia statistica

, relative la caracteristica

, din

3.3.1 Parametri statistici ce masoara tendinta

Definitia 3.3.1. Media (aritmetica) a distributiei statistice a caracteristicii
data prin

este

Definitia 3.3.2. Media geometrica a distributiei statistice a caracteristicii pozitive

este data prin

3.3. Parametrii distributiilor statistice

149

Observatia 3.3.3. In aplicatii se lucreaza mai usor cu

log

Definitia 3.3.4. Media armonica a distributiei statistice a caracteristicii nenule

este data prin

Observatia 3.3.5. Intre cele trei medii definite mai nainte exista relatiile cunoscute

.

3.3.2 Functiile mean, geomean si harmean

Sistemul de baza Matlab contine functia mean, iar Statistics toolbox dispune de celelalte doua functii, geomean si harmmean.
Apelul acestor functii se face prin:
ma=mean(x)
mg=geomean(x)
mh=harmmean(x)

si au ca efect calculul mediilor corespunzatoare, pentru componentele vectorului x,

iar daca x este matrice, atunci operatia se executa pentru fiecare coloana a matricei.
Prin urmare, n acest ultim caz, rezultatul este un vector avand atatea componente
cate coloane are matricea x.

3.3.3 Functia trimmean

Sistemul Matlab, prin Statistics toolbox, dispune de functia trimmean, care se poate
apela prin
m=trimmean(x,p)

avand ca efect calculul mediei aritmetice a vectorului x, dupa ce au fost eliminate

cele mai mici p componente si cele mai mari p componente, iar daca x este
matrice, aceasta operatie se face pentru fiecare coloana n parte.
Definitia 3.3.6. Numim mediana distributiei statistice a caracteristicii , valoarea
numerica care mparte datele statistice, ordonate crescator, n doua parti egale.
Observatia 3.3.7. Fie datele statistice primare ordonate n mod nedescrescator

150

Statistica descriptiva

atunci mediana va fi data prin

daca

Observatia 3.3.8. Cand datele statistice sunt grupate, atunci se determina prima data

intervalul median astfelncat pentru
frecventele cumulate si sa fie

satisfacute inegalitatile
si . Folosind apoi interpolarea liniara se

ia ca mediana

unde este amplitudinea intervalului median.

Cand caracteristica cercetata este de tip discret, mediana este

3.3.4 Functia median

Sistemul de baza Matlab dispune de functia median. Apelarea acesteia se face prin
m=median(x)

si are ca efect calculul medianei pentru componentele vectorului x, iar daca x este
matrice, atunci operatia se executa pentru fiecare coloana a matricei. Prin urmare, n
acest ultim caz, rezultatul este un vector avand atatea componente cate coloane are
matricea x.

3.3.5 Parametri statistici ce masoara dispersarea

Definitia 3.3.9. Numim cuartile ale distributiei statistice a caracteristicii , valorile
numerice (cuartila inferioara),
, (cuartila superioara), care mpart
datele statistice, ordonate crescator, n patru parti egale.
Observatia 3.3.10. Cand datele statistice sunt grupate, ca si n cazul medianei, folosind interpolarea liniara consideram

dupa ce s-a
ncat sa aiba loc
determinat
intervalul cuartilic inferior , astfel

si ,respectiv intervalul cuartilic superior , astfel ncat
si

3.3. Parametrii distributiilor statistice

151

Cand caracteristica cercetata este de tip discret, avem ca

Observatia 3.3.11. In mod analog se definesc parametri numerici cum ar fi decilele

si centilele.

3.3.6 Functia prctile

Statistics toolbox contine functia prctile, care se poate apela prin
c=prctile(x,p)

si care calculeaza pentru componentele vectorului x, dupa ce acestea au fost ordonate

crescator, centilele precizate prin parametrul p, care contine unul sau mai numere
ntregi de la 1 la 99. De exemplu, p=[25, 50, 75] produce respectiv cuartila
inferioara ( ), mediana, cuartila superioara ( ):

floor

ceil

floor

ceil

Daca x este matrice, atunci se opereaza pentru fiecare coloana n parte.

Definitia 3.3.12. Numim mod al distributiei statistice a caracteristicii orice punct
de maxim local al distributei statistice.
Observatia 3.3.13. Cand distributia statistica are un singur mod spunem ca avem
distributie statistica unimodala. Daca exista doua sau mai multe moduri spunem ca
avem distributii statistice bimodale, respectiv multimodale.
Observatia 3.3.14. Cand datele statistice sunt grupate, pentru determinarea modului,
se determina intervalul modal, adica intervalul cu frecventa maxima locala. Daca

intervalul modal este , atunci se considera

,
unde
, . Formula
se obtine

cu

usor daca se intersecteaza interpolantul liniar al punctelor

interpolantul liniar al punctelor ,

.
Cand caracteristica cercetata este de tip discret, avem ca

Definitia 3.3.15. Numim moment de ordin

, valoarea numerica

al distributiei statistice a caracteristicii

152

Statistica descriptiva

Definitia 3.3.16. Numim amplitudinea (interval de variatie) distributiei statistice a

caracteristicii , valoarea numerica

Definitia 3.3.17. Numim abatere cuartilica (interval intercuartilic) a distributiei statistice a lui
a dintre cuartila superioara si cuartila inferioara, adica
, diferent
.
diferenta
Observatia 3.3.18. Mai ntalnim, n aplicatii, variatia intercuartilica data prin formula

respectiv abaterea cuartila relativa

Observatia 3.3.19. Daca
, atunci distributia se considera intens concentrata, iar n caz contrar, intens dispersata.

Definitia 3.3.20. Numim abatere medie (absoluta) a distributiei statistice

rea numerica

unde

Definitia 3.3.21. Numim moment centrat de ordin

loarea numerica

, valoa-

al distributiei statistice

, va-

Definitia 3.3.22. Momentul centrat de ordinul doi al distributiei statistice se

numeste dispersie si se noteaza
, iar
se numeste abatere medie
patratica sau abatere standard.
Observatia 3.3.23. Alte formule de calcul pentru dispersie sunt

(formula lui Konig)

3.3. Parametrii distributiilor statistice

153

Observatia 3.3.24. Se observa ca pentru calculul dispersiei ar fi necesar sa fie parcurse datele statistice de doua ori, odata pentru calculul mediei aritmetice , iar apoi
pentru calculul lui , care foloseste pe . Prezentam o metoda pentru calculul dispersiei printr-o singura parcurgere a datelor statistice.
Pentru aceasta introducem notatiile

Vom arata, prima data, ca are loc relatia de recurenta

Pentru stabilirea relatiei de recurenta se scrie succesiv

Daca retinem extremitatile sirului de egalitati avem:

ce trebuie aratat.
, iar . Prin urmare formula de recurenta de
Observam ca
la punctul precedent permite calculul lui odata cu calculul lui , deci printr-o
parcurgere a datelor statistice.
Algoritmul de calcul poate fi descris prin urmatoarele etape:

1. , .
2. Pentru
3.

;

154

Statistica descriptiva

Definitia 3.3.25. Numim coeficient de variatie al distributiei statistice

, raportul

care de regula se exprima n procente (

Definitia 3.3.26. Numim coeficient de variatie intercuartil al distributiei statistice ,

raportul

Definitia 3.3.27. Numim coeficientul de asimetrie intercuartil (Yule) al distributiei

statistice , raportul

, iar daca

Observat
lui Yule satisface relatiile
ia 3.3.28.
Coeficientul

( ), atunci
, n caz contrar

Definitia 3.3.29. Numim coeficienti ai lui Pearson relativ la distributia statistica

rapoartele:

(3.3.1)

(skewness)

(kurtosis)

(coeficient de asimetrie)

Definitia 3.3.30. Numim coeficienti ai lui Fisher relativ la distributia statistica a lui
, valorile numerice

(3.3.2)

(asimetria)

(excesul)

Observatia 3.3.31. Pentru curba lui Gauss avem ca
, deci
. Cand

, maximul curbei distributiei este deplasat spre dreapta n raport cu valoarea

medie, iar cand , maximul este deplasat spre stanga.

3.3. Parametrii distributiilor statistice

155

pentru curba lui Gauss avem ca
, deci
. Astfel, daca
De asemenea,

atunci
curba
distribut

iei
este
mai

ngustat
a
dec
a
t
curba
lui Gauss,

distributia numindu-se leptocurtica. Daca
curba
distribut
iei este

mai turtita, distributia numindu-se platicurtica.

O parte din acesti parametri statistici exista n sistemul de baza Matlab, iar altii
se gasesc n Statistics toolbox. Facem prezentarea lor n cele ce urmeaza.

3.3.7 Functia moment

Apelul functiei moment se poate face prin
s=moment(x,k)

si are ca efect calculul, pentru componentele vectorului x, a momentului centrat de

ordin k, iar daca x este matrice, atunci se opereaza pe fiecare coloana n parte.

3.3.8 Functiile var si std

Apelurile functiilor var si std se pot face prin:
v=var(x)
s=std(x)
v=var(x,w)
v=var(x,1)

Primele doua forme calculeaza, pentru componentele vectorului x, dispersia definita

prin

v
x
x

unde este lungimea vectorului, si respectiv abaterea standard s

v.
Forma a doua pentru var, cand parametrul optional w este prezent, acesta trebuie
sa fie un vector cu ponderi pozitive a caror suma este 1, si are ca efect calculul lui v
dupa formula

x
x
wx

Forma a treia pentru var, cand parametrul optional 1 este prezent, are ca efect
calculul lui v dupa formula momentului centrat de ordinul 2.
In toate cazurile, daca x este matrice, se opereaza pe fiecare coloana n parte.

3.3.9 Functiile range, iqr, mad, skewness si kurtosis

Apelurile functiilor range, iqr, mad, skewness, kurtosis se fac prin

156

Statistica descriptiva
r=range(x)
iq=iqr(x)
md=mad(x)
sk=skewness(x)
k=kurtosis(x)

si calculeaza pentru componentele vectorului x, respectiv amplitudinea, abaterea

cuartilica, abaterea absoluta, asimetria (cu formula (3.3.2)) si excesul (cu formula
(3.3.1)).
Daca x este matrice, se opereaza pe fiecare coloana n parte.

3.3.10 Functiile max si min

Prezentam numai modul de apel pentru functia max, deoarece functia min se utilizeaza la fel.
Pentru max avem urmatoarele forme de apel:
r=max(x)
r=max(x,y)
[r,k]=max(x)
[r,k]=max(x,y)

Prin acestea se calculeaza valoarea maxima a componentelor vectorului x, iar n

k se obtin si indicii corespunzatori componentelor. Daca este prezent parametrul
optional y, care este un vector de aceasi lungime cu cea a lui x, atunci r este un
vector ce va contine valorile maxime, prin compararea celor doi vectori pe componente. Daca x este matrice, respectiv cand apare y matrice de aceasi dimensiune,
atunci comparatiile sunt efectuate pe coloane n primul caz, iar n al doilea caz se
face compararea element cu element.

3.3.11 Functiile sort si sortrows

Functia sort are urmatoarele forme de apel
y=sort(x)
y=sort(x,k)
[y,s]=sort(x)
[y,s]=sort(x,k)

si sortrows aceleasi forme de apel.

Functia sort ordoneaza crescator elementele fiecarei coloane a matricei x, cand
k=1 (care este valoarea implicita), respectiv ordonarea crescatoare pe linii, cand k=2.
Vectorul s pastreaza indicii elementelor dinainte de ordonare. Daca x este vector,
atunci parametrul optional lipseste si este efectuata ordonarea crescatoare a componentelor vectorului, eventual cu pastrarea indicilor componentelor dinainte de ordonare n s.

3.3. Parametrii distributiilor statistice

157

Functia sortrows ordoneaza lexicografic liniile matricei x, avand n vedere

toate elementele liniilor matricei (cand parametrul k lipseste) sau numai elementele
ce apartin coloanelor precizate prin vectorul k, cu posibilitatea pastrarii n s a indicilor liniilor nainte de ordonare.

3.3.12 Functiile sum, prod, cumsum si cumprod

Apelurile functiilor sum, prod, cumsum, cumprod, se pot realiza prin:
y=sum(x)
y=sum(x,k)
y=prod(x)
y=prod(x,k)
y=cumsum(x)
y=cumsum(x,k)
y=cumprod(x)
y=cumprod(x,k)

Executia acestor instructiuni calculeaza respectiv sumele, sumele partiale, produsele,

produsele partiale pentru fiecare coloana a matricei x, cand k=1 (valoare implicita),
iar cand k=2, se executa aceste operatii pe linii. Daca x este vector, atunci parametrul
optional k lipseste, iar operatiile se executa asupra componentelor vectorului.

3.3.13 Functia diff

Apelul functiei diff se realizeaza prin:
y=diff(x)
y=diff(x,r)
y=diff(x,r,k)

In urma executarii unei astfel de instructiune, se calculeaza diferentele de ordin r ale

elementelor liniilor consecutive ale matricei x, cand k=1 (valoare implicita), respectiv diferentele de ordin r ale elementelor coloanelor consecutive ale matricei x, cand
k=2, adica

y
y

x

x x
x

k=1
k=2

Diferentele de ordin doi pentru x sunt diferentele de ordinul ntai pentru y. Daca x
este vector, atunci parametrul k lipseste, iar operatia se executa asupra componentelor
vectorului.

158

Statistica descriptiva

3.3.14 Functiile nanmean, nanmedian, nanstd,

nanmin, nanmax si nansum
Aceste functii din Statistics toolbox sunt definite ca si functiile corespunzatoare
mean, median, std, min, max, sum, cu exceptia faptului ca sunt excluse din calcule valorile NaN.

3.3.15 Corectiile lui Sheppard

Daca datele statistice relative la caracteristica de tip continuu au fost grupate, n
unele cazuri, se cere sa fie aplicate corectiile lui Sheppard
pentru momentele .

Daca se noteaza cu momentul corectat de ordinul , atunci

unde este amplitudinea claselor.

Folosind formula precedenta scriem primele patru momente corectate:

Avand n vedere ca

obtinem, de asemenea, momentele centrate corectate

Corectiile lui Sheppard se aplica, de regula, cand avem distributie unimodala si

pentru

, .
Exemplul 3.3.32. Sa revenim la datele statistice din Exemplul 3.2.10 si sa calculam
parametrii statistici definiti pana aici.
Printre parametrii statistici care masoara tendinta i calculam pe urmatorii.
Media (aritmetica), care este data prin

3.3. Parametrii distributiilor statistice

159

Mediana, care se obtine dupa ordonarea crescatoare a datelor statistice. Anume, avem
ca

Datele statistice dublu ncadrate fiind la mijlocul acestei ordonari (numar par de date
statistice) obtinem mediana ca fiind

Cuartila inferioara se obtine din aceeasi ordonare a datelor statistice, luand data

statistica cu numarul de ordine , prima ncadrata, adica

, iar cuartila
superioara, luand data statistica cu numarul de ordine , a doua ncadrata, adica

.
Printre parametrii statistici care masoara gradul de mprastiere i calculam pe cei
care urmeaza.
Intervalul de variatie este

Abaterea cuartila sau intervalul intercuartilic se obtine prin

Deoarece

concentrata.
Abaterea cuartila relativa este

, avem ca distributia statistica este intens

Abaterea medie (absoluta) are valoarea data prin

160

Statistica descriptiva

Primele patru momente sunt

Folosind legaturile dintre momentele obisnuite si momentele centrate se obtin acestea din urma cu formulele

Se pot calcula apoi coeficientii lui Pearson

(skewness)

respectiv coeficientii lui Fisher

(asimetria)

(kurtosis)

(excesul)

Sa recalculam parametrii statistici pe baza datelor statistice sistematizate (grupate).

Media (aritmetica) va fi

Pentru a calcula mediana folosim formula

3.3. Parametrii distributiilor statistice

161

Aici este cea mai

a cumulata (ascendenta) ce nu depaseste pe ,
mare frecvent

, intervalul

deci

.
Astfel
se obtine

si frecventa absoluta
median, care are amplitudinea
. Prin
urmare rezulta ca

Pentru a calcula cuartila inferioara se determina prima data intervalul cuartilic inferior
astfel ncat sa fie cea mai mare frecventa cumulata ascendenta ce nu

. Aceasta este
depaseste pe
. Prin urmare , iar

. Se foloseste apoi formula

In mod analog, pentru cuartila superioara

Intervalul modal, cel cu frecventa maxima, este

modul va fi calculat cu formula

. Prin urmare

Abaterea (absoluta) este

Primele patru momente se calculeaza prin

162

Statistica descriptiva

iar apoi se obtin momentele centrate

Coeficientii lui Pearson sunt

(skewness)

(kurtosis)

iar coeficientii lui Fisher sunt

(asimetria)

(excesul)

Programul 3.3.33. Sa scriem un program, care sa calculeze o parte din acesti parametri statistici din exemplul precedent. Ne vom opri numai la acei parametri, care
sunt definiti prin functii Matlab, dar evident ca odata deteminati acesti parametri, se
pot calcula usor si ceilalti parametri din exemplul precedent.
load x.dat -ascii% fisierul x.dat contine datele
% primare din exemplul precedent
ma=mean(x);
fprintf(ma=
%6.4f\n,ma)
mg=geomean(x); fprintf(mg=
%6.4f\n,mg)
mh=harmmean(x); fprintf(mh=
%6.4f\n,mh)
m=median(x);
fprintf(mediana=%6.4f\n,m)
Q=prctile(x,[25,75]);
fprintf(Q1=
%6.4f\n,Q(1)),
fprintf(Q3=
%6.4f\n,Q(2))
md=mad(x);
fprintf(md=
%6.4f\n,md)
mu=moment(x,2); fprintf(mu2=
%6.4f\n,mu)
mu=moment(x,3); fprintf(mu3=
%6.4f\n,mu)
mu=moment(x,4); fprintf(mu4=
%6.4f\n,mu)
r=range(x);
fprintf(range= %6.4f\n,r)
iq=iqr(x);
fprintf(iq=
%6.4f\n,iq)
s=std(x);
fprintf(s=
%6.4f\n,s)
v=var(x);
fprintf(v=
%6.4f\n,v)
sk=skewness(x); fprintf(sk=
%6.4f\n,sk)
k=kurtosis(x); fprintf(k=
%6.4f\n,k)

Prin executarea programului se obtin rezultatele

ma=
mg=

2.2708
2.1725

3.3. Parametrii distributiilor statistice

163

mh=
2.0704
mediana=2.2430
Q1=
1.8020
Q3=
2.6410
md=
0.5277
mu2=
0.4379
mu3=
0.1156
mu4=
0.5402
range= 3.1300
iq=
0.8390
s=
0.6666
v=
0.4443
sk=
0.3988
k=
2.8164

3.3.16 Functia grpstats

Functia grpstats, din Statistics toolbox, face posibila determinarea unor parametri
statistici pentru date clasificate (grupate) dupa o anumita variabila de grupare.
Apelul functiei se face prin
ma=grpstats(x,g)
[ma,s,fr,nume]=grpstats(x,g)

Parametrul g este un vector numeric sau de tip caracter, de aceeasi lungime cu

numarul liniilor matricei x, si care permite gruparea datelor continute de x. O astfel
de grupare este formata din acele date din x, pentru fiecare coloana n parte, pentru
care valorile corespunzatoare din g sunt aceleasi.
Executarea primei instructiuni are ca efect calculul mediilor aritmetice pentru
fiecare grupa a fiecarei coloane din matricea x.
A doua instructiune, fata de prima instructiune, mai calculeaza abaterile standard
s, pentru fiecare grupa din fiecare coloana a matricei x, precum si numarul datelor
fr si etichetele nume, pentru fiecare grupa.
Programul 3.3.34. Programul care urmeaza genereaza 100 de numere aleatoare ce

urmeaza legea uniforma discreta, cu
, n vectorul g, care va reprezenta un
vector de grupare.
In matricea x cu 100 de linii si 3 coloane, vor fi generate numere aleatoare ce

urmeaza legea normala
, unde parametrul , iar parametrul , este
respectiv 1, 2 si 3 pentru cele trei coloane.
Folosind vectorul de grupare g, se calculeaza valorile medii, abaterile standard,
frecventele absolute si se precizeaza numele grupelor, pentru coloanele matricei x.
g=unidrnd(4,100,1);
t=1:3;
t=t(ones(100,1),:);

164

Statistica descriptiva
x=normrnd(t,1);
[ma,s,fr,nume]=grpstats(x,g);
fprintf(
Mediile pe grupe \n)
disp(ma)
fprintf(
Abaterile standard pe grupe \n)
disp(s)
fprintf(
Frecventele grupelor \n)
disp(fr)
fprintf(
Etichetele grupelor \n)
disp(nume)

In urma executarii programului se obtin urmatoarele rezultate

Mediile pe grupe
1.2486
1.8376
0.6895
2.0323
1.0393
1.9893
1.0034
1.8834
Abaterile
0.2024
0.2076
0.2051
0.1875

3.0692
3.2620
3.0223
3.0419

standard pe grupe
0.1701
0.2033
0.1793
0.2763
0.1723
0.1574
0.1670
0.1859

Frecventele
24
24
23
23
27
27
26
26

grupelor
24
23
27
26

Etichetele grupelor
1
2
3

3.3.17 Functia boxplot

Sistemul Matlab, prin Statistics toolbox, dispune de functia boxplot, care se poate
apela cu una din urmatoarele forme:
boxplot(x)
boxplot(x,cr)
boxplot(x,cr,s)
boxplot(x,cr,s,v)
boxplot(x,cr,s,v,w)

Efectul executarii acestor instructiuni este reprezentarea grafica prin dreptunghiuri cu

prelungiri de segmente pentru fiecare coloana a matricei x. Laturile de jos si de sus
ale dreptunghiurilor au ordonatele date de cuartilele inferioare si superioare corespunzatoare, medianele fiind si ele marcate la randul lor prin segmente paralele situate
n interioarele dreptunghiurilor, pozitionate prin ordonatele date de valorile acestora.

3.4. Corelatie si regresie

165

In mijloacele laturilor de jos si de sus ale dreptunghiurilor sunt trasate spre exterior segmente verticale de lungimi date prin

respectiv

unde avem valoarea implicita w

. Datele care se afla nafara acestor

prelungiri se numesc outliers (erori grosolane) si sunt marcate prin simbolul precizat prin parametrul s (implicit s=+). Daca nu exista astfel de date ntro parte sau
alta, atunci segmentul din partea de jos se termina cu un marcaj.
Daca cr=1, atunci dreptunghiurile sunt crestate pe laturile verticale, avand mijloacele crestaturilor n dreptul medianelor, iar deschiderile crestaturilor prezinta
estimatii robuste pentru valorile medii teoretice. Valoarea cr=0 (valoare implicita)
implica faptul ca dreptunghiurile nu sunt crestate.
Cand v=0 (valoare implicita este v=1) reprezentarile prezentate pana aici sunt

rotite cu
, adica sunt prezentate pe orizontala.
Remarcam faptul ca daca x este un vector, atunci poate apare un parametru suplimentar g, imediat dupa parametrul x. Parametrul g este un vector numeric sau de
tip caracter, de aceeasi lungime cu x, si care permite gruparea datelor continute de x.
O astfel de grupare este formata din acele date din x, pentru care valorile corespunzatoare din g sunt aceleasi. Functia boxplot n acest caz va produce dreptunghiuri
pentru fiecare grupare n parte.
Programul 3.3.35. Programul urmator genereaza n vectori aleatori, care urmeaza
legea normala bidimensionala, n matricea X de tipul n 2, dupa care, folosind functia
boxplot, reprezinta grafic datele pentru prima variabila si respectiv pentru a doua
variabila.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); X=mvnrnd(mu,v,n); boxplot(X)
xlabel(Numarul variabilelor),
ylabel(Valorile variabilelor)

In urma executarii programului, cu valorile mu1=10, mu2=10, v

2 -2
si
-2 3

n=50, se obtine Figura 3.11.

3.4 Corelatie si regresie

Corelatia (ntr-un sens larg) poate fi nteleasa ca legatura care exista ntre o caracteristica dependenta si una sau mai multe caracteristici independente, iar regresia este

166

Statistica descriptiva
14

Valorile variabilelor

2
Numarul variabilelor

Figura 3.11: Reprezentare de date cu boxplot

..
.

Tabelul 3.2: Tabel de corelatie

metoda prin care se stabileste acesta legatura.

relative la colectivitatea . DaSa consideram caracteristicile
cantitative

s

i

tele statistice primare sunt
, care dupa grupare sunt prezentate n

Tabelul de corelatie 3.2. unde reprezinta frecventa absoluta a clasei
. De
asemenea, avem ca

al distributiei statistice a carac-

Definitia 3.4.1. Numim moment de ordinul

teristicii bidimensionale , valoarea numerica

3.4. Corelatie si regresie

unde

167

este frecventa relativa a clasei

al distributiei statistice

Definitia 3.4.2. Numim moment centrat de ordinul

bidimensionale , valoarea numerica

unde

Observatia 3.4.3. Remarcam, printre momentele centrate, dispersiile pentru distri

butiile statistice ale caracteristicilor si respectiv , anume

Definitia 3.4.4. Numim coeficient de corelatie (al lui Pearson) al distributiei statis
tice bidimensionale , raportul

Observatia 3.4.5. Folosind datele statistice negrupate avem formulele de calcul pentru coeficientul de corelatie

168

Statistica descriptiva

Observatia 3.4.6. Folosind inegalitatea CauchySchwarzBuniakovski

se stabileste ca . De asemenea, daca , atunci ntre cele doua caracteris

tici exista o legatura liniara, si invers. Cand
, spunem ca cele doua caracteristici
sunt (liniar) necorelate. Prin urmare, coeficientul de corelatie poate fi folosit pentru
a stabili daca ntre cele doua caracteristici exista sau nu o legatura liniara. In cazul

n care caracteristica bidimensionala urmeaza legea normala bidimensionala

implica faptul ca cele doua caracteristici sunt independente.
Exemplul 3.4.7. Sa calculam cativa din parametrii definiti pentru datele statistice de
la Exemplul 3.2.20.
Pentru a calcula coeficientul de corelatie, calculam prima data valorile medii ale

caracteristicilor si . Remarcam, pentru aceasta, ca distributiile statistice ale ca
racteristicilor si sunt respectiv

Obtinem astfel ca

cm

kg

De asemenea, calculand dispersiile caracteristicilor se obtine

3.4. Corelatie si regresie

169

Covarianta dintre si
Cov

se calculeaza cu formula

Astfel se ajunge la coeficientul de corelatie

Cov

Programul 3.4.8. Programul Matlab, care urmeaza, efectueaza aceste calcule

f=[1,1,3,1,zeros(1,8);
0,3,4,1,0,1,zeros(1,6);
1,4,5,7,1,2,1,zeros(1,5);
0,1,2,6,9,6,4,1,zeros(1,4);
zeros(1,2),1,7,36,17,6,2,1,zeros(1,3);
zeros(1,2),1,6,27,56,39,18,4,1,zeros(1,2);
zeros(1,3),2,10,16,26,7,2,1,zeros(1,2);
zeros(1,4),1,7,10,11,6,2,1,0;
zeros(1,5),1,2,4,7,3,1,0; zeros(1,6),1,2,3,1,1,0;
zeros(1,8),1,2,2,1; zeros(1,9),1,2,1];
x=[126:137]; y=[24:35]; fx=sum(f); fy=sum(f);
xa=sum(fx.*x)/(sum(fx)); ya=sum(fy.*y)/(sum(fy));
vx=(sum(fx.*x.2)-(sum(fx.*x))2/sum(fx))/sum(fx);
vy=(sum(fy.*y.2)-(sum(fy.*y))2/sum(fy))/sum(fy);
cov=(x*f*y-sum(fx.*x)*sum(fy.*y)/sum(fx))/sum(fx);
r=cov/(sqrt(vx*vy));
fprintf( xa=%8.3f\n ya=%8.4f\n,xa,ya)
fprintf( vx=%8.5f\n vy=%8.5f\n,vx,vy)
fprintf( cov=%7.5f\n r=%9.6f,cov,r)

iar rezultatele sunt urmatoarele:

xa= 131.054
ya= 29.2447
vx= 3.45354

170

Statistica descriptiva
vy= 3.35188
cov=2.56323
r= 0.753374

Definitia 3.4.9. Numim valoare medie conditionata a distributiei statistice a carac

teristicii n raport cu , valoarea numerica

si respectiv valoare medie conditionata a distributiei statistice a caracteristicii

, valoarea numerica
raport cu

Definitia 3.4.10. Curba de ecuatie

pe care se situeaz
a punctele de co

,
, se numeste curba de regresie a lui n raport cu ,
ordonate

iar curba de ecuatie
pe care se situeaza punctele de coordonate
,

, se numeste curba de regresie a lui n raport cu .
Definitia 3.4.11. Numim dispersie conditionata a distributiei statistice a caracteris
ticii n raport cu , valoarea numerica

si respectiv dispersie conditionata a distributiei statistice a caracteristicii n raport

, valoarea numerica
cu

Definitia 3.4.12. Numim dispersia conditionata a distributiei statistice a lui

raport cu distributia statistica a lui , valoarea numerica

si respectiv dispersia conditionata a distributiei statistice a lui n raport cu distri

butia statistica a lui , valoarea numerica

3.4. Corelatie si regresie

unde

a clasei .

171

este frecventa relativa a clasei , iar

este frecventa relativa

Proprietatea 3.4.13. Dispersiile conditionate definite mai nainte satisfac relatiile

unde

adica sunt dispersiile valorilor medii conditionate.

Demonstratie. Se porneste de la identitatea

care se nmulteste cu

. Astfel se obtine

si se nsumeaza dupa

Retinem extremitatile acestui sir de egalitati, le nmultim cu

. Rezulta n acest mod

si le nsumam dupa

de unde se obtine prima relatie. Analog se obtine si cealalta relatie.

Definitia 3.4.14. Numim raport de corelatie al distributiei statistice a caracteristicii
fata de distributia statisticii , valoarea numerica

172

Statistica descriptiva

si n mod analog avem

, atunci
Observatia 3.4.15. Cand
, prin urmare

, ceea ce nseamna absenta dependentei n medie. Pe de

alta parte,
cand
,
, adica pentru fiecare clasa valorile

caracteristicii sunt aceleasi.

In cazul n care, relativ la caracteristica

, exista numai doua clase avem

Daca se nlocuies te aceasta expresie n formula

se obtine ca

deci

Aplicatia 3.4.16. (Determinarea curbelor de regresie). Prezentam n continuare metoda celor mai mici patrate pentru determinarea ecuatiilor curbelor de regresie.

,
, curba de
Presupunem ca din reprezentarea n plan a punctelor

. Vom
regresie a lui n raport cu
este
de forma

determina parametrii
, astfel ncat

sa fie minima.

3.4. Corelatie si regresie

173

Punctul de minim
lui normal de ecuatii, rezultat din

pentru

al functiei

se obtine prin rezolvarea sistemu-

. Ecuatia curbei de regresie va fi

La fel se determina si ecuatia curbei de regresie a lui n raport cu

Aplicatia 3.4.17. (Drepte de regresie). Consideram cazul liniar, adica ecuatia curbei

de regresie este
. Expresia minimizata este

care conduce la sistemul normal de ecuatii

Se obtine n acest fel ecuatia dreptei de regresie a lui

n raport cu ca fiind

174

Statistica descriptiva
In mod analog se ajunge la ecuatia dreptei de regresie a lui n raport cu

(3.4.1)

Punctul de intersectie al celor doua drepte de regresie are coordonatele si

se numeste centrul de greutate al distributiei statistice a caracteristicii bidimensionale
.
Daca se noteaza

coeficientul unghiular al dreptei de regresie a lui

de regresie al lui n raport cu ) si cu

coeficientul de regresie al lui n raport cu

, atunci

n raport cu (numit coeficientul

De asemenea se constata ca sign

sign

format de cele doua drepte de regresie este dat prin relatia
tg

Se arata ca unghiul

Folosind aceasta relatie se pot trage urmatoarele concluzii:

a) daca atunci
, deci dreptele de regresie se confunda, cu specificatia
ca pentru
dreptele au panta (coeficientul unghiular) negativa, iar pentru

panta este pozitiva.

b) daca si sunt independente atunci
, deci
(dreptele de regresie
sunt perpendiculare).
Observatia 3.4.18. Alte tipuri de curbe de regresie mai des ntalnite si care pot fi
liniarizate sunt:
1.
2.

meaza

(exponentiala), care prin logaritmare se liniarizeaza dupa cum ur

luand

, , ;
(hiperbolica), care se liniarizeaza daca se noteaza
sau

, care se liniarizeaza daca se noteaza

;

3.4. Corelatie si regresie

4.
5.

luand
6.
7.

175

(exponentiala), care prin logaritmare se liniarizeaza ln

ln ;

e , care prin logaritmare se liniarizeaza ln

ln ;

, luand

e , care se liniarizeaza daca se ia

, luand

, care prin logaritmare se liniarizeaza,

, ;

;

(logaritmica), care se liniarizeaza daca se noteaza

e si

Aceasta ultima legatura este un caz particular al legaturii logistice definita prin

Printre legaturile ce nu pot fi liniarizate amintim:

a doua putand fi adusa la forma polinomiala.

Exemplul 3.4.19. Sa consideram din nou datele statistice de la Exemplul 3.2.20, sa
calculam noile caracteristici numerice definite si sa determinam ecuatiile dreptelor
de regresie.

Valorile medii conditionate si dispersiile conditionate ale lui n raport cu se
calculeaza cu formulele

In mod analog se obtin valorile medii conditionate si dispersiile conditionate ale lui
in raport cu .
Aceste valori calculate sunt trecute n tabelele urmatoare.

176

Statistica descriptiva

Dispersia conditionata a lui

n raport cu va fi

In mod analog dispersia conditionata a lui n raport cu este

Dispersia conditionata a lui

n raport cu se poate calcula si cu formula

unde

este dispersia valorilor medii. Anume, avem ca

de unde
In mod analog,

3.4. Corelatie si regresie

177

unde

adica

Raportul de corelatie al lui

este

Ecuatiile dreptelor de regresie respectiv a lui

au ecuatiile

fata de este

iar raportul de corelatie al lui fata de

In acest fel se obtine ca

n raport cu si a lui n raport cu

Avand n vedere ca

avem ecuatiile

Centrul de greutate al distributiei statistice este punctul de coordonate

, adica punctul de intersectie a celor doua drepte de regresie.

178

Statistica descriptiva

Coeficientul de regresie al lui

n raport cu

dreptei de regresie a lui n raport cu , adica

este coeficientul unghiular al

In mod analog, coeficientul de regresie al lui n raport cu este

Pentru determinarea unghiului

tg
de unde

format de cele doua drepte de regresie avem formula

tg
adica

rad.

Programul 3.4.20. Calculele de mai sus se pot face cu programul Matlab, care urmeaza:
f=[1,1,3,1,zeros(1,8);
0,3,4,1,0,1,zeros(1,6);
1,4,5,7,1,2,1,zeros(1,5);
0,1,2,6,9,6,4,1,zeros(1,4);
zeros(1,2),1,7,36,17,6,2,1,zeros(1,3);
zeros(1,2),1,6,27,56,39,18,4,1,zeros(1,2);
zeros(1,3),2,10,16,26,7,2,1,zeros(1,2);
zeros(1,4),1,7,10,11,6,2,1,0;
zeros(1,5),1,2,4,7,3,1,0; zeros(1,6),1,2,3,1,1,0;
zeros(1,8),1,2,2,1; zeros(1,9),1,2,1];
x=[126:137]; y=[24:35]; fx=sum(f); fy=sum(f);
xa=sum(fx.*x)/(sum(fx)); ya=sum(fy.*y)/(sum(fy));
vx=(sum(fx.*x.2)-(sum(fx.*x))2/sum(fx))/sum(fx);
vy=(sum(fy.*y.2)-(sum(fy.*y))2/sum(fy))/sum(fy);
cov=(x*f*y-sum(fx.*x)*sum(fy.*y)/sum(fx))/sum(fx);
r=cov/(sqrt(vx*vy));
yb=f*y./fx; xb=f*x./fy;
for i=1:12
syb(i)=f(i,:)*(y-yb(i)).2/fx(i);
end
for j=1:12
sxb(j)=f(:,j)*(x-xb(j)).2/fy(j);
end
syx=sum(fx.*syb)/sum(fx);

3.4. Corelatie si regresie

179

sxy=sum(fy.*sxb)/sum(fx);
syxb=sum(fx.*(yb-ya).2)/sum(fx);
sxyb=sum(fy.*(xb-xa).2)/sum(fx);
eyx=sqrt(syxb/vy); exy=sqrt(sxyb/vx);
ayx=r*sqrt(vy/vx); axy=r*sqrt(vx/vy);
tang=(1-r2)/r2*sqrt(vx*vy)/(vx+vy);
arctan=atan(tang); arc=180*arctan/pi;
fprintf( i | yb
| syb
|
j |
xb
| sxb\n)
for i=1:12
fprintf(%3d |%6.2f |%6.3f |%7d |%6.3f |%6.3f\n,...
i,yb(i),syb(i),i,xb(i),sxb(i))
end
fprintf(\n syx=%8.5f, sxy=%8.5f,syx,sxy)
fprintf(\n eyx=%8.6f, exy=%8.6f,eyx,exy)
fprintf(\n ayx=%8.6f, axy=%8.6f,ayx,axy)
fprintf(\n tg=%9.3f, alpha=%6.0f,tang,arc)

In urma executarii programului precedent, se obtin urmatoarele rezultate:

i
1
2
3
4
5
6
7
8
9
10
11
12

|
|
|
|
|
|
|
|
|
|
|
|
|

yb
25.67
26.11
26.62
28.14
28.43
29.32
29.56
30.63
31.67
31.88
33.50
34.00

|
|
|
|
|
|
|
|
|
|
|
|
|

syb
0.889
1.432
2.141
1.843
1.045
1.363
1.340
1.706
1.444
1.359
0.917
0.500

syx= 1.39279,
eyx=0.764509,
ayx=0.742203,
tg=
0.381,

|
|
|
|
|
|
|
|
|
|
|
|
|

j
1
2
3
4
5
6
7
8
9
10
11
12

|
xb
|127.000
|127.556
|127.813
|129.433
|130.464
|130.943
|131.438
|132.000
|133.125
|134.091
|135.429
|136.500

|
|
|
|
|
|
|
|
|
|
|
|
|

sxb
1.000
0.691
1.902
2.112
0.844
1.204
1.280
1.778
2.276
2.992
1.959
0.250

sxy= 1.40291
exy=0.770568
axy=0.764713
alpha=
21

3.4.1 Functiile cov si corrcoef

Aceste doua functii sunt specifice sistemului Matlab de baza si pot fi apelate prin:
C=cov(x)
C=cov(x,y)
r=corrcoef(x)

Functia cov calculeaza matricea covariantelor pentru matricea x, unde fiecare coloana este considerata a fi o variabila:
C

x
x x
x

180

Statistica descriptiva

Daca x este vector este returnata varianta vectorului, caz n care se poate folosi si parametrul optional y, care este vector de aceeasi dimensiune cu x, cand este calculata
covarianta dintre x si y, pe langa variantele lui x respectiv y, adica

x x y y

Prin urmare, n acest caz, cov(x,y) produce acelasi rezultat ca si cov([x y]).
Remarcam faptul ca instructiunea diag(cov(x)) genereaza vectorul variantelor
fiecarei coloane a matricei x, iar sqrt(diag(cov(x))) este vectorul abaterilor standard pentru fiecare coloana a matricei x.
Functia corrcoef calculeaza matricea coeficientilor de corelatie pentru matricea x, unde fiecare coloana este considerata o variabila:
r

CC C

Programul 3.4.21. Programul urmator genereaza n vectori aleatori, care urmeaza legea normala bidimensionala, n matricea X de tipul n 2, dupa care, folosind functiile
cov si corrcoef, calculeaza matricele covariantelor si a coeficientilor de corelatie,
pentru cele doua coloane ale matricei X.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); X=mvnrnd(mu,v,n);
v=cov(X); r=corrcoef(X);
fprintf(Matricea covariantelor\n), disp(v)
fprintf(Matricea coeficientilor de corelatie\n), disp(r)

In urma executarii programului, cu valorile mu1=100, mu2=-100, v

n=1000, se obtin rezultatele
Matricea covariantelor
5.1327
4.0419
4.0419
4.0487
Matricea coeficientilor de corelatie
1.0000
0.8867
0.8867
1.0000

5 4
si
4 4

3.4. Corelatie si regresie

181

3.4.2 Functiile lsline, refline si gline

Functiile lsline, refline si gline apartin la Statistics toolbox, apelurile lor
facanduse prin:
lsline
refline
refline(m)
refline(m,n)
gline
gline(f)

Functia lsline reprezinta grafic n figura curenta dreptele de regresie, obtinute

cu metoda celor mai mici patrate, pentru fiecare curba a figurii, care a fost reprezentata grafic cu instructiunea plot, dar nu prin linie continua, ntrerupta sau de tipul
punctlinie.
Functia refline reprezinta grafic n figura curenta dreapta de ecuatie y=mx+n.
Daca lipseste parametrul n, se impune ca parametrul m sa fie un vector avand doua
componente, m(1) reprezentand panta dreptei, iar m(2)=n. Adica n acest caz
dreapta, ce se va reprezenta grafic, va avea ecuatia y=m(1)x+m(2). Daca lipsesc ambele argumente, m si n, efectul functiei refline coincide cu cel al functiei
lsline.
Functia gline reprezinta grafic n figura precizata prin parametrul f, iar daca
acesta lipseste n figura curenta, segmentul de dreapta prin marcarea cu ajutorul
mouse-lui a capetelor segmentului.
Programul 3.4.22. Vom prezenta un program Matlab, care genereaza N vectori aleatori ce urmeaza legea normala bidimensionala, reprezinta grafic norul statistic pentru
aceste date, precum si cele doua drepte de regresie, a lui Y n raport cu X, respectiv a
lui X n raport cu Y.
Dreapta de regresie a lui Y n raport cu X se va reprezenta grafic cu functia
lsline, iar dreapta de regresie a lui X n raport cu Y se va face cu functia refline,
avand n vedere parametrii m si n ai dreptei de regresie definita prin (3.4.1), anume
m

clear,clf, mu(1)=input(m1=); mu(2)=input(m2=);

v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=Z(:,2);

182

Statistica descriptiva
ma=mean(Z); s=std(Z);r=corrcoef([X,Y]);
m=s(2)/(r(1,2)*s(1)); n=ma(2)-m*ma(1);
plot(X,Y,.), lsline, refline(m,n)
text(ma(1),ma(2),o Centrul de greutate)

Pentru datele de intrare N=20, mu=(0,0), v

1
-0.8
se obtin grafi-0.8
1

cele din Figura 3.12.

o Centrul de greutate

3
2

1.5

0.5

1.5

Figura 3.12: Drepte de regresie

3.4.3 Functiile polyfit si refcurve

Functia polyfit este specifica sistemului de baza Matlab, iar functia refcurve
este continuta de Statistics toolbox, fiind folosite n ajustarea datelor prin functii polinomiale.
Apelurile acestor functii se pot face prin:
p=polyfit(x,y,n)
refcurve(p)

Functia polyfit determina coeficientii polinomului de ajustare de grad n, cu me

toda celor mai mici patrate, corespunzator datelor statistice x y . Prima componenta a vectorului p este coeficientul monomului de grad n. Daca n=1, se obtin
coeficientii dreptei de regresie a variabilei Y n raport cu variabila X.
Functia refcurve reprezinta grafic n figura curenta functia polinomiala precizata prin coefcientii p, cu precizarea ca p(1) reprezinta coeficientul monomului
de grad maxim. Daca parametrul p are doua componente, functia este echivalenta cu
functia refline.

3.4. Corelatie si regresie

183

Calculul valorilor unei functii polinomiale se face cu ajutorul functiei polyval,

pe care o prezentam n continuare, mpreuna cu alte functii specifice sistemului Matlab de baza, din acest grup de functii.

3.4.4 Functiile polyval, polyvalm, poly si roots

Forme de apel pentru functiile polyval, polyvalm, poly si roots sunt:
y=polyval(p,x)
y=polyvalm(p,x)
p=poly(a)
p=roots(a)

Functia polyval calculeaza valorile y ale polinomului precizat prin coeficientii

continuti de vectorul p, pe fiecare punct al matricei sau vectorului x.
Functia polyvalm calculeaza matricea patratica y, care reprezinta valoarea matriceala a polinomului precizat prin coeficientii continuti de vectorul p, pentru matricea patratica x, adica
y

p x

daca p are
componente.
Functia poly calculeaza coeficientii polinomului caracteristic al matricei patratice a:

iar cand a este un vector calculeaza coeficientii polinomului care are ca radacini
elementele vectorului, adica ai lui

Functia roots calculeaza radacinile polinomului cu coeficientii dati prin vectorul p.

Programul 3.4.23. Programul urmator va genera matricea Z, care contine N vectori
aleatori ce urmeaza legea normala bidimensionala. Se transforma apoi componenta
a doua a vectorilor aleatori, prin ridicarea acestora la puterea a treia, iar apoi se determina polinomul de ajustare de grad trei, prin folosirea datelor transformate. Polinomul de ajustare obtinut se reprezinta grafic mpreuna cu norul statistic al datelor
transformate.

184

Statistica descriptiva
clf, clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=Z(:,2); p=polyfit(X,Y.3,3);
scatter(X,Y.3,7,filled), hold on,
m=mu(1); s=sqrt(v(1,1));
x=m-3*s:0.01:m+3*s;
y=polyval(p,x); plot(x,y)

Pentru datele de intrare N=25, mu=(0,0), v

1
-0.9
se obtine grafi-0.9
1

cul din Figura 3.13.

25
3

Figura 3.13: Polinom de ajustare de grad 3

3.4.5 Functia polytool

Functia demonstrativa polytool se lanseaza prin:
>>polytool(x,y)
>>polytool(x,y,n)

In urma lansarii se produce un grafic interactiv (demonstrativ) privind polinomul de

ajustare pentru datele continute n vectorii coloana x si y, avand gradul precizat

3.4. Corelatie si regresie

185

prin parametrul n (valoarea implicita este n=1). Schimbarea gradului polinomului

de ajustare se face prin introducerea noii valori n fereastra din partea de sus.
Pe figura este reprezentat norul statistic pentru datele x si y, mpreuna cu graficul
polinomului de ajustare (cu linie continua).
Prin introducerea valorii unui argument n fereastra de jos sau prin deplasarea
dreptei verticale pe pozitia abscisei , pe axa ordonatelor se obtine valoarea corespunzatoare.
Pe langa aceste elemente, graficul demonstrativ contine si alte elemente, care
se refera la notiuni ce urmeaza a fi prezentate n capitolele ce urmeaza, cum ar fi
probabilitate de ncredere si intervale de ncredere.
De asemenea, exista posibilitatea ajustarii datelor cu alte metode decat metoda
celor mai mici patrate. Alegerea unei astfel de metoda se face prin activarea butonului
method din meniu.

3.4.6 Functia nlinfit

Pentru ajustarea neliniara, Statistics toolbox dispune de functia nlinfit, bazata pe
metoda celor mai mici patrate. Apelul functiei se poate face prin:
a=nlinfit(x,y,numef,a0)
[a,r]=nlinfit(x,y,f,a0)

unde numef reprezinta numele functiei, care defineste legatura cautata dintre variabila dependenta, cu valorile continute de vectorul coloana y, variabilele independente, cu valorile continute n coloanele matricei x. Matricea x trebuie sa aiba acelasi
numar de linii ca si lungimea vectorului y.
Parametrul a0 reprezinta valorile de pornire (initiale) ale parametrilor a, care
urmeaza sa fie calculati.
Functia numef poate fi o functie Matlab proprie, care are linia de definitie
function z=numef(a,x)

In urma executarii primei instructiuni, se obtin coeficientii a ai functiei numef,

iar daca se foloseste a doua instructiune se mai obtin si erorile r=y-numef(a,x).
Programul 3.4.24. Vom considera N vectori aleatori ce urmeaza legea normala bidimensionala, pastrati n matricea Z de tipul (N,2). Asupra elementelor coloanei a
doua se efectueaza transformarea data prin functia exp. Daca a doua coloana a lui
Z astfel transformata o consideram ca reprezinta valorile unei variabile dependente
Y, iar prima coloana consideram ca reprezinta valorile unei variabile independente X,
vrem sa determinam legatura de forma
Y

beaX

Procedam n doua moduri, cu ajutorul functiei nlinfit (linie continua pe grafic),

respectiv prin liniarizarea acestei relatii (linie nrerupta pe grafic), adica prin logaritmare: Y b aX

186

Statistica descriptiva
clf, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=exp(Z(:,2));
a=nlinfit(X,Y,expo,[1,1]);
p=polyfit(X,log(Y),1);
a1=p(1); b1=exp(p(2));
scatter(X,Y,7,filled), hold on
m=mu(1); s=sqrt(v(1,1));
x=m-3*s:0.01:m+3*s;
y=expo(a,x); y1=b1*exp(a1*x);
plot(x,y,-,x,y1,--)

1
-0.9
se obtin
-0.9
1

Considerand datele de intrare N=20, mu=(0,0), v

graficele din Figura 3.14.
12

0
3

Figura 3.14: Ajustare neliniara

3.4.7 Functia nlintool

Functia demonstrativa polytool se lanseaza prin:
>>nlintool(x,y,numef,a0)

3.4. Corelatie si regresie

187

In urma lansarii se produce un grafic interactiv (demonstrativ) privind ajustarea datelor continute n vectorul coloana y si matricea x, avand tipul legaturii precizat prin
parametrul numef, care poate fi o functie Matlab proprie.
Pe figura este reprezentat graficul de ajustare (cu linie continua).
Prin introducerea valorii unui argument n fereastra de jos sau prin deplasarea
dreptei verticale pe pozitia abscisei , pe axa ordonatelor se obtine valoarea cores
punzatoare pentru .
Elementele obtinute, prin lansarea acestei functii, pot fi salvate n spatiul de lucru,
workspace, partial sau n totalitate, prin utilizarea butonului export.
Pe langa aceste elemente, graficul demonstrativ contine si alte elemente, care
se refera la notiuni ce urmeaza a fi prezentate n capitolele ce urmeaza, cum ar fi
intervale de ncredere.

3.4.8 Coeficientii Spearman si Kendall

Definit
ia 3.4.25. Fie ,
, rangurile datelor statistice primare

,
, obtinute prin ordonarea crescatoare dupa prima, respectiv a
doua componenta. Numim coeficient de corelatie al rangurilor sau coeficientul lui
Spearman, valoarea numerica

unde si sunt noile caracteristici care definesc rangurile datelor statistice, res
pectiv pentru si .

Proprietatea 3.4.26. Daca notam
diferenta rangurilor aceluiasi
individ, atunci

Demonstratie. Conform definitiei lui avem ca

Deoarece

, rezulta ca

188

Statistica descriptiva

deci numitorul din expresia lui este calculat.

Pentru calcularea numaratorului pornim de la identitatea

care se nsumeaza pentru

. Obtinem n acest fel

adica

Daca se nlocuiesc aceste expresii n formula lui

prietatii.

se obtine relatia din enuntul pro-

Corolarul 3.4.27. Coeficientul lui Spearman verifica relatiile

.

se obtine cand
, adica toate
Demonstratie. Valoarea maxima

rangurile corespunzatoare celor doua caracteristici coincid. Valoarea minima

se va obtine cand diferentele rangurilor sunt maxime, adica rangurile sunt inverse
pentru cele doua caracteristici. In acest caz avem

de unde se obtine, ntr-adevar,

.

Acelasi rezultat se obtine si din faptul ca este definit cu ajutorul
coeficientului

(pentru ranguri) Pearson, despre care stie ca ia valori n intervalul .
Observatia 3.4.28. Pe baza corolarului precedent, vom spune ca pentru
sunt identice, pentru
doua clasamente pentru caracteristicile si

inverse unul celuilalt, iar pentru
sunt independente.

cele
sunt

3.4. Corelatie si regresie

189

Observatia 3.4.29. Cand exista doua sau mai multe date statistice primare care au
aceeasi valoare, atunci rangurile acestora se considera toate egale (ex-aequo) cu media aritmetica a rangurilor pe care le ocupa aceste date n ordonarea crescatoare.

corespunzator vom face modificarea lui .
Daca n ordonarea dupa caracteristica avem grupe de date statistice care

coincid, fiecare grupa continand
, date statistice si daca n ordonarea dupa

caracteristica
avem grupe de date statistice ce coincid, fiecare grupa continand

, date statistice, atunci se modifica dupa cum urmeaza

unde

Definitia 3.4.30. Numim coeficientul lui Kendall relativ la distributia statistica a

caracteristicii bidimensionale , raportul

sign

unde

Proprietatea 3.4.31. Coeficientul lui Kendall satisface relatiile

Demonstratie. Valoarea maxim

a a lui se obtine cand este maxim, adica atunci

, pentru fiecare
cand
.
In acest caz avem ca

deci
.

Valoarea minima a lui se obtine cand este minim,

pentru fiecare
, caz n care

deci

. Prin urmare avem

190

Statistica descriptiva

Observatia 3.4.32. Din proprietatea precedenta, avem ca pentru

clasamente ale celor doua caracteristici
si sunt identice, pentru
inverse unul celuilalt, iar pentru
sunt independente.

cele
doua

sunt

Observatia 3.4.33. Pentru calculul rapid

al lui
, se poate proceda dupa cum ur

meaza. Se ordoneaza datele primare
, n mod crescator dupa prima

componenta. Fie aceasta
calculeaza apoi numarul

, cu

sign

obtinandu-se astfel .
Remarcam de asemenea ca toate formulele relative la coeficientul lui Kendall

raman adevarate dac
a se lucreaza cu rangurile , corespunzatoare datelor statis

,
tice primare
, asa cum s-au introdus pentru definirea coeficientului
lui Spearman.
Observatia 3.4.34. Cand n cele doua clasamente sunt valori egale (ex-aequo) se
procedeaza ca la Observatia 3.4.29, adica se nlocuiesc toate rangurile pentru valorile
egale prin media aritmetic
a a rangurilor pe care le ocupa n ordonare. Corespunzator
se face modificarea lui prin formula

unde
si
cu
definiti la

Observatia 3.4.29. Pentru calculul lui pentru fiecare pereche ex-aequo valoarea lui
ramane neschimbata.

Exemplul 3.4.35. Echipele diviziei nationale de fotbal sunt clasificate dupa numarul
n primele
de goluri primite si dupa numarul cartonaselor galbene primite
meciuri ale campionatului. Datele statistice sunt trecute n tabelul urmator
Echipa

E E E E E E E E E E E E E E E E E E

15 13 10 13 12 11 16 11 13

13 9 11 11 12 8

Sa calculam coeficientii lui Spearman respectiv al lui Kendall. Pentru aceasta ordonam crescator echipele dupa caracteristica , dupa care folosind regula ex-aequo
stabilim rangurile datelor statistice.
Calculele sunt efectuate n tabelul urmator.

3.4. Corelatie si regresie

191

Echipa
E
E
E
E

8
9
9
9
10
10
10
11
11
11
12
13
13
13
14
15
15
16

E
E
E
E
E
E
E
E
E
E
E
E
E
E

Rang

5
8
9
10
11
8
13
8
6
14
12
9
11
9
10
13
11
7

1
3
3
3
6
6
6
9
9
9
11
13
13
13
15
16.5
16.5
18

Rang

1
5
8
10.5
13
5
16.5
5
2
18
15
8
13
8
10.5
16.5
13
3

0
2
5
7.5
7
1
10.5
4
7
9
4
5
0
5
4.5
0
3.5
15

0
4
25
56.25
49
1
110.25
16
49
81
16
25
0
25
20.25
0
12.25
225

0
2
4
6
7
2
9
2
0
8
6
1
3
1
1
2
1
0

17
12
9
7
4
9
1
8
9
0
1
4
1
3
2
0
0
0

715

Total

Numarul grupelor ex-aequo este cinci atat pentru cat si pentru

. Avem astfel

Daca se nlocuiesc aceste valori n formule se obtin coeficientii

192

Statistica descriptiva

Programul 3.4.36. Programul Matlab, care urmeaza, calculeaza cei doi coeficienti,
Spearman si Kendall, fara tratarea cazurilor ex-aequo.
x=[15,13,10,13,12,11,16,11,13,9,10,14,15,9,8,9,10,11];
y=[13,9,11,11,12,8,7,6,9,8,8,10,11,9,5,10,13,14];
[xord,ind]=sort(x); [yord,jnd]=sort(y);
for i=1:18
rx(ind(i))=i; ry(jnd(i))=i;
end
d=abs(rx-ry); d2=d.2;
sp=1-6*sum(d2)/18/(182-1);
ke=0;
for i=1:18
for j=1:18
if i<j
ke=ke+sign((rx(i)-rx(j))*(ry(i)-ry(j)));
end
end
end
ke=2*ke/(18*17);
fprintf( x |
y |rang(x)|rang(y)|
d | d2 \n)
for i=1:18
fprintf(%3d |%4d |%5d |%5d |%4d |%4d\n,...
x(i),y(i),rx(i),ry(i),d(i),d2(i))
end
fprintf(\n sp=%5.3f,
ke=%5.3f,sp,ke)

In urma executarii acestui program, se obtin urmatoarele rezultate:

x
15
13
10
13
12
11
16
11
13
9
10
14
15
9
8
9
10
11

|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|

y
13
9
11
11
12
8
7
6
9
8
8
10
11
9
5
10
13
14

sp=0.269,

|rang(x)|rang(y)|
|
16 |
16 |
|
12 |
7 |
|
5 |
12 |
|
13 |
13 |
|
11 |
15 |
|
8 |
4 |
|
18 |
3 |
|
9 |
2 |
|
14 |
8 |
|
2 |
5 |
|
6 |
6 |
|
15 |
10 |
|
17 |
14 |
|
3 |
9 |
|
1 |
1 |
|
4 |
11 |
|
7 |
17 |
|
10 |
18 |
ke=0.203

d
0
5
7
0
4
4
15
7
6
3
0
5
3
6
0
7
10
8

| d2
|
0
| 25
| 49
|
0
| 16
| 16
| 225
| 49
| 36
|
9
|
0
| 25
|
9
| 36
|
0
| 49
| 100
| 64

3.4. Corelatie si regresie

193

Observatia 3.4.37. (Formula lui Daniels). Coeficientul

de corelatie (al lui Pear

son), coeficientul al lui Spearman si coeficientul al lui Kendall se pot exprima
prin formula unica

Daca se ia

se obtine coeficientul de corelatie .

Intradevar, prin calcule algebrice simple se poate scrie

iar

Daca se ia

astfel ca

se obtine, ca mai nainte, coeficientul al lui Spearman, iar daca se considera

sign

se obtine coeficientul

al lui Kendall.

sign

194

Statistica descriptiva

Definitia 3.4.38. Fie colectivitatea cercetata din punct de vedere a caracteristici

si fie datele statistice primare relative la aceste caracteristici scrise
n matricea

cu matricea

a rangurilor corespunzatoare pentru fiecare caracteristica data prin

Numim coeficientul de concordanta al lui Kendall raportul

unde

Observatia 3.4.39. Fiecare coloana a tabloului rangurilor este o permutare

a nu

merelor
, deci suma elementelor din fiecare coloana este
si prin
urmare

Cand cele clasamente sunt identice, deci coloanele din matricea ranguri

lor sunt identice, totalurile
formeaza o permutare a elementelor

. In acest caz valoarea lui va fi maxima, anume

prin urmare
.
Cand
atunci se obtine valoarea minima
avem independenta ntre caracteristicile cercetate.

, caz n care

Observatia 3.4.40. Cazurile ex-aequo se trateaza ca si pentru doua caracteristici, iar

formula modificata este

3.4. Corelatie si regresie

195

este numarul datelor ex-aequo pentru caracteristica .

Exemplul 3.4.41. Se considera familii pentru care sunt cercetate urmatoarele caracteristici , , , reprezentand cheltuielile (n sute de lei) zilnice pentru
paine, legume, fructe, carne respectiv. S-au obtinut urmatoarele date statistice

unde

Vrem sa calculam coeficientul de concordanta al lui Kendall.

Pentru a calcula coeficientul de concordanta al lui Kendall, se determina rangurile
datelor statistice pentru fiecare caracteristica n parte. Matricea rangurilor este

De asemenea, avem ca sumele rangurilor de pe fiecare line a matricei rangurilor sunt

, deci

196

Statistica descriptiva

Coeficientul de concordanta al lui Kendall va fi

Programul 3.4.42. Un program Matlab, care efectueaza aceste calcule, este prezentat n continuare
x=[332,428,354,1437;293,559,388,1527;372,767,562,1948;
406,563,341,1509;386,608,396,1501;438,843,689,2345;
534,660,367,1620;460,699,483,1856;385,789,621,2366;
655,776,423,1848;584,995,548,2056;515,1097,887,2630];
N=12; p=4;
[x1,i1]=sort(x(:,1)); [x2,i2]=sort(x(:,2));
[x3,i3]=sort(x(:,3)); [x4,i4]=sort(x(:,4));
for i=1:12
r1(i1(i))=i; r2(i2(i))=i; r3(i3(i))=i; r4(i4(i))=i;
end
r=[r1,r2,r3,r4]; sb=sum((sum(r)-sum(sum(r))/12).2);
w=12*sb/(p2*(N3-N));
fprintf(
Matricea rangurilor\n)
for i=1:12
fprintf(%6d |%3d |%3d |%3d\n,r1(i),r2(i),r3(i),r4(i))
end
fprintf(\n
w=%5.3f,w)

iar rezultatele obtinute, n urma executarii programului, sunt

Matricea
2 | 1
1 | 2
3 | 7
6 | 3
5 | 4
7 | 10
10 | 5
8 | 6
4 | 9
12 | 8
11 | 11
9 | 12

rangurilor
| 2 | 1
| 4 | 4
| 9 | 8
| 1 | 3
| 5 | 2
| 11 | 10
| 3 | 5
| 7 | 7
| 10 | 11
| 6 | 6
| 8 | 9
| 12 | 12

w=0.735

Capitolul 4

Teoria selectiei
Studiul statistic al unei colectivitat i din punct de vedere al uneia sau mai multor caracteristici prin considerarea tuturor indivizilor colectivitatii de multe ori este
imposibil de efectuat sau foarte costisitor. Daca ne gandim, de exemplu, la studiul calitatii produselor unei fabrici de conserve, ne dam seama ca nu are sens considerarea
tuturor acestor produse pentru efectuarea controlului, ceea ce ar duce la distrugerea
ntregii productii. De asemenea, daca se are n vedere recensamantul populatiei unei
ta ri, ne dam seama de costul ridicat al acestei operatii, motiv pentru care astfel de
recensaminte sunt destul de rare.
Si numai din cele doua exemple amintite nainte, ne dam seama ca ar fi potrivit
ca sa fie considerata pentru studiu numai o parte a colectivitat ii cercetate, iar apoi
rezultatele obtinute relative la aceasta parte sa fie extinse la ntreaga colectivitate.

4.1 Tipuri de selectie

Definitia 4.1.1. Numim esantion (selectie, sondaj) relativ la colectivitatea
o
submultime de indivizi a lui , care urmeaza sa fie cercetati din punct de vedere
a uneia sau mai multor caracteristici, iar numarul indivizilor din esantionul se
numeste volumul esantionului.
Observatia 4.1.2. Modurile de obtinere a esantionului
atoare si respectiv metode aleatoare de selectie.

ne conduc la metode neale-

Dintre metodele nealeatoare amintim:

selectia sistematica, cand indivizii care intra n esantion sunt considerati dupa

o anumita regula, de exemplu din n ;
197

198

Teoria selectiei
selectie tipica, cand, cunoscandu-se informatii anterioare referitoare la colectivitate, sunt considerati indivizi cu valori medii apropiate de valoarea medie a
ntregii colectivitat i;
selectie stratificata, cand colectivitatea este clasificata (stratificata) dupa anumite criterii, cunoscanduse proportia indivizilor pentru fiecare strat. Esantionul se ia astfel ncat sa fie respectate aceste proportii pentru fiecare strat.

Pentru metodele aleatoare, fiecare individ al colectivitat ii poate sa intre n esantion

cu aceasi probabilitate (selectie cu probabilitat i egale) sau cu probabilitat i diferite.
Metodele aleatoare de selectie sunt:
repetate (bernoulliene), cand individul, ce intra n esantion, dupa ce a fost cercetat, este reintrodus n colectivitate;
nerepetate, cand individul ce intra n esantion, dupa ce a fost cercetat, nu este
reintrodus n colectivitate.
Observatia 4.1.3. Daca volumul colectivitat ii este mult mai mare decat volumul esantionului, atunci o selectie nerepetata poate fi considerata ca fiind de tip repetat.
Aceasta are la baza rezultatul privind comportarea asimptotica a legii hipergeometrice
ca si o lege binomiala (a se vedea Observatia 2.4.4).

4.2 Functii de selectie

In cele ce urmeaza vom considera ca avem de fiecare data o selectie repetata.
Definitia 4.2.1. Fie colectivitatea cercetata din punct de vedere al caracteristicii
. Numim date de selectie relative la caracteristica datele statistice
privind indivizii care intra n esantion.
Observatia 4.2.2. Datele de selectie pot fi considerate ca fiind valorile unor variabile

, numite variabile de selectie si care n cazul unei selectii
aleatoare
repetate sunt variabile aleatoare independente, identic repartizate cu .
Definitia 4.2.3. Numim functie de selectie sau statistica variabila aleatoare

unde
este o functie masurabila, iar
numeste valoarea functiei de selectie.

4.2. Functii de selectie

199

4.2.1 Media de selectie

Definitia 4.2.4. Numim medie de selectie functia de selectie

iar

se numeste valoarea mediei de selectie.

Proprietatea 4.2.5. Fie caracteristica

persia
, atunci

avand valoarea medie

si dis-

Demonstratie. Folosind proprietat ile valorii medii si ale dispersiei si avand n vedere
ca selectia este repetata avem succesiv

Observatia 4.2.6. In cazul n care caracteristica urmeaza legea normala

,

atunci , fiind o combinatie liniara de variabile aleatoare independente, ce urmeaza fiecare aceasi lege normala, va urma de asemenea legea normala (a se vedea

Observatia 2.5.6). Pe baza proprietat ii precedente va urma asadar legea normala

.

Proprietatea 4.2.7. Fie caracteristica avand valoarea medie

persia
, atunci statistica
(4.2.1)

si dis-

, iar cand urmeaza
converge n repartitie la legea normala
, cand

legea normala
afirmatia are loc pentru orice valoare a lui .

Proprietatea nu reprezinta altceva decat Teorema 2.7.8.

200

Teoria selectiei

Functia 4.2.8. Pentru ilustrarea proprietat ii precedente, scriem o functie Matlab, care
genereaza o matrice de tipul (n,m), ale carei elemente sunt numere aleatoare ce urmeaza o lege de probabilitate precizata. Pentru fiecare coloana a matricei generate, se
calculeaza valoarea zn , folosind formula (4.2.1), dupa care se reprezinta grafic histo .
grama valorilor zn , mpreuna cu densitatea de probabilitate a legii normale
function hist2(n,m,lege)
% Comportare asimptotica a mediei de selectie
% lege - legea de probabilitate
% (n,m) - tipul matricei generate
switch lege
case unid
N=input(N=);
X=unidrnd(N,n,m); [med,var]=unidstat(N);
case bino
nn=input(n=); p=input(p=);
X=binornd(nn,p,n,m); [med,var]=binostat(nn,p);
case hyge
M=input(M=); K=input(K=); nn=input(n=);
X=hygernd(M,K,nn,n,m); [med,var]=hygestat(M,K,nn);
case poiss
la=input(lambda=);
X=poissrnd(la,n,m); [med,var]=poisstat(la);
case nbin
r=input(r=); p=input(p=);
X=nbinrnd(r,p,n,m); [med,var]=nbinstat(r,p);
case geo
p=input(p=);
X=geornd(p,n,m); [med,var]=geostat(p);
case unif
a=input(a:); b=input(b(a<b):);
X=unifrnd(a,b,n,m); [med,var]=unifstat(a,b);
case norm
mu=input(mu=); s=input(sigma=);
X=normrnd(mu,s,n,m); [med,var]=normstat(mu,s);
case logn
mu=input(mu=); s=input(sigma=);
X=lognrnd(mu,s,n,m); [med,var]=lognstat(mu,s);
case gam
a=input(a=); b=input(b=);
X=gamrnd(a,b,n,m); [med,var]=gamstat(a,b);
case exp
mu=input(mu=);
X=exprnd(mu,n,m); [med,var]=expstat(mu);
case beta
a=input(a=); b=input(b=);
X=betarnd(a,b,n,m); [med,var]=betastat(a,b);
case weib
a=input(a=); b=input(b=);

4.2. Functii de selectie

201

X=weibrnd(a,b,n,m); [med,var]=weibstat(a,b);
case rayl
b=input(b=);
X=raylrnd(b,n,m); [med,var]=raylstat(b);
case t
nn=input(n=);
X=trnd(nn,n,m); [med,var]=tstat(nn);
case chi2
nn=input(n=);
X=chi2rnd(nn,n,m); [med,var]=chi2stat(nn);
case f
mm=input(m=); nn=input(n=);
X=frnd(mm,nn,n,m); [med,var]=fstat(mm,nn);
otherwise
error(Lege necunoscuta)
end
Z=mean(X); Z=(Z-med)/sqrt(var/n);
hist(Z,fix(1+10/3*log10(m)), hold on
x=-3:0.01:3; f=normpdf(x,0,1);
plot(x,f,k-), colormap spring

Apelul functiei hist2 se face prin

>>hist2(n,m,lege)

unde valorile pentru n, m si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>hist2(25,35,unif)

are ca efect apelul functiei pentru legea uniforma, iar pe ecran se va cere introducerea

parametrilor a si b (a b), dupa care pe ecran va fi reprezentat graficul din Figura 4.1,
n cazul n care a=-1 si b=1. Sa remarcam totusi ca la un nou apel, cu aceeasi
parametri, graficul difera, deoarece sunt generate alte numere aleatoare.

4.2.2 Momente de selectie

Definitia 4.2.9. Numim moment de selectie de ordin

iar

functia de selectie

se numeste valoarea momentului de selectie de ordin .

Observatia 4.2.10. Se vede imediat ca

Proprietatea
4.2.11. Fie

caracteristica

ordin ,
, atunci

pentru care exista momentul teoretic de

202

Teoria selectiei
12

0
3

Figura 4.1: Legea

iar pentru

, avem ca

converge n repartitie la legea normala

Demonstratie. Deoarece selectia este repetata putem scrie succesiv

Ultima afirmatie rezulta prin aplicarea Teoremei 2.7.8 sirului de varia

bile aleatoare
si identic repartizate. Anume, deoarece

independente

, avem

4.2. Functii de selectie

203

dar converge n repartitie la legea normala

, ceea ce ncheie demonstratia.

Definitia 4.2.12. Numim moment centrat de selectie de ordin

iar

functia de selectie

se numeste valoarea momentului centrat de selectie de ordin .

Observatia 4.2.13. Se
vede imediat ca
, iar momentul centrat de ordinul doi
se poate scrie .

Proprietatea 4.2.14. Fie caracteristica pentru care exista momentul teoretic ,

atunci pentru momentul centrat de ordinul doi avem

unde

, si de asemenea

Demonstratie. Pentru prima relatie scriem succesiv

Daca se retin extremitatile sirului de egalitati avem prima relatie.

consideram variabilele aleatoare reduse, notate prin
a calcula dispersia,

Pentru
, , care sunt independente si identic repartizate si pentru
, ,
care
.
Se arata usor ca

unde

204

Teoria selectiei
Pe de alta parte avem ca

apoi

deoarece
avem

, pentru orice

Pentru ultimul termen

Calculam pe rand termenii din membrul drept al aceste relatii. Astfel avem

de unde se obtine

. Pentru aceasta avem

A ramas, prin urmare, de calculat

4.2. Functii de selectie

Termenii lui
ca factor pe

205

, care nu au fost luati n considerare, sunt nuli deoarece contin

. Obtinem n acest fel ca

deci pentru dispersie avem succesiv

deoarece

, cand

Asadar

Observatia 4.2.15. Din proprietatea precedenta avem ca

deci

, caz n care

, deci

Pentru ultima relatie putem considera

avem

adica

, avem ca statisticile si sunt necorelate
Deoarece
, iar daca are distributia simetrica ( ), atunci si sunt
pentru
necorelate pentru orice .

206

Teoria selectiei
De asemenea se poate arata ca statistica

converge n repartitie la legea normala

, cand

Definitia 4.2.16. Numim dispersie de selectie functia de selectie

iar valoarea numerica

se numeste valoarea dispersiei de selectie.

Observatia 4.2.17. Intre momentul centrat de selectie de ordinul doi si dispersia de
selectie exista relatia

(4.2.2)

Ca urmare avem ca

pentru care exista momentul centrat teo

, atunci

Proprietatea 4.2.18.
Fie caracteristica

retic

Demonstratie. Folosind formula binomului avem ca

Fara a restrange generalitatea,

se poate considera ca

tile
,
. Putem scrie atunci

, deci au loc egalita-

4.2. Functii de selectie

207

Pe de alta parte, din inegalitatea lui Schwarz, se obtine ca

Daca se are n vedere Proprietatea 4.2.11, rezulta ca

Se poate arata, de asemenea, ca

warz se obtine

. Astfel din inegalitatea lui Sch

In cazul

, se calculeaza direct

Luand n considerare aceste evaluari, se obtine n final

4.2.3 Coeficient de corelatie de selectie

Observatia 4.2.19. Printro cale analoga, se poate obtine ca

Definitia 4.2.20. Fie caracteristica bidimensinal

a si o selectie repetata de

volum , cu
datele de selectie ,
, si respectiv variabilele de selectie

,
. Numim coeficient de corelatie de selectie functia de selectie

208

Teoria selectiei

iar valoarea numerica

se numeste valoarea coeficientului de corelatie de selectie.

Observatia 4.2.21. Fisher a aratat ca pentru o caracteristica bidimensionala ,

care urmeaza legea normala
, densitatea de probabilitate a coeficientului de corelatie de selectie este

De asemenea, daca se considera transformarea (lui Fisher)

ln atunci urmeaza aproximativ legea normala

, avem densitatea de probabilitate a lui exprimata prin

In cazul particular

a
ln si dac

.

iar statistica
(4.2.3)
urmeaza legea Student cu

grade de libertate.

Programul 4.2.22. Vom scrie un program, care genereaza de N ori cate n vectori
aleatori, ce urmeaza legea normala bidimensionala, avand coeficientul de corelatie
dintre cele doua componente nul, adica r=0. Folosind aceste date se vor calcula
N numere aleatoare dupa regula precizata prin statistica (4.2.3), iar histograma corespunzatoare acestor noi date va fi reprezentata grafic mpreuna cu densitatea de
probabilitate a legii Student cu n-2 grade de libertate.
clear,clf,
mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=0; v(2,1)=0;

4.2. Functii de selectie

209

n=input(n=); N=input(N=);
for k=1:N
Z=mvnrnd(mu,v,n); r=corrcoef(Z); r12=r(1,2);
t(k)=sqrt(n-2)*r12/sqrt(1-r122);
end
x=-3:0.01:3; f=tpdf(x,n-2);
nn=fix(1+10/3*log10(N));
[fr,cl]=hist(t,nn); h=cl(2)-cl(1);
bar(cl,fr/(h*N),1),hold on, plot(x,f,k-)
colormap spring

2 0
se obtin graficele din Figura 4.2.
0 3

Pentru N=50, n=20, mu=(5,10), v

0.45

0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
3

Figura 4.2: Legea

Lema 4.2.23 (Fisher). Daca variabilele aleatoare

sunt indepen
dente, fiecare urmand legea normala
si daca se considera matricea orto

normata
, atunci variabilele aleatoare

sunt independente, fiecare urmand legea normala

Demonstratie. Pentru a arata ca variabilele aleatoare ,

, sunt independente

. Pornind de
determinam functia caracteristica a vectorului aleator

210

Teoria selectiei

la definitia functiei caracteristice avem

Variabilele aleatoare

, fiind independente se obtine

Fiecare factor din membrul drept este

valoarea functiei caracteristice a legii normale

, pe punctele, respectiv ,
, adica

Folosind conditiile de ortonormalitate relative la coeficientii , se obtine ca

adica faptul ca
care legea normala

sunt variabile aleatoare independente, ce urmeaza fie-

Proprietatea 4.2.24. Fie caracteristica , ce urmeaza legea normala
si va

riabilele de selectie
, ce corespund unei selectii repetate de volum ,
atunci statisticile

sunt variabile aleatoare

independente, ce urmeaza legea normala

tiv legea
cu
grade de libertate.

si respec-

4.2. Functii de selectie

211

Demonstratie. Se considera matricea ortonormata

pentru care se aplica Lema 4.2.23.

Pe de o parte avem ca

sunt independente rezulta ca si sunt independente.

Deoarece
urmeaza legea normala , iar fiind suma
Pe de alta
parte
patratelor a
variabile aleatoare independente,
fiecare urmand legea normala

, obtinem ca
urmeaza legea
cu
grade de libertate (a se vedea
legea prezentata n Capitolul 2).

si
Proprietatea 4.2.25. Fie caracteristica , ce urmeaza legea normala

variabilele de selectie
, ce corespund unei selectii repetate de volum , atunci statisticile

sunt variabile aleatoare

independente, ce urmeaza respectiv legea normala

si legea
cu
grade de libertate.
Demonstratie. Se considera variabilele aleatoare

212

Teoria selectiei

care sunt variabile aleatoare independente ce urmeaza fiecare legeanormala
.

Prin aplicarea Proprietatii 4.2.24 pentru variabilele aleatoare ,
, se obtine
afirmatia facuta. Intr-adevar avem ca

Proprietatea 4.2.26. Fie caracteristica , ce urmeaza legea normala

si

, ce corespund unei selectii repetate de vovariabilele de selectie
lum , atunci statistica

(4.2.4)
urmeaza legea Student cu

grade de libertate.

Demonstratie. Cu notatiile de la Proprietatea 4.2.25, aratam ca

Intr-adevar, avem succesiv

Din teoria probabilitat ilor se stie ca raportul dintre o variabila aleatoare, ce urmeaza

legea normala
si radicalul unei variabile aleatoare ce urmeaza legea , raportata la numarul gradelor de libertate, n cazul n care cele doua variabile aleatoare
sunt independente, este o variabila aleatoare, ce urmeaza legea Student cu acelasi
numar al gradelor de libertate ca legea considerata (a se vedea legile si pre
zentate n Capitolul 2). Avand n vedere cine sunt si rezulta afirmatia din
enuntul proprietatii.

4.2. Functii de selectie

213

Programul 4.2.27. Pentru ilustrarea acestui rezultat, programul Matlab, care urmeaza, genereaz
a legea nor a o matrice de tipul (n,m) de numere aleatoare, ce urmeaz
mala
, dupa care pentru fiecare coloana a matricei generate, se construiesc
datele aleatoare conform statisticii (4.2.4). Pentru aceste date se reprezinta grafic histograma corespunzatoare, mpreuna cu densitatea de probabilitate a legii Student cu
n-1 grade de libertate.
clear,clf, mu=input(mu=); sigma=input(s=);
n=input(n=); m=input(m=);
Z=normrnd(mu,sigma,n,m);
t=(mean(Z)-mu)./sqrt(var(Z)/n);
x=-3:0.01:3; f=tpdf(x,n-1);
nn=fix(1+10/3*log10(m));
[fr,clasa]=hist(t,nn);
h=clasa(2)-clasa(1);
bar(clasa,fr/(h*m),1)
hold on, plot(x,f,k-)
colormap([.7,.7,.7])

Pentru n=15, m=100, mu=5 si sigma=2, se obtin graficele din Figura 4.3.
0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
3

Figura 4.3: Legea

Proprietatea 4.2.28. Fie caracteristicile

independente
si , fiecare urmand

legea
normala, respectiv
si
si variabilele de selectie

, respectiv

, ce corespund unei selectii repetate de volum

pentru caracteristica si unei selectii repetate de volum
pentru caracteristica

214

Teoria selectiei

, atunci statistica

(4.2.5)

unde

urmeaza legea Student cu

grade de libertate.

Demonstratie. Conform Observatiei 4.2.6, avem ca mediile de select ie si

urmeaza fiecare legea normala respectiv

si

. Prin urmare
statistica

urmeaza legea normala
.
Pe de alta parte, folosind Proprietatea 4.2.25, se obtine ca statistica

cu grade de libertate, fiind suma a doua variabile

urmeaza legea
aleatoare
independente, ce urmeaza legea

grade de libertate.

grade de libertate si respectiv

Ca si la demonstratia Proprietatii 4.2.26, statistica

urmeaza legea

Student cu
grade de libertate. Mai ramane de aratat ca aceasta statistica
este chiar statistica . Intr-adevar, avem succesiv

4.2. Functii de selectie

215

ceea ce trebuie demonstrat.

Observatia 4.2.29. Daca se consider
a caracteristicile independente
si , fiecare

si respectiv
urmand legea normal
a

s

i
dac
a
avem variabilele

de selectie
, ce corespund unei select

ii
repetate
de
volum
relativa

ce corespund unei

la caracteristica si variabilele
de
select

ie

selectii repetate de volum
relativa la caracteristica , atunci statistica

urmeaza legea normala

Proprietatea 4.2.30. Fie caracteristicile

independente
si , fiecare urmand

legea
normal
a, respectiv
si
si variabilele de selectie

, respectiv

, ce corespund unei selectii repetate de volum

pentru
caracteristica si unei selectii repetate de volum
pentru caracteristica

, atunci statistica

(4.2.6)

urmeaza legea FisherSnedecor cu

grade de libertate.

Demonstratie. Din Proprietatea 4.2.25, avem ca functiile de selectie

urmeaza fiecare legea
cu
si
grade de libertate.

Pe de alta parte, deoarece si sunt independente,
si
sunt indepen

dente. Din calculul probabilitat ilor (a se vedea legea f prezentata n Capitolul 2) este
cunoscut ca raportul a doua variabile aleatoare independente, ce urmeaza legea ,
raportate fiecare la numarul gradelor de libertate corespunzator, este o variabila aleatoare, ce urmeaza legea FisherSnedecor cu numarul gradelor de libertate date de
numerele gradelor de libertate ale celor doua legi . Asadar avem ca

urmeaza legea FisherSnedecor cu

grade de libertate.

216

Teoria selectiei

Observatia 4.2.31. Daca urmeaza legea FisherSnedecor cu si grade de li

bertate, atunci urmeaza legea FisherSnedecor cu si grade de libertate. Prin
urmare, daca notam cu cuantila
arul pen de ordin a lui , adica, num

unde
tru care are loc

atunci avem ca

este cuantila de ordin a lui . Intr-adevar avem ca relatia care defineste

,
este echivalenta cu
sau cu

relatia
Comparand ultima relatie cu relatia care defineste

cuantila , se obtine relatia dintre cele doua cuantile mai sus precizata.
pe

Programul 4.2.32. Pentru ilustrarea Proprietatilor 4.2.28 si 4.2.30, vom genera doua
matrice de tipurile (n1,m) si (n2,m), ale
aror elemente
sunt numere aleatoare, ce
c

s
i
urmeaza respectiv legile normale
. Folosind cele doua matrice se vor determina, pentru fiecare pereche de coloane cu acelasi numar de ordine,
din cele doua matrice, datele construite conform definitiilor statisticilor (4.2.5) si
(4.2.6). Datele astfel obtinute se reprezinta grafic folosind histogramele corespunzatoare, mpreuna cu densitatea legii Student cu n1+n2-2 grade de libertate, respectiv
a legii FisherSnedecor cu n1-1 si n2-1 grade de libertate.
clear,clf
mu1=input(mu1=); s1=input(sigma1=);
mu2=input(mu2=); s2=input(sigma2=);
n1=input(n1=); n2=input(n2=); m=input(m=);
X1=normrnd(mu1,s1,n1,m); X2=normrnd(mu2,s2,n2,m);
t=(mean(X1)-mean(X2)-mu1+mu2);
t=t./sqrt((n1-1)*var(X1)+(n2-1)*var(X2));
t=t*sqrt((n1+n2-2)/(1/n1+1/n2));
f=(var(X1)/s12)./(var(X2)/s22);
x1=-3:0.01:3; x2=0:0.01:6;
f1=tpdf(x1,n1+n2-2); f2=fpdf(x2,n1-1,n2-1);
nn=fix(1+10/3*log10(m));
[fr1,c1]=hist(t,nn); [fr2,c2]=hist(f,nn);
h1=c1(2)-c1(1); h2=c2(2)-c2(1);
subplot(1,2,1)
bar(c1,fr1/(m*h1),1), hold on, plot(x1,f1,k-)
hold off
subplot(1,2,2)
bar(c2,fr2/(m*h2),1), hold on, plot(x2,f2,k-)
colormap([.7,.7,.7])

Pentru n1=15, n2=20, m=50, mu1=5, mu2=10, sigma1=2 si sigma2=3, se

obtin graficele din Figura 4.4.

4.2.4 Functie de repartitie de selectie

Definitia 4.2.33. Fie caracteristica

si variabilele de selectie

cercetata, datele de selectie

. Numim functie de repartitie de selectie,

4.2. Functii de selectie

217

0.5

0.9

0.45

0.8

0.4

0.7

0.35
0.6
0.3
0.5
0.25
0.4
0.2
0.3
0.15
0.2

0.1

0.05

0
4

Figura 4.4: Legea

functia de selectie definita prin

unde
iar

card

legea

card

se numeste valoarea functiei de repartitie de selectie.

Observatia 4.2.34. Valoarea functiei de repartitie selectie este o functie n scara de
o variabila reala. Daca datele de selectie sunt ordonate crescator, atunci

daca

daca
daca

De asemenea, functia de repartitie de selectie, se vede ca este o variabila aleatoare

de tip discret si care are distributia

218

Teoria selectiei

Pentru demonstratia unui rezultat fundamental al statisticii matematicii, descoperit de matematicianul rus Glivenko, vom prezenta doua leme.

Lema 4.2.35. Fie sirul de evenimente
astfel ncat
, avem .
atunci, pentru evenimentul

Demonstratie. Aratam la nceput ca proprietatea enuntata are loc pentru un numar

finit de evenimente. Demonstratia o facem prin inductie dupa .

Pentru
, avem
, de unde
,
care nlocuita n relatia

conduce la .
ca proprietatea are
loc pentru

Presupunem

. Din nou avem ca

si aratam ca este adevarat

a si pentru

, deci
.
Scriem formula lui Poincare si tinem seama de ipoteza inductiei, ceea ce conduce la

Retinem extremitatile si vom obtine

.

Cand sirul de evenimente este infinit, avem n vedere scrierea lui ca urmatoarea
intersectie de evenimente

adica

unde evenimentele intersectiei satisfac relatiile

4.2. Functii de selectie

219

Conform teoremei de continuitate din teoria probabilitat ilor si

avand n vedere prima
parte a demonstratiei putem ncheia prin

Din calculul probabilitat ilor este cunoscuta forma tare a teoremei lui Bernoulli
sau teorema lui Borel si care o dam sub forma unei leme.
Lema 4.2.36. Se considera repetari independente ale
unui experiment. La fiecare
repetare evenimentul apare cu probabilitatea . Fie frecventa absoluta a aparitiei
evenimentului n cele repetari, atunci

adica frecventa relativa a aparitiei evenimentului converge tare (aproape sigur) la

probabilitatea de aparitie a evenimentului .

Teorema 4.2.37 (Glivenko). Fie caracteristica care are functia de repartitie teoretica si fie o selectie repetata de volum relativa la caracteristica cu variabi

lele de selectie
si functia de repartitie de selectie corespunzatoare, atunci

adica functia de repartitie de selectie converge aproape sigur la functia de repartitie

teoretica.
Demonstrat
ie. Se considera
, definite prin relatia

oarecare, dar fixat, si consideram numerele

se obtine dupa cum este aratat n Figura 4.5 si reprezinta

Geometric, punctul

cuantila de ordin
Daca se considera evenimentul
, atunci avem

card

Prin urmare este frecventa relativa a aparitiei evenimentului si conform
si

Lemei 4.2.36 rezulta ca

220

Teoria selectiei
1

y=k/r

xr,k

y=k/r

r,k

y=k/r

xr,k

Figura 4.5: Determinarea cuantilei

. Se poate renunta la valoarea
, deoarece

.

Notam prin evenimentul

cand

Deoarece ,
, conform Lemei 4.2.35, rezulta ca
pentru
fiecare

nseamna

unde evenimentul

In mod analog, considerand evenimentul

cand

, se obtine ca

4.2. Functii de selectie

. Daca se noteaza prin

pentru fiecare

evenimentul

, care nseamna

221

cand

atunci
.
Daca se considera evenimentul

cand

, care nseamna

, conform Lemei 4.2.35, avem
atunci
. In acest fel, daca
, adica

Aratam n continuare implicatia

din care se va obtine

deci

Pentru aceasta sa consideram oarecare. Pentru orice va exista

astfel ncat . Avand n vedere ca si sunt functii
nedescrescatoare, putem sa scriem urmatoarele inegalitati:

de unde se obtine

222

Teoria selectiei
Pe de alta parte, din modul de definire a numerelor ,

de unde

, avem ca

Utilizate n dubla inegalitate de mai nainte, conduc la

Din prima inegalitate se obtine

de unde

Din a doua inegalitate se obtine

Folosind cele doua inegalitati obtinute rezulta ca
, unde

de unde
, pentru orice .

, care conduce la
In final avem ca

implicatia care trebuia demonstrata.

Teorema 4.2.38 (Kolmogorov). Fie caracteristica care are functia de repartitie

teoretica continua si fie o selectie repetata de volum relativa la caracteristica

4.2. Functii de selectie

223

cu variabilele de selectie

selectie , atunci

si corespunzator functia de repartitie de

unde

iar

este functia lui Kolmogorov.

Observatia 4.2.39. Teorema lui Kolmogorov reprezinta comportarea asimptotica
a distantei dintre functia de repartitie de selectie si functia de repartitie teoretica.
Demonstratia poate fi gasita n [56].
Observatia 4.2.40. Functia lui Kolmogorov este tabelata, pentru anumite valori, n
Anexa V.
Observatia 4.2.41. Pentru calculul valorilor aproximative ale functiei lui Kolmogorov se pot utiliza urmatoarele formule de aproximare

daca
daca

daca

4.2.5 Functia cdfplot

Statistics toobox dispune de functia cdfplot, care reprezinta grafic functia de
repartitie de selectie. Apelul functiei se poate face prin:
cdfplot(x)
h=cdfplot(x)
[h,stats]=cdfplot(x)

Prima forma reprezinta grafic functia de repartitie de selectie corespunzatoare datelor continute de vectorul x, caracteristici cum ar fi culoarea, tipul liniei etc. sunt
considerate implicit de sistemul Matlab. Pentru modificarea unor astfel de caracteristici, adica alegerea acestora de catre utilizator, se recomanda a doua forma, prin care
parametrul h poate fi folosit n comanda set.

224

Teoria selectiei

Parametrul stats contine, dupa executarea functiei, o parte din parametrii statsitici pentru x. Acestia sunt: valoarea minima (stats.min), valoarea maxima
(stats.max), valoarea mediei de selectie (stats.mean), valoarea medianei
(stats.median) si abaterea standard (stats.std).
Functia 4.2.42. Functia Matlab care urmeaza genereaza n numere aleatoare, care urmeaza o lege de probabilitate precizata, dupa care reprezinta grafic, pe aceeasi figura,
functia de repartitie teoretica prin linie-punct, mpreuna cu functia de repartitie de
selectie.
function compar(n,lege)
% Functie de repartitie de selectie
% lege - legea de probabilitate
% n - volumul datelor
clf
switch lege
case unid
N=input(N=);
X=unidrnd(N,n,1); [med,var]=unidstat(N);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,N);
case bino
m=input(n=); p=input(p=);
X=binornd(m,p,n,1); [med,var]=binostat(m,p);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,m,p);
case hyge
M=input(M=); K=input(K=); m=input(n=);
X=hygernd(M,K,m,n,1); [med,var]=hygestat(M,K,m);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,M,K,m);
case poiss
la=input(lambda=);
X=poissrnd(la,n,1); [med,var]=poisstat(la);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,la);
case nbin
r=input(r=); p=input(p=);
X=nbinrnd(r,p,n,1); [med,var]=nbinstat(r,p);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,r,p);
case geo
p=input(p=);
X=geornd(p,n,1); [med,var]=geostat(p);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,p);
case unif
a=input(a:); b=input(b(a<b):);
X=unifrnd(a,b,n,1); [med,var]=unifstat(a,b);

4.2. Functii de selectie

x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,a,b);
case norm
mu=input(mu=); s=input(sigma=);
X=normrnd(mu,s,n,1); [med,var]=normstat(mu,s);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,mu,s);
case logn
mu=input(mu=); s=input(sigma=);
X=lognrnd(mu,s,n,1); [med,var]=lognstat(mu,s);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,mu,s);
case gam
a=input(a=); b=input(b=);
X=gamrnd(a,b,n,1); [med,var]=gamstat(a,b);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,a,b);
case exp
mu=input(mu=);
X=exprnd(mu,n,1); [med,var]=expstat(mu);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,mu);
case beta
a=input(a=); b=input(b=);
X=betarnd(a,b,n,1); [med,var]=betastat(a,b);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,a,b);
case weib
a=input(a=); b=input(b=);
X=weibrnd(a,b,n,1); [med,var]=weibstat(a,b);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,a,b);
case rayl
b=input(b=);
X=raylrnd(b,n,1); [med,var]=raylstat(b);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,b);
case t
m=input(n=);
X=trnd(m,n,1); [med,var]=tstat(m);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,m);
case chi2
m=input(n=);
X=chi2rnd(m,n,1); [med,var]=chi2stat(m);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,m);
case f
m1=input(m=); m2=input(n=);

225

226

Teoria selectiei
X=frnd(m1,m2,n,1); [med,var]=fstat(m1,m2);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,m1,m2);
otherwise
error(Lege necunoscuta)
end
plot(x,f,k-.), hold on, cdfplot(X), grid off
title(Functia de repartitie de selectie)

Apelul functiei compar se face prin

>>compar(n,lege)

unde valorile pentru n si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>compar(25,bino)

are ca efect apelul functiei pentru legea binomiala, iar pe ecran se va cere introducerea
parametrilor n si p, dupa care pe ecran va fi reprezentat graficul din Figura 4.6, n
cazul n care n=7 si p=0.4.
Functia de repartitie de selectie
1

0.9

0.8

0.7

F(x)

0.6

0.5

0.4

0.3

0.2

0.1

0
2

Figura 4.6: Legea

Comanda
>>compar(15,norm)

are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introducerea parametrilor mu si sigma, dupa care pe ecran va fi reprezentat graficul din
Figura 4.7, n cazul n care mu=5 si sigma=2.

4.2. Functii de selectie

227

Functia de repartitie de selectie

0.9

0.8

0.7

F(x)

0.6

0.5

0.4

0.3

0.2

0.1

0
2

Figura 4.7: Legea

228

Teoria selectiei

Capitolul 5

Teoria estimatiei
Relativ la colectivitatea este cercetata caracteristica , care urmeaza legea de pro
babilitate data prin functia de probabilitate , ce reprezinta functia de frecventa
daca este de tip discret, respectiv densitatea de probabilitate n cazul continuu, iar

este un parametru real necunoscut. Se considera o selectie repetata de volum

avand corespunzator variabilele de selectie
.

5.1 Functie de verosimilitate

Definitia 5.1.1. Numim functie de verosimilitate, functia de selectie

Observatia 5.1.2. Daca se considera functia de n variabile reale

aceasta reprezinta functia frecventa (n cazul discret), respectiv densitatea de proba

bilitate (n cazul continuu) a vectorului aleator
.

Definitia 5.1.3. Statistica

este statistica
suficienta (exhaus

nenegativ

tiva) pentru parametrul , daca exista functia masurabila
a si

functia masurabila

nenegativa, astfel ncat

unde

229

230

Teoria estimatiei

Observatia 5.1.4. Echivalenta cu conditia precedenta pentru suficienta statisticii

este conditia ca functia de frecventa (n cazul discret), respectiv densitatea de pro

a vectorului aleator
babilitate (n cazul continuu)

, sa nu depinda de parametrul .
conditionata de evenimentul
Exemplul 5.1.5. Fie caracteristica ce urmeaza legea lui Poisson cu parametrul

necunoscut, adica are functia de frecventa

. Deoarece variabilele aleatoare

Consideram statistica

sunt independente si identic repartizate cu avem ca urmeaza legea lui Poisson

de parametru , adica

Pe de o parte avem:

Se poate considera

Avand n vedere ca putem scrie si

se poate considera de asemenea

Prin urmare, unicitatea acestei scrieri nu se impune.

Pe de alta parte, avand n vedere ca urmeaza legea

, avem succesiv

5.1. Functie de verosimilitate

231

nu depinde de parametrul , decat prin intermediul

Asadar
valorii statisticii .

Exemplul 5.1.6 (Familia exponentiala). Se considera caracteristica

functia de probabilitate de forma

Vom arata ca, n acest caz, statistica

, care are

este suficienta pentru parametrul . Intr-adevar avem ca

Daca se considera

atunci

deci conditia suficientei este ndeplinita.

232

Teoria estimatiei

Definitia 5.1.7. Numim cantitate de informatie (Fisher) a unei selectii de volum

relativa la parametrul necunoscut, valoarea medie

cand functia de verosimilitate este derivabila n raport cu .

Observatia 5.1.8. Daca parametrul este dimensional, matricea

se numeste matricea informatiei lui Fisher.

Teorema 5.1.9. Daca domeniul valorilor caracteristicii nu depinde de parame

trul , iar functia de verosimilitate este derivabila de doua ori n raport cu , atunci

ln

Demonstratie. Se porneste de la relatia cunoscuta

pe care o satisface densitatea de probabilitate. Se deriveaza aceasta relatie n raport

cu si se tine seama de faptul ca

obtinandu-se

Derivand nca odata n raport cu rezulta

ln
ln

5.1. Functie de verosimilitate

233

sau, avand n vedere relatia de mai nainte, rezulta ca

ln
ln

Asadar am obtinut ca

de unde avem relatia dorita.

Observatia 5.1.10. In demonstratia teoremei precedente am considerat cazul unei
caracteristici de tip continuu. In mod analog se procedeaza si n cazul discret,
integrala multipla este nlocuita cu o suma multipla.

nu depinde de

Corolarul 5.1.11. Cand domeniul de definitie al caracteristicii

.
parametrul , atunci
Demonstratie. Deoarece selectia este repetata, avem ca

Folosind Teorema 5.1.9, se obtine

deoarece

Observatia 5.1.12. Din demonstratia Teoremei 5.1.9 avem de asemenea ca

deoarece

234

Teoria estimatiei

Exemplul 5.1.13. Sa consideram caracteristica , ce urmeaza legea normala

, unde este necunoscut, iar este cunoscut.
Deoarece

avem ca

Prin urmare, cantitatea de informatie continuta (adusa) de o observatie, relativ la

parametrul , este cu atat mai mare cu cat dispersia este mai mica.

Teorema 5.1.14. Fie caracteristica , cu functia de probabilitate derivabila

de doua ori n raport cu si statistica
relativa la caracte
ristica , cu functia de probabilitate
, atunci cantitatea de informatie

relativa la parametrul
continuta n statistica
nu depaseste cantitatea de

.
informatie continuta de selectia considerata, adica

Demonstratie. Daca
este functia de frecventa (n cazul discret), respectiv
densitatea de probabilitate (n cazul continuu) pentru statistica , atunci

este functia de frecventa (n cazul discret), respectiv

unde

densitatea de probabilitate (n cazul continuu) pentru vectorul aleator

conditionata de evenimentul
.
Asadar avem ca

(5.1.1)
deci

ceea ce trebuia aratat.

5.1. Functie de verosimilitate

235

Exemplul 5.1.15. Se considera caracteristica ce urmeaza legea normala

si o selectie repetata de volum . Vom compara informatia dispersiei de selectie

relativa la dispersia teoretica
parametru.

, cu informatia selectiei relativa la acelasi

Calculam prima data informatia selectiei de volum relativa la parametrul notat

cu
. Avand n vedere ca densitatea de probabilitate a caracteristicii
este

e

se obtine

Rezulta astfel ca

deci

Pe de alta parte, se stie ca statistica

urmeaza legea cu
grade de libertate. Avand n vedere legatura dintre statisticile si rezulta ca densitatea de probabilitate pentru este data prin

Astfel se obtine ca

236

Teoria estimatiei

de unde
ln

Calculam acum informatia dispersiei de selectie relativa la

seama de faptul ca

. Pentru aceasta tinem

deci

Observatia 5.1.16. Deoarece, n cazul unei statistici suficiente, avem ca functia

nu depinde de rezulta ca n acest caz. Acest
Astfel obtinem:

lucru se obtine imediat, daca se are n vedere relatia (5.1.1).

5.2 Functii de estimatie

Definitia 5.2.1. Fie caracteristica cu functia de probabilitate , parame

trul necunoscut si o selectie repetata de volum . Numim functie de estimatie

(estimator) pentru parametrul , functia de selectie

care ia valori n domeniul

numeste estimatia lui .

, iar valoarea

numerica

Definitia 5.2.2. Estimatorul

(functie de es este estimator

timatie) nedeplasat pentru parametrul necunoscut , daca
iar valoarea
numerica

trul .

se numeste estimatie nedeplasata pentru parame-

Definitia 5.2.3. Spunem ca estimatorul

este estimator con
p
, adica
sistent, pentru parametrul necunoscut , daca

pentru orice

, iar valoarea numerica

estimatie consistenta pentru parametrul .

se numeste

5.2. Functii de estimatie

237

5.2.1 Functii de estimatie absolut corecte

Definitia 5.2.4. Numim functie de estimatie (estimator) absolut corecta pentru para

metrul , functia de selectie
, care satisface conditiile

(i)
(ii)

iar valoarea numerica

pentru parametrul .

se numeste estimatie absolut corecta

Proprietatea 5.2.5. Un estimator absolut corect este un estimator consistent.

, un estimator absolut corect

Demonstratie. Fie estimatorul

pentru parametrul . Din inegalitatea lui Cebsev avem

. Facand pe
, se obtine

pentru orice

, ceea ce trebuie demonstrat.

, unde paExemplul 5.2.6. Fie caracteristica , ce urmeaza legea normala

este cunoscut, iar este necunoscut. Considerand o selectie
rametrul
repetata de volum , vom determina constanta astfel ncat statistica

sa fie estimator absolut corect pentru abaterea standard .

Avand n vedere ca variabilele de selectie , , . . . , sunt variabile aleatoare
identic repartizate cu , putem scrie succesiv

(5.2.1)

238

Teoria estimatiei

Tinem seama de faptul ca urmeaza legea normala

obtinem

Facem schimbarea de variabila

si tinem seama de faptul ca functia obtinuta
este para, iar intervalul de integrare este simetric fata de origine:

Din conditia de nedeplasare si din formula (5.2.1) avem

adica
Pana aici am aratat ca statistica

este un estimator nedeplasat pentru parametrul .

Deoarece selectia considerata este repetata rezulta ca variabilele de selectie sunt
independente, prin urmare se poate scrie

Astfel este ndeplinita si conditia (ii) din Definitia 5.2.4, anume

cand

Proprietatea
5.2.7. Fie caracteristica
pentru care exista momentul teoretic de

ordinul , , si fie o selectie repetata de volum , atunci momentul de
Remarcam ca

selectie de ordin

este functie de estimatie absolut corecta pentru parametrul

5.2. Functii de estimatie

239

si de asemenea

Demonstratie. Din Proprietatea 4.2.11 avem ca

Conditiile Definitiei 5.2.4 sunt satisfacute, deci proprietatea este demonstrata.

Observatia 5.2.8. Media de selectie

corecta pentru media teoretica

este

functie de estimatie absolut

5.2.2 Functii de estimatie corecte

Definitia 5.2.9. Numim functie de estimatie (estimator) corecta, pentru parametrul

necunoscut , functia de selectie
, care satisface conditiile

(i)

(ii)

iar valoarea numerica

parametrul .

se numeste estimatie corecta pentru

Proprietatea 5.2.10. Un estimator corect este un estimator consistent.

Demonstratie. Fie estimatorul

pentru parametrul ,
corect

atunci din conditiile (i) si (ii) avem ca pentru orice si exista numarul

natural
astfel ncat

pentru

. Asadar, putem scrie

pentru
, de unde daca
vom avea ca

. Prin urmare avem

care conduce la inegalitatea

, pentru

240

Teoria estimatiei

Pe de alta parte, folosind inegalitatea lui Cebsev,

Deoarece

, pentru

Prin urmare se ajunge la

, rezulta ca

p
de unde
, ceea ce trebuie aratat.

Proprietatea
5.2.11. Fiecaracteristica pentru care exista momentul teoretic de

ordin ,
,si fie o selectie repetata de volum , atunci momentul
centrat de selectie de ordin

este functie de estimatie corect

a pentru momentul centrat teoretic de ordin , adica

pentru

.
Demonstratie. Conform Observatiei 4.2.18 avem

De asemenea, avem

Asadar, conditiile Definitiei 5.2.9 sunt satisfacute.

Observatia 5.2.12. Momentul centrat de selectie de ordinul ,

estimatie corecta pentru dispersia teoretica
.

, este functie de

Avand n vedere Observatia 4.2.17 (formula (4.2.2)) avem ca dispersia de selectie

este functie de estimatie absolut corecta pentru dispersia teoretica

5.2. Functii de estimatie

241

5.2.3 Functii de estimatie eficiente

Teorema 5.2.13 (Inegalitatea Rao-Cramer). Se considera caracteristica avand

functia de probabilitate , , pentru care exista derivata partiala de

ordinul ntai n raport cu si fie o statistica

absolut corecta

pentru parametrul , atunci

Demonstratie. Deoarece estimatorul

este nedeplasat, avem ca

, adica

este functia de verosimilitate.
unde

Prin derivarea n raport cu a acestei relatii se obtine ca

Pe de alta parte, deoarece

avem

care scazuta din egalitatea obtinuta nainte conduce la

adica

242

Teoria estimatiei
Se aplica acum inegalitatea lui Schwarz si se obtine

adica

Dar avem ca

care nlocuita n inegalitatea dinainte conduce la inegalitatea RaoCramer.

Definitia 5.2.14. Se numeste eficienta a unei functii de estimatie absolut corecte,

, pentru parametrul , raportul
e

Definitia 5.2.15. Spunem ca functia de estimatie absolut corecta pentru parame

trul ,
eficienta daca inegalitatea RaoCramer este
, este

verificata prin egalitate, adica
.
Exemplul 5.2.16. Se considera caracteristica ce urmeaza legea normala

si o selectie repetata de volum relativa la aceasta caracteristica. Vrem sa deter

minam eficienta estimatorului lui
, construit n Exemplul 5.2.6, dat
prin

Stim ca

deci

este estimator absolut corect pentru .

5.2. Functii de estimatie

243

Pe de alta parte avem

de unde

Se calculeaza usor

Avem astfel eficienta estimatorului

adica estimatorul nu este estimator eficient pentru parametrul .

Teorema 5.2.17 (Rao-Cramer). Se considera caracteristica cu functia de pro

babilitate , , care satisface conditiile Teoremei 5.2.13 si fie functia

de estimatie absolut corecta
pentru parametrul . Conditia

necesara si suficienta ca sa fie functie de estimatie eficienta pentru parametrul
este ca sa aiba loc reprezentarea

ln

n plus are loc formula

Demonstratie. Pentru necesitate, din demonstratia inegalitatii RaoCramer, avem ca

egalitatea n aceasta inegalitate are loc daca inegalitatea lui Schwarz este verificata
prin egalitate. Aceasta are loc daca si numai daca variabilele aleatoare considerate
depind n mod liniar, adica

Considerand

( oarecare),

const., (=0 de exemplu) avem

244

Teoria estimatiei

de unde

Astfel s-a obtinut ca

si prin urmare

de unde

pentru orice

. Rezulta de aici ca

sunt constante (nu depind de ), deoarece

urmare

si daca se noteaza

nu depinde de . Prin

, atunci

Asadar s-a ajuns la

Pe de alta parte, deoarece

5.2. Functii de estimatie

obtinem

245

de unde

Integram, dupa ce am notat

, ultima relatie n raport cu

Pentru suficienta se porneste de la relatia cunoscuta

adica

exp

pe care o derivam n raport cu . Obtinem astfel ca

de unde, deoarece

Derivam din nou n raport cu

si se ajunge la

Deoarece

, rezulta ca

de unde

, am obtinut astfel ca

si obtinem

246

Teoria estimatiei

deci

Pe de alta parte

Prin urmare putem scrie

deci

este estimator eficient pentru parametrul .

Se considera caracteristica ce urmeaza legea

Exemplul 5.2.18.
, cu

cunoscut si necunoscut. Vrem sa aratam ca media de selectie este estimator eficient

pentru parametrul necunoscut
. Pentru aceasta vom considera o

selectie repetata de volum relativa la aceasta caracteristica.

Functia de frecventa a caracteristicii este

de unde

deci
unde
ca

ln
ln

ln ln

Considerand

avem

Pe baza teoremei RaoCramer se obtine

este estimator eficient pentru parametrul

5.2. Functii de estimatie

247

5.2.4 Estimatori optimali

, pentru parameDefinitia 5.2.19. Estimatorul nedeplasat

trul , este optimal daca are dispersia minima dintre toti estimatorii nedeplasati ai

lui .

Observatia 5.2.20. Un estimator eficient este optimal, invers proprietatea nu are loc.
Proprietatea 5.2.21. Estimatorul optimal al unui parametru este unic.

si
doi
Demonstratie. Fie

estimatori optimali distincti pentru parametrul . Daca se considera functia de selectie

, atunci este estimator nedeplasat pentru , deoarece

Pe de alta parte

unde
.
Din inegalitatea lui Schwarz se obtine

. Prin urmare, putem scrie ca , ceea
ce contrazice
faptul ca , sunt

estimatori optimali, afara de cazul n care

, adica
. Avand n vedere aceste rezultate, putem

deci

scrie:

adica

faptul ca

. Dar avem ca

Prin urmare se ajunge la

cu afirmatia ca cei doi estimatori sunt distincti.

, ceea ce implica

, n contradictie

248

Teoria estimatiei

Teorema 5.2.22 (Rao-Blackwell). Fie caracteristica cu functia de probabilitate

si fie
un estimator nedeplasat pentru parametrul .
Daca statistica
este o statistica suficienta pentru parametrul ,

este un estimator nedeplasat
atunci estimatorul
pentru

si are loc relatia

Demonstratie. Deoarece statistica este suficienta rezulta ca functia de probabilitate

condit
ionata a vectorului aleator
de evenimentul

nu depinde de , deci

nu depinde de , adica este o functie de selectie ce nu depinde de . Pe de alta parte,

folosind proprietati ale mediei conditionate avem

deci nedeplasarea are loc.

Pentru a stabili inegalitatea dintre dispersiile celor doi estimatori avem ca

Dar avem ca

iar ultimul termen este nul deoarece pentru

deci

adica primul termen din expresia lui

este

. Al doilea termen din aceeasi expresie

fixat, avem

const.,

5.2. Functii de estimatie

249

Am stabilit astfel relatia

de unde

Definitia 5.2.23. Statistica

, daca
de legi de probabilitate ,

implica faptul ca
a.s.

Exemplul 5.2.24. Statistica

Poisson cu parametrul .

este
completa pentru familia

, pentru orice ,

este completa pentru familia de legi

Pe de alta parte

urmeaza legea lui Poisson de parametru , deci

Prima data avem ca

, pentru orice

, conduce la

pentru orice

,ceea ce are loc numai daca fiecare coeficient este nul, adica
, cand
.

conditiile Teoremei RaoBlackwell, daca

Teorema 5.2.25 (LehmannScheffe). In
statistica
este completa, atunci estimatorul

este estimator optimal.

un estimator nedeplasat pentru parameDemonstratie. Fie

trul . Folosind Teorema RaoBlackwell, avem ca estimatorul

Asadar avem ca

de unde

completa rezulta ca

este nedeplasat pentru parametrul , adica

, si

Avand n vedere ca statistica

a.s., deci

este

a.s., de unde

250

Teoria estimatiei

In final

orice estimator nedeplasat

adica

, pentru

, ceea ce este chiar conditia din definitia optimalitatii.

Exemplul 5.2.26. Fie caracteristica , care urmeaza legea lui Poisson de parametru

. Vrem s
.
a determinam un estimator optimal pentru parametrul
Functia de frecventa a caracteristicii

este

este completa

In Exemplul 5.2.24 am vazut ca statistica suficienta

pentru familia de legi Poisson si urmeaza legea lui Poisson de parametru
ln
Daca se considera functia de selectie

atunci

are distributia

card

deci

adica este estimator nedeplasat pentru parametrul .

cu distributiile date prin
Daca se introduc variabilele aleatoare

daca
daca

, , atunci avem ca
deci
Aplicam Teorema RaoBlackwell si obtinem

Pentru

, avem

5.3. Metode pentru estimarea parametrilor

251

Folosind formula lui Bayes avem

de unde se obtine ca

, care este dat prin

Am ajuns astfel la estimatorul optimal pentru parametrul

formula

5.3 Metode pentru estimarea parametrilor

5.3.1 Metoda momentelor
Se considera caracteristica , care are functia de probabilitate cu parametrul

si o selectie repetat

necunoscut
a de volum .

Definitia 5.3.1. Numim estimator pentru

parametrul

telor solutia
a sistemului

unde este momentul

teoretic de ordin ,
selectie de ordinul , adica

obtinut prin metoda momen-

, iar

este momentul de

Observatia 5.3.2. Metoda momentelor este una din cele mai vechi metode de estimare a parametrilor, folosita initial n mod empiric. Este fundamentata teoretic pe
faptul ca momentele de selectie sunt estimatori absolut corect
momentele

a.s.ipentru

teoretice corespunzatoare. Este cunoscut de asemenea ca
cand

252

Teoria estimatiei

Exemplul 5.3.3. Se considera caracteristica , care urmeaza legea gamma cu para

metrii necunoscuti. Densitatea de probabilitate pentru este

Vrem sa estimam parametrii

Se stie ca

Prin urmare, avem sistemul de ecuatii

si prin metoda momentelor.

care are solutia

5.3.2 Metoda verosimilitatii maxime

Se considera caracteristica cu functia de probabilitate , unde parametrul

. Relativ la caracteristica se consider
a o selectie repetata
necunoscut
de volum .

Definitia 5.3.4. Numim estimator de verosimilitate maxima, pentru parametrul ,

statistica

pentru care se obtine maximul functiei de verosimilitate

iar

parametrul .

se numeste estimatie de verosimilitate maxima, pentru

Observatia 5.3.5. In definitia estimatorului de verosimilitate maxima nu este necesar ca sa fie diferentiabila n raport cu . De asemenea, nu este neaparat
unic si nedeplasat.

5.3. Metode pentru estimarea parametrilor

253

Observatia 5.3.6. Daca functia de verosimilitate este diferentiabila de doua ori n

raport cu , atunci estimatorul de verosimilitate maxima se obtine ca solutie a sistemului de ecuatii

Sistemul de ecuatii este echivalent cu

numit sistemul ecuatiilor de verosimilitate maxima.

Exemplul 5.3.7. Sa determinam estimatorii de verosimilitate maxima pentru valoarea medie si abaterea standard, daca se considera caracteristica , care urmeaza legea

normala
.
si , iar densitatea de probabilitate a lui este
Se stie ca

Pentru a scrie sistemul de verosimilitate maxima, avem ca

de unde

In acest mod se obtine

254

Teoria estimatiei

de unde se rezulta estimatorii de verosimilitate maxima

si .

pentru parametrii

Exemplul 5.3.8. Caracteristica urmeaza legea uniforma pe intervalul
, unde

parametrul este necunoscut. Relativ la caracteristica se considera o selectie
repetata de volum . Vrem sa se determinam estimatorul de verosimilitate maxima

, pentru parametrul necunoscut .

Estimatorul de verosimilitate maxima pentru se determina astfel ncat functia
de verosimilitate

. Deoarece

sa fie maxima pentru

se obtine ca
Se observa ca n acest exemplu nu s-a putut folosi ecuatia de verosimilitate ma
xima, deoarece domeniul valorilor caracteristicii , care este
, depinde de parametrul estimat.
Vom arata, n continuare, ca estimatorul astfel construit este estimator corect pen
tru parametrul . Apoi vom folosi acest estimator pentru obtinerea unui estimator

absolut corect pentru .

Functia de repartitie a statisticii este

deci

are densitatea de probabilitate

cand

Se calculeaza usor

5.3. Metode pentru estimarea parametrilor

255

Astfel se obtine ca

Prin urmare, este estimator

pentru .

corect
, rezulta ca
Punand conditia

de unde se obtine

si n final

Deoarece

cand

, rezulta ca

este estimator absolut corect pentru parametrul .

Proprietatea 5.3.9. Daca

este statistica suficient
a pentru

parametrul , iar este estimator de verosimilitate maxima pentru , atunci este
functie de .

Demonstratie. Deoarece statistica

este suficienta rezulta ca

decimaximul lui , dupa , se obtine atunci si numai atunci cand se obtine maximul

lui dupa . Astfel ca se exprima n functie de .

este functie de estimatie eficient
Teorema 5.3.10. Daca
a

pentru parametrul , atunci este estimator de verosimilitate maxima pentru .

Demonstratie. Deoarece
este estimator eficient pentru , din inegalitatea Rao
Cramer (cu egalitate), avem ca
ln
Astfel ca
ln
deci

verifica ecuatia verosimilitat ii maxime.

256

Teoria estimatiei

Observatia 5.3.11. Daca valoarea adevarata a parametrului este , se arata ca

functia de verosimilitate maxima pentru parametrul are
urmatoarele comportari

a.s.

asimptotice:
, cand
, iar
converge n repartitie la

.
legea normala

5.3.3 Metoda minimului

Se considera colectivitatea si caracteristica cercetata, cu legea de probabilitate

Domeniul valorilor lui

data prin functia , unde

l consideram compus din clasele , . Vom introduce notatiile urmatoare

, adica probabilitatea ca un individ luat la ntamplare din
colectivitatea sa apartina clasei .

,
Daca se considera o selectie repetata de volum cu datele de selectie

respectiv variabilele de selectie
, notam prin frecventa absoluta a da
telor de selectie din clasa . Fie
variabila aleatoare (de selectie) corespunzatoare

lui , atunci vectorul aleator
urmeaza legea multinomiala de

parametri
, .

Definitia 5.3.12. Estimatorul cu minim pentru parametrul este estimatorul

care realizeaza valoarea minima a
(functia de selectie)
expresiei

n raport cu parametrul , iar

minim pentru parametrul .

se numeste estimatie cu

se obtine cand este minima expresia

prin urmare, minimul lui

, atunci valoarea lui se poate scrie n felul

Observatia 5.3.13. Daca notam

urmator:

Observatia 5.3.14. Daca ,

, sunt diferentiabile de doua ori n raport

cu , atunci se obtine ca solutie a sistemului

5.3. Metode pentru estimarea parametrilor

257

de mai sus, numit indicatorul lui Pear-

Observatia 5.3.15. In locul expresiei lui

son, se pot utiliza alte expresii ca:

indicatorul de verosimilitate

indicatorul lui Kullbach

ln
ln

indicatorul lui Neyman

indicatorul lui Berkson

5.3.4 Metoda intervalelor de ncredere

Se considera caracteristica cu legea de probabilitate , unde parametrul ne

, numit
cunoscut . Fie
o selectie repetata de volum si numarul
probabilitate de risc,
numindu-se probabilitate de ncredere.

Definitia 5.3.16. Numim interval de ncredere pentru parametrul , intervalul aleator

unde statisticile si sunt astfel ncat
iar intervalul

numeric

intervalului de ncredere pentru parametrul .

se numeste valoarea

Observatia 5.3.17. Pentru determinarea intervalului de ncredere se considera o statistica

, care urmeaza o lege de probabilitate cunoscuta, dar

n expresia careia apare parametrul . Se determina apoi intervalul numeric

astfel ncat

relatie care se va scrie, n mod echivalent,

Observatia 5.3.18. Cu cat este mai mic si intervalul de ncredere are lungimea mai
mica cu atat estimatia parametrului necunoscut este mai buna.

Observatia 5.3.19. Din relatia

, intervalul nu este
determinat n mod unic.
De la problema la problema se mai adauga o conditie suplimentara, de exemplu

fixarea valorii fie a lui , fie a lui . De asemenea, se poate considera o legatura

ntre si data de anumite ipoteze de lucru.

258

Teoria estimatiei

Interval de ncredere pentru media teoretica dispersie cunoscuta

Se considera caracteristica ce urmeaza legea normala
, unde este

necunoscut, iar este cunoscut.
Pentru construirea unui interval de ncredere pentru media teoretica
necunoscuta efectu
a
m
o
select

ie
repetat
a
de
volum
s

i
consider
a
m
probabilitatea
de

ncredere
data,
.
Se construies te statistica

care urmeaza legea normala
(a se vedea Observatia 4.2.6). Prin urmare, pen
tru dat determinam intervalul numeric astfel ncat

unde

este functia lui Laplace. Functia lui Laplace estetabelat

I pentru valori
anAnexa
.
pozitive ale argumentului, avand n vedere ca
Deoarece dubla inegalitate

este echivalenta cu

rezulta ca
adica este un interval de ncredere

pentru media teoretica .

Desigur ca intervalul numeric nu este n mod unic determinat. Daca nu
exista nici o informatie suplimentara relativa la valoarea medie, atunci se va considera

intervalul de ncredere de lungime minima, pentru fixat,
si se obtine cand
.

In acest caz
, va fi dat prin relatia

ceea

ce este echivalent cu

Cand se foloseste functia lui Laplace definita prin

5.3. Metode pentru estimarea parametrilor

atunci se determina din relatia

de ordin
Intervalul de ncredere pentru parametrul

(5.3.1)

259

si reprezinta de fapt cuantila

are extremitatile

Observatia 5.3.20. Geometric, daca se considera graficele functiei de repartitie si

densitat ii de probabilitate a legii normale
, modul de obtinere a cuantilei
este prezentat n Figura 5.1. Adica, fie intersectand graficul functiei de repartitie a

legii normale
cu dreapta de ecuatie
, fie alegandul pe astfel ca aria
umbrita de sub graficul densitatii de probabilitate sa fie .
1

0
z

Figura 5.1: Determinarea cuantilei

Observatia 5.3.21. Daca exista o informatie relativa la valoarea medie
de forma ca

,
aceasta nu este limitata superior, atunci intervalul numeric

care conduce la intervalul de ncredere

In mod analog, daca se cunoaste ca valoarea medie nu este limitata inferior, adica
are tendinta de a avea valori mici n raport cu ceea ce ne asteptam, atunci intervalul

260

Teoria estimatiei

numeric

care conduce la intervalul de ncredere

Pe baza teoremei limita centrala avem ca rezultatul obtinut se mentine cand ur
meaza o lege de probabilitate oarecare, pentru (a se vedea Proprietatea 4.2.7).
Exemplul 5.3.22. Relativ la populatia se cerceteaza caracteristica privind media teoretica

. Stiind ca dispersia teoretica a caracteristicii este

, sa se stabileasca un
interval de ncredere pentru media teoretica
cu probabilitatea de ncredere
, utilizand distributia empirica de
selectie

Deoarece volumul selectiei este
, putem considera ca statistica

unde

. Asadar, extremitat ile intervalului de ncredere penurmeaza legea normala
tru media teoretica sunt date prin (5.3.1). Calculam valorile acestor extremitat i pe
baza datelor de selectie.

Valoarea mediei de selectie este

iar din Anexa I, pentru
De asemenea, avem ca

, se gaseste

Obtinem, n acest fel, intervalul de ncredere pentru media teoretica

Programul 5.3.23. Calculele pot fi facute cu urmatorul program Matlab:

5.3. Metode pentru estimarea parametrilor

261

x=[22.7,22.8*ones(1,3),22.9*ones(1,7),23*ones(1,4),...
23.1*ones(1,6),23.2*ones(1,7),23.3*ones(1,5),23.4*ones(1,2)];
s=sqrt(0.35)*norminv(0.975)/sqrt(35);ma=mean(x);
m1=ma-s; m2=ma+s;
fprintf( (m1,m2)=(%6.3f,%6.3f),m1,m2)

si care, n urma executarii, afiseaza rezultatul

(m1,m2)=(22.881,23.273)

Interval de ncredere pentru media teoretica dispersia necunoscuta

In conditiile sectiunii precedente, dar cu necunoscut, se va considera statistica

care, conform Proprietatii 4.2.26, urmeaza legea Student cu

Se determina intervalul numeric astfel ncat

unde

grade de libertate.

este functia de repartitie a legii Student cu grade de libertate si care este tabelata,
pentru anumite valori, n Anexa II.

Luand
, avem ca

iar

, deci, intervalul de ncredere pentru media teoretica
are extremitatile date prin

(5.3.2)

Observatia 5.3.24. Daca exista o informatie relativa la valoarea medie de forma ca

aceasta nu este limitata superior, adica are tendinta
de a avea valori mai mari decat

, care conduce la
cele asteptate, atunci intervalul numeric

intervalul de ncredere pentru :

262

Teoria estimatiei

In mod analog, daca se cunoaste ca valoarea medie nu este limitata inferior, atunci

, care conduce la intervalul de ncredere
intervalul numeric

Observatia 5.3.25. Geometric, daca se consider
a graficele functiei de repartitie si
densitat ii de probabilitate a legii Student cu
grade de libertate, modul de obtinere

a cuantilei
este prezentat n Figura 5.2.

1

0
t

tn1,

n1,

Figura 5.2: Determinarea cuantilei

Din teorema limita centrala avem ca rezultatele pot fi aplicate pentru o caracte
ristica ce urmeaza o lege de probabilitate oarecare, pentru .
Exemplul 5.3.26. Pentru receptionarea unei marfi ambalata n cutii, se efectueaza un

control, prin sondaj, privind greutatea a cutiilor. Pentru
de cutii cantarite s-a
obtinut distributia empirica de selectie, relativ la caracteristica :

Folosind probabilitatea de ncredere
, sa determinam un interval de ncredere
pentru valoarea medie a greutatii cutiilor, presupunand ca urmeaza legea normala

.

5.3. Metode pentru estimarea parametrilor

Deoarece abaterea standard
tistica

263

este necunoscuta, se considera sta-

care urmeaza legea Student cu

grade de libertate.
Extremitatile intervalului de ncredere pentru valorea medie teoretica

sunt date prin
(5.3.2).

Pentru

si
, din Anexa II se determina

.

De asemenea, folosind datele de selectie, obtinem valoarea a mediei de selectie

, anume

si valoarea abaterii standard de selectie

Putem scrie atunci intervalul (numeric) de ncredere

Programul 5.3.27. Daca se executa programul Matlab

x=[2.7,2.8*ones(1,2),2.9*ones(1,5),3*ones(1,3),...
3.1*ones(1,5),3.2*ones(1,4),3.3*ones(1,2)];
ma=mean(x); va=var(x);
s=tinv(0.99,21)*sqrt(va)/sqrt(22);
m1=ma-s; m2=ma+s;
fprintf( (m1,m2)=(%6.3f,%6.3f),m1,m2)

relativ la problema precedenta, se obtine intervalul de ncredere:

(m1,m2)=( 2.942, 3.122)

Interval de ncredere pentru dispersie

Consideram caracteristica ce urmeaza legea normala
cu necu
noscut si necunoscut. Determinam un interval de ncredere pentru dispersia
teoretica a caracteristicii .

264

Teoria estimatiei
Statistica ce se considera n acest caz este

cu
care, conform Proprietatii 4.2.25, urmeaza legea

Se determina intervalul numeric
astfel nat

grade de libertate.

este functia de repartitie a legii
cu
grade de libertate si este tabelata, pentru
unde

anumite valori, n Anexa III.

Daca se alege
si

se obtine

(5.3.3)

, adica astfel ncat

, unde

Observatia 5.3.28. Modul geometric de obtinere a cuantilei este prezentat n

Figura 5.3, daca se consider
a graficele functiei de repartitie si densitatii de probabili
tate a legii cu
grade de libertate.
Exemplul 5.3.29. Fie caracteristica ce reprezinta timpul de producere a unei

reactii chimice, masurat n secunde. Daca urmeaza legea normala
si

avand o selectie repetata de volum
, cu datele de selectie , ,
,

,
,
,
, ,
, , vom determina intervalul de ncredere

si pentru abaterea standard

pentru dispersia

, cu

probabilitatea de ncredere
.
Se considera statistica

unde

5.3. Metode pentru estimarea parametrilor

265

2
n1,

Figura 5.3: Determinarea cuantilei

care urmeaza legea cu

grade de libertate. Extremitatile intervalului de

ncredere pentru vor fi date prin (5.3.3).
Pentru determinarea valorilor numerice ale acestor intervale de ncredere, calculam:

Asadar, intervalele de ncredere pentru si sunt

respectiv

Programul 5.3.30. Un program Matlab, care sa rezolve aceasta problema, ar putea

fi urmatorul:
x=[4.21,4.03,3.99,4.05,3.89,3.98,4.01,3.92,4.23,3.85,4.20];
va=var(x); c1=chi2inv(0.025,10); c2=chi2inv(0.975,10);

266

Teoria estimatiei
v1=10*va/c2; v2=10*va/c1; s1=sqrt(v1); s2=sqrt(v2);
fprintf( (v1,v2)=(%6.3f,%6.3f)\n,v1,v2)
fprintf( (s1,s2)=(%6.3f,%6.3f),s1,s2)

In urma executarii, se obtin intervalele de ncredere pentru dispersie si respectiv pentru abaterea standard:
(v1,v2)=( 0.008, 0.052)
(s1,s2)=( 0.091, 0.229)

Interval de ncredere pentru raportul dispersiilor

Se considera caracteristicile
independente
si fiecare urmand legea normala,

si
. Relativ la celedoua caracteristici se considera
respectiv
cate o selectie repetata, respectiv
de volume si . Vom determina un interval de

corespunzator probabilitatii de ncredere
ncredere pentru raportul
data.
Pentru aceasta se considera statistica

care, conform
Proprietatii 4.2.30, urmeaza legea FisherSnedecor cu

grade de libertate.

Se determina intervalul numeric astfel ncat

unde

este functia de repartitie a legii FisherSnedecor cu si grade de libertate si care

este tabelata pentru anumite valori n Anexa IV.
Daca se alege si , adica astfel ncat

atunci

(5.3.4)

Aceasta relatie pune n evidenta intervalul de ncredere pentru raportul celor doua
dispersii.

5.3. Metode pentru estimarea parametrilor

267

Observatia 5.3.31. Modul geometric de obtinere a cuantilei este prezentat n

Figura 5.4, daca se considera graficele functiei de repartitie si densitatii de probabilitate a legii FisherSnedecor cu si grade de libertate.
1

0
f

fm,n,

m,n,

Figura 5.4: Determinarea cuantilei

Exemplul 5.3.32. Se cerceteaza precizia cu care doua masini produc conserve de

acelasi tip. Pentru aceasta, se considera cate un esantion din conservele produse de
cele doua masini si se masoara greutatea acestora.
Fie greutatea n grame a unei

conserve produsa de prima masina, respectiv pentru a doua masina. Masuratorile
obtinute sunt:

Sa se calculeze
de ncredere pentru raportul abaterilor standard, adica
un interval

folosind probabilitatea de risc .

pentru

Vom considera ca cele dou

a caracteristici si sunt independente si ca ur

meaza legile normale
si respectiv
.
Statistica
ce se utilizeaza pentru stabilirea intervalului de ncredere pentru rapor

tul este

268

Teoria estimatiei

care urmeaza legea FisherSnedecor cu

de libertate.
Intervalul de ncredere este dat prin (5.3.4).
Pentru aceasta avem ca

grade

Pe de alta parte, se obtin cuantilele

pe baza Anexei IV. Facem observatia ca n acest calcul s-a avut n vedere ca

adica

Se ajunge astfel la faptul ca

La acelasi rezultat se ajunge si daca se considera statistica

Programul 5.3.33. Programul Matlab, care urmeaza, calculeaza intervalele de

ncredere pentru raportul dispersiilor, respectiv al abaterilor standard, pentru datele
considerate n problema precedenta.
x1=[1021,980,988,1017,1005,998,1014,985,995,1004,...
1030,1015,995,1023,1008,1013];
x2=[1003,988,993,1013,1006,1002,1014,997,1002,1010,975];
v1=var(x1); v2=var(x2); r=v1/v2;

5.3. Metode pentru estimarea parametrilor

269

f1=finv(0.025,10,15); f2=finv(0.975,10,15);
r1=f1*r; r2=f2*r; s1=sqrt(r1); s2=sqrt(r2);
fprintf( (r1,r2)=(%6.3f,%6.3f)\n,r1,r2)
fprintf( (s1,s2)=(%6.3f,%6.3f),s1,s2)

In urma executarii programului, sa obtinut:

(r1,r2)=( 0.445, 4.795)
(s1,s2)=( 0.667, 2.190)

Interval de ncredere pentru diferenta mediilor

Caracteristicile
independente si urmeaza respectiv legile
normale

si
. Folosind cate o selectie repetata de volum si pentru cele doua
caracteristici, vrem sa determinam un interval de ncredere pentru diferenta
.
Distingem urmatoarele trei situatii:

A. abaterile standard ale celor doua caracteristici sunt cunoscute,

B. abaterile standard sunt necunoscute, dar se stie ca sunt egale,
C. abaterile standard sunt necunoscute si diferite,
pe care le tratam pe rand n continuare.
A. Abaterile standard

Se considera statistica

sunt cunoscute.

(5.3.5)

(a se vedea Observatia 4.2.29). Astfel, pencare urmeaza legea normala

data, se poate determina intervalul numeric
tru probabilitatea de risc

astfel ncat
Anume,

, unde
se calculeaza din relatia

este functia lui Laplace, tabelata n Anexa I. Se ajunge astfel la relatia

(5.3.6)

270

Teoria estimatiei

unde

care pune n evidenta extremitatile intervalului de ncredere pentru diferenta celor

doua medii.
B. Abaterile standard

sunt egale cu , dar necunoscut.

Se considera statistica

(5.3.7)

unde

si care urmeaza legea Student cu
grade de libertate (a se vedea
Proprietatea 4.2.28).
Ca la punctul precedent se obtin extremitatile intervalului de ncredere

(5.3.8)
unde

este cuantila de ordin pentru legea Student cu

C. Abaterile standard

Se considera statistica

care urmeaza legea Student cu

(5.3.10)

grade de libertate.

sunt diferite si necunoscute.

(5.3.9)

grade de libertate si care se calculeaza prin formula

unde

Ca la punctul precedent se ajunge la extremitatile intervalului de ncredere pentru

diferenta celor doua medii:
(5.3.11)

5.3. Metode pentru estimarea parametrilor

271

Exemplul 5.3.34. Masinile si ambaleaz
a carne n pachete de
grame.

Greutatea cutiilor este o caracteristic
a

,
ce
urmeaz
a
legea
normal
a
si

respectiv o caracteristica , ce urmeaza legea normala
.

Cantarind de pachete din cele produse de masina
sa obtinut valoarea

mediei de selectie
grame, iar din cantarirea a de pachete de la masina

grame.
sa obtinut

Folosind probabilitatea
de

ncredere
, sa determinam intervalul
de ncredere

pentru diferenta
, daca se stie ca abaterile standard sunt
si
.

Se foloseste statistica (5.3.5), care
urmeaz
a
legea
normal
a

.
Astfel,
inter
valul de ncredere pentru diferenta
este dat prin (5.3.6), unde se deter

.
mina astfel ca
. Folosind Anexa I, obtinem

De asemenea, avem ca

Astfel, intervalul de ncredere pentru diferenta

este

Programul 5.3.35. Executarea programului Matlab:

z1=norminv(0.01,0,1); z2=norminv(0.99,0,1);
s=sqrt(9/100+16/150); d=1007-1002;
m1=d+z1*s; m2=d+z2*s;
fprintf( (m1,m2)=(%6.3f,%6.3f),m1,m2)

conduce la rezultatul:
(m1,m2)=( 3.968, 6.032)

Exemplul 5.3.36. Fie caracteristica ce urmeaza legea normala

si care
reprezint
a vanzarile n milioane lei pe saptamana la magazinele alimentare n orasul

si vanzarile n milioane
lei la magazinele alimentare din orasul si care ur
. Sau efectuat dou
meaz
a
legea
normal
a

a sondaje, respectiv pentru si

si sau obtinut urmatoarele date de selectie:

272

Teoria estimatiei

Cu probabilitatea de
ncredere
, vrem sa se construim un interval de ncredere

pentru diferenta
, daca este necunoscut.

Folosind statistica (5.3.7), care urmeaza legea Student cu

grade de libertate, se va construi intervalul de ncredere pentru
. Anume,
acest interval de ncredere este precizat prin (5.3.8).
Pentru a determina valoarea numerica a intervalului de ncredere, se calculeaza
pe rand

si

va fi

De asemenea, din Anexa II, pentru

astfel ca intervalul de ncredere pentru

, obtinem

Programul 5.3.37. Prin executarea programului Matlab:

x1=[226.5,224.1,218.6,220.1,228.8,229.6,222.5];
x2=[221.5,230.2,223.4,224.3,230.8,223.8];
ma1=mean(x1); ma2=mean(x2); md=ma1-ma2;
v1=var(x1); v2=var(x2);
t1=tinv(0.025,11); t2=tinv(0.975,11);
s=sqrt((1/7+1/6)/11)*sqrt(6*v1+5*v2);
m1=md+t1*s; m2=md+t2*s;
fprintf( (m1,m2)=(%6.3f,%6.3f)\n,m1,m2)

regasim intervalul de ncredere pentru diferenta valorilor medii:

(m1,m2)=(-6.324, 3.619)

Exemplul 5.3.38.
Se
consider
a
dou
a
aparate
de

mbuteliat
vin

n
sticle
de

ml. Fie

a cantitatea de vin (n ml) mbuteliata de primul aparat
caracteristica ce reprezint

ntr-o sticla si respectiv aceeasi caracteristica pentru al doilea aparat. Pentru compararea modului de mbutliere pentru cele doua aparate, se considera cate o selectie
din sticlele mbuteliate de cele doua aparate, respectiv

5.3. Metode pentru estimarea parametrilor

273

Vom construi un interval de ncredere pentru diferenta

folosind
probabilitatea de risc
. Vom considera ca cele
doua caracteristici

si
si sunt independente si ca urmeaza legile normale

.

Distingem doua cazuri, unul cand se stie ca , caz
n care se foloseste
statistica (5.3.7), care urmeaz
a
legea
Student
cu
grade de libertate,

respectiv cand se stie ca
, caz n care se foloseste statistica (5.3.9), care
urmeaza legea Student cu grade de libertate. Numarul al gradelor de libertate se
calculeaza, n acest caz, cu formula (5.3.10)

In cazul
, extremitatile intervalului de ncredere pentru diferenta
sunt date prin formulele

Cuantila

Pe de alta parte

Astfel avem ca

, s-a determinat, conform Anexei II, din relatia

274

Teoria estimatiei

Pentru cazul
Astfel avem ca

iar apoi

, calculam prima data numarul

al gradelor de libertate.

Avand n vedere ca

de unde avem ca
.
Extremitatile intervalului de ncredere sunt date prin

rezulta ca

Programul 5.3.39. Programul Matlab, care urmeaza, rezolva problema precedenta,

adica, va determina intervale de ncredere pentru diferenta mediilor, n cele doua
cazuri, cand se considera dispersii egale si necunoscute, respectiv dispersii diferite
necunoscute.
x1=[746,743,748,748,750,745,744,753,750,751,743,747,749,742];
x2=[749,748,748,753,750,749,747,745,744,751];
ma1=mean(x1); ma2=mean(x2); md=ma1-ma2;
v1=var(x1); v2=var(x2);
t1=tinv(0.025,22); t2=tinv(0.975,22);
s=sqrt((1/14+1/10)/22)*sqrt(13*v1+9*v2);
m1=md+t1*s; m2=md+t2*s;
fprintf( (m1,m2)=(%6.3f,%6.3f)\n,m1,m2)
c=(v1/14)/(v1/14+v2/10);n=c2/13+(1-c)2/9;
n=ceil(1/n); t1=tinv(0.025,n); t2=tinv(0.975,n);
s=sqrt(v1/14+v2/10); m1=md+t1*s; m2=md+t2*s;
fprintf( (m1,m2)=(%6.3f,%6.3f)\n,m1,m2)

Dupa executarea programului, se obtin cele doua intervale de ncredere:

(m1,m2)=(-3.990, 1.333)
(m1,m2)=(-3.888, 1.231)

5.3. Metode pentru estimarea parametrilor

275

5.3.5 Metoda intervalelor de ncredere pentru selectii mari

Fie caracteristica cercetata, cu legea de probabilitate , unde
este un parametru necunoscut. Consideram o selectie repetata de volum relativa la

caracteristica , pentru care avem variabilele de selectie
.

Proprietatea 5.3.40. Daca se considera variabilele aleatoare

prin relatia

ln

definite

si pentru care exista dispersia

pentru

, atunci statistica

, urmeaza legea normala

independente si identic reDemonstratie. Variabilele aleatoare ,

, fiind

partizate, rezulta ca si variabilele aleatoare ,
, sunt independente si identic
repartizate. Conform teoremei limita centrala, avem ca

rezulta ca

converge n repartitie la legea normala

Deoarece

, ceea ce ncheie demonstratia.

Pentru probabilitatea
de ncredere
data se va determina intervalul numeric

astfel ncat

Functia
Ceea ce revine la determinarea cuantilei astfel ncat

a lui Laplace este aici, cea tabelata n Anexa I.

Prin operatii algebrice se nlocuieste inegalitatea
inega , cu dubla

litate echivalenta de forma

care

defineste intervalul de ncredere pentru parametrul .

Aplicatia 5.3.41.
si
cu probabilit
at ile
Fie caracteristica ce ia numai valorile

si respectiv
, adica are functia de frecventa

unde
este un parametru necunoscut.

276

Teoria estimatiei

Vom folosi metoda intervalelor de ncredere pentru selectii mari n vederea estimarii parametrului .Consideram o selectie repetata de volum
(mare) si probabi
litatea de ncredere
. Deoarece ln ln
ln avem
ca

ln

si prin urmare se obtine statistica

rezulta

ln

Stiind ca

Statistica

.
si care urmeaza legea normala
, cand

Pentru dat, se determina
astfel ncat

Putem scrie ca
este echivalenta cu

devine asadar

Discriminantul trinomului este pozitiv, anume

deci inecuatia n are solutia de forma unui interval si care va reprezenta
intervalul de ncredere pentru parametrul .
Astfel extremitatile intervalului de ncredere au urmatoarele expresii:

5.3. Metode pentru estimarea parametrilor

277

Aceste formule de calcul sunt complicate. Avand n vedere ca aceste formule au

fost deduse pentru mare, sa zicem , cand se obtin rezultate bune, putem
face simplificari ale acestor formule. In primul rand putem folosi urmatoarea scriere
asimptotica

iar apoi

S-a ajuns, n acest mod, la intervalul de ncredre pentru

Observatia 5.3.42. Daca se doreste sa se determine

parametrul cu o incertitudine

, pentru o probabilitate de ncredere
, atunci volumul selectiei se determina
n felul urmator. Avand n vedere ca

conduce la volumul optim al

conditia
, echivalenta cu
selectiei.
Mai jos prezentam un tabel cu valorile optime ale volumului selectiei pentru diferite valori ale nivelului de ncredere si ale lui :

0.90

0.95

0.98

0.01

6760

9600

13530

0.02

1700

2400

3380

0.05

270

380

540

5.3.6 Functii Matlab privind estimatia

Sistemul Matlab, prin Statistics toolbox, dispune de functii corespunzatoare teoriei
estimatiei, pe care le prezentam n continuare.

278

Teoria estimatiei

Functia histfit
Functia histfit are drept rezultat reprezentarea pe aceeasi figura a histogramei si

.
a densitat ii legii normale
Lansarea executarii functiei se face prin una din formele
histfit(x)
histfit(x,nc)

unde x este un vector ce contine datele ce urmeaza a fi prelucrate, iar nc este numarul
claselor. Daca parametrul nc este absent, atunci numarul claselor se considera ca
fiind radicalul volumului datelor, adica radicalul lungimii vectorului x.
Programul 5.3.43. Programul urmator genereaza n numere aleatoare, ce urmeaza
legea normala
, dupa care
apeleaza la functia histfit, iar graficul obtinut,
pentru n=100,
si
, este prezentat n Figura 5.5.
n=input(n=); mu=input(mu=);
s=input(sigma=);x=normrnd(mu,s,1,n);
histfit(x), colormap spring

Figura 5.5: Legea

Functia mle
Pentru estimarea parametrilor, folosind metoda verosimilitat ii maxime, precum si
metoda intervalelor de ncredere, poate fi utilizata functia mle. Apelul functiei se
poate face prin una din instructinile:

5.3. Metode pentru estimarea parametrilor

279

P=mle(lege,x)
[P,int]=mle(lege,x)
[P,int]=mle(lege,x,alpha)
[P,int]=mle(lege,x,alpha,n)

unde lege specifica una din legile: bernoulli, unid, bino, poiss, geo,
unif, norm, gam, exp, beta, weib si rayl. Parametrul x este un vector, iar n
urma executarii unei astfel de instructiune, P si int vor contine estimatori de verosimilitate maxima, respectiv intervale de ncredere, pentru parametrii legii considerate,
obtinute pe baza datelor continute de x.
Parametrul optional alpha, avand valoarea implicita alpha=0.05, specifica
probabilitate de ncredere, 1-alpha, n construirea intervalelor de ncredere.
Ultima forma este specifica numai legii binomiale, adica lege=bino, parame
trul n fiind parametrul cel de la legea n . Daca x si n sunt scalari, se returneaza
n P raportul acestora, daca x este vector si n este scalar, se va returna n P fiecare
element a lui x mpartit la n, iar daca x si n sunt vectori de aceleasi dimensiuni, P va
contine rapoartele pe componente ale lui x si n.
Mai remarcam ca pentru prima data ntalnim legea lui Bernoulli, care reprezinta

cazul particular al legii binomiale, . Daca lege=bernoulli, atunci x, desigur, trebuie sa contina numai valorile 0 si 1.
Functia 5.3.44. Vom scrie o functie, care genereaza n numere aleatoare ce urmeaza
una din legile de probabilitate: uniforma discreta, Poisson, uniforma, normala, Gamma, exponentiala, Weibull si Rayleigh. Se va apela aceasta functie pentru obtinerea
estimatiilor de verosimilitate maxima ale parametrilor legii de probabilitate considerate. De asemenea, se va reprezenta grafic, pe aceeasi figura, functia de repartitie a
legii de probabilitate considerata, mpreuna cu functia de repartitie a aceleasi legi, dar
avand parametrii precizati nlocuiti cu estimatiile acestora.
function veros(lege,n)
switch lege
case unid
P1=input(N=);
case poiss
P1=input(lambda=);
case unif
P1(1)=input(a=); P1(2)=input(b=);
case norm
P1(1)=input(mu=); P1(2)=input(sigma=);
case gam
P1(1)=input(a=); P1(2)=input(b=);
case exp
P1=input(mu=);
case beta
P1(1)=input(a=); P1(2)=input(b=);
case weib
P1(1)=input(a=); P1(2)=input(b=);

280

Teoria estimatiei
case rayl
P1=input(b=);
otherwise
error(Eroare)
end
if length(P1)==1
x=random(lege,P1,1,n);
else
x=random(lege,P1(1),P1(2),1,n);
end
P2=mle(lege,x); xx=min(x):0.01:max(x);
if length(P1)==1
F1=cdf(lege,xx,P1); F2=cdf(lege,xx,P2);
else
F1=cdf(lege,xx,P1(1),P1(2)); F2=cdf(lege,xx,P2(1),P2(2));
end
plot(xx,F1,k-.,xx,F2,k-)
legend(Functia de repartitie teoretica,...
Functia de repartitie estimata,2)

Apelul functiei veros se face prin

>>veros(lege,n)

unde valorile pentru n si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>veros(poiss,50)

are ca efect apelul functiei pentru legea lui Poisson, iar pe ecran se va cere introducerea parametrului lambda, dupa care pe ecran va fi reprezentat graficul din Figura 5.6,
n cazul n care lambda=7. Sa remarcam totusi ca la un nou apel, cu aceeasi parametri, graficul difera, deoarece sunt generate alte numere aleatoare.
Daca se considera comanda
>>veros(norm,50)

are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introducerea parametrilor mu si sigma, dupa care pe ecran va fi reprezentat graficul din
Figura 5.7, n cazul n care mu=10 si sigma=2.
Functiile normlike, gamalike,betalike si weiblike
Functiile normlike, gamlike, betalike si weiblike sunt specifice pentru
Statistics toolbox si se pot apela cu una din comenzile
L=numef(par,x)
[L,cov]=numef(par,x)

unde numef reprezinta numele uneia din cele patru functii.

Parametrul par contine respectiv parametrii legilor normala, gamma, beta si
Weibull, iar x este un vector, care contine datele de selectie.

5.3. Metode pentru estimarea parametrilor

281

1
Functia de repartitie teoretica
Functia de repartitie estimata
0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

Figura 5.6: Legea

1
Functia de repartitie teoretica
Functia de repartitie estimata
0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

Figura 5.7: Legea

282

Teoria estimatiei

Prima forma returneaza n L valoarea logaritmului functiei de verosimilitate de

parametrii precizati prin par, nmultita cu -1.
Daca se foloseste a doua forma, se mai returneaza matricea var, care reprezinta
valoarea asimptotica a matricei covariantelor estimatorilor parametrilor legii considerate, cand sau considerat parametrii de intrare par, ca fiind estimatiile de verosimilitate maxima ale acestora. Remarcam faptul ca var reprezinta inversa matricei
informatiei lui Fisher, cand volumul selectiei tinde la infinit.
Functiile binofit, poissfit, unifit, normfit,
gamfit, expfit, betafit, raylfit si weibfit
Functiile Matlab din aceasta categorie returneaza estimatii punctuale si intervale de
ncredere pentru parametrii respectiv ai legilor de probabilitate binomiala , Poisson,
uniforma, normala, Gamma, exponentiala, Beta, Rayleigh si Weibull.
Apelul acestor functii nu are o sintaxa generala.
Pentru functia binofit se pot folosi comenzile
P=binofit(x,n)
[P,int]=binofit(x,n)
[P,int]=binofit(x,n,alpha)

parametrul x fiind un vector, iar n precizeaza parametrul ntreg pozitiv al legii binomiale n . Pentru functiile poiss si exp, respectiv pentru gam, beta, rayl
si weib, apelurile sunt de forma:
P=numef(x)
[P,int]=numef(x,alpha)

unde parametrul numef reprezinta numele functiei, iar x este fie un vector, fie o
matrice, pentru prima grupa de functii, iar pentru a doua, numai vector. Daca x este
matrice, atunci functia opereaza pentru fiecare coloana n parte.
Pentru legile unif si norm, apelurile sunt:
[par1,par2,int1,int2]=unifit(x)
[par1,par2,int1,int2]=normfit(x,alpha)

unde x poate fi vector sau matrice. In al doilea caz, operatiunea se executa pentru
fiecare coloana n parte.
De regula, estimatiile punctuale returnate, sunt obtinute prin metoda verosimilitatii maxime, folosinduse datele continute n parametrul x, n parametrii P, par1
si par2. Intervalele de ncredere sunt returnate n parmetrii int, int1 si int2, si
sunt determinate folosind probabilitatea de ncredere 1-alpha. Valoarea implicita
pentru alpha fiind alpha=0.05.
Pentru legile unif si norm, n comenzile de apel pot lipsi int2, int1 si par2,
caz n care sunt returnate numai valorile parametrilor ramasi.
Mai remarcam faptul ca int, int1 si int2 au cate doua componente, extremitatile intervalului de ncredere corespunzator.

5.3. Metode pentru estimarea parametrilor

283

Functia 5.3.45. Vom scrie o functie, care genereaza n numere aleatoare, ce urmeaza
una din legile Gamma, Beta, Weibull si Rayleigh. Folosind aceste numere, se vor
da estimatii punctuale pentru parametrii acestora, precum si intervale de ncredere,
considerand o probabilitate de ncredere 1-alpha specificata. Folosind estimatiile
punctuale obtinute pentru parametri, se vor reprezenta grafic densitatile de probabilitate, folosind parametrii estimati si respectiv parametrii considerati la generarea
numerelor aleatoare. De asemenea, se vor afisa intervalele de ncredere obtinute.
function estimat(lege,n,alpha)
switch lege
case gam
a=input(a=); b=input(b=);
x=gamrnd(a,b,n,1); [P,I]=gamfit(x,alpha);
case beta
a=input(a=); b=input(b=);
x=betarnd(a,b,n,1); [P,I]=betafit(x,alpha);
case weib
a=input(a=); b=input(b=);
x=weibrnd(a,b,n,1); [P,I]=weibfit(x,alpha);
case rayl
b=input(b=); x=raylrnd(b,n,1);
[P,I]=raylfit(x,alpha);
otherwise
error(Eroare)
end
t=min(x):0.01:max(x);
if length(P)==1
y=pdf(lege,t,P); yy=pdf(lege,t,b);
fprintf( bbarat=%6.3f\n,P)
fprintf( (b1,b2)=(%6.3f,%6.3f)\n,I)
else
y=pdf(lege,t,P(1),P(2)); yy=pdf(lege,t,a,b);
fprintf( abarat=%6.3f, bbarat=%6.3f\n,P)
fprintf( (a1,a2)=(%6.3f,%6.3f)\n,I(1,1),I(2,1))
fprintf( (b1,b2)=(%6.3f,%6.3f)\n,I(1,2),I(2,2))
end
plot(t,y,k-,t,yy,k-.), plot(t,y,k-,t,yy,k-.)
legend(Legea estimata, Legea teoretica)

Apelul functiei estimat se face prin

>>estimat(lege,n,alpha)

unde valorile pentru n, lege si alpha, fie ca sunt precizate n acest apel, fie sunt
precizate nainte. De exemplu, comanda
>>estimat(beta,500,0.01)

are ca efect apelul functiei pentru legea Beta, iar pe ecran se va cere introducerea
parametrilor a si b, dupa care pe ecran va fi reprezentat graficul din Figura 5.8, n
cazul n care a=3 si b=7. Sa remarcam totusi ca la un nou apel, cu aceeasi parametri,
graficul difera, deoarece sunt generate alte numere aleatoare. De asemenea, se vor
afisate si estimatiile punctuale, respectiv intervalele de ncredere:

284

Teoria estimatiei
3
Legea estimata
Legea teoretica

2.5

1.5

0.5

0.1

0.2

0.3

0.4

Figura 5.8: Legea

abarat= 2.925, bbarat= 7.130
(a1,a2)=( 2.431, 3.418)
(b1,b2)=( 5.928, 8.333)

0.5

0.6

0.7

0.8

Capitolul 6

Verificarea ipotezelor statistice

6.1 Concepte de baza
Fie colectivitatea cercetata din punct de vedere al caracteristicii , care are le
gea de probabilitate data prin functia de probabilitate , ce reprezinta functia
de frecventa n cazul discret, respectiv densitatea de probabilitate n cazul continuu,
pentru variabila aleatoare .
Definitia 6.1.1. Numim ipoteza statistica o presupunere relativa la legea de probabilitate pe care o urmeaza caracteristica .
Definitia 6.1.2. Metoda de stabilire a veridicitat ii unei ipoteze statistice, se numeste
test (criteriu) de verificare a ipotezei statistice.
Definitia 6.1.3. Cand ipoteza statistica se refera la parametri de care depinde legea
de probabilitate a caracteristicii se obtine un test parametric, iar n caz contrar se
obtine un test neparametric.

Observatia 6.1.4. Pentru testele parametrice vom considera ca ,

. Ipoteza o vom numi ipoteza nula, iar ipoteza
unde

o vom numi ipoteza alternativa.
Definitia 6.1.5. O ipoteza parametrica se numeste ipoteza simpla, daca multimea la
care se presupune ca apartine parametrul necunoscut este formata dintr-un singur
element, iar n caz contrar se numeste ipoteza compusa.
Observatia 6.1.6. Ipoteza nula este aceea care o intuim a fi cea apropriata de realitate, intuitie pe care o obtinem din informatiile pe care le detinem referitoare la
caracteristica cercetata .
285

286

Verificarea ipotezelor statistice

Observatia 6.1.7. Construirea unui test revine la obtinerea unui domeniu

numit regiune critica, pentru un nivel de semnificatie (probabilitate de risc)
astfel ncat

,
dat,

unde
sunt variabilele de selectie corespunzatoare unei selectii de
volum considerata.

Folosind datele de selectie si regiunea critica astfel determinata, avem ca ipo

, iar n caz contrar va
teza nula va fi admisa (acceptata) daca
fi respinsa, altfel spus ipoteza alternativa va fi admisa (acceptata) n al doilea caz.

6.2 Testul

privind media teoretica

Se considera caracteristica care urmeaza legea normala

este necunoscut, iar este cunoscut.
Relativ la media teoretica
facem ipoteza nula
din alternativele:

(testul

bilateral),

(testul

unilateral dreapta),

(testul

unde

, cu una

unilateral stanga).
Pentru verificare ipotezei nule cu una din alternativele precizate mai nainte,

consideram o selectie repetata de volum

Se cunoaste ca statistica

urmeaza legea normala
. Prin urmare, pentru

interval numeric
astfel ncat

si un nivel de semnificatie

, putem determina un

Intervalul nu este determinat n mod unic, dar avand n vedere alternativa

considerat
a, adaugam conditia suplimentara:

, daca

, unde

, adica

, unde

, daca

;

6.2. Testul

privind media teoretica

, unde

287

, daca

Corespunzator celor trei alternative definim regiunea critica respectiv prin:

Aici s-a folosit notatia .
Intr-adevar, pentru fiecare din cele trei regiunui critice scrise mai nainte, avem

ca

Modul n care am ales regiunea critica ne
conduce respectiv la testul bilateral, unilateral dreapta si unilateral stanga.
Mai tarziu va fi fundamentata riguros modalitatea de construire a regiunii critice
pentru alternativele considerate.
Odata construita regiunea critica , ipoteza nula va fi admisa daca datele de

, iar n caz contrar va fi respinsa.
selectie satisfac conditia
Remarcam de asemenea ca regiunea critica corespunde multimii complemen
tare intervalului .
Etapele aplicarii testului
1. Se dau:

;

2. Se calculeaza intervalul
s-a precizat mai nainte);

astfel ncat

3. Se calculeaza
4. Concluzia: daca
este respinsa.

unde

(dupa cum

ipoteza este admisa, n caz contrar ipoteza

Observatia 6.2.1. Testul se poate aplica si n cazul unei caracteristici care nu

urmeaza legea normala, daca volumul selectiei este mare ( ), considerandu

se media teoretica
necunoscuta si abaterea standard

cunoscuta. Aceasta consideratie se bazeaza pe Teorema 2.7.8.

288

Verificarea ipotezelor statistice

Exemplul 6.2.2. Caracteristica reprezinta cheltuielile lunare n mii lei pentru abonamentele la ziare si reviste ale unei familii. Sa se verifice, cu nivelul de semnificatie

, daca media acestor cheltuieli lunare pentru o familie este de mii lei,

stiind ca abaterea standard
mii lei si avand o selectie repetata de volum
,
care ne da distributia empirica de selectie

Deoarece

si abaterea standard
pentru verificarea ipotezei nule

Pentru

este cunoscuta, vom folosi testul

cu ipoteza alternativa

, folosind Anexa I, se determina

Anume, se obtine ca

pentru statistica notata prin:

, astfel ncat

, care ne da intervalul numeric

Calculam succesiv

Deoarece

, rezulta ca se accepta ipoteza ca cheltuielile
medii lunare ale unei familii pentru abonamentele la ziare si reviste sunt de 16 mii

lei, cu nivelul de semnificatie
.
Programul 6.2.3. Programul Matlab, care urmeaza, executa aceste calcule si afiseaza
intervalul de ncredere, mpreuna cu valoarea calculata a statsiticii .
x=[11 13 15 17 20]; f=[4 6 12 10 8];
z=(sum(x.*f)/40-16)/(3/sqrt(40));
z1=norminv(0.005,0,1); z2=norminv(0.995,0,1);
fprintf( (z1,z2)=(%6.3f,%6.3f)\n,z1,z2)
fprintf(
z=%6.3f,%6.3f),z)

6.2. Testul

privind media teoretica

289

In urma executarii programului, sau obtinut rezultatele:

(z1,z2)=(-2.576, 2.576)
z=-0.422,

Observatia 6.2.4. Avand n vedere ca functia

a lui Laplace este monoton

crescatoare si ca pentru determinarea intervalului este necesara inversarea
functiei lui Laplace, se poate renunta la inversarea acesteia. Pentru aceasta se determina ceea ce se numeste valoare critica si pe care o notam prin . Vom analiza pe
rand cele trei alternative.
Daca se considera testul bilateral, facand notatia

adica

ipoteza nula va fi respinsa daca , adica
.

Pentru testul unilateral dreapta, se noteaza

adica

, adica, la fel ca mai nainte, daca

iar ipoteza nula este respinsa, daca

.
Un rationament analog, pentru testul unilateral stanga ne conduce la valoarea cri

tica, calculata dupa formula
. Drept urmare, ipoteza nula este respinsa,

daca
.
In rezumat, ipoteza nula este respinsa, daca , unde

daca

Pentru datele din Exemplul 6.2.2, se obtine

pentru testul bilateral

pentru testul unilateral dreapta

petru testul unilateral stanga

290

Verificarea ipotezelor statistice

6.2.1 Functiile zscore si ztest

Sistemul Matlab, prin Statistics toolbox, dispune de functiile zscore si ztest, cu
aplicabilitate la testul . Apelarea acestor functii se face prin:
z=zscore(d)
h=ztest(x,m0,sigma)
h=ztest(x,m0,sigma,alpha)
h=ztest(x,m0,sigma,alpha,tail)
[h,c,ci,zc]=ztest(x,m0,sigma,alpha,tail)

In urma executarii primei instructiuni, daca d este un vector, se calculeaza abaterile

componentelor vectorului de la valorea medie a componentelor, raportate la abaterea
d d
standard a componentelor, adica x
Daca d este matrice, atunci operatia
d
este executata pentru fiecare coloana n parte.
Celelalte instructiuni se refera la functia ztest si efectueaza testul asupra
datelor continute n vectorul x, folosind nivelul de semnificatie alpha, care are valoarea implicita alpha=0.05.
Parametrul tail specifica una din cele trei alternative, care conduc la testul bilateral (tail=0, implicit), unilateral dreapta (tail=1) si unilateral stanga
(tail=-1). Daca h=1, atunci ipoteza nula va fi respinsa, respectiv daca h=0, ipoteza nu poate fi respinsa.
Ultima forma de apel permite, de asemenea, obtinerea valorii critice c, a valorii
zc a statisticii , precum si a intervalului de ncredere pentru media teoretica, corespunzator probabilitat ii de ncredere 1-alpha, obtinut n vectorul cu doua componente ci.
Programul 6.2.5. Programul Matlab, ce urmeaza, rezolva problema din Exemplul 6.2.2. Mai mult, se considera si testele unilateral dreapta si unilateral stanga,
precum si obtinerea intervalelor de ncredere.
x=[11*ones(1,4),13*ones(1,6),15*ones(1,12),...
17*ones(1,10),20*ones(1,8)];
fprintf( h
c
ci
z\n)
fprintf(____________________________________\n)
for i=-1:1
[h,c,ci,zc]=ztest(x,16,3,0.01,i);
fprintf( %d %5.4f
(%4.2f,%4.2f)
%6.4f\n,...
h,c,ci,zc)
end

In urma executarii programului, se obtin rezultatele:

h
c
ci
z
____________________________________
0 0.3366
(-Inf,16.90)
-0.4216
0 0.6733
(14.58,17.02)
-0.4216
0 0.6634
(14.70, Inf)
-0.4216

6.3. Puterea unui test

291

Se observa ca pentru tail=-1 si tail=1, se construiesc intervale nemarginite,

respectiv la stanga si la dreapta.

6.3 Puterea unui test

Definitia 6.3.1. Daca se considera un test relativ la ipoteza nula cu alternativa
, se numes
te eroare de genul (speta) ntai respingerea unei ipoteze adevarate, iar
probabilitatea acestei erori se numeste risc de speta ntai (risc al furnizorului) si este
data de nivelul de semnificatie, adica

Definitia 6.3.2. Se numeste eroare de genul (speta) al doilea admiterea unei ipoteze
false, iar probabilitatea acestei erori se numeste risc de speta a doua (risc al benefi
ciarului) si este notata ,

Observatia 6.3.3. Producerea unei erori de genul al doilea este mai grava decat a
unei erori de genul ntai, cand verificam concentratia unui medicament, care peste
un anumit grad de concentratie devine daunator. Pe de alta parte, producerea unei
erori de genul ntai este mai grava decat cea a unei erori de genul doi, cand verificam
calitatea unui articol de mbracaminte.
Definitia 6.3.4. Numim puterea unui test probabilitatea respingerii unei ipoteze false,
adica

cand este parametrul asupra caruia se face ipoteza statistica, iar este regiunea

critica construita sub ipoteza nula cu nivelul de semnificatie
fixat.
Observatia 6.3.5. Daca testul considerat se refera la ipoteza nul
a

, atunci
ipoteza alternativa
si

Aplicatia 6.3.6. Calculam n continuare puterea testului , cand avem ipoteza alter .

nativa
Dupa cum am vazut la testul regiunea critica n acest caz este

292

Verificarea ipotezelor statistice

Pentru calculul puterii

a testului avem

Daca se considera evenimentul contrar, vom putea scrie succesiv

de unde avem ca
(6.3.1)

adica

(6.3.2)

, vom
Deoarece
si
, rezulta ca pentru

avea
, adica
. Asadar, putem determina, din relatia precedenta

valoarea lui (volumul selectiei) astfel ncat puterea testului (corespunzator riscul
de speta a doua) sa fie atinsa pentru acel .

Exemplul 6.3.7. Relativ la caracteristica s-a efectuat o selectie de volum
,
obtinandu-se datele de selectie

Stiind ca urmeaza legea normala
cu abaterea standard teoretica cunos

cuta

, vrem sa verificam ipoteza nula
, cu nivelul de semnificatie , cand,
se considera ipoteza alternativa

iar apoi sa calculam puterea testului, cand

, si sa determinam
volumul optim al selectiei cand se considera alternativa
, si riscul de

speta a doua
.

6.3. Puterea unui test

293

Cand se considera alternativa

determina cuantila

se foloseste testul

din relatia

bilateral. Se

Pe de alta parte avem ca

astfel ca

Deoarece

, ipoteza
este admisa.

Formula de calcul a puterii testului bilateral este (6.3.2). Prin urmare, se obtine

Pentru determinarea volumului optim al selectiei, cand se considera alternativa

, se foloseste formula (6.3.1). Astfel se obtine

Cand este astfel
ncat

, se observa ca valoarea
nu poate

fi atinsa. Daca
, atunci , astfel avem

.
Prin urmare, pentru determinarea
lui optim avem relatia
,de

si folosind Anexa I se obtine

, adica
unde se obtine
.

Programul 6.3.8. Programul Matlab, ce urmeaza, pe langa faptul ca va efectua calculele din exemplul precedent, va reprezenta grafic si functia putere. Punctele de pe
curba puterii, ale caror valori au fost calculate n exemplul de mai sus, sunt marcate
prin cerculete n Figura 6.1.

294

Verificarea ipotezelor statistice

clear,clf
x=[3.59,4.27,2.83,2.28,3.69,2.81,3.16,3.03,3.65,...
3.84,4.32,3.21,3.20,3.32,3.82,3.27,3.77,3.56,...
3.29,4.08,2.97,3.29,3.78,3.58];
z=(mean(x)-3.5)/(0.5/sqrt(24));
z1=norminv(0.005,0,1); z2=norminv(0.995,0,1);
fprintf( z=%6.3f\n z1=%6.3f\n z2=%6.3f\n,z,z1,z2)
m=3:0.01:4; m1=3.4:0.1:3.7;
c1=norminv(0.005,0,1); c2=norminv(0.995,0,1);
pib=1-normcdf((3.5-m)./(0.5/sqrt(24))+c2,0,1)...
+normcdf((3.5-m)./(0.5/sqrt(24))+c1,0,1);
pib1=1-normcdf((3.5-m1)./(0.5/sqrt(24))+c2,0,1)...
+normcdf((3.5-m1)./(0.5/sqrt(24))+c1,0,1);
plot(m,pib,k-,m1,pib1,o), grid on, len=length(m1);
for i=1:len
fprintf( pi(%3.1f)=%5.3f\n,m1(i),pib1(i))
end
za=norminv(0.005,0,1); zb=norminv(0.95,0,1);
n=ceil(0.52*(zb-za)2/(3.5-3.4)2);
fprintf( nopt=%3d,n)

Rezultatele obtinute, n urma executarii programului, sunt urmatoarele:

z=-0.567
z1=-2.576
z2= 2.576
pi(3.4)=0.055
pi(3.5)=0.010
pi(3.6)=0.055
pi(3.7)=0.269
nopt=446

Lema 6.3.9 (NeymanPearson). Fie caracteristica cu legea de probabilitate data

este parametrul necunoscut asupra c
aruia se face
prin , unde

ipoteza nula simpla

, cu ipoteza alternativa simpla

.
Se considera o selectie repetata de volum relativa la caracteristica si nivelul de

semnificatie dat
, atunci

regiunea critica , fiind definita prin

6.3. Puterea unui test

295

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

3.1

3.2

3.3

3.4

3.5

3.6

3.7

3.8

3.9

Figura 6.1: Curba functiei putere

unde

Demonstratie. Facem demonstratia n doua etape.

In prima etapa, consideram ca se cunoaste constanta

Pentru aceasta, daca notam

si aratam ca

, obtinem succesiv

de unde avem ca

296

Verificarea ipotezelor statistice

adica

(6.3.3)

Putem trece acum la calculul diferentei

Scriem aceata diferenta sub forma

Pentru fiecare integrala din membrul drept aplicam formula de medie. Prin urmare

astfel ncat
si
exista

Folosind relatia (6.3.3), stabilita mai nainte, avem ca

6.3. Puterea unui test

297

Dar integrala din membrul drept este pozitiva, iar din modul cum s-a definit regiunea
critica avem ca

deci

si ca urmare

. Ceea cencheie partea ntai a demonstratiei.
In partea a doua aratam existenta constantei .

Notam prin urmatoarea regiune

si prin

, urmatoarea probabilitate

Se observa ca

, iar

De asemenea, avem ca funct
ia este monoton

descrescatoare. Prin urmare,

fixat, exista

astfel ncat
, adica
pentru

Ceea ce ncheie demonstratia lemei.

Observatia 6.3.10. Demonstratia lemei NeymanPearson a fost facuta n cazul continuu. In mod analog se demonstreaza si pentru cazul discret, integralele multiple
care apar fiind nlocuite cu sume multiple.
Definitia 6.3.11. Testul pentru care puterea este maxima l numim cel mai puternic
test.
Definitia 6.3.12. Testul pentru care are loc inegalitatea

adica puterea testului este mai mare decat riscul de speta ntai se numeste test nedeplasat.

298

Verificarea ipotezelor statistice

Proprietatea 6.3.13.Cel mai puternic test dat de lema NeymanPearson este un test

nedeplasat, adica

.
Demonstratie. Cu notatiile de la lema NeymanPearson, avem ca

Distingem dou
a cazuri.
Daca avem , atunci obtinem

de unde

.
In cazul cand

de unde

, avem

, ceea ce trebuie demonstrat.

Observat
ia 6.3.14. Prin micsorarea riscului de speta ntai, pentru fixat, creste con, deci creste riscul de speta a
stanta si prin urmare scade puterea testului,
doua.
Aplicatia 6.3.15. Fie caracteristica ce urmeaza legea normala
, unde

este necunoscut si este cunoscut. Fie ipoteza nula
, cu

ipoteza alternativa
. Vrem sa determinam cel mai puternic test
pentru verificarea acestei ipoteze nule.
Pentru aceasta aplicam lema Neyman-Pearson.
Prima data determinam regiunea critica .
Deoarece

6.3. Puterea unui test

299

rezulta ca

Conditia care defineste regiunea critica

devine prin logaritmare

adica

Distingem n continuare doua cazuri.

Daca , avem

si notand constanta din membrul drept prin

critica a celui mai puternic test este

Daca

, avem ca . Asadar regiunea

procedand analog, se ajunge la regiunea critica

Pentru determinarea constantei

(cazul

se scrie relatia

300

Verificarea ipotezelor statistice

Prin urmare,
se va determina astfel ncat

Laplace este cea definita prin

In acest fel, regiunea critica se poate scrie

In cazul

de unde

Asadar avem cuantila , ca fiind

procedand la fel, se ajunge la

unde functia

a lui

Observatia 6.3.16. In aplicatia precedenta, regiunea critica

nu depinde de

numai prin faptul ca
, respectiv
. Drept urmare, ipoteza se

poate nlocui, pentru cele doua situatii prin
, ceea ce ne conduce

, care ne conduce la testul

la testul unilateral dreapta, respectiv

unilateral stanga. Aceasta confirma justetea alegerii regiunilor critice n cazul testului
unilateral dreapta si respectiv stanga.

(testul
Observatia 6.3.17. Cand se considera ipoteza alternativa
bilateral), utilizand lema NeymanPearson, nu putem construi un cel mai puternic
test. Alta metoda va fi prezentata pentru construirea acestuia n acest caz.
Aplicatia 6.3.18. Vrem sa determinam n continuare puterea testului
Aplicatia 6.3.15.
Din nou distingem cele doua cazuri.
Daca , avem succesiv

stabilit la

6.3. Puterea unui test

301

unde functia a lui Laplace este cea din Aplicatia 6.3.15.

, de asemenea, avem
Daca

, cand , adica .

Se vede, nca odata, n ambele cazuri, ca

Sa ncheiem prin modul de determinare a volumului al selectiei, pentru a se

atinge o putere a testului (sau un risc de speta a doua) apriori fixata. Desigur ca
este considerat de asemenea dat.

In cazul , din

am determinat

Pe de alta parte,
rescrie n felul urmator

adica

de unde se obtine o alta relatie ce l contine pe , anume
parand cele doua relatii ce l contin pe , avem ca

(6.3.4)
In cazul

Com-

avem urmatoarele doua relatii, care l contin pe

de unde se obtine

(6.3.5)

de unde se obtine

302

Verificarea ipotezelor statistice

Exemplul 6.3.19. Sa consideram aceleasi date de selectie de la Exemplul 6.3.7. Vom

verifica ipoteza nula
, cand se considera respectiv ipotezele alternative

. Vom
,

, iar nivelul de semnificatie este

calcula puterea pentru fiecare din testele considerate, cand

,
iar apoi vom determina volumul optim al selectiei cand se considera alternativa

.
, respectiv
, cu riscul de speta a doua fixat
Cand se considera alternativa

se foloseste testul unilateral

dreapta. In acest
caz,
cuantila
se
determin
a
din

Deoarece

, rezulta ca ipoteza nula este admisa.

Pentru alternativa

se
te testul unilateral stanga. Se deter

foloses

mina
Deoarece are loc inegalitatea

din relatia

, se admite ipoteza si n acest ultim caz.
Pentru testul unilateral dreapta, formula de calcul a puterii este

si prin urmare

In cazul testului

unilateral stanga, avem

deci

Pentru determinarea volumului optim al selectiei, cand folosim testul unilateral

, se utilizeaza formula (6.3.4):
stanga, cu alternativa

de unde se obtine

6.3. Puterea unui test

303

Pentru determinarea volumului optim al selectiei, cand folosim testul unilateral

dreapta, cu alternativa
, se utilizeaza formula (6.3.5). Astfel volumul
optim al selectiei se calculeaza cu formula:

de unde se obtine

Programul 6.3.20. Programul Matlab urmator, efectueaza calculele din exemplul

precedent, iar n plus, reprezinta grafic curbele putere, n cazul celor doua alternative. Punctele de pe curbele putere, care au fost calculate n exemplul precedent, sunt
marcate pe Figura 6.2 prin cerculete.
clear,clf
x=[3.59,4.27,2.83,2.28,3.69,2.81,3.16,3.03,3.65,...
3.84,4.32,3.21,3.20,3.32,3.82,3.27,3.77,3.56,...
3.29,4.08,2.97,3.29,3.78,3.58];
z=(mean(x)-3.5)/(0.5/sqrt(24));
fprintf( z=%6.3f\n,z)
z1=norminv(0,0,1); z2=norminv(0.99,0,1);
fprintf(
m gt 3.5\n)
fprintf( z1=%6.3f, z2=%6.3f\n,z1,z2)
z1=norminv(0.01,0,1); z2=norminv(1,0,1);
fprintf(
m lt 3.5\n)
fprintf( z1=%6.3f, z2=%6.3f\n,z1,z2)
m=3:0.01:4; m1=3.4:0.1:3.7;
c2=norminv(0.99,0,1);
pib=1-normcdf(c2+(3.5-m)./(0.5/sqrt(24)),0,1);
pib1(1,:)=1-normcdf(c2+(3.5-m1)./(0.5/sqrt(24)),0,1);
subplot(2,1,1)
plot(m,pib,k-,m1,pib1(1,:),o), grid on
c1=norminv(0.01,0,1);
pib=normcdf(c1+(3.5-m)./(0.5/sqrt(24)),0,1);
pib1(2,:)=normcdf(c1+(3.5-m1)./(0.5/sqrt(24)),0,1);
subplot(2,1,2)
plot(m,pib,k-,m1,pib1(2,:),o), grid on
len=length(m1);
for i=1:len
for j=1:2
fprintf( pi(%3.1f)=%5.3f
,m1(i),pib1(j,i))
end
fprintf(\n)
end
zb=norminv(0.95,0,1); za=norminv(0.01,0,1);
nr=ceil(0.52*(zb-za)2/(3.5-3.4)2);
zb=norminv(0.05,0,1); za=norminv(0.99,0,1);
nl=ceil(0.52*(zb-za)2/(3.5-3.7)2);
fprintf( nr=%3d, nl=%3d,nr,nl)

304

Verificarea ipotezelor statistice

In urma executarii programului, pe langa graficele curbelor de putere, sunt afisate si

urmatoarele rezultate:
z=-0.567
m gt 3.5
z1= -Inf, z2= 2.326
m lt 3.5
z1=-2.326, z2=
Inf
pi(3.4)=0.000
pi(3.4)=0.089
pi(3.5)=0.010
pi(3.5)=0.010
pi(3.6)=0.089
pi(3.6)=0.000
pi(3.7)=0.357
pi(3.7)=0.000
nr=395, nl= 99

care reprezinta intervalele numerice (z1,z2) si volumul optim, cand se considera

cele doua alternative.
1
0.8
0.6
0.4
0.2
0

3.1

3.2

3.3

3.4

3.5

3.6

3.7

3.8

3.9

3.1

3.2

3.3

3.4

3.5

3.6

3.7

3.8

3.9

1
0.8
0.6
0.4
0.2
0

Figura 6.2: Curbele functiilor putere

6.4 Testul

(Student) privind media teoretica

, cu ambii parametri
Fie caracteristica ce urmeaza legea normala

si necunoscuti. Relativ la valoarea medie a acestei caracteristici, se face ipoteza
, cu una din alternativele
nula

, cand obtinem testul bilateral,

, cand obtinem testul unilateral dreapta,

6.4. Testul (Student) privind media teoretica

305

, cand obtinem testul unilateral stanga.

Pentru verificarea acestei ipoteze se considera o selectie repetata de volum , cu da

si corespunzator variabilele de selectie . Contele de selectie
form Proprietatii 4.2.26, statistica

unde

urmeaza legea Student cu

grade de libertate.
dat, se poate determina
Prin urmare, pentru nivelul de semnificatie

intervalul numeric astfel ncat

unde

este functia de repartitie pentru legea Student cu
grade de libertate (tabelata n
Anexa II, pentru anumite valori).

Intervalul numeric pentru statistica nu este determinat n mod unic din
conditia de mai sus. In functie de alternativa aleasa, se considera suplimentar:

unde

, daca

, daca

este cuantila de ordin

a legii Student cu

Corespunzator intervalului
prin:

, daca

grade de libertate, adica

se considera respectiv regiunea critice

definite

306

Verificarea ipotezelor statistice

Aici s-au utilizat notatiile
, respectiv

Se verifica imediat ca

iar cele trei moduri de
definire a regiunii critice ne conduc respectiv la testul bilateral, unilateral dreapta
si unilateral stanga.

,
Odata construita regiunea critica , folosind datele de selectie

ipoteza nula va fi admisa daca
, iar n caz contrar va fi
respinsa. Remarcam de asemenea ca regiunea critica corespunde multimii comple
mentare intervalului .
Etapele aplicarii testului
1. Se dau:

2. Se calculeaza intervalul astfel ncat

(dupa cum s-a prezentat nainte);
3. Se calculeaza

4. Concluzia: daca
respinsa.

unde

ipoteza este admisa, n caz contrar ipoteza este

Observatia 6.4.1. Cand numarul gradelor de libertate tinde la infinit, conform teoremei limita centrala, avem ca legea Student converge n repartitie la legea normala

. Prin urmare, daca volumul al selectiei este mare

se poate utiliza

testul pentru verificarea ipotezei nule

, prin utilizarea statisticii n
loc de statistica . Toate rezultatele de la testul raman, asadar, adevarate n acest
caz.
Observatia 6.4.2. Avand n vedere ca functia de repartitie a legii Student este strict

crescatoare, iar pentru determinarea intervalului este necesara inversarea
acestei functii, se poate renunta la operatia de inversare. Pentru aceasta se determina
ceea ce se numeste valoare critica, ca si la testul , si pe care o notam prin . Vom
analiza pe rand cele trei alternative.

6.4. Testul (Student) privind media teoretica

307

Daca se considera testul bilateral, facand notatia

adica

ipoteza nula va fi respinsa daca , adica
.

Pentru testul unilateral dreapta, se noteaza

adica

, adica, la fel ca mai nainte, daca

iar ipoteza nula este respinsa, daca

.
Un rationament analog, pentru testul unilateral stanga ne conduce la valoarea critica, calculata dupa formula
. Drept urmare, ipoteza nula este respinsa,

daca
.
In rezumat, ipoteza nula este respinsa, daca , unde

daca
daca
daca

6.4.1 Functia ttest

Sistemul Matlab, prin Statistics toolbox, dispune de functia ttest, cu aplicabilitate
la testul . Apelarea acestei functii se face prin:
h=ttest(x,m0)
h=ttest(x,m0,alpha)
h=ttest(x,m0,alpha,tail)
[h,c,ci]=ttest(x,m0,alpha,tail)

In urma executarii acestor instructiuni, se efectueaza testul asupra datelor continute

n vectorul x, folosind nivelul de semnificatie alpha, care are valoarea implicita
alpha=0.05.
Parametrul tail specifica una din cele trei alternative, care conduc la testul bilateral (tail=0, implicit), unilateral dreapta (tail=1) si unilateral stanga
(tail=-1). Daca h=1, atunci ipoteza nula va fi respinsa, respectiv daca h=0, ipoteza nu poate fi respinsa.
Ultima forma de apel permite, de asemenea, obtinerea valorii critice c, precum
si a intervalului de ncredere pentru media teoretica, corespunzator probabilitat ii de
ncredere 1-alpha, obtinut n vectorul cu doua componente ci.
Programul 6.4.3. Programul Matlab, ce urmeaza, aplica testul , pentru datele
din Exemplul 6.2.2, considerand ca dispersia este necunoscuta. Ipoteza nula este

308

Verificarea ipotezelor statistice

, iar ca ipoteze alternative se considera, pe rand, cele trei, care conduc, respectiv la testele bilateral, unilateral stanga si unilateral dreapta. Programul va
determina, de asemenea, intervalele de ncredere pentru media teoretica, n cele trei
cazuri, folosind alpha=0.01.
x=[11*ones(1,4),13*ones(1,6),15*ones(1,12),...
17*ones(1,10),20*ones(1,8)];
fprintf( h
c
ci
\n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest(x,16,0.01,i);
fprintf( %d %5.4f
(%4.2f,%4.2f) \n,h,c,ci)
end

In urma executarii programului, se obtin rezultatele:

h
c
ci
___________________________
0 0.3261
(-Inf,16.87)
0 0.6522
(14.61,16.99)
0 0.6739
(14.73, Inf)

Se observa ca pentru tail=-1 si tail=1, se construiesc intervale nemarginite,

respectiv la stanga si la dreapta.

6.5 Testul raportului verosimilitatilor

Fie caracteristica cu legea de probabilitate , unde parametrul necunoscut
. Relativ laparametrul , se considera ipoteza nula cu
alternativa . Se considera o selectie repetata de volum cu ajutorul
careia se construies te statistica

unde

este functia de verosimilitate. Din felul cum a fost definita statistica , avem ca

, iar ipoteza va putea fi acceptata daca este apropiata de . Fo
losind aceasta observatie, pentru un nivel de semnificatie
dat, se determina

regiunea critica din relatia

unde
este cuantila de ordin ,

pentru legea de probabilitate a statisticii .

6.5. Testul raportului verosimilitat ilor

309

Exemplul 6.5.1. Fie caracteristica ce urmeaza legea normala

, unde pa

rametrii
si sunt necunoscuti. Vrem sa verificam urmatoarea ipoteza
. Pentru aceasta
, cu alternativa
nula

consideram o selectie repetata de volum si nivelul de semnificatie
fixat.
Functia de verosimilitate este data prin

este adevarata, atunci estimatorul de verosimilitate maxima pentru

Cand ipoteza
este dat prin

Obtinem astfel, n acest caz, ca

Pe de alta parte, pentru determinarea numitorului statisticii , vom cauta estima si necunoscuti.
torii de verosimilitate maxima pentru parametrii
Sistemul de verosimilitate maxima

ne da estimatorii de verosimilitate maxima pentru

si , anume

310

Verificarea ipotezelor statistice

Obtinem astfel ca

Putem scrie acum statistica raportului verosimilitat ilor

Folosind formula lui Konig (Observatia 3.3.23):

avem ca

Daca se introduce statistica definita prin

atunci

, se obtine din

, care este

acelasi lucru cu

. Altfel spus, determinarea
cuantilei

.
revine la determinarea lui
, astfel ncat

Dar statistica , n ipoteza , urmeaza legea Student cu
grade de libertate

(Proprietatea
4.2.26),
deci
,
adic
a
cuantila
de
ordin

a legii Student

cu
grade de libertate. Putem scrie n final regiunea critica:

Regiunea critica , pentru

adica chiar regiunea critica de la testul

obtinem testul bilateral.

bilateral. Prin urmare, cu aceasta metoda

6.5. Testul raportului verosimilitat ilor

311

Teorema
6.5.2. Fie statistica
a raportului verosimilitatilor, atunci statistica

, fiind numarul
ln urmeaza legea cu grade de libertate, cand
parametrilor necunoscuti.
Demonstratie. Vom considera numai cazul .
Folosind formula lui Taylor cu doi termeni avem ca

ln
ln

unde sau

pentru , prin urmare

Pede alta parte, daca ipoteza
adevarata, se stie ca
a.s.
, cand . Putem scrie atunci este
ca
ln

este estimator de verosimilitate maxima

ln
deci avem ca

. Dar

a.s.
, deci

Folosind legea numerelor mari avem ca

ln a.s.

ln

de unde

Conform Observatiei 5.3.11, statistica

cand
, de unde avem ca statistica
grad de libertate, ceea ce trebuia aratat.

urmeaza legea normala ,

urmeaza legea cu un

312

Verificarea ipotezelor statistice

6.6 Testul

privind dispersia teoretica

Fie caracteristica ce urmeaza legea normala

, unde
necunoscuta si , de asemenea necunoscut.
Relativ la dispersia teoretica se face ipoteza nula
alternativele:

cand obtinem testul

bilateral,

cand obtinem testul

unilateral dreapta,

cand obtinem testul

unilateral stanga.

este

, cu una din

Pentru verificarea ipotezei nule , cu una din alternativele precizate, se con

si coressidera o selectie repetata de volum , cu datele de selectie

punzator variabilele de selectie
. Conform Proprietatii 4.2.25, avem
ca statistica

urmeaza legea cu
grade de libertate.

Folosind un nivel de semnificatie
dat, se poate determina un interval

numeric
astfel

nc
a
t

unde

este functia de repartitie pentru legea cu

grade de libertate (tabelata pentru
anumite valori n Anexa III).

Intervalul numeric pentru statistica nu este determinat n mod unic
din conditia de mai sus. In functie de alternativa aleasa se considera suplimentar:

unde

daca

este cuantila de ordin

daca

a legii

grade de libertate, adica

6.6. Testul

privind dispersia teoretica

Cu ajutorul intervalului numeric

tiv regiunile critice:

313

, astfel determinat, se considera respec-

Usor se verifica faptul ca

iar cele trei moduri

de definire a regiunii critice ne conduc respectiv la testul bilateral, unilateral

dreapta si unilateral stanga.
Odata construita regiunea critica , folosind datele de selectie, ipoteza nula

va fi admisa daca
, iar n caz contrar va fi respinsa. Remarcam
de asemenea

ca regiunea critica corespunde multimii complementare intervalului

.
Etapele aplicarii testului
1. Se dau:

astfel ncat

2. Se determina intervalul
(dupa cum s-a precizat nainte);
3. Se calculeaza

4. Concluzia: daca
respinsa.

unde

ipoteza este admisa, n caz contrar

este

Exemplul 6.6.1. Se consider

a caracteristica ce urmeaza legea normala

cu parametrii
si necunoscuti. Relativ la caracteristica se considera o
selectie repetata de volum
. Fie datele de selectie

Vrem sa verificam ipoteza nula , cu fiecare din urmatoarele alternative

, , , cand se considera

. Vom calcula

apoi valorile functiei putere pentru

, pentru fiecare din
alternativele considerate.

314

Verificarea ipotezelor statistice

Cand

avem testul

bilateral. Se calculeaza cuantilele

Pe de alta parte avem

Deoarece

ipoteza este respinsa.

Cand , avem testul unilateral dreapta si se calculeaza cuantila
. Astfel, avand n vedere ca , ipoteza

nula este admisa.

Cand
, avem testul unilateral stanga. In acest caz se calculeaza
si deoarece , ipoteza nula este
cuantila

respinsa.
Cand se considera testul bilateral, puterea se obtine din

deci

In cazul de fata , obtinem

6.6. Testul

privind dispersia teoretica

315

Pentru testul unilateral dreapta, n mod analog, se ajunge la

de unde

Cand se considera testul

deci

unilateral stanga, se obtine

Programul 6.6.2. Programul urmator, efectueaza calculele cerute n exemplul precedent. In plus, reprezinta grafic functia putere, cea din Figura 6.3, n cazul testului
bilateral, marcand prin cerculete punctele curbei putere, care au fost determinate n
exemplu.

316

Verificarea ipotezelor statistice

clf
x=[24.03,25.92,26.92,23.04,25.44,26.31,...
26.13,25.97,24.44,24.82,24.17,25.53,...
23.78,26.06,24.29];
x2=14*var(x)/1.82;
c1=chi2inv(0.025,14); c2=chi2inv(0.975,14);
fprintf( x2=%6.3f\n,x2)
fprintf(
sigma ne 1.8\n)
fprintf( c1=%6.3f, c2=%6.3f\n,c1,c2)
c1=chi2inv(0,14); c2=chi2inv(0.95,14);
fprintf(
sigma gt 1.8\n)
fprintf( c1=%6.3f, c2=%6.3f\n,c1,c2)
c1=chi2inv(0.05,14); c2=chi2inv(1,14);
fprintf(
sigma lt 1.8\n)
fprintf( c1=%6.3f, c2=%6.3f\n,c1,c2)
s=1.2:0.01:2.4; s1=1.5:0.1:1.9;
c1=1.82*chi2inv(0.025,14); c2=1.82*chi2inv(0.975,14);
pib=1-chi2cdf(c2./s.2,14)+chi2cdf(c1./s.2,14);
pib1(1,:)=1-chi2cdf(c2./s1.2,14)+chi2cdf(c1./s1.2,14);
plot(s,pib,k-,s1,pib1(1,:),o), grid on
c1=1.82*chi2inv(0,14); c2=1.82*chi2inv(0.95,14);
pib=1-chi2cdf(c2./s.2,14)+chi2cdf(c1./s.2,14);
pib1(2,:)=1-chi2cdf(c2./s1.2,14)+chi2cdf(c1./s1.2,14);
c1=1.82*chi2inv(0.05,14); c2=1.82*chi2inv(1,14);
pib=1-chi2cdf(c2./s.2,14)+chi2cdf(c1./s.2,14);
pib1(3,:)=1-chi2cdf(c2./s1.2,14)+chi2cdf(c1./s1.2,14);
len=length(s1);
for i=1:len
for j=1:3
fprintf( pi(%3.1f)=%5.3f
,s1(i),pib1(j,i))
end
fprintf(\n)
end

In urma executarii programului sau obtinut rezultatele:

x2= 5.446
sigma ne 1.8
c1= 5.629, c2=26.119
sigma gt 1.8
c1= 0.000, c2=23.685
sigma lt 1.8
c1= 6.571, c2=
Inf
pi(1.5)=0.117
pi(1.5)=0.002
pi(1.6)=0.073
pi(1.6)=0.008
pi(1.7)=0.052
pi(1.7)=0.022
pi(1.8)=0.050
pi(1.8)=0.050
pi(1.9)=0.068
pi(1.9)=0.095

pi(1.5)=0.200
pi(1.6)=0.128
pi(1.7)=0.080
pi(1.8)=0.050
pi(1.9)=0.031

6.6. Testul

privind dispersia teoretica

317

0.45

0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

1.5

Figura 6.3: Curba functiei putere - cazul bilateral

Observatia 6.6.3. Cand caracteristica nu urmeaza legea normala, pentru a verifica ipoteza nula de forma dinainte, cu una din alternativele precizate, unde dispersia

teoretica este
, se tine seama de faptul ca statistica

unde

.
, cand
urmeaza legea normala

De exemplu, daca ipoteza alternativa este , se va ajunge la regiunea
critica

unde este cuantila de ordin de la legea normala
.

Observatia 6.6.4. Daca se considera statistica

exista relatia

atunci ntre statisticile si

.

Deoarece se cunoaste legea de probabilitate pentru statistica (legea cu

grade de libertate), se poate determina si legea de probabilitate a statisticii
. Sunt
manuale care contin tabelata legea de probabilitate a lui . Descrierea testului ,
folosind statistica , urmeaza aceeasi cale ca cea cand se foloseste statistica .

318

Verificarea ipotezelor statistice

(ceea ce se ntampla mai rar)

Observatia 6.6.5. Cand se cunoaste parametrul

se poate considera statistica

Deoarece
gea cu
statistica.

, avem ca statistica urmeaza leurmeaza legea normala
de libertate. Cele prezentate mai nainte pot fi rescrise cu aceasta
grade

6.7 Testul (FisherSnedecor)

pentru compararea dispersiilor

Se considera doua populatii independente

si
cercetate din
punct de vedere al

aceleasi caracteristici.
Aceast
a
caracteristic
a
este

pentru
s

i
urmeaz
a legea
nor

mala
si respectiv pentru si urmeaza legea normala
.
Relativ la dispersiile
teoretice ale celor doua caracteristici se face ipoteza nula com

pusa
, cu una din alternativele:

, cand obtinem testul bilateral,

, cand obtinem testul unilateral dreapta,

, cand obtinem testul unilateral stanga.

considerate, se ePentru verificarea ipotezei nule , cu una din alternativele

fectueaz
a cate o selectie repetata de volume
respectiv si
din celedou
a populat
ii

si . Notam datele de select

ie
prin
s

i
respectiv

cu variabilele de selectie
si
Conform Proprietatii 4.2.30, statistica

unde

6.7. Testul (FisherSnedecor) pentru compararea dispersiilor

319

urmeaza legea FisherSnedecor cu

grade de libertate.
si

Pentru un nivel de semnificatie
fixat, se poate
determina un interval

numeric , astfel ca

unde

este functia de repartitie pentru legea FisherSnedecor cu

si grade de libertate

(tabelata pentru anumite valori n Anexa IV). Intervalul de ncredere pentru
statistica nu este unic determinat. In functie de alternativa aleasa, se considera
suplimentar:

daca

daca

daca

astfel determinat, se considera respectiv re-

Cu ajutorul intervalului numeric

giunile critice

S-au folosit notatiile

Se verifica imediat ca

iar
cele trei alternative ne conduc la cele trei regiuni critice, care definesc respectiv testul
bilateral, unilateral dreapta si unilateral stanga.
Odata construit
critica , folosind
datele de selectie, ipoteza nula va fi

a regiunea

admisa daca
iar n caz contrar va fi respinsa.

Remarcam de asemenea ca regiunea critica corespunde multimii complementare

intervalului .

320

Verificarea ipotezelor statistice

Etapele aplicarii testului

1. Se dau:

2. Se determina intervalul astfel ncat

(dupa cum s-a prezentat nainte);

unde

3. Se calculeaza

4. Concluzia: daca
pinsa.

ipoteza este admisa, n caz contrar este res-

, atunci ipoteza nula se poate rescrie

Observatia 6.7.1. Daca se noteaza prin

, iar ipotezele alternative se scriu corespunz
ator , ,

respectiv

, iar statistica

, se scrie sub forma

Exemplul 6.7.2. Se cerceteaza precizia cu care doua masini produc conserve de

Considerand nivelul
de semnificatie
, vrem sa verificam
ipoteza
nula com

pusa , respectiv cu fiecare din alternativele ,

,

. Vom considera ca cele dou
a caracteristici si
sunt independente

si ca urmeaza legile normale
si respectiv
.
Se considera statistica

6.7. Testul (FisherSnedecor) pentru compararea dispersiilor

ce urmeaza legea FisherSnedecor cu

si
care ne conduce la testul . Pentru aceasta avem

grade de libertate,

321

este

Valoarea calculata a statisticii

De asemenea, avem calculate, conform Anexei IV, cuantilele

Cand se considera alternativa

ipoteza este admisa.

Pentru alternativa

, avem testul bilateral. Deoarece

, avem testul unilateral dreapta. Astfel ca

prin urmare ipoteza este admisa.

De asemenea, pentru alternativa

stanga. Deoarece avem

, se obtine testul unilateral

ipoteza este admisa.

322

Verificarea ipotezelor statistice

Programul 6.7.3. Programul Matlab, care urmeaza, efectueaza calculele din exemplul precedent, dupa care afiseaza valoarea f a statisticii , precum si intervalele
numerice (f1,f2), pentru fiecare din cele trei alterantive.
x1=[1021,980,988,1017,1005,998,1014,985,995,...
1004,1030,1015,995,1023,1008,1013];
x2=[1003,988,993,1013,1006,1002,1014,997,...
1002,1010,975];
f=var(x1)/var(x2);
fprintf(
Bilateral\n)
f1=finv(0.025,15,10); f2=finv(0.975,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)
fprintf(
Unilateral dreapta\n)
f1=finv(0,15,10); f2=finv(0.95,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)
fprintf(
Unilateral stanga\n)
f1=finv(0.05,15,10); f2=finv(1,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)

In urma executarii programului se obtin rezultatele:

Bilateral
1.567, (f1,f2)=(0.327,3.522)
Unilateral dreapta
f= 1.567, (f1,f2)=(0.000,2.845)
Unilateral stanga
f= 1.567, (f1,f2)=(0.393, Inf)
f=

6.8 Teste pentru compararea mediilor

Se considera doua populatii independente

si , cercetate
din punct de vedere

pentru
si urmeaza legea
al aceleasi caracteristici.
Aceast
a
caracteristic
a
este

normala
si respectiv pentru si urmeaza legea normala
.
Relativ la mediile
teoretice
ale celor doua caracteristici independente, se face

ipoteza nula
, cu una din alternativele:

, cand obtinem un test bilateral,

, cand obtinem un test unilateral dreapta,
, cand obtinem un test unilateral stanga.

Ca si n cazul testului se considera cate o selectie repetata de volum

respectiv . Pastram n continuare notatiile de la testul .
Distingem trei cazuri.

6.8. Teste pentru compararea mediilor

323

6.8.1 Dispersii cunoscute

Dispersiile

sunt cunoscute. In acest caz se considera statistica

(6.8.1)

.
care urmeaza legea normala
Se aplica prin urmare testul pentru compararea celor doua medii teoretice.

Pentru nivelul de semnificatie
dat, se obtin regiunile critice corespunzatoare celor trei alternative:

Etapele aplicarii testului

1. Se dau:

;

2. Se determina intervalul astfel ncat
unde

este functia lui Laplace tabelata n Anexa I. Intervalul numeric este res
pectiv pentru cele trei alternative considerate:
,
,

;

unde

3. Se calculeaza
4. Concluzia: daca
pinsa.

ipoteza este admisa, n caz contrar este res-

Exemplul 6.8.1. La o unitate de mbuteliere a laptelui exista doua masini care efectueaza aceasta operatie n sticle de litru. Pentru a cerceta reglajul de mbuteliere
la cele doua masini sau efectuat doua selectii relative la sticlele mbuteliate de cele
doua masini si sau obtinut datele de selectie:

324

Verificarea ipotezelor statistice

n ml

Folosind nivelul de semnificatie
, vrem sa verificam daca mediile de
umplere a sticlelor
de
c
a
tre
cele
dou
a
mas

ini
sunt
aceleasi, n cazul n care abaterile

standard sunt
ml
s

i

ml.

Caracteristicile si , ce reprezinta cantitatea de lapte (n ml) continuta de
o sticla mbuteliata de prima masina, respectiv
de a doua masina, se considera ca

si
urmand legile de probabilitate normale

.

Verificarea ipotezei nule
, cu alternativa
, se va

face cu testul , deoarece sunt cunoscute abaterile standard.

Folosind nivelul de semnificatie
, se determina din Anexa I valoarea

astfel ncat

Anume, se obtine ca
, care ne da intervalul
tistica , data prin formula (6.8.1).
Se calculeaza succesiv:

pentru sta-

Deoarece

, rezulta ca mediile de umplere a sticlelor nu
difera semnificativ pentru cele doua masini.

Programul 6.8.2. Programul Matlab, care urmeaza, efectueaza calculele din exemplul precedent.
x1=[990*ones(1,7),995*ones(1,9),1000*ones(1,11),...
1005*ones(1,8),1010*ones(1,5)];
x2=[985*ones(1,5),990*ones(1,5),995*ones(1,6),...
1000*ones(1,7),1005*ones(1,6),1010*ones(1,4)];
ma1=mean(x1); ma2=mean(x2);
z=(ma1-ma2)/sqrt(62/40+7.52/33);
z2=norminv(0.995); z1=-z2;
fprintf( z=%7.3f\n z1=%6.3f\n z2=%6.3f,z,z1,z2)

6.8. Teste pentru compararea mediilor

325

Rezultatele obtinute n urma executarii programului sunt:

z= 1.209
z1=-2.576
z2= 2.576

6.8.2 Dispersii egale necunoscute

Dispersiile

sunt necunoscute si

(6.8.2)

. Se considera statistica

care urmeaza, conform Proprietatii 4.2.28, legea Student cu

de libertate.
In acest caz se va aplica testul . Pentru nivelul de semnificatie
obtin regiunile critice corespunzatoare celor trei alternative:

grade

dat, se

unde

Etapele aplicarii testului

1. Se dau:

;

2. Se determina intervalul astfel ncat

unde

este functia de repartitie pentru legea Student cu

grade de libertate, iar intervalul numeric este respectiv, pentru cele trei

;
alternative considerate,
,
,

326

Verificarea ipotezelor statistice

unde

3. Se calculeaza

4. Concluzia: daca
pinsa.

ipoteza este admisa, n caz contrar este res-

Exemplul 6.8.3. Se cerceteaza doua loturi de ulei pentru automobile, din punct de
vedere al vascozitat ii, obtinanduse datele de selectie

pentru primul lot, respectiv

pentru al doilea lot.

Analizele facanduse cu acelasi aparat, se considera ca abaterile standard sunt

aceleasi. Considerand nivelul de semnificatie
, sa se verifice daca mediile
de vascozitate pentru cele
dou
a
loturi
nu
difer
a
semnificativ.

Caracteristicile si , ce reprezinta vascozitatile pentru cele doua loturi

de ulei,
se considera ca urmeaza fiecare legea normala, respectiv
si

, cu abaterea standard necunoscut
a
.

, cu alternativa
, se va
Verificarea ipotezei nule
face cu testul , deoarece abaterea standard este necunoscuta.

Folosind nivelul de seminficat
ie
, se determina, din Anexa II, valoarea

, astfel ncat
, unde numarul gradelor de libertate este

. Adica, se determina astfel ncat

, obtinanduse
. In acest mod, sa obtinut

pentru statistica dat
intervalul

a
prin
formula (6.8.2), care urmeaza

legea Student cu
grade de libertate.
Se calculeaza pe rand

6.8. Teste pentru compararea mediilor

327

Deoarece

, rezulta ca vascozitat ile medii ale celor
doua loturi de ulei nu difera semnificativ.
Programul 6.8.4. Programul Matlab urmator efectueaza calculele de mai sus, dupa
care afiseaza valoarea t a statisticii , mpreuna cu capetele intervalului (t1,t2).
x1=[10.27*ones(1,3),10.28*ones(1,2),10.29,10.3,10.32];
x2=[10.26,10.26,10.27,10.29,10.3,10.31*ones(1,3)];
ma1=mean(x1); ma2=mean(x2);
v1=var(x1); v2=var(x2);
t=(ma1-ma2)/sqrt(7*v1+7*v2)*sqrt(14/(1/8+1/8));
t2=tinv(0.975,14); t1=-t2;
fprintf( t=%7.3f\n t1=%6.3f\n t2=%6.3f,t,t1,t2)

In urma executarii programului, se obtin rezultatele:

t= -0.372
t1=-2.145
t2= 2.145

6.8.3 Functia ttest2

Sistemul Matlab, prin Statistics toolbox, dispune de functia ttest2, cu aplicabilitate la testul pentru compararea a doua medii, cand dispersiile sunt egale, dar
necunoscute. Apelarea acestei functii se face prin:
h=ttest2(x,y)
h=ttest2(x,y,alpha)
h=ttest2(x,y,alpha,tail)
[h,c,ci]=ttest(x,y,alpha,tail)

328

Verificarea ipotezelor statistice

In urma executarii acestor instructiuni, se efectueaza testul asupra datelor continute

n vectorii x si y, folosind nivelul de semnificatie alpha, care are valoarea implicita
alpha=0.05.
Parametrul tail specifica una din cele trei alternative, care conduc la testul bilateral (tail=0, implicit), unilateral dreapta (tail=1) si unilateral stanga
(tail=-1). Daca h=1, atunci ipoteza nula va fi respinsa, respectiv daca h=0, ipoteza nu poate fi respinsa.
Ultima forma de apel permite, de asemenea, obtinerea valorii critice c, precum si
a intervalului de ncredere pentru diferenta mediilor teoretice, corespunzator probabilitatii de ncredere 1-alpha, obtinut n vectorul cu doua componente ci. Valoarea
critica c are aceeasi semnificatie cu cea precizata la Observatia 6.4.2 si se calculeaza
cu formulele prezentate acolo.
Programul 6.8.5. Programul Matlab, ce urmeaza, aplica testul , pentru datele
din Exemplul 6.8.3. Mai mult, se considera si testele unilateral dreapta si unilateral
stanga, precum si obtinerea intervalelor de ncredere, cand alpha=0.05.
x=[10.27*ones(1,3),10.28*ones(1,2),10.29,10.3,10.32];
y=[10.26*ones(1,2),10.27,10.29,10.3,10.31*ones(1,3)];
fprintf( h
c
ci
\n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest2(x,y,0.05,i);
fprintf( %d %5.4f
(%4.2f,%4.2f) \n,h,c,ci)
end

In urma executarii programului, se obtin rezultatele:

h
c
ci
___________________________
0 0.3577
(-Inf,0.01)
0 0.7154
(-0.03,0.02)
0 0.6423
(-0.02, Inf)

Se observa ca pentru tail=-1 si tail=1, se construiesc intervale nemarginite,

respectiv la stanga si la dreapta.

6.8.4 Dispersii diferite necunoscute

Dispersiile
(6.8.3)

sunt necunoscute si diferite. Se va considera statistica

6.8. Teste pentru compararea mediilor

care urmeaza legea Student cu
se calculeaza cu formula

(6.8.4)

329

grade de libertate. Numarul

al gradelor de libertate

unde

Sa ajuns la testul , care pentru nivelul de semnificatie
dat, conduce
la regiunile critice corespunzatoare alternativelor considerate, respectiv:

Etapele aplicarii testului

1. Se dau:

;

astfel nc
at

2. Se determina intervalul

unde

este functia de repartitie pentru legea Student cu grade de liber
tate calculat cu formula (6.8.4), iar intervalul numeric este respec

tiv, pentru cele trei alternative considerate,
,
,

;

unde

3. Se calculeaza

4. Concluzia: daca
pinsa.

ipoteza este admisa, n caz contrar este res-

330

Verificarea ipotezelor statistice

Exemplul 6.8.6. Se cerceteaza capacitatea fiolelor farmaceutice de ml, care provin de la doua fabrici. In acest scop, se considera cate o selectie pentru doua loturi
de fiole provenite respectiv de la cele doua fabrici. Selectiile obtinute au distributiile
empirice de selectie

respectiv, pentru : , , , , , , , , , , , ,

, , , , , , , .

Folosind nivelul de semnificatie
, vom compara dispersiile celor doua
caracteristici. Apoi, pe baza acestui rezultat, vom compara mediile celor doua carac
teristici, utilizand acelasi nivel de semnificatie
.

Vom considera
c
a
cele
dou
a
caractersitici

s

i

sunt repartizate normal, res

pectiv
si . Se poate aplica testul , pentru compararea dispersiilor teoretice si .
Calculam pe rand:

Deoarece

avem ca

Pe de alta parte, pentru

, se considera statistica

FisherSnedecor cu
Daca se consider
a ipoteza nula

care urmeaza legea

grade de libertate.

cu alternativa

, avem din Anexa IV ca

In acest fel, am obtinut intervalul , pentru statistica

.

Deoarece
, respingem
ipoteza
ca
.

Avand n vedere ca dispersiile teoretice si sunt necunoscute, iar conform
rezultatului precedent
difera n mod semnificativ, folosim testul pentru compararea

mediilor
si
. Statistica , ce se considera, n acest caz, este cea data prin formula (6.8.3), care urmeaza legea Student cu grade de libertate, unde se calculeaza
din relatia (6.8.4).

6.8. Teste pentru compararea mediilor

331

Astfel, pentru determinarea lui , avem succesiv

si

de unde
. Folosind Anexa
ine ca
, prin urmare inter II, se obt

valul pentru statistica este
.
Pe de alta parte, avem ca

Deoarece

, respingem ipoteza ca mediile teoretice
pentru fiolele produse de cele doua fabrici nu difera semnificativ.

Programul 6.8.7. Calculele din exemplul de mai sus, se pot efectua cu urmatorul
program Matlab:
x1=[100,101,102*ones(1,2),103*ones(1,3),...
104*ones(1,4),105*ones(1,5),106*ones(1,4),...
107,108*ones(1,3),109];
x2=[110,101,112,120,117,105,109,111,118,113,...
106,108,115,113,112,100,116,112,114,112];
f=var(x2)/var(x1);
c1=finv(0.01,19,24); c2=finv(0.99,19,24);
fprintf( f=%6.2f, c1=%5.2f, c2=%5.2f\n,f,c1,c2)
ma1=mean(x1); ma2=mean(x2);
v1=var(x1); v2=var(x2); c=(v1/25)/(v1/25+v2/20);
n=c2/24+(1-c)2/19; n=ceil(1/n);
t=(ma1-ma2)/sqrt(v1/25+v2/20);
t2=tinv(0.99,n); t1=-t2;
fprintf( t=%7.3f, t1=%6.3f, t2=%6.3f,t,t1,t2)

Rezultatele obtinute, n urma executarii programului, sunt:

f= 5.31, c1= 0.34, c2= 2.76
t= -5.116, t1=-2.485, t2= 2.485

Observatia 6.8.8. Daca se noteaza prin

, atunci ipoteza compusa nula

devine
, iar ipotezele alternative se rescriu dupa cum urmeaza:
,

s
i respectiv
iar statisticile care au fost date mai nainte se pot

rescrie cu acest nou parametru necunoscut .

Observatia 6.8.9. Cand selectiile sunt
de volum mare,
, pentru legi de

probabilitate oarecari, respectiv

, pentru legi de probabilitate normale,
statistica

332

Verificarea ipotezelor statistice

poate fi considerata ca urmand legea normala

aplica testul .

. Asadar n acest caz se poate

6.8.5 Observatii perechi

Dac
a cele dou
ie sunt
perechile
a selectii sunt de tip pereche, adica variabilele de select

, ,atunci
se
pot
considera
diferent

ele

,
pentru
care

, oricare a fi
.
Problema poate fi reformulata.
Se considera o populatie , pentru care se cerceteaza caracteristica , care ur
meaza legea normala
, cu necunoscut.

Vrem sa verificam ipoteza nula
, cu una din alternativele
, cand obtinem testul bilateral,

and obtinem testul unilateral dreapta,
, c

, cand obtinem testul unilateral stanga.
Conform Proprietatii 4.2.26, statistica

unde

urmeaza legea Student cu

grade de libertate.
dat, se poate determina
Prin urmare, pentru nivelul de semnificatie

intervalul numeric astfel ncat

unde

6.8. Teste pentru compararea mediilor

unde

333

, daca

, daca

, daca

este cuantila de ordin

,

,

,

a legii Student cu

grade de libertate.

Etapele aplicarii testului

1. Se dau:

2. Se calculeaza intervalul astfel ncat

(dupa cum s-a prezentat nainte);
3. Se calculeaza

4. Concluzia: daca
respinsa.

ipoteza este admisa, n caz contrar ipoteza este

Programul 6.8.10. Vom scrie un program, care genereaza n vectori aleatori, care
urmeaza legea normala bidimensionala. Folosind testul pentru perechi, vom verifica ipoteza nula, ca mediile celor doua variabile sunt egale, precum si intervalul de
ncredere pentru diferenta mediilor, respectiv cand se aplica testele bilateral, unilateral dreapta si unilateral stanga. Nivelul de semnificatie folosit este alpha=0.05.
mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); Z=mvnrnd(mu,v,n);
d=diff(Z,1,2);
fprintf( h
c
ci
\n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest(d,0,0.05,i);
fprintf( %d %5.4f
(%4.2f,%4.2f) \n,h,c,ci)
end

Rezultatele obtinute, pentru mu1=mu2=10, v

2 2
si n=30, sunt
2 3

334

Verificarea ipotezelor statistice

h
c
ci
___________________________
0 0.6715
(-Inf,0.35)
0 0.6570
(-0.26,0.41)
0 0.3285
(-0.20, Inf)

Deoarece h=0, pentru fiecare alternativa n parte, testul nu respinge ipoteza ca cele
doua medii sunt egale. Acest lucru se vede si din faptul ca valoarea critica satisface
inegalitatea c alpha=0.05.
Programul mai calculeaza intervalul de ncredere pentru diferenta celor doua medii. Se observa ca acesta difera, n functie de parametrul tail=-1,0,1. De asemenea, se observa ca am considerat nivelul de semnificatie alpha=0.05, dar acesta
poate fi usor modificat n apelul functiei ttest.

6.9 Testul

pentru concordanta

Se considera colectivitatea cercetata din punct de vedere al caracteristicii cantitativa sau calitativa. Fie numarul claselor caracteristicii si
evenimentul ca
un individ luat la ntamplare din colectivitatea sa apartina clasei cu numarul de

ordine .

Notand
, , atunci .

a
,
, cu ipoteza
Relativ la caracteristica facem ipoteza nul

.
alternativa : exista astfel ncat
Pentru a verifica aceasta ipoteza se considera o selectie repetata de volum . Fie

. Folosind aceste date de selectie se obtin frecventele
datele de selectie
absolute ale claselor caracteristicii . Vom nota prin
frecventa absoluta a clasei

cu numarul de ordine . Altfel spus, numara de cate ori a aparut evenimentul
n
selectia considerata.

Corespunzator frecvent
elor absolute ,
, avem variabilele aleatoare (de

, ce iau aceste valori.
selectie) ,
Asadar, pornind de la caracteristica
, care poate fi si calitativa, s-a ajuns la

variabilele de selectie ,
, care sunt componentele unui vector aleator
dimensional
, ce urmeaza legea multinomiala. Anume, avem:

unde
,
Daca privim ipoteza nula
legi multinomiale.

,
, .
, constatam ca aceasta se refera la parametrii unei

6.9. Testul

pentru concordanta

335

Proprietatea 6.9.1. Cu notatiile dinainte avem ca statistica

cu grade de libertate, cand

urmeaza legea

Demonstratie. Se porneste de la formula lui Stirling

avem ca

sau

e . Astfel,

unde este o constanta pozitiva. Logaritmand aceasta relatie obtinem
ln

si notand

adica

rezulta ca

Pastrand primii doi termeni din dezvoltarea n serie a logaritmului avem

deci

336

Verificarea ipotezelor statistice

Dar avem ca

deci

, obtinem
Daca se noteaza

adica vectorul aleator

pentru
, urmeaza o lege normala dimensionala degenerata, deoarece fiecare
componenta se poate exprima ca si combinatie liniara a celorlalte componente.
Din teoria probabilitat ilor se cunoaste ca suma patratelor componentelor unui
vector aleator ce urmeaza legea normala si ntre care exista o legatura liniara este
o variabila aleatoare ce urmeaza legea cu numarul gradelor de libertate dat de
numarul componentelor vectorului mai putin unu. Ceea ce trebuie demonstrat.
Pe baza proprietatii precedente, pentru nivelul de semnificatie
poate determina cuantila astfel ncat

dat, se

unde noteaza functia de repartitie a legii

cu
grade de libertate.

Regiunea critica se poate scrie si n acest caz, anume

Astfel, pentru mare, are loc relatia

ipoteza va fi admisa daca
contrar.

, deci
, respectiv va fi respinsa n caz

6.9. Testul

pentru concordanta

Etapele aplicarii testului

. (sirul datelor de select
ie

este un sir avand ca elemente evenimentele
,
, din

1. Se dau:

337

care se obtin frecventele absolute

2. Se calculeaza
3.
4.

astfel ncat

);

Se calculeaza

ipoteza este admisa, n caz contrar ipoteza
Concluzia: daca

este respinsa.

privind concordanta trebuie ca sa fie nObservatia 6.9.2. La utilizarea testului

, c
and , iar daca numarul claselor
, atunci
deplinite conditiile
sa fie mult mai mare decat . Cand aceste conditii nu sunt ndeplinite, se efectueaza
o regrupare a datelor de selectie.

Exemplul 6.9.3. S-a aruncat un zar de de ori si s-au obtinut urmatoarele rezultate:

Fata

Frecventa

Folosind nivelul de semnificatie
, sa verificam daca zarul respectiv este fals
sau nu.
Se aplica testul , privind parametrii legii multinomiale. Intr-adevar, evenimen

tul
reprezinta aparitia fetei cu numarul ,
. Se face ipoteza nula

cu alternativa

astfel ncat

Se calculeaza valoarea statisticii

adica zarul nu este fals

adica zarul este fals

, care are

grade de libertate, anume

Pe de alta parte, din Anexa III, avem cuantila
, deci

, ceea ce conduce la respingerea ipotezei nule,
rezulta

adica acceptam ipoteza ca zarul este fals.

338

Verificarea ipotezelor statistice

Programul 6.9.4. Programul Matlab, care urmeaza, efectueaza calculele din exemplul precedent:
x=1:6; f=[15,7,4,11,6,17]; p=1/6*ones(1,6);
x2=sum((f-60*p).2./(60*p));
cuant=chi2inv(0.95,5);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

iar rezultatele obtinute sunt:

x2=
13.6
cuant= 11.07

Aplicatia 6.9.5. (Testul neparametric privind concordanta). Fie caracteristica ,

care urmeaza legea de probabilitate cu functia de repartitie necunoscuta. Relativ
la legea de probabilitate, se face ipoteza nula
, cu ipoteza alternativa

. Cand consideram testul neparametric, functia de repartitie nu
depinde de nici un parametru necunoscut.

Daca domeniul valorilor caracteristicii este, sa zicem, intervalul si daca

vom considera clasele obtinute prin punctele

, atunci
apar parametrii necunoscuti

De asemenea, evenimentul
va fi evenimentul ca un individ luat la ntamplare din

colectivitatea cercetata sa apartina clasei . Prin urmare, s-a ajuns la aplicarea

testului privind
concordanta. Ipoteza nula, mai sus precizata, devine n acest fel

,
, iar ipoteza alternativa se va rescrie : exista astfel ncat

, unde

neparametric

Etapele aplicarii testului

1. Se dau:

2. Se calculeaza frecventele absolute

;

, si probabilitat ile

astfel ncat

functia de repartitie a legii cu
grade de libertate;

3. Se calculeaza

4. Se calculeaza

fiind

6.9. Testul

pentru concordanta

339

se admite ipoteza ca legea de probabilitate a

5. Concluzia: daca

caracteristicii este data de functia de repartitie , n caz contrar ipoteza este
respinsa.

Exemplul 6.9.6. Fie caracteristica ce reprezinta numarul fetelor dintro familie cu

patru copii. Pentru verificarea ipotezei ca urmeaza o lege binomiala de parametru

. Distributia selectiei lui este
, s-a efectuat o selectie de volum

Folosind nivelul de semnificatie
, sa verificam daca urmeaza legea bino
miala. Daca urmeaza legea binomiala cu
, atunci are distributia teoretica

Ipoteza privind faptul ca urmeaza legea binomiala, se scrie sub forma

neparametric, unde numarul gradelor de libertate este dat

. Valoarea calculata a caracteristicii este

Seva aplica
testul

Cum

avem ca ipoteza nula este admisa.

Programul 6.9.7. Prin executarea programului Matlab:

x=0:4; f=[4,10,8,7,3];
p=[1/16,1/4,3/8,1/4,1/16];
x2=sum((f-32*p).2./(32*p));
cuant=chi2inv(0.95,4);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

se obtine
x2=
cuant=

4.5
9.49

340

Verificarea ipotezelor statistice

Aplicatia 6.9.8. (Testul neparametric privind exponentialitatea). Relativ la ca, unde , si

racteristica se face ipoteza nula

parametrul cunoscut, adica urmeaza legea exponentiala.

, se consiDeoarece domeniul valorilor caracteristicii este intervalul

dera clasele caracteristicii date prin

. Astfel
avem:

Etapele aplicarii testului

1. Se dau:

2. Se calculeaza frecventele absolute

3. Se calculeaza

Se calculeaza

, si probabilitat ile

astfel ncat

se accepta ipoteza ca urmeaza legea expo5. Concluzia: daca

nentiala de parametru , n caz contrar ipoteza este respinsa.

Aplicatia 6.9.9. (Testul parametric privind concordanta). Se considera caracteristica care urmeaza legea de probabilitate cu functia de repartitie necunoscuta.
Relativ la legea de probabilitate se face ipoteza nula
cu ipoteza alter

nativa
. Fata de cazul neparametric, functia de repartit
ie se consi

dera ca depinde de parametri necunoscuti. Fie acesti parametri
, adica

.

In acest caz, fata de cazul neparametric, la nceput se estimeaza parametrii necunoscuti, folosind datele de selectie considerate, cu ajutorul metodei verosimilitat ii
maxime. Fie estimatiile de verosimilitate maxima ale parametrilor mai sus precizati,

respectiv
.
In continuare, cele expuse la cazul neparametric raman neschimbate cu doua observatii. In primul rand, probabilitat ile claselor considerate se calculeaza prin formula

pentru
libertate.

. In al doilea rand, legea

, n acest caz, are

grade de

6.9. Testul

pentru concordanta

parametric

Etapele aplicarii testului

1. Se dau:

341

2. Se determina estimatiile de verosimilitate maxima

metrii
;
3. Se calculeaza frecventele absolute

4. Se calculeaza

5. Se calculeaza

6. Concluzia: daca

pentru para-

, si probabilitat ile

astfel ncat

se accept
a ipoteza ca urmeaza legea de

probabilitate data prin functia de repartitie

n caz

contrar ipoteza este respinsa.

Exemplul 6.9.10. O substanta radioactiva este observata n intervale de timp de
lungimi egale ( secunde). Pentru fiecare interval de timp este nregistrat numarul
particulelor emise. Rezultatele obtinute sunt:

Nr. part.

Notand cu caracteristica ce reprezinta numarul de particule emise ntr-un interval

de timp de lungime secunde, vrem sa verificam daca urmeaza legea lui Poisson,

folosind nivelul de semnificatie
.

Folosim testul
parametric privind concordanta, deoarece parametrul legii lui

, este necunoscut. Asadar, num
Poisson,

arul gradelor de libertate va fi

. Avem ca estimatorul de verosimilitate maxima pentru

este media de selectie. Prin urmare avem

Se calculeaz
at ile de la legea lui Poisson, cu parametrul
aapoiprobabilit

adica

Astfel se obtin valorile:

342

Verificarea ipotezelor statistice

de unde

Pe de alta parte, folosind Anexa III, avem cuantila
si prin urmare

, deci ipoteza ca urmeaza legea lui Poisson este
acceptata.

Programul 6.9.11. Ilustrarea calculelor este facuta prin programul Matlab

x=0:10;
f=[57,203,383,525,532,408,273,139,45,27,16];
la=sum(f.*x)/2608; p=poisspdf(x,la);
x2=sum((f-2608*p).2./(2608*p));
cuant=chi2inv(0.99,9);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

care prin executare conduce la urmatoarele rezultate:

x2=
14.9
cuant= 21.67

Aplicatia 6.9.12. (Testul parametric privind normalitatea). Relativ la caracteristica se considera ipoteza nula , unde

sunt parametri necunoscuti, adica faptul ca urmeaza legea normala

cu cei doi parametri necunoscuti.
Folosind metoda verosimilitatii maxime se determina, pe baza datelor de selectie

, estimatiile de verosimilitate maxima pentru si respectiv , anume
si

(a se vedea Exemplul 5.3.7).Deoarece domeniul valorilor caracteristicii este se

considera clasele date prin

Pe de alta parte probabilitat ile corespunzatoare acestor clase se obtin cu formulele

6.9. Testul

pentru concordanta

Avand n vedere ca

unde

343

este functia lui Laplace, adica

rezulta ca

Etapele aplicarii testului

1. Se dau:

2. Se calculeaza frecventele absolute

si probabilitat ile

;

, estimatiile

3. Se calculeaza

4. Se calculeaza

astfel ncat

se accepta ipoteza ca

5. Concluzia: daca

, n caz contrar
mala
ipoteza este respinsa.

urmeaza legea nor-

Exemplul 6.9.13. Se considera caracteristica , ce reprezinta rezistenta, n

,a
unor tronsoane de ceramica acoperite
cu
carbon.
S
a
se
verifice
normalitatea
lui

,

folosind o selectie de volum
, pentru care sau obtinut datele de selectie

clasa

frecv.

344

Verificarea ipotezelor statistice

utilizand testul de concordanta , cu nivelul de semnificatie
.

Prima data se estimeaza parametrii de la legea normala
, adica media

teoretica
si abaterea standard teoretica
, folosind metoda
de verosimilitate maxima. Se cunoaste ca estimatiile de verosimilitate maxima pentru
si sunt respectiv

(a se vedea Exemplul 5.3.7). Avem distributia empirica de selectie pentru caracteristica

de unde calculam

Se considera valoarea numerica

unde este numarul claselor (

este dat prin

, n cazul de fata ), este frecventa clasei , iar

subintervalul definind clasa . Dupa cum

estecunoscut, este valoarea

unei variabile aleatoare care urmeaza legea cu
grade de libertate,
fiind

numarul parametrilor estimati. In cazul de fata avem ca
, deci avem

grade de libertate.

6.9. Testul

pentru concordanta

345

, folosind Anexa III.
, pentru statistica

, adica intervalul numeric pentru
Anume, se obtine ca

statistica este .
Calculele pentru valoarea numerica se aranjeaza n urmatorul tabel:
Se determina intervalul

Valorile functiei lui

se iau din Anexa I si se are n vedere ca functia
Laplace

impara, adica
. De asemenea, facem observatia ca

Deoarece
risticii .

este

, rezulta ca se accepta ipoteza normalitatii caracte-

Programul 6.9.14. Toate calculele din tabelul precedent pot fi efectuate prin programul Matlab:
x=1.625:0.05:2.025; f=[11,14,17,17,18,16,13,10,8];
ma=sum(f.*x)/124; s=sqrt(sum(f.*(x-ma).2)/124);
a=[-inf,1.65:0.05:2,inf];
F=normcdf(a,ma,s); p=diff(F);
x2=sum((f-124*p).2./(124*p));
cuant=chi2inv(0.95,6);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

Rezultatele obtinute n urma executarii programului sunt:

x2=
3.3
cuant= 12.59

346

Verificarea ipotezelor statistice

6.10 Testul
pentru compararea
mai multor caracteristici

Se considera colectivitat ile ,

, independente, cercetate din punct de vedere al
aceleasi caracteristici (calitative sau cantitative). Fie aceasta caracteristica pentru

colectivitatea . Relativ la caracteristicile ,
, se face ipoteza nula ,

ca acestea urmeaza aceeasi lege de probabilitate. Se noteaza cu numarul claselor
caracteristicii cercetate si
evenimentul ca un individ luat la ntamplare din una din
colectivitat ile cercetate sa apartina clasei cu numarul de ordine .
Daca se noteaza prin
, adica probabilitatea ca un individ luat
la ntamplare din colectivitatea
sa apartina clasei cu numarul de ordine , atunci

ipoteza nula se poate rescrie

.
Probabilitat ile astfel definite satisfac relatiile

iar cand ipoteza este satisfacuta, avem de asemenea

Pentru a verifica aceasta ipoteza se considera cate o selectie repetata de volum

. Datele de selectie sunt trecute n tabelul urmator.
Selectia

..
.

Vol. selectiei

..
.

Total

..
.

Elementul
, iar

al tabelului reprezinta frecventa absoluta a aparitiei clasei n selectia

Proprietatea 6.10.1. Estimatiile de verosimilitate maxima pentru parametrii necu

noscuti , , sunt date prin

6.10. Testul

pentru compararea mai multor caracteristici

Demonstratie. Functia de verosimilitate are expresia

347

cand ipoteza nula este adevarata. Avand n vedere relatia dintre probabilitat ile

, se obtine ca

sau prin logaritmare, se ajunge la

Sistemul ecuatiilor de verosimilitate maxima va fi

de unde rezulta ca

sau, avand n vedere proprietat i ale sirului de rapoarte egale, se obtine

Observatia 6.10.2. Daca se are n vedere ca

binomiale
, rezulta ca statistica

S-a ajuns astfel la estimatiile

sunt valorile unor variabile aleatoare

348

Verificarea ipotezelor statistice

urmeaza o lege . Pentru a stabili numarul al gradelor de libertate se tine seama

de faptul ca numarul variabilelor aleatoare
este , numarul legaturilor ntre

este , iar numarul parametrilor
i este
urmare, numarul gradelor de

estimat
.Prin

libertate este

Etapele aplicarii testului
1. Se dau: ;

2. Se calculeaza
3.
4.

;

, astfel ncat

Se calculeaza

Se calculeaza

5. Concluzia: daca
respinge.

;

se accepta ipoteza nula

, n caz contrar se

Observatia 6.10.3. Cand probabiliat ile ,

, sunt cunoscute (caz mai rar
ntalnit), deci nu se cere a fi estimate, atunci statistica

urmeaza legea cu
grade de libertate. Aplicarea testului,
n acest caz, se adapteaza n mod corespunzator.
Exemplul 6.10.4. S-au considerat trei loturi de bolnavi de emfizem pulmonar, n
functie de numarul tigarilor fumate zilnic: mai putin de un pachet, unul sau doua
pachete si respectiv mai mult de doua pachete. Pentru emfizemul pulmonar sunt considerate stadii notate de la I la IV. Rezultatele cercetarilor sunt trecute n urmatorul
tabel sistematizat
Categoria

Stadiul

pachet
pachete

pachete

III

pentru tabele de contingenta

6.11. Testul

349

Vrem sa sa verificam, cu nivelul de semnificatie
, ipoteza ca numarul
de tigari fumate zilnic nu influenteaza repartizarea bolnavilor n cele patru stadii
ale bolii. Verificam ipoteza facuta cu ajutorul testului privind compararea aceluiasi atribut, dar pentru
iidiferite.
Numarul gradelor de libertate este dat
populat
prin formula

pentru care se obtine cuantila
.

Se calculeaza apoi valoarea

, se respinge ipoteza ca repartizarea pe cele

Deoarece

patru stadii ale bolii nu depinde de numarul tigarilor fumate zilnic.
Programul 6.10.5. Programul Matlab
f=[41,28,25,6;24,116,46,14;4,50,34,12];
fip=sum(f); fpj=sum(f); x2=0;
for i=1:3
for j=1:4
t=fip(i)*fpj(j)/400;
x2=x2+(f(i,j)-t)2/t;
end
end
cuant=chi2inv(0.99,6);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

n urma executarii, conduce la rezultatele din exemplul precedent:

x2=
64.4
cuant= 16.81

6.11 Testul

pentru tabele de contingenta

Se considera colectivitatea cercetata din punct de vedere a doua caracteristici si

(calitative sau cantitative). Se pune problema independentei celor doua caracteris
tici. Fie numarul claselor pentru caracteristica si respectiv pentru caracteristica
. Notam cu evenimentul ca un individ luat la ntamplare din colectivitatea sa

apartina clasei cu numarul de ordine n raport cu si notam cu evenimentul ca
un individ luat la ntamplare din sa apartina clasei cu numarul de ordine n raport

350
cu

Verificarea ipotezelor statistice

. Fie

. Daca se noteaza

atunci ipoteza nula relativa la independenta celor doua caracteristici se scrie

cu ipoteza alternativa , ca este falsa.

Pentru verificarea acestei ipoteze se considera datele de selectie
Datele de selectie sunt sistematizate n tabelul de contingenta

..
.

unde

iar

..
.

reprezinta frecventa absoluta a clasei

..
.

Proprietatea 6.11.1. Estimatiile de verosimilitate maxima pentru parametrii necu

noscuti ,
, si ,
, sunt date prin formulele:

Demonstratie. Functia de verosimilitate are expresia

cand ipoteza nula

este adevarata. Prin logaritmare se obtine

6.11. Testul

pentru tabele de contingenta

351

de unde se ajunge la sistemul ecuatiilor de verosimilitate maxima

Avand n vedere proprietatile unui sir de rapoarte egale se obtine ca

deci

In mod analog se obtine si faptul ca

Observatia 6.11.2. Valoarea numerica

este cea a unei variabile aleatoare ce urmeaza legea cu

grade
de libertate. Num
de libertate s-a determinat avand n vedere ca au
arul algradelor

parametri, iar ntre si exista o singura legatura
fost estimati

Asadar

Etapele aplicarii testului

1. Se dau: ;
2. Se calculeaza:
3. Se calculeaza

adica

;

, astfel nc
at

;

352

Verificarea ipotezelor statistice

Se calculeaza

5. Concluzia: daca
respinge.

se accepta ipoteza nula

Observatia 6.11.3. Cand probabilitat ile

ntalnit), avem ca

, n caz contrar se

sunt cunoscute (caz mai rar

este valoarea unei variabile aleatoare ce urmeaza legea cu
grade
unei legi

de libertate. Aceasta rezulta din faptul ca prima suma corespunde

cu
grade de libertate, a doua sum
grade de
a corespunde unei legi cu

cu
libertate, iar a treia unei legi
grade de libertate. Prin urmare

de unde

Aplicarea testului, n acest caz, se face prin adaptarea corespunzatoare a cazului precedent.
Observatia 6.11.4. Testul pentru tabele de contingenta si respectiv pentru compararea mai multor caracteristici, pare sa fie acelasi . Dar, remarcam faptul ca problemele de la care se porneste sunt complet diferite.
Exemplul 6.11.5. Pentru cercetarea dependentei dintre culoarea
a ochilor si cuindivizi. Rezultatele
loarea a parului, s-a considerat un esantion format din
sunt trecute n tabelul sistematizat urmator
A

Albastri
Gri sau verzi
Caprui

Blonzi

Sateni

Bruneti

Roscati

Folosind nivelul de semnificatie
, vom verifica ipoteza ca cele doua caracteristici (atribute) sunt independente.

Se
foloses
tetestul
tabele
decontingenta cu numarul gradelor de liber pentru

tate

.

6.12. Testul de concordanta al lui Kolmogorov

353

Pe de o parte avem ca

Pe de alta parte, avem cuantila

ca cele doua atribute sunt independente.

, deci se respinge ipoteza

Programul 6.11.6. Calculele din exemplul precedent pot fi efectuate cu programul

Matlab
f=[1768,807,189,47;946,1387,746,53;115,438,288,16];
fip=sum(f); fpj=sum(f); x2=0;
for i=1:3
for j=1:4
t=fip(i)*fpj(j)/6800;
x2=x2+(f(i,j)-t)2/t;
end
end
cuant=chi2inv(0.99,6);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)

In urma executarii acestui program, se obtin rezultatele:

x2= 1073.5
cuant= 16.81

6.12 Testul de concordanta al lui Kolmogorov

Se considera caracteristica de tip continuu cu functia teoretica de repartitie
necunoscuta. Relativ la functia se face ipoteza nula , cu una din
(1)
(2)
(3)

(testul lui Kolmogorov bilateral),

(testul lui Kolmogorov unilateral dreapta),
(testul lui Kolmogorov unilateral stanga).

Pentru verificarea ipotezei nule , cu una din alternativele precizate, se consi

, respectiv
dera o selectie repetata de volum , cu datele de selectie
variabilele de selectie , , . . . , corespunzatoare. Se considera statisticile

354

Verificarea ipotezelor statistice

unde este functia de repartitie de selectie.

Conform teoremei lui Kolmogorov (Teorema 4.2.38) statistica

urmeaza o lege de probabilitate data prin legea lui Kolmogorov, cand

me, avem ca

. Anu-

a lui Kolmogorov fiind tabelata pentru anumite valori n Anexa V.
functia
De asemenea,

ce poarta numele de lege cu doua grade de libertate.

fixat, se pot determina cuantilele
Pentru un nivel de semnificatie
si astfel ncat

adica

pentru testul bilateral al lui Kolmogorov,

, pentru testele unilaterale dreapta si stanga ale lui Kolmo

adica

gorov.
va fi admisa cand valorile calcuCorespunz

ator celor trei alternative, ipoteza

ale statisticilor , ,
late , , , pe baza datelor de selectie

, satisfac respectiv conditiile

(1)
(2)
(3)

, c
and

, cand

, cand

,

,

,

iar n caz contrar va fi respinsa.
Prezentam, n cele ce urmeaza, mpreuna, cele trei teste (bilateral, unilateral
dreapta, unilateral stanga) ale lui Kolmogorov. Remarcam ca cele trei teste sunt teste
distincte, alegerea unuia dintre ele se face apriori.

6.12. Testul de concordanta al lui Kolmogorov

355

Etapele aplicarii testului lui Kolmogorov

1. Se dau: ;

;

2. Se determina
(1)
(2)
(3)

astfel nc
at

astfel nc

at

astfel ncat

, cand

, cand
, cand

,

,

;

3. Se calculeaza
(1)
(2)
(3)

, cand

, cand
, cand

,

,

;

4. Concluzia: daca
(1)
(2)
(3)

ipoteza este admisa, cand

este admisa, cand
ipoteza

este admisa, cand
ipoteza

,

,

Observatia 6.12.1. Avand n vedere ca functiile (de repartit

sunt mo ie) si
noton crescatoare si ca pentru determinarea cuantilelor si este necesara

inversarea acestor functii de repartitie, se poate evita aceasta operatie. Pentru aceasta
se determina valorile functiilor
si
ale statisticilor
pe valorilecalculate
,,
,

,

,
adic
a
se
calculeaz
a
respectiv

. Astfel, se va respinge ipoteza nula , daca , numindu

se valoare critica.

Observatia 6.12.2. Pentru calculul valorilor statisticilor , , putem con

,
sidera ca datele de selectie sunt ordonate crescator, adica

altfel se poate
face o astfel de ordonare. De asemnea, remarcam faptul ca are loc
.
aceste precizari, precum si faptul ca atat functia de repartitie de selectie
, Folosind
cat si functia de repartitie sunt functii nedescrescatoare, obtinem urmatoarele

356

Verificarea ipotezelor statistice

formule de calcul

Observatia 6.12.3. Cand datele sunt grupate, avand clasele date prin punctele

atunci se folosesc formulele

Exemplul 6.12.4. Rezultatele masuratorilor asupra diametrului

piese de acelasi tip (n mm), sunt cele ce urmeaza
Diam.
Frecv.

, pentru de

Folosind nivelul de semnificatie
, stiind

mm si

abaterea standard
mm, se cere verificarea normalitatii caracteristicii , cu ajutorul testului lui Kolmogorov bilateral, iar apoi cu ajutorul testului
neparametric.
Ipoteza care se face este ca functia de repartitie a lui este

6.12. Testul de concordanta al lui Kolmogorov

357

unde
. Pentru verificarea acestei ipoteze, folosind criteriul lui

,
Kolmogorov, se calculeaza

, iar
este functia de repartitie

,
unde
de selectie.
Pentru calculul valorilor functiei de repartitie se tine seama de faptul ca

cu functia lui Laplace
tabelata n Anexa I.
Pe de alta parte, valorile functiei de repartitie de selectie se calculeaza cu formula

pentru

Calculele sunt aranjate n urmatorul tabel.

Din calculele facute avem ca

, de unde rezulta ca

Din Anexa V, se determina cuantila

normalitate pentru caracteristica , deoarece

si admitemipoteza de

.

358

Verificarea ipotezelor statistice

, cu testul neparametric, cal-

Pentru a verifica normalitatea caracteristicii

culam prima data probabilitat ile

unde

. Astfel avem

Pe de alta parte, avem cuantila

Deoarece
acceptata.

de unde

, conform Anexei III.

, rezult
a ca ipoteza de normalitate este

Programul 6.12.5. Vom scrie un program Matlab, pentru aplicarea testului lui Kolmogorov si a testului , n cazul datelor din exemplul precedent.
% Testul lui Kolmogorov
a=97.75:0.5:102.75;
n=[0,21,47,87,158,181,201,142,97,41,25];
F0=normcdf(a,100.25,1); Fn=cumsum(n)/1000;
dn=max(abs(F0-Fn)); ks=sqrt(1000)*dn;
fprintf( ks=
%6.4f\n,ks)
% Testul chi2
F0(1)=0; F0(end)=1;n=n(2:end);
p0=diff(F0); x2=sum((n-1000*p0).2./(1000*p0));
cuant=chi2inv(0.95,9);
fprintf( x2= %6.4f\n,x2)
fprintf( cuant=%6.2f,cuant)

Rezultatele obtinute n urma executarii programului sunt:

ks=
0.1964
x2= 3.2117
cuant= 16.92

Ceea ce confirma rezultatele mai sus obtinute.

Exemplul 6.12.6. Se tin sub observatie
motoare electrice pana la defectarea
ultimului dintre ele. Se considera caracteristica , ce reprezinta numarul miilor de
ore de functionare pana la defectare. Rezultatele observatiilor sunt date n tabelul
urmator

6.12. Testul de concordanta al lui Kolmogorov

Durata
Frecv.

359

Sa se cerceteze exponentialitatea caracteristicii , folosind testul cu nivelul

de semnificatie
, iar apoi folosind testul lui Kolmogorov cu acelasi nivel de
semnificatie.
Legea exponentiala are functia de repartitie

parametru necunoscut

Folosind metoda verosimilitatii maxime avem estimatia pentru

Se calculeaza prima data probabilitat ile:

unde

Rezultatele sunt trecute n tabelul urmator

si care conduce la

. Deoarece avem valoaDin Anexa III obtinem cuantila

accept
rea calculata

am ipoteza exponentialitatii.

Pentru
aplicarea
testului
lui
Kolmogorov,
din
Anexa
V se determina cuantila

. Ipoteza exponentialitatii lui va fi acceptata daca

Aici
, iar
n tabelul urmator.

este functia de repartitie de selectie. Calculele sunt efectuate

360

Verificarea ipotezelor statistice

Asadar avem ca
exponentialitatea lui este admisa.

deci

Programul 6.12.7. Vom scrie un program Matlab, care efectueaza calculele din
exemplul precedent:
% Testul chi2
clear
a=[0:30:180,300]; f=[13,10,5*ones(1,4),7];
mij=[15:30:165,240]; mu=sum(mij.*f)/50;
F0=expcdf(a,mu);F0(end)=1; p0=diff(F0);
x2=sum((f-50*p0).2./(50*p0));
cuant=chi2inv(0.95,5);
fprintf( x2= %6.4f\n,x2)
fprintf( cuant= %4.2f\n,cuant)
% Testul lui Kolmogorov
F0=F0(2:end);F0(end)=expcdf(a(end),mu);
Fn=cumsum(f)/50;
dn=max(abs(F0-Fn)); ks=sqrt(50)*dn;
fprintf( ks=
%6.4f,ks)

In urma executarii programului se obtine:

x2= 2.8770
cuant= 11.07
ks=
0.4181

6.12.1 Functia kstest

Statistics toolbox contine functia kstest, care efectueaza testul lui Kolmogorov.
Apelul functiei se poate face cu una din instructiunile:
h=kstest(x)
h=kstest(x,cdf)
h=kstest(x,cdf,alpha)
h=kstest(x,cdf,alpha,tail)
[h,c,ks]=kstest(x,cdf,alpha,tail)

Comenzile de acest tip lanseaza executia testului lui Kolmogorov bilateral (cand
tail=0, valoare implicita), unilateral dreapta (cand tail=1), respectiv unilateral
stanga (cand tail=-1), prin considerarea datelor continute de vectorul x, iar functia

6.12. Testul de concordanta al lui Kolmogorov

361

de repartitie ipotezata fiind precizata prin prametrul cdf. Implicit se considera cdf
corespunzand legii normale standard.
Daca parametrul cdf este prezent, trebuie sa fie o matrice cu doua coloane, care
contine n coloana a doua valorile functiei de repartitie ipotezate pe punctele precizate
n prima coloana. Ar fi de dorit ca prima coloana a matricei cdf sa coincida cu
vectorul x, altfel functia va efectua un proces de interpolare pentru calculul valorilor
functiei ipotezate pe punctele lui x, folosind punctele precizate prin matricea cdf.
Din acest motiv, se impune ca toate componentele lui x sa aiba valorile continute n
intervalul determinat de valoare minima si valoarea maxima a componentelor primei
coloane a lui cdf.
Parametrul alpha (implicit alpha=0.05) reprezinta nivelul de semnificatie.
Rezultatele obtinute au urmatoarele semnificatii. Daca h=1 ipoteza nula se res
pinge, ceea ce corespunde faptului ca valoarea critica c satisface relatia c alpha,
iar daca h=0, ipoteza nula nu poate fi respinsa. Mai
remarcam faptul ca ks va

contine respectiv
valoarea
calculat
a
a
statisticilor
,
si ,
si verific
iile

anrelat
si,
c

n
,
pentru
testul
bilateral,
respectiv
c

n pentru testele unilaterale.
c

Programul 6.12.8. Sa aplicam testele lui Kolmogorov (bilateral, unilateral dreapta

si unilateral stanga) pentru datele x=-2:1:4, considerand legea ipotezata ca fiind
legea normala standard si nivelul de semnificatie alpha=0.05. Programul ce urmeaza, sa reprezinte grafic si functia de repartitie de selectie, mpreuna cu functia de
repartitie ipotezata.
x=-2:4;
fprintf( h
c
ks\n)
fprintf(__________________\n)
for i=-1:1
[h,c,ks]=kstest(x,[],0.05,i);
fprintf( %d %5.4f
%4.2f \n,h,c,ks)
end
cdfplot(x), hold on, title([])
t=-3:0.01:3; plot(t,normcdf(t,0,1),k--)

In urma executarii programului, se obtin rezultatele:

h
c
ks
__________________
0 0.0682
0.41
0 0.1363
0.41
0 0.7753
0.13

respectiv graficele din Figura 6.4 Se observa, n mod surprinzator, ipoteza nula nu
poate fi respinsa. Acest lucru se datoreaza faptului ca testul lui Kolmogorov este bazat
pe un rezultat asimptotic, adica se aplica pentru valori mari ale volumului selectiei.

362

Verificarea ipotezelor statistice

0.9

0.8

0.7

F(x)

0.6

0.5

0.4

0.3

0.2

0.1

0
3

Figura 6.4: Testul lui Kolmogorov

6.12.2 Functia lillietest

Functia lillietest efectueaza testul Lilliefors, care reprezinta o modificare a
testului lui Kolmogorov, n care ipoteza nula presupune ca functia de repartitie este
cea de la legea normala, dar parametrii nu mai sunt precizati, ci sunt estimati folosind
datele de selectie.
Apelul functiei se poate face cu una din comenzile
h=lillietest(x)
h=lillietest(x,alpha)
[h,c,ls]=lillietest(x,alpha)

Comenzile de acest tip lanseaza executia testului Lilliefors, prin considerarea datelor
continute de vectorul x, iar functia de repartitie ipotezata fiind cea de la legea normala

.
Parametrul alpha (implicit alpha=0.05) reprezinta nivelul de semnificatie.
Rezultatele obtinute au urmatoarele semnificatii. Daca h=1 ipoteza nula se res
pinge, ceea ce corespunde faptului ca valoarea critica c satisface relatia c alpha,
iar daca h=0, ipoteza nula nu poate fi respinsa.
Mai remarcam faptul ca ls va contine respectiv valoarea calculata a statisticii
, iar c este valoarea critica, care se calculeaza cu ajutorul lui ls, folosinduse
tabelele construite de Lilliefors. Daca n aceste tabele nu se afla valoarea corespunzatoare, atunci c=NaN, dar h indica nca daca ipoteza nula este respinsa sau nu.
Programul 6.12.9. Sa aplic
am testul lui Lilliefors pentru n numere aleatoare ce urmeaza legea normala
, continute de vectorul x, cu nivelul de semnificatie

6.13. Testul KolmogorovSmirnov

363

alpha=0.05. Programul ce urmeaza sa reprezinte grafic si functia de repartitie de

selectie, mpreuna cu functia de repartitie ipotezata, adica cea de la legea normala

.
clf
n=input(n=); mu=input(mu=); s=input(sigma=);
x=normrnd(mu,s,1,n);
[h,c,ls]=lillietest(x);
fprintf( h=%d\n c= %5.4f\n ls=%5.4f,h,c,ls)
ma=mean(x); va=sqrt(var(x));
cdfplot(x), hold on, title([])
t=ma-3*va:0.01:ma+3*va;
plot(t,normcdf(t,ma,va),k--)

In urma executarii programului pentru n=10, mu=100 si sigma=2, se obtin rezultatele:

h=0
c= 0.1433
ls=0.1093

si graficele din Figura 6.5

0.9

0.8

0.7

F(x)

0.6

0.5

0.4

0.3

0.2

0.1

10
x

Figura 6.5: Testul Lilliefors

6.13 Testul KolmogorovSmirnov

Se considera doua caracteristici independente si

de tip continuu cu functiile
teoretice de repartitie si necunoscute. Privind cele doua caracteristici vrem

sa verificam daca sunt identic repartizate. Astfel, consideram ipoteza nula data prin
, cu una din alternativele:

364

Verificarea ipotezelor statistice

(1)
(2)
(3)

(testul KolmogorovSmirnov bilateral),

(testul KolmogorovSmirnov unilateral dreapta),

(testul KolmogorovSmirnov unilateral stanga).

Pentru verificarea ipotezei nule , cu una din alternativele precizate, se considera cate o selectie repetata de volum si respectiv , cu datele de selectie

si variabilele de selectie , corespunzatoare pen

tru caracteristica si datele de selectie
, corespunzatoare pentru caracteristica . si variabilele de selectie

Se considera statisticile

unde si sunt functiile de repartitie de selectie.

Pentru
, functiile de repartitie ale acestor functii de selectie au
urmatoarele comportari asimptotice:

e

, fiind tabelata pentru anumite valori n Anexa V, resfunctia lui Kolmogorov
pectiv

ce poarta numele de lege cu doua grade de libertate.

fixat, se pot determina cuantilele ,
Pentru
un nivel de semnificatie

s
i astfel ncat

adica

pentru testul bilateral KolmogorovSmirnov,

adica

6.13. Testul KolmogorovSmirnov

365

pentru testul unilateral dreapta KolmogorovSmirnov,

adica

pentru testul unilateral stanga KolmogorovSmirnov,

Corespunza tor celor trei alterantive, ipoteza va fi admisa cand valorile cal

si , ale
culate , , pe baza datelor de selectie
statisticilor , , satisfac respectiv conditiile

(1)

(2)

(3)

, cand

, cand

, cand

iar n caz contrar va fi respinsa.

Prezentam, n cele ce urmeaza, mpreuna cele trei teste (bilateral, unilateral
dreapta si unilateral stanga) KolmogorovSmirnov. Remarcam ca cele trei teste sunt
teste distincte, alegerea unuia dintre ele se face apriori.
Etapele aplicarii testului lui KolmogorovSmirnov

1. Se dau: ;

;

2. Se determina
(1)
(2)
(3)

astfel nc
at

astfel nc
at

3. Se calculeaza

(1)
(2)
(3)

astfel ncat

, cand

, cand

, cand

4. Concluzia: daca

, cand
, cand
, cand

;
;

,
;

;

366

Verificarea ipotezelor statistice

este admisa, cand
ipoteza

este admisa, cand
ipoteza

ipoteza este admisa, cand

(1)
(2)
(3)

,
,

Observatia 6.13.1. Avand n vedere ca functiile (de repartit

ie) si sunt monoton crescatoare si ca pentru determinarea cuantilelor , si este ne

cesara inversarea acestor functii de repartitie, se poate evita aceasta operatie. Pentru
aceasta se determina valorile functiilor si
pe valorile calculateale statisticilor

, , , adica se calculeaza, respectiv
,

ipoteza nula

daca valoarea critica

. Astfel, se va respinge

satisface inegalitatea

6.13.1 Functia kstest2

Statistics toolbox contine functia kstest2, care efectueaza testul Kolmogorov
Smirnov. Apelul functiei se poate face cu una din instructiunile:
h=kstest(x,y)
h=kstest(x,y,alpha)
h=kstest(x,y,alpha,tail)
[h,c,ks]=kstest(x,y,alpha,tail)

Comenzile de acest tip lanseaza executia testului KolmogorovSmirnov bilateral

(cand tail=0, valoare implicita), unilateral dreapta (cand tail=1), respectiv unilateral stanga (cand tail=-1), prin considerarea datelor continute n vectorii x si y.
Parametrul alpha (implicit alpha=0.05) reprezinta nivelul de semnificatie.
Rezultatele obtinute au urmatoarele semnificatii. Daca h=1, ipoteza nula se res
pinge, ceea ce corespunde faptului ca valoarea critica c satisface relatia c alpha,
iar daca h=0, ipoteza nula nu poate fi respinsa. Mai remarc
am faptul ca ks va contine

, si ,si verifica relat
respectivvaloarea
calculat
a
a
statisticilor
n , pentru testul bilateral, respectiv c
n iilesi

c
n, pentru testele unilaterale.
c

Programul 6.13.2. Sa aplicam testele KolmogorovSmirnov (bilateral, unilateral

dreapta si unilateral stanga) pentru datele x=-1:1:5 si y reprezentand 20 de numere aleatoare, ce urmeaza legea normala standard, iar nivelul de semnificatie sa fie
alpha=0.05. Programul ce urmeaza, sa reprezinte grafic si cele doua functii de
repartitie de selectie.
clf
x=-1:5; y=randn(1,20);
fprintf( h
c
ks\n)
fprintf(__________________\n)
for i=-1:1

6.13. Testul KolmogorovSmirnov

367

[h,c,ks]=kstest2(x,y,[],i);
fprintf( %d %5.4f
%4.2f\n,h,c,ks)
end
h1=cdfplot(x); hold on, h2=cdfplot(y);
title(Functiile de repartitie de selectie)
set(h1,linestyle,--)
set(h2,linestyle,-)

In urma executarii programului, se obtin rezultatele:

h
c
ks
__________________
1 0.0110
0.61
1 0.0219
0.61
0 0.9783
0.04

respectiv graficele din Figura 6.6. Testul KolmogorovSmirnov este bazat pe un reFunctiile de repartitie de selectie
1

0.9

0.8

0.7

F(x)

0.6

0.5

0.4

0.3

0.2

0.1

0
2

Figura 6.6: Testul KolmogorovSmirnov

zultat asimptotic, adica se aplica pentru valori mari ale volului selectiei, dar aici sau
folosit selectii de volum mic, n mod special pentru a urmari pe figura modul de calcul
a celor trei statistici , si .

368

Verificarea ipotezelor statistice

Anexe

369

Anexa I (Functia lui Laplace)

Sutimi ale lui

370

Anexe
Anexa II (Legea Student)

Anexe

371

Anexa III (Legea

)

372

Anexe
Anexa IV (Legea FisherSnedecor)

Anexe

373

Anexa IV (continuare)

374

Anexe
Anexa IV (continuare)

Anexe

375

Anexa IV (continuare)

376

Anexe

Anexa V (Functia lui Kolmogorov)

Sutimi ale lui

Bibliografie
[1] Abramowitz, M., Stegun, I. A., Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables, tenth ed., Dover Publications, Inc.,
New York, 1972.
[2] Blaga, P., Calculul probabilitat ilor. Culegere de probleme, Universitatea
BabesBolyai, ClujNapoca, 1984.
[3]

, Metode statistice n modelarea cu calculatorul. Lucrari de laborator,

Universitatea BabesBolyai, ClujNapoca, 1993.

[4]

, Calculul probabilitat ilor si statistica matematica. Vol. II. Curs si culegere de probleme, Universitatea BabesBolyai, ClujNapoca, 1994.

[5]

, Statistica matematica. Lucrari de laborator, Universitatea Babes

Bolyai, ClujNapoca, 1999.

[6]

, Statistica matematica, Universitatea BabesBolyai, ClujNapoca,

2000.

[7]

, Statistica matematica (editia II), Universitatea BabesBolyai, Cluj

Napoca, 2001.

[8] Blaga, P., Lupas, A., Muresan A. S., Matematici aplicate, Vol.III, Promedia
Plus, ClujNapoca, 1999.
[9] Blaga, P., Muresan A. S., Matematici aplicate n economie, Vol.III, Transilvania Press, ClujNapoca, 1996.
[10] Blaga, P., Radulescu, M., Calculul probabilitat ilor, Universitatea Babes
Bolyai, ClujNapoca, 1987.
[11] Ciucu, G., Elemente de teoria probabilitat ilor si statistica matematica, Editura
didactica si pedagogica, Bucuresti, 1963.
377

378

Bibliografie

[12] Ciucu, G., Craiu, V., Probleme de statistica matematica, Editura didactica si
pedagogica, Bucuresti, 1968.
[13]

, Teoria estimatiei si verificarea ipotezelor statistice, Editura didactica

si pedagogica, Bucuresti, 1968.

[14]

, Introducere n teoria probabilitat ilor si statistica matematica, Editura

didactica si pedagogica, Bucuresti, 1971.

[15]

, Inferenta statistica, Editura didactica si pedagogica, Bucuresti, 1974.

[16] Ciucu, G., Craiu, V., Stefanescu, A., Statistica matematica si cercetari operationale, Vol. I, Editura didactica si pedagogica, Bucuresti, 1974.
[17] Ciucu, G., Tudor, C., Probabilitat i si procese stochastice. Vol. I, Editura Academiei, Bucuresti, 1978.
[18] Craiu, V., Verificarea ipotezelor statistice, Editura stiintifica si enciclopedica,
Bucuresti, 1972.
[19] Craiu, V., Enache, R., Basca, O., Teste de concordanta cu programe n FORTRAN, Editura stiintifica si enciclopedica, Bucuresti, 1974.
[20] Cramer, H., Mathematical methods of statistics, Princeton University Press,
Princeton, 1951.
[21] DacunhaCastelle, D., Duflo, M., Exercises de probabilites et statistiques.
1. Probl`emes a` temps fixe. Tome 1, Masson, Paris, 1990.
[22]

, Probabilites et statistiques. 1. Probl`emes a` temps fixe. Tome 1, Masson, Paris, 1990.

[23] Deak, I., Random number generators and simulation, Akademiai Kiado, Budapest, 1990.
[24] Dumitrescu, M., Florea, D., Tudor, C., Probleme de teoria probabilitat ilor si
statistica matematica, Editura Tehnica, Bucuresti, 1985.
[25] Enders, W., Applied econometric. Time series, John Wiley & Sons, 1995.
[26] Ermakov, S. M., Metoda Monte Carlo si probleme nrudite, Editura Tehnica,
Bucuresti, 1976.
[27] Feller, W., An introduction to probability theory and its applications. Vol. I,
John Wiley, New York, 1957.

Bibliografie
[28]

379

, An introduction to probability theory and its applications. Vol. II, John

Wiley, New York, 1966.

[29] Gnedenko, B. V., The theory of probability, Mir Publishers, Moscow, 1976.
[30] Good, Ph. I., Resampling Methods. A Practical Guide to Data Analysis,
Birkhauser, Boston Basel Berlin, 1999.
[31] Griffiths, D. F., An Introduction to Matlab, Version 2.1, University of Dundee,
1997.
[32] Grinstead, Ch. M., Snell, J. L., Introduction in probability, Second edition, American Mathematical Society, 1997.
[33] Gurski, E. I., Culegere de probleme pentru teoria probabilitat ilor si statistica
matematica (l. rusa), Edit. Inv. superior Minsk, Minsk, 1984.
[34] Hoel, P. J., Introduction to mathematical statistics, Fourth edition, John Wiley
& Sons, New YorkLondonSydneyToronto, 1971.
[35]

, Statistique mathematique, Tome II, Armand Colin, Paris, 1991.

[36] HoffmannJrgensen, J., Probability with a view toward statistics, Vol. I-II,
Chapman & Hall, New YorkLondon, 1994.
[37] Iosifescu, M., Mihoc, Gh., Theodorescu, R., Teoria probabilitat ilor si statistica
matematica, Editura Tehnica, Bucuresti, 1966.
[38] Iosifescu, M., Moineanu, C., Trebici, V., Ursianu, E., Mica enciclopedie de statistica, Editura stiintifica si enciclopedica, Bucuresti, 1985.
[39] Jansson, B., Random number generators, Victor Petterson Bokindustri Aktiebolag, Stockholm, 1966.
[40] Johnson, N. L., Kotz, S., Distributions in statistics. Discrete distributions, Houghton Mifflin Company, Boston, 1969.
[41] Kendall, M. G., Stuart, A., The advanced theory of statistics. Vol. 1. Distribution
theory, Second edition, Charles Griffin & Company Limited, London, 1961.
[42]

, The advanced theory of statistics. Vol. 2. Inference and relationship,

Charles Griffin & Company Limited, London, 1963.

[43]

, The advanced theory of statistics. Vol. 3. Design and analysis, and

timeseries, Charles Griffin & Company Limited, London, 1966.

380

Bibliografie

[44] Knuth, D. E., The art of computer programming, Vol. II. Seminumerical algorithms, Addison-Wesley, Mass., 1969.
[45] Lebart, L., Morineau, M. G., Fenelon, J.-P., Traitment des donnees statistiques.
methodes et programmes, Dunod, Paris, 1982.
[46] Lecoutre, J.-P., Tassi, Ph., Statistique non parametrique et robustesse, Economica, Paris, 1987.
[47] Lehmann, E. L., Testing statistical hypotheses, Second edition, Springer, New
YorkBerlin, 1997.
[48] Malita, M., Zidaroiu, C., Incertitudine si decizie, Editura stiintifica si enciclopedica, Bucuresti, 1980.
[49] Mihoc, Gh., Ciucu, G., Craiu, V., Teoria probabilitat ilor si statistica matematica, Editura didactica si pedagogica, Bucuresti, 1970.
[50] Mihoc, Gh., Ciucu, G., Muja, A., Modele matematice ale asteptarii, Editura
Academiei, Bucuresti, 1973.
[51] Mihoc, Gh., Craiu, V., Tratat de statistica matematica. Vol. I. Selectie si
estimatie, Editura Academiei, Bucuresti, 1976.
[52]

, Tratat de statistica matematica. Vol. II. Verificarea ipotezelor statistice, Editura Academiei, Bucuresti, 1977.

[53] Mihoc, Gh., Firescu, D., Statistica matematica, Editura didactica si pedagogica,
Bucuresti, 1966.
[54] Mihoc, I., Calculul probabilitat ilor si statistica matematica. Part. I, II, lito.
Univ. BabesBolyai, ClujNapoca, 1994,1995.
[55] Nakamura, S., Numerical Analysis and Graphic Visualization with MATLAB,
Prentice Hall PTR, Upper Saddle River, New Jersey, 1996.
[56] Oancea, E., Radulescu, M., Calculul probabilitat ilor si statistica matematica,
lito. Univ. BabesBolyai, ClujNapoca, 1974.
[57] Ogden, R. T., Essential wavelets for statistical applications and data analysis,
Birkhauser, Boston Basel Berlin, 1997.
[58] Onicescu, O., Numere si sisteme aleatoare, Editura Academiei, Bucuresti, 1962.

Bibliografie

381

[59] Onicescu, O., Botez, M. C., Incertitudine si modelare economica (econometrie

informationala), Editura stiintifica si enciclopedica, Bucuresti, 1985.
[60] Parzen, E., Modern probability theory and its applications, John Wiley, New
YorkLondon, 1960.
[61] Press, W. H., Flannery, B. P., Teukolsky, S. A., Vetterling, W. T., Numerical
Recipes. The Art of Scientific Computing, Cambridge University Press, Cambridge, 1986.
[62] Rancu, N., Tovissi, L., Statistica matematica cu aplicatii n productie, Editura
Academiei, Bucuresti, 1963.
[63] Rao, M. M., Probability theory with applications, Academic Press, New York,
1984.
[64] Renyi, A., Probability theory, Akademiai Kiado, Budapest, 1970.
[65] Rumsiski, L. Z., Prelucrarea matematica a datelor experimentale, Editura Tehnica, Bucuresti, 1974.

[66] Saporta, G., Probabilites, analyse des donnees et statistique, Editions

Technip,
Paris, 1990.
[67] Schervish, M. J., Theory of statistics, Springer, New YorkBerlin, 1995.
[68] Shiryaev, A. N., Probability, Springer, New YorkBerlin, 1995.
[69] Sigmon, K., Matlab Primer, Third edition, University of Florida, 1993.
[70] Snedecor, G. W, Cochran, W. G., Statistical methods, Iowa State University
Press, 1989.
[71] Stapleton, J. H., Linear statistical models, John Wiley & Sons, New York
ChichesterBrisbane, 1995.
[72] Stark, H., Woods, J. W., Probability, random processes, and estimation theory
for engineers, Prentice-Hall, New Jersey, 1986.
[73] Stoyanov, J., Mirazchiiski, I., Ignatov, Z., Tanushev, M., Exercise manual in
probability theory, Kluwer Academic Publishers, DordrechtBostonLondon,
1988.
[74] Sacuiu, I., Zorilescu, D., Numere aleatoare. Aplicatii n economie, industrie si
studiul fenomenelor naturale, Editura Academiei, Bucuresti, 1978.

382

Bibliografie

[75] Sveshnikov, A. A., Problems in probability theory, mathematical statistics and

theory of random functions, W. B. Saunders Company, PhiladelphiaLondon
Toronto, 1968.

[76] Tassi, Ph., Methodes statistiques, e dition, Economica, Paris, 1989.
[77] Vaduva, I., Analiza dispersionala, Editura Tehnica, Bucuresti, 1970.
[78]

, Modele de simulare cu calculatorul, Editura Tehnica, Bucuresti, 1977.

[79] Wahba, G., Spline models for observational data, Society for Industrial and
Applied Mathematics, Philadelphia, 1990.
[80] Yule, G. U., Kendall, M. G., Introducere n teoria statisticii, Editura stiintifica,
Bucuresti, 1969.

Index
Abatere
cuartilica, 152
medie absoluta, 152
medie patratica, 152
standard, 107, 152
abs, 9
acos, 9
acosh, 9
acot, 9
acoth, 9
acsc, 9
acsch, 9
all, 15
Amplitudinea, 152
clasei, 120
and, 14
angle, 9
ans, 12
any, 14
asec, 9
asech, 9
Asimetrie, 103, 154
asin, 9
asinh, 9
atan, 9
atan2, 9
atanh, 9
Atribut, 114
axis, 23

bar3h, 58
barh, 31
beta, 80
betafit, 282
betalike, 280
bino, 68
binofit, 282
boxplot, 164
Camp de evenimente, 62
Camp de probabilitate, 62
calendar, 6
Cantitate de informatie, 232
Caracteristica, 114
calitativa (atribut), 114
cantitativa, 114
continua, 115
discreta, 115
caseread, 127
casewrite, 127
cd, 4, 10
cdf, 65, 66, 74, 107
cdfplot, 223
ceil, 9
Centile, 104, 151
Centru de greutate, 174
chi2, 83
cla, 23
Clase, 120
clear, 11
clf, 23
clock, 6

bar, 31, 65, 134, 138

bar3, 58
383

384
Coeficientii
lui Fisher, 154
lui Pearson, 154
Coeficient de asimetrie
intercuartil, 154
Coeficient de corelatie, 95
al lui Pearson, 167
al rangurilor, 187
de selectie, 207
Coeficient de regresie, 174
Coeficient de variatie, 154
intercuartil, 154
Coeficientul
lui Kendall, 189
lui Spearman, 187
Coeficientul de concordanta
al lui Kendall, 194
Colectivitate, 114
colormap, 27
combnk, 10
Concatenare, 9
conj, 9
contour, 54
contourf, 55
Convergenta
n probabilitate, 108
n repartitie, 108
Corectiile
Sheppard, 158
Corelatie, 95, 165
Corp borelian, 62
corrcoef, 180
cos, 9
cosh, 9
cot, 9
coth, 9
cov, 179
Covarianta , 95
crosstab, 126

Index
csc, 9
csch, 9
Cuantila, 104
Cuartila, 104, 150
inferioara, 104, 150
superioara, 104, 150
cumprod, 157
cumsum, 157
Curba de regresie, 103, 170
date, 6
Date de selectie, 198
dbclear, 16
dbcont, 16
dbdown, 16
dbmex, 17
dbquit, 17
dbstack, 16
dbstatus, 16
dbstep, 16
dbstop, 16
dbtype, 16
dbup, 17
Decile, 104, 151
delete, 17
demo, 4
Densitate de probabilitate, 73, 74
marginala, 89
det, 10
diag, 10
Diagrama
cumulativa ascendenta, 129
integrala cumulativa, 132
prin batoane (bare), 129
diary, 11, 43
diff, 157
dir, 4
disp, 10
Dispersie, 95, 152
conditionata, 101, 170

Index
de selectie, 206
Distributie, 64
statistica, 123
Distributie marginala, 88
disttool, 107
Drepte de regresie, 173
Esantion, 197
echo, 48
edit, 16
Eficienta , 242
eps, 6
eq, 14
erf, 76
Eroare
de speta ntai, 291
de speta a doua, 291
Estimatie, 236
absolut corecta, 237
consistenta, 236
corecta, 239
cu minim, 256
de verosimilitate maxima, 252
nedeplasata, 236
Estimator, 236
absolut corect, 237
consistent, 236
corect, 239
cu minim, 256
de verosimilitate maxima, 252
nedeplasat, 236
optimal, 247
Eveniment
cert, sigur, 62
Exces, 103
exit, 2
exp, 9, 79
Experiment, 62
expfit, 282
eye, 6

385
ezcontour, 56
ezcontourf, 57
ezmesh, 57
ezmeshc, 57
ezplot, 35
ezplot3, 51
ezpolar, 25
ezsurf, 57
ezsurfc, 57
f, 85
factor, 10
factorial, 10
feval, 47
Fisiere script, 15, 43
figure, 23
file, 17
fill, 35
fix, 9
floor, 9
flops, 48
format, 5
Formula lui Daniels, 193
fplot, 33
fprintf, 13
Frecventa
absoluta, 120, 124
cumulata
ascendenta, 123
descendenta, 123
relativa, 123
Functia eroare, 76
Functia Laplace, 76, 77
Functia lui Euler
de speta ntai, 80
de speta a doua, 78
Functie caracteristica, 103
Functie de estimatie, 236
absolut corecta, 237
corecta, 239

386
eficienta, 242
nedeplasata, 236
Functie de probabilitate, 65
Functie de repartitie, 6365, 74
conditionata, 89
de selectie, 216
marginala, 88
Functie de selectie, 198
Functie de supravietuire, 93
Functie de verosimilitate, 229
Functie hazard, 93
Functie nucleu, 131
Gaussian, 131
parabolic (Epanechnikov), 131
Functie wavelet, 29
mama, 29
Functii Matlab, 43
Functiile lui Haar, 29
gam, 78
gamfit, 282
gamlike, 280
gcd, 10
ge, 14
geo, 73
geomean, 149
ginput, 13
gline, 181
global, 44
gplotmatrix, 146
grid, 24
grpstats, 163
Grupare, 120
gscatter, 144
gt, 14
gtext, 24
harmmean, 149
help, 2, 44
helpdesk, 4

Index
helpwin, 3
hist, 138, 139
histc, 139, 140
histfit, 278
Histograma, 129
hold, 22
hyge, 69
i, 6
icdf, 104, 107
imag, 9
Indicatorul
de verosimilitate, 257
lui Berkson, 257
lui Kullbach, 257
lui Neyman, 257
lui Pearson, 257
Indice
de dilatare, 29
de translatare, 29
inf, 6
input, 13
Instructiunea
break, 42
de atribuire, 12
error, 43
for, 40
if, 37
pause, 42
return, 42
switch, 38
try...catch, 41
while, 39
Instructiuni
de citire, 13
de scriere, 13
Interval
intercuartilic, 152
Interval de ncredere, 185, 187, 257
inv, 10

Index
Ipoteza statistica, 285
alternativa, 285
compusa, 285
nula, 285
simpla, 285
iqr, 155
j, 6
kstest, 360
kstest2, 366
kurtosis, 155
lcm, 10
ldivide, 8
le, 14
Lege de probabilitate
de tip continuu, 74
clasica, 74
statistica, 81
de tip discret, 64
clasica, 67
Legea
, 83
necentrata, 85
arcsin, 80
Bernoulli, 67
beta, 80
binomiala, 68
binomiala negativa, 72
Cauchy, 81
evenimentelor rare, 71
exponentiala, 71, 79
F (FisherSnedecor), 85
necentrata, 86
gamma, 78
geometrica, 73
hipergeometrica, 69
lognormala, 78
normala, 76
normala multidimensionala, 90

387
Pascal, 72
Poisson, 70
Rayleigh, 80
t (Student), 81
necentrata, 82
uniforma, 74
discreta, 68
Weibull, 80
Legea numerelor mari, 109
legend, 24
length, 10
lillietest, 362
load, 11
log, 9
log10, 9
log2, 9
logn, 78
lookfor, 3, 44
lsline, 181
lt, 14
mad, 155
magic, 6
Matrice vida, 12
Matricea covariantelor, 95
Matricea informatiei lui Fisher, 232
max, 156
mean, 149
median, 150
Mediana, 104, 149
Medie
aritmetica, 148
armonica, 149
geometrica, 148
Medie de selectie, 199
mesh, 52
meshgrid, 52
Metoda ferestrei mobile, 130
Metode de selectie
nerepetate, 198

388
repetate(bernoulliene), 198
min, 156
minus, 8
mkdir, 4, 10
mldivide, 8
mle, 278
Mod, 151
Moment, 151, 166
centrat, 103, 152, 167
centrat de seletie, 203
de seelctie, 201
initial, 103
moment, 155
mpower, 8
mrdivide, 9
mtimes, 8
mvnrnd, 117
mvtrnd, 117
NaN, 6
nanmax, 158
nanmean, 158
nanmedian, 158
nanmin, 158
nanstd, 158
nansum, 158
nargin, 44
nargout, 44
nbin, 72
ncf, 86
nchoosek, 10
nct, 82
ncx2, 85
ndims, 10
ne, 14
Nivel de semnificatie, 286
nlinfit, 185
nlintool, 186
Nor statistic, 133
norm, 76

Index
normfit, 282
normlike, 280
normspec, 87
not, 14
Numere
aleatoare, 116
pseudoaleatoare, 117
Observare
curenta, 115
partiala, 115
periodica, 115
totala, 115
ones, 6
or, 14
pdf, 65, 66, 74, 107
perms, 10
pi, 6
pie, 147
pie3, 147
plot, 17, 25, 28, 65, 74, 138
plot3, 49
plotmatrix, 145
plus, 8
poiss, 70
poissfit, 282
polar, 25
poly, 183
polyfit, 182
polytool, 184
polyval, 183
polyvalm, 183
Populatie, 114
power, 8
prctile, 151
primes, 10
Proba, 62
Probabilitate, 62
Probabilitate de ncredere, 185

Index
Proceduri Matlab, 43
prod, 157
Puterea unui test, 291
quit, 2
rand, 118
randn, 118
random, 117
randperm, 119
randtool, 147
range, 155
rank, 10
Raport de corelatie, 171
rayl, 80
raylfit, 282
rdivide, 8
real, 9
realmax, 6
realmin, 6
refcurve, 182
refline, 181
Regiune critica, 286
Regula lui Sturges, 120
rem, 9
Repartitie, 64
reshape, 7
Risc
de speta ntai, 291
de speta a doua, 291
roots, 183
round, 9
save, 11, 43
scatter, 142
scatter3, 143
sec, 9
sech, 9
Selectie, 197
cu probabilitat i egale, 198
sistematica, 197

389
stratificata, 198
tipica, 198
shading, 53
sign, 9
sin, 9
sinh, 9
Sistemul ecuatiilor
de verosimilitate maxima, 253
size, 10
skewness, 155
Sondaj, 197
sort, 156
sortrows, 156
Spatiul probelor, 62
sqrt, 9
stairs, 28, 65, 134
Statistica, 198
completa, 249
suficienta, 229
std, 155
Subfunctii Matlab, 45
subplot, 32
sum, 157
surf, 52
t, 81
Tabel de contingenta , 124, 349
Tabel de corelatie, 124
Tabel statistic
nesistematizat, 119
sistematizat, 119, 120
tabulate, 125
tan, 9
tanh, 9
tblread, 128
tblwrite, 128
Teorema limita
centrala, 110
MoivreLaplace, 110
Test, 285

390
cel mai puternic, 297
nedeplasat, 297
neparametric, 285
parametric, 285
Testul
, 318, 321
bilateral, 318, 321
unilateral dreapta, 318, 321
unilateral stanga, 318, 321
, 304, 325, 329
bilateral, 304, 310, 332
unilateral dreapta, 304, 332
unilateral stanga, 304, 332
, 286, 323
bilateral, 286
unilateral dreapta, 286
unilateral stanga, 286
, 312, 334, 346, 349
bilateral, 312
neparametric, 338
parametric, 340, 342
unilateral dreapta, 312
unilateral stanga, 312
FisherSnedecor, 318
bilateral, 318
unilateral dreapta, 318
unilateral stanga, 318
Kolmogorov, 353
bilateral, 353
unilateral dreapta, 353
unilateral stanga, 353
Kolmogorov-Smirnov, 363
bilateral, 363
unilateral dreapta, 364
unilateral stanga, 364
raportului verosimilitatilor, 308
Student, 304
bilateral, 304, 332
unilateral dreapta, 304, 332

Index
unilateral stanga, 304, 332
text, 24
tic, 49
times, 8
title, 24
toc, 49
trace, 10
transpose, 10
trimmean, 149
ttest, 307
ttest2, 327
unid, 68
unif, 74
unifit, 282
Valoare medie, 94, 95
conditionata, 99, 170
Valoarea functiei de selectie, 198
var, 155
Variatie
intercuartilica, 152
Variabila
nominala, 114
ordinala, 114
Variabila aleatoare, 62
(absolut) continua, 73
de tip continuu, 63
de tip discret, 63
simpla, 63
Variabile aleatoare
independente, 64
Variabile de selectie, 198
Varianta , 95
conditionata, 101
Vector aleator, 63
(absolut) continuu, 74
version, 4
Volumul
colectivitat ii, 114

Index
weib, 80
weibfit, 282
weiblike, 280
what, 17
which, 17
who, 11
whos, 11
workspace, 43
xlabel, 24
xor, 14
ylabel, 24
zeros, 6
zoom, 25
zscore, 290
ztest, 290

391

392

Index