Stat Matlab PDF
Stat Matlab PDF
Prefata
1
vii
Introducere n Matlab
1.1 Gestionarea unei sesiuni Matlab . . . . . . . . . . . . . . . . . . .
1.1.1 Lansarea si nchiderea unei sesiuni Matlab . . . . . . . . .
1.1.2 Comenzi help . . . . . . . . . . . . . . . . . . . . . . . .
1.1.3 Comenzi sistem . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Constante. Variabile. Expresii aritmetice . . . . . . . . . . . . . . .
1.2.1 Constante . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Instructiunea format . . . . . . . . . . . . . . . . . . . .
1.2.3 Constante speciale . . . . . . . . . . . . . . . . . . . . . .
1.2.4 Variabile . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.5 Operatori aritmetici . . . . . . . . . . . . . . . . . . . . . .
1.2.6 Functii predefinite . . . . . . . . . . . . . . . . . . . . . .
1.2.7 Comenzi pentru gestiunea variabilelor si a spatiului de lucru
1.3 Instructiuni de atribuire . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Instructiuni de citire si scriere . . . . . . . . . . . . . . . . . . . . .
1.4.1 Instructiunea input . . . . . . . . . . . . . . . . . . . . .
1.4.2 Instructiunea ginput . . . . . . . . . . . . . . . . . . . .
1.4.3 Instructiunea fprintf . . . . . . . . . . . . . . . . . . .
1.5 Operatori relationali si operatori logici . . . . . . . . . . . . . . . .
1.5.1 Operatori relationali . . . . . . . . . . . . . . . . . . . . .
1.5.2 Operatori logici . . . . . . . . . . . . . . . . . . . . . . . .
1.6 Fisiere script (mfile) . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.1 Comenzi pentru gestionarea fisierelor . . . . . . . . . . . .
1.7 Grafica bidimensionala . . . . . . . . . . . . . . . . . . . . . . . .
1.7.1 Instructiunea plot . . . . . . . . . . . . . . . . . . . . . .
1.7.2 Comenzi si instructiuni de gestionare a graficelor . . . . . .
1.7.3 Instructiunile polar si ezpolar . . . . . . . . . . . . . .
i
1
2
2
2
4
4
5
5
6
7
8
9
10
12
13
13
13
13
14
14
14
15
17
17
17
22
25
ii
Cuprins
1.7.4 Instructiunea stairs . . . . . . . . . . . . . . . . . . .
1.7.5 Instructiunile bar si barh . . . . . . . . . . . . . . . . .
1.7.6 Instructiunea subplot . . . . . . . . . . . . . . . . . .
1.7.7 Instructiunea fplot . . . . . . . . . . . . . . . . . . . .
1.7.8 Instructiunea ezplot . . . . . . . . . . . . . . . . . . .
1.7.9 Instructiunea fill . . . . . . . . . . . . . . . . . . . . .
1.8 Instructiuni de ciclare si control . . . . . . . . . . . . . . . . . .
1.8.1 Instructiunea if . . . . . . . . . . . . . . . . . . . . . .
1.8.2 Instructiunea switch . . . . . . . . . . . . . . . . . . .
1.8.3 Instructiunea while . . . . . . . . . . . . . . . . . . . .
1.8.4 Instructiunea for . . . . . . . . . . . . . . . . . . . . .
1.9 Instructiuni de ntrerupere . . . . . . . . . . . . . . . . . . . . . .
1.9.1 Instructiunea try. . . catch . . . . . . . . . . . . . . . .
1.9.2 Instructiunea pause . . . . . . . . . . . . . . . . . . . .
1.9.3 Instructiunea return . . . . . . . . . . . . . . . . . . .
1.9.4 Instructiunea break . . . . . . . . . . . . . . . . . . . .
1.9.5 Instructiunea error . . . . . . . . . . . . . . . . . . . .
1.10 Functii (proceduri) n Matlab . . . . . . . . . . . . . . . . . . . .
1.10.1 Definirea si structura unei functii Matlab . . . . . . . . .
1.10.2 Apelul unei functii (proceduri) Matlab . . . . . . . . . . .
1.10.3 Subfunctii . . . . . . . . . . . . . . . . . . . . . . . . . .
1.10.4 Functia feval . . . . . . . . . . . . . . . . . . . . . . .
1.10.5 Comanda echo . . . . . . . . . . . . . . . . . . . . . . .
1.11 Instructiuni de evaluare a eficientei . . . . . . . . . . . . . . . . .
1.11.1 Instructiunea flops . . . . . . . . . . . . . . . . . . . .
1.11.2 Instructiunile tic si toc . . . . . . . . . . . . . . . . .
1.12 Grafica tridimensionala . . . . . . . . . . . . . . . . . . . . . . .
1.12.1 Instructiunea plot3 . . . . . . . . . . . . . . . . . . . .
1.12.2 Instructiunea ezplot3 . . . . . . . . . . . . . . . . . .
1.12.3 Instructiunile meshgrid, mesh si surf . . . . . . . . .
1.12.4 Instructiunile contour si contourf . . . . . . . . . .
1.12.5 Instructiunile ezcontour si ezcontourf . . . . . . .
1.12.6 Instructiunile ezmesh, ezsurf, ezmeshc si ezsurfc
1.12.7 Instructiunile bar3 si bar3h . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
28
31
32
33
35
35
36
37
38
39
40
41
41
42
42
42
43
43
44
45
45
47
48
48
48
49
49
49
51
51
54
56
57
58
.
.
.
.
61
62
62
63
64
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Cuprins
2.5
2.6
2.7
iii
2.4.1 Functiile Matlab pdf si cdf . . . . . . . . . . . . . . . . .
2.4.2 Legi de probabilitate de tip discret clasice . . . . . . . . . .
Legi de probabilitate continue . . . . . . . . . . . . . . . . . . . .
2.5.1 Legi de probabilitate continue clasice . . . . . . . . . . . .
2.5.2 Legi de probabilitate continue statistice . . . . . . . . . . .
2.5.3 Functia Matlab normspec . . . . . . . . . . . . . . . . .
2.5.4 Distributie marginala . . . . . . . . . . . . . . . . . . . . .
2.5.5 Functie de repartitie conditionata . . . . . . . . . . . . . . .
2.5.6 Functie de supravietuire. Functie hazard . . . . . . . . . . .
Caracteristici numerice . . . . . . . . . . . . . . . . . . . . . . . .
2.6.1 Valoare medie. Dispersie (varianta ). Covarianta . . . . . . .
2.6.2 Functii Matlab pentru valoare medie si dispersie . . . . . .
2.6.3 Valoare medie conditionata. Dispersie (varianta ) conditionata
2.6.4 Functie caracteristica . . . . . . . . . . . . . . . . . . . . .
2.6.5 Momente . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.6 Mediana. Cuartile. Cuantile . . . . . . . . . . . . . . . . .
2.6.7 Functia Matlab icdf . . . . . . . . . . . . . . . . . . . . .
2.6.8 Functia Matlab disttool . . . . . . . . . . . . . . . . .
Siruri de variabile aleatoare . . . . . . . . . . . . . . . . . . . . . .
2.7.1 Inegalitatea lui Cebsev . . . . . . . . . . . . . . . . . . . .
2.7.2 Tipuri de convergenta . . . . . . . . . . . . . . . . . . . . .
2.7.3 Legea numerelor mari . . . . . . . . . . . . . . . . . . . .
2.7.4 Teoreme limita . . . . . . . . . . . . . . . . . . . . . . . .
65
67
73
74
81
87
88
89
92
94
94
99
99
103
103
104
104
107
107
107
108
109
109
Statistica descriptiva
113
3.1 Concepte de baza ale statisticii . . . . . . . . . . . . . . . . . . . . 114
3.2 Culegerea, prezentarea si prelucrarea datelor statistice . . . . . . . . 115
3.2.1 Generarea numerelor aleatoare n Matlab . . . . . . . . . . 115
3.2.2 Tabele statistice . . . . . . . . . . . . . . . . . . . . . . . . 119
3.2.3 Functiile tabulate si crosstab . . . . . . . . . . . . . 125
3.2.4 Functiile caseread, casewrite, tblread si tblwrite 127
3.2.5 Reprezentari grafice . . . . . . . . . . . . . . . . . . . . . 129
3.2.6 Functii Matlab pentru reprezentarea grafica a datelor statistice 134
3.2.7 Functia randtool . . . . . . . . . . . . . . . . . . . . . 147
3.2.8 Functiile pie si pie3 . . . . . . . . . . . . . . . . . . . . 147
3.3 Parametrii distributiilor statistice . . . . . . . . . . . . . . . . . . . 148
3.3.1 Parametri statistici ce masoara tendinta . . . . . . . . . . . 148
3.3.2 Functiile mean, geomean si harmean . . . . . . . . . . 149
3.3.3 Functia trimmean . . . . . . . . . . . . . . . . . . . . . 149
3.3.4 Functia median . . . . . . . . . . . . . . . . . . . . . . . 150
iv
Cuprins
3.3.5
3.3.6
3.3.7
3.3.8
3.3.9
3.3.10
3.3.11
3.3.12
3.3.13
3.3.14
3.4
Teoria selectiei
4.1 Tipuri de selectie . . . . . . . . . . . . .
4.2 Functii de selectie . . . . . . . . . . . . .
4.2.1 Media de selectie . . . . . . . . .
4.2.2 Momente de selectie . . . . . . .
4.2.3 Coeficient de corelatie de selectie
4.2.4 Functie de repartitie de selectie . .
4.2.5 Functia cdfplot . . . . . . . .
.
.
.
.
.
.
.
Teoria estimatiei
5.1 Functie de verosimilitate . . . . . . . . . .
5.2 Functii de estimatie . . . . . . . . . . . . .
5.2.1 Functii de estimatie absolut corecte
5.2.2 Functii de estimatie corecte . . . .
5.2.3 Functii de estimatie eficiente . . . .
5.2.4 Estimatori optimali . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
150
151
155
155
155
156
156
157
157
158
158
163
164
165
179
181
182
183
184
185
186
187
.
.
.
.
.
.
.
197
197
198
199
201
207
216
223
.
.
.
.
.
.
229
229
236
237
239
241
247
Cuprins
5.3
v
Metode pentru estimarea parametrilor . . . . . . . . . . . .
5.3.1 Metoda momentelor . . . . . . . . . . . . . . . . .
5.3.2 Metoda verosimilitatii maxime . . . . . . . . . . . .
5.3.3 Metoda minimului . . . . . . . . . . . . . . . .
5.3.4 Metoda intervalelor de ncredere . . . . . . . . . . .
5.3.5 Metoda intervalelor de ncredere pentru selectii mari
5.3.6 Functii Matlab privind estimatia . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
251
251
252
256
257
275
277
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
285
285
286
290
291
304
307
308
312
318
322
323
325
327
328
332
334
346
349
353
360
362
363
366
Anexa I
369
Anexa II
370
Anexa III
371
Anexa IV
372
vi
Cuprins
Anexa V
376
Bibliografie
377
Index
383
Prefata
Aspecte primare ale statisticii se pierd n negura timpului. Astazi, putem spune, fara
a gresi, ca statistica facem fiecare dintre noi, cu stiinta sau fara. Gandul la ziua de
maine, cum ne organizam si cum folosim timpul si mijloacele materiale de care dispunem, are la baza date (statistice) retinute (culese) si prelucrate n mod simplu sau
mai complex. Ne dam seama, prin urmare, ca statistica are o larga raspandire, de la
utilizarea ei n mod empiric, pana la apelarea la metodele fundamentate matematic.
Statistica faceau chinezii antici, care dispuneau de date relative la populatie,
pamanturi si recolte, dar si egiptenii, care efectuau cadastrari (operatii de determinare a unor proprietat i agricole si imobiliare cu toate caracteristicile lor) si numarari
de populatie. Numararea populatiei era cunoscuta si la evrei, de exemplu, n texte
biblice sunt mentionate numarari de populatie, ca cea efectuata de Moise, privind
barbatii buni de oaste. La grecii antici erau, de asemenea, efectuate numarari de
populatie, ale bunurilor necesare pentru scopuri militare, pentru asezarea impozitelor si evaluarea bogatiilor. Toate acestea au culminat cu recensamintele si anchetele
romane .
Culegerea de date privind resursele umane si materiale aveau la baza o gandire
practica, folosirea acestora n scopuri fiscale, militare sau administrative. Putem
spune ca toate acestea erau utilizate n descrierea statului.
Tratarea stiintifica a datelor relative la descrierea statului se ntalneste n Germania (sec. XVIIXVIII), iar denumirea de statistica apare n cursul lui Martin Schmeitzel (16791757), intitulat Collegium politico-statisticum (Universitatea din Halle). Unii istorici atribuie ntaietate privind aceasta denumire lui Gottfried Achenwall
(1719-1772), care a introdus nvata mantul Staatskunde la Universitatea din Gottingen.
In Anglia, n aceeasi perioada, n afara universitatilor, exista ca disciplina descriptiva a statului ceea ce se numea aritmetica politica. Aritmetica politica se ocupa n
special de cercetarea fenomenelor demografice.
Un moment important n dezvoltarea statisticii l reprezinta cristalizarea calculului probabilitat ilor.
Calculul probabilitat ilor si fundamentarea riguroasa din punct de vedere matemavii
viii
Prefata
Prefata
ix
John Bernoulli n anul . Se remarca n continutul cartii, ceea ce se numeste azi
legea numerelor mari, unul din rezultatele stralucitoare ale teoriei probabilitat ilor.
Un alt rezultat de aceeasi dimensiune, teorema limita centrala, se gaseste n cartea
Doctrine of Chances, aparuta n anul si care este opera lui A. de Moivre (1667
1754), ceea ce, se cunoaste, este strans legata de legea normala de probabilitate.
Descoperirea legii normale de probabilitate este atribuita, de cele mai multe ori,
lui K. F. Gauss (17771855), si care este considerata ca fiind specifica erorilor de
masurare. Trebuie remarcat faptul ca n anul 1808, cu un an nainte de descoperirea
lui Gauss, topograful american Robert Adrain (17751843) publicase o lucrare n
care a sugerat utilizarea legii normale pentru descrierea erorilor de masurare.
Rezultatele lui Moivre, privind teorema limita centrala, sunt extinse de catre P. S. de Laplace (17701820), stabilind de asemenea legatura cu legea normala de probabilitate, n cartea Theorie Analytique des Probabilites (Teoria analitica a probabi
litatilor), aparuta n anul .
Un statistician belgian de seama al sec. XIX, unanim recunoscut pentru rezultatele de pionerat n domeniul statisticii matematice este A. Quetelet (17961874). De
numele lui se leaga notiuni ale statisticii ca: repartitie, medie, dispersie, observare de
masa, regularitate. Pentru el, statistica reprezenta singura metoda ce se poate aplica
fenomenelor de masa.
Un salt remarcabil n dezvoltarea teoria probabilitat ilor a fost facut prin contributia matematicienilor rusi L. P. Cebsev (18211884), A. A. Markov (18561922)
si A. M. Leapunov (18571918). Primul a introdus notiunea de variabila aleatoare,
reformuland si generalizand legea numerelor mari n limbajul variabilelor aleatoare.
Folosind notiunea de variabila aleatoare, A. A. Markov si A. M. Leapunov au obtinut
apoi alte rezultate privind legea numerelor mari si teorema limita centrala.
Pasul decisiv privind fundamentarea moderna a teoriei probabilitat ilor este facut
prin lucrarea matematicianului rus A. N. Kolmogorov (19031989), aparuta n anul
1933. A. N. Kolmogorov, folosind teoria masurii, reuseste sa construiasca modelul
axiomatic al teoriei probabilitat ilor.
Se remarca de asemenea preocupari si rezultate importante obtinute de alti ma Borel (18711956), S. N. Bernstein
tematicieni ca: S. D. Poisson (17811840), E.
(18801968), R. von Mises (18831953), A. I. Hincin (18941959).
Sfarsitul sec. XIX si nceputul sec. XX se considera a fi nceputul statisticii moderne. Este momentul cand se trece de la etapa descriptiva, la interpretarea analitica a
fenomenelor de masa si obtinerea de concluzii inductive pe baza observatiilor empirice. Statisticieni de renume, care au pus bazele statisticii matematice sunt considerati
a fi englezii F. Galton (18221911) si K. Pearson (18571936). Opera acestora este
continuata de celebrul statistician R. A. Fisher (18901962). Dintre reprezentantii
scolii engleze de statistica amintim pe G. U. Yule (18711951), W. S. Gosset (1876
Prefata
Capitolul 1
Introducere n Matlab
MATLAB (MATrix LABoratory) este un sistem interactiv de nivel si performanta
nalte pentru efectuarea de calcule stiintifice si tehnice, precum si de analiza si vizualizare a datelor si care dispune de un limbaj propriu de programare.
Prima versiune a fost realizata n anii de catre Cleve Moler, iar versiunea
utilizata n cele ce urmeaza este Matlab 6.0.
Se pare ca acest produs are o larga raspandire din mai multe motive:
interactivitatea sistemului;
elementele de baza sunt matricele, dupa cum spune si denumirea, ale caror
tipuri si dimensiuni nu se declara;
grafica puternica si foarte usor de utilizat;
posibilitatea integrarii unor proceduri proprii n limbaje de programare cum ar
fi Fortran, C;
arhitectura modulara, care permite adaugarea unor proceduri si functii proprii,
ceea ce a permis deja elaborarea unor pachete de proceduri si functii, numite
toolboxuri, orientate pe anumite domenii, cum ar fi
Statistica Statistics Toolbox;
Functii spline Spline Toolbox;
Analiza wavelet Wavelet Toolbox;
Procesarea semnalelor Signal Processing Toolbox;
Procesarea imaginilor Image Processing Toolbox;
Modelare, simulare si analiza sistemelor dinamice Simulink;
1
Introducere n Matlab
Calcul simbolic Symbolic/Extended Symbolic Math Toolbox;
Ecuatii cu derivate partiale PDE Toolbox;
Optimizare Optimization Toolbox.
Sistemul Matlab devine n acest fel interactiv, adica la fiecare comanda sau functie
tastata si acceptata de Matlab (editarea comenzii sau functiei ncheinduse prin
Enter), sistemul o executa si afiseaza pe ecran rezultatul, daca este cazul.
Exista posibilitatea de trecere de la modul interactiv la cel programat, prin tastarea numelui unui fisier (cu extensia m), care contine un program n sistemul Matlab
(succesiune de instructiuni Matlab) si care mod se ncheie odata cu terminarea executarii programului respectiv, dupa care se revenie la modul interactiv.
Incheierea unei sesiuni Matlab se poate face, fie prin comenzi specifice sistemului
de operare Windows, fie prin tastarea uneia din comenzile
>>quit
>>exit
>>help topic
are ca efect afisarea pe ecran a unei liste ce cuprinde domeniile care opereaza n
versiunea curenta Matlab
HELP topics:
matlab\general
matlab\ops
matlab\lang
matlab\elmat
matlab\elfun
matlab\specfun
matlab\matfun
matlab\datafun
matlab\audio
matlab\polyfun
matlab\funfun
matlab\sparfun
matlab\graph2d
matlab\graph3d
matlab\specgraph
matlab\graphics
matlab\uitools
matlab\strfun
matlab\iofun
matlab\timefun
matlab\datatypes
matlab\verctrl
matlab\winfun
matlab\demos
toolbox\local
toolbox\stats
va lista prima linie de comentariu din fiecare fisier cu extensia .m, care contine
cuvantul cheie key, precedata de numele fisierului.
Introducere n Matlab
tastarea comenzii helpwin urmata de un domeniu (topic) n care suntem
interesati, adica
>>helpwin topic
produce deschiderea unei ferestre prin care se permite cautarea n baza helpului
Matlab.
1.2.1 Constante
Introducerea constantelor se poate face:
de la tastatura;
prin generarea cu ajutorul unor instructiuni Matlab;
dintrun fisier creat cu ajutorul unui editor.
La intrare constantele numerice pot fi de tipul:
ntreg: 2002, -2002;
real: 3.14159, 0.314e1, -.314e+01, 31.4e-1, 31.4e-01;
complex: a+bi, unde a si b sunt
doua constante ntregi sau reale, iar i reprezinta unitatea imaginara (i
).
unde tip poate lua una din valorile short, long, short e, long e, short g,
long g, hex, +, bank, rat, loose, compact.
Formatele short si long afiseaza pe ecran datele numerice n virgula fixa,
respectiv cu 5 cifre zecimale si 15 cifre zecimale (precedate de semnul minus, daca
sunt negative).
Formatele short e si long e afiseaza pe ecran datele numerice n virgula flotanta, respectiv cu 5 cifre zecimale si 15 cifre zecimale (precedate de semnul minus,
daca sunt negative).
Formatele short g si long g afiseaza pe ecran datele numerice cu cea mai
potrivita reprezentare, virgula fixa sau virgula flotanta, respectiv cu 5 cifre zecimale
si 15 cifre zecimale (precedate de semnul minus, daca sunt negative).
Formatele rat, bank, hex si + afiseaza pe ecran respectiv datele numerice sub
forma de fractie ordinara, sub forma bancara (cu doua zecimale), sub forma hexazecimala, iar n ultimul caz, prin + daca numarul este pozitiv, respectiv -, daca numarul
este negativ si spat
iu daca este zero.
Formatele loose si compact permite afisare datelor la doua randuri (format
implicit), respectiv la un rand n cazul al doilea.
Pentru a afla la un moment dat, care format este n functie se poate apela la
comanda
>>get(0,Format)
Introducere n Matlab
;
realmax cel mai mare numar real pozitiv reprezentat pe dublu cuvant
(1.7977e+308);
realmin cel mai mic numar real pozitiv reprezentat pe dublu cuvant
(2.2251e-308);
pi =3.14159... (valoarea reprezentata pe dublu cuvant);
eps epsilonul masinii (eps=2.2204e-16=254 );
date data curenta;
clock timpul curent;
calendar calendarul lunii curente;
i, j unitatea imaginara (i,j=
);
zeros(n) si zeros(m,n) genereaza matricea patratica de ordin n, respectiv matricea cu m linii si n coloane, avand toate elementele nule;
ones(n) si ones(m,n) genereaza matricea patratica de ordin n, respectiv
matricea cu m linii si n coloane, avand toate elementele 1;
eye(n) si eye(m,n) genereaza matricea patratica de ordin n, respectiv
matricea cu m linii si n coloane, avand pe diagonala principala 1 si 0 n rest
(cand matricea este patratica avem matricea unitate);
magic(n) genereaza matrice magica patratica de ordin n.
Pentru introducerea elementelor unei matrice, linie cu linie, elemente ce pot fi exprimate si prin expresii aritmetice, acestea sunt incluse ntre paranteze drepte. Elementele fiecarei linii sunt separate prin spatiu sau virgula, iar liniile sunt separate prin
punctvirgula (;) sau prin trecerea la randul urmator.
Astfel matricea
se poate introduce de la tastatura prin
>>[3 5 2;9 1 4]
sau
>>[3,5,2;9,1,4]
Daca elementele matricei prezinta regularitatea, ca elementele unei linii sunt date
printro progresie aritmetica, atunci avem o introducere prescurtata. De exemplu,
introducerea matricei
se poate face de la tastatura prin
>>[3:2:9;9:-3:0]
1.2.4 Variabile
Variabilele sunt matrice ce sunt utilizate ntrun program Matlab sau n mod interactiv si ale caror valori pot fi modificate. Numele lor fiind precizate prin identificatori,
care sunt dati de orice combinatie de litere, cifre zecimale si liniuta de subliniere, din
care primul caracter este litera: Matrice1, mat, Cluj Napoca.
Apelarea si vizualizarea unui element al unei variabile (matrice) se face prin specificarea numelui variabilei urmat de lista indicilor corespunzatori, separati prin virgula, nchisa ntre paranteze. De exemplu, A(i,j ) pune n evidenta elementul din
linia i si coloana j al matricei A.
Facem observatia ca matricele n sistemul Matlab nu accepta decat indici strict
pozitivi.
Utilizand operatorul doua puncte (:) se pot obtine submatrice ale unei matrice.
De exemplu, A(1:3,4:5) extrage submatricea formata din primele trei linii si coloanele 4 si 5 ale matricei A, iar A(:,4) si A(1,:) extrag respectiv coloana a patra
a matricei A si prima linie a matricei A. O forma mai generala de obtinere a unei
submatrice se realizeaza prin apelul de forma A([l],[c]), unde l si c reprezinta
liste de indici de linie si indici de coloane, separati prin virgula sau spatiu. Astfel va fi
obtinuta submatricea formata din liniile si coloanele precizate prin l, respectiv c ale
matricei A. Daca se introduce comanda A(:), atunci matricea A este transformata
ntrun vector coloana, ce contine coloanele matricei.
Alte combinatii ale acestor tipuri de specificare ale elementelor unei matrice pot
fi considerate.
Mai remarcam aici comanda
>>reshape(A,m,n)
Introducere n Matlab
A
B, A B, A B, A /B, sau formele echivalente, respectiv times(A,B),
power(A,B), ldivide(A,B), rdivide(A,B) efectueaza operatiile
de nmultire, de ridicare la putere, mpartire inversa, mpartire directa, toate de
tipul element cu element (ca la operatiile de adunare si scadere), pentru matricele de aceleasi dimensiuni, iar daca una dintre matrice e un scalar, aceasta este
extinsa la matricea constanta data prin scalarul respectiv, avand dimensiunile
celeilalte matrice, dupa care este efectuata operatia;
), fix
10
Introducere n Matlab
atan2(A,B) (are acelasi efect cu atan(A. B)), rem(A,B) (restul mpartirii lui A la B).
Daca A si B sunt matrice, atunci trebuie sa fie de aceeasi dimensiune, iar functia se
aplica element cu element.
size(A) (dimensiunea matricei A), length(A) (lungimea vectorului A),
ndims(A) (numarul dimensiunilor matricei A), disp(A) (afiseaza elementele matricei A fara numele matricei), det(A) (determinantul matricei
patratice A), inv(A) (inversa matricei patratice A), rank(A) (rangul matricei A), A sau transpose(A) (transpusa matricei A, daca matricea este cu
elemente numere reale, daca are elemente numere complexe, atunci se efectueaza matricea transpusa a conjugatelor elementelor), A (transpusa matricei
A), diag(A) (diagonala matricei patratice A, iar daca A este vector, genereaza matricea patratica diagonala cu elementele diagonalei date de vector),
trace(A) (urma matricei patratice A, adica ).
11
vor salva n fsierul file.mat toate variabilele din sesiune curenta, respectiv numai
variabilele x, y, z.
Diferenta dintre comanda diary si comanda save este ca fisierul obtinut prin
diary se poate modifica (edita) cu ajutorul unui editor, pe cand celalalt nu se poate
edita.
De asemenea, remarcam faptul ca n fisierul creat prin comanda diary contine
toate informatiile pana la ntalnirea comenzii
>>diary off
Daca nainte de nchiderea unei sesiuni Matlab nu se executa o comanda save, atunci
toate variabilele mpreuna cu continutul lor se pierd.
Intro alta sesiune Matlab, se pot recupera variabilele din sesiunea precedenta,
daca au fost salvate prin comanda save, prin lansarea comenzii load. Anume, daca
fisierul salvat este file.mat atunci comanda
>>load file
va avea ca efect pentru sesiunea curenta a generarii unei variabile cu numele A si care
contine ca valori datele din fisierul A.dat.
12
Introducere n Matlab
unde vi, pas, vf sunt expresii aritmetice, care pot fi evaluate la momentul executarii instructiunii. In urma executarii acestor instructiuni variabila ans respectiv x
va contine valorile numerice ncepand cu vi pana la vf cu pasul pas.
Daca valoarea lui vf este mai mica decat cea a lui vi si pas are valaore negativa,
atunci rezultatul instructiunii de atribuire este matricea vida, avand sintaxa [].
Daca pas=1, atunci se pot considera formele echivalente
>>vi:vf
>>x = vi:vf
Un alt tip specific de instructiune de atribuire a sistemului Matlab este acela cand
variabila primeste valoarea unei submatrice. De exemplu, instructiunile de atribuire
>>x = A(:,2)
>>y = A(end,1:10)
13
Prin executarea acestei instructiuni se afiseaza pe ecran sirul de caractere dat prin s,
asteptanduse tastarea datelor ce se doresc a fi atribuite pentru variabila v. Cand
se ncheie operatiunea de tastarea datelor, se tasteaza Enter, drept consecinta se
efectueaza operatia de atribuire.
14
Introducere n Matlab
15
In urma lansarii executiei acestui program, fara a putea interveni pana la ncheierea
executiei, se produc urmatoarele operatii:
executa instructiunea din prima linie, prin afisarea pe ecran a mesajului
m (nr. natural > 0):
si se asteapa tastarea unui numar ntreg pozitiv, dupa care prin comanda Enter
se trece la instructiunea din linia urmatoare;
instructiunea din linia a doua va genera matricea magica patratica A de ordin
m, care nu va fi afisata pe ecran deoarece instructiunea se termina cu simbolul
punctvirgula;
se executa functia ndim, iar rezultatul este atribuit variabilei d, care va avea
valoarea 2 si va fi afisat pe ecran, deoarece instructiunea nu se termina cu
punctvirgula, pe doua randuri
d =
2
16
Introducere n Matlab
urmatoarea instructiune atribuie variabilelor l si c numarul liniilor si coloanelor matricei A, care n cazul de fata coincid cu valoarea lui m, iar valorile lui l
si c vor fi afisate pe ecran;
B va fi un vector coloana cu m componente si contine produsul dintre matricea
A si vectorul coloana de m componente, toate avand valoarea 1, iar daca avem
n vedere ca A este o matrice magica, toate componentele lui B vor fi egale;
ultima instructiune ajuta la afisarea pe ecran a componentelor vectorului linie
C, care este vectorul transpus al vectorului coloana B.
Editarea unui fisier script se poate face cu orice editor de text, dar sistemul Matlab
dispune de un editor propriu.
Editorul Matlab se poate lansa din fereastra de lucru Matlab prin comenzi specifice sistemului Windows, alegand din meniul File optiunea New sau Open, daca
se doreste crearea uni nou fisier, respectiv se doreste editare unui fisier deja existent.
Acelasi rezultat se obtine prin comanda
edit file.m
n care file.m este optional. Daca lipseste acest argument atunci urmeaza crearea
(editarea) unui fisier nou, iar daca acest argument este prezent, fisierul cu acest nume
urmeaza sa fie reactualizat (editat).
Editorul sistemului Matlab poate fi lansat din orice alta parte prin activarea unui
fisier cu extensia .m.
Editorul Matlab are capacitatea de a efectua unele verificari sintactice, de exemplu corespondent a paranteza deschisa paranteza nchisa, dar este prevazut si cu un
set de comenzi (debuger) pentru depanarea programului prin evaluarea si modificarea
unor variabile si expresii, crearea si stergerea unor puncte de ntrerupere etc.
Comenzile specifice sistemului de depanare Matlab sunt:
dbstop crearea unui punct de ntrerupere (breakpoint);
dbclear stergerea unui punct de ntrerupere;
dbstatus listeaza punctele de ntrerupere;
dbstack listeaza stiva apelurilor;
dbcont reluarea executiei programului;
dbstep executia uneia sau mai multe instructiuni;
dbtype genereaza lista fisierelor cu extensia .m, mpreuna cu numarul liniilor acestora;
17
dbup schimba spatiul de lucru curent, cu cel al unui fisier cu extensia .m,
care a fost apelat;
dbdown efectueaza operatia inversa comenzii dbup;
dbmex execua depanarea unui fisier cu extensia .mex (creat cu unul din
limbajele Fortran si C);
dbquit ncheierea depanarii.
18
Introducere n Matlab
In urma executiei programului, pentru m=10, se obtine graficul din Figura 1.1.
100
90
80
70
60
50
40
30
20
10
10
In urma executiei programului, pentru m=10 si n=2, se obtine graficul din Figura 1.2.
Daca y este de tip complex, atunci prima forma este echivalenta cu a doua forma
a instructiunii plot, adica cu
plot(real(y),imag(y))
19
100
90
80
70
60
50
40
30
20
10
10
In urma executiei programului, pentru m=100, se obtine graficul din Figura 1.3.
Remarcam faptul ca pentru toate celelalte forme, daca avem parametri complecsi,
partea imaginara este ignorata.
Daca se utilizeaza a doua forma, iar x si y sunt vectori de aceasi lungime m, atunci
se reprezinta grafic linia poligonala ce trece prin punctele de coordonate
,
m.
Programul
1.7.4. Fie programul care reprezinta grafic functia pe intervalul
:
m = input(m:);
h = 1/m; x = 0:h:1;
plot(x,sin(2*pi*x))
20
Introducere n Matlab
2
4
2
1.5
0.5
Figura 1.3:
0.5
1.5
0.4
0.6
0.8
0.6
0.4
0.2
0.2
0.4
0.6
0.8
0.1
0.2
0.3
Figura 1.4:
0.5
0.7
0.8
0.9
21
respectiv
m = input(m:);
h = 1/m; x = 0:h:1;
y = 2*pi*x;
y = [sin(y) cos(y)]; x=[x x];
plot(x,y)
Executand una din cele doua variante, cu m=200, se genereaza graficul din Figura 1.5.
Remarcam faptul ca prima varianta ar fi potrivita daca cele doua functii se reprezinta grafic pe acelasi domeniu, iar a doua varianta cand cele doua functii sunt
reprezentate grafic pe domenii diferite.
1
0.8
0.6
0.4
0.2
0.2
0.4
0.6
0.8
0.1
0.2
0.3
Figura 1.5:
0.4
0.5
0.6
,
0.7
0.8
0.9
22
Introducere n Matlab
23
0.8
0.6
0.4
0.2
0.2
0.4
0.6
0.8
0.1
0.2
0.3
Figura 1.6:
0.4
0.5
0.6
si
0.7
0.8
0.9
hold trece la modul off, daca sistemul se afla n modul on, respectiv la
modul on, cand sistemul se afla n modul off;
clf sterge graficul curent;
cla sterge graficul curent, pastrand axele;
figure(n) activeaza fereastra cu graficul n anterior obtinut;
axis([xmin xmax ymin ymax]) fixeaza limitele pentru axele absciselor si ordonatelor pentru figura curenta;
v = axis ntoarce un vector linie ce contine cele patru limite pentru axele
de coordonate, care pot fi si -Inf, Inf;
axis auto considera forma implicita a limitelor axelor de coordonate;
axis manual pastreaza limitele curente, astfel daca este utilizata instructiunea hold, figurile urmatoare vor avea aceleasi limite pentru axele de coordonate;
axis tight atribuie pentru limitele axelor cele mai apropiate valori ce
rezulta din datele ce se reprezinta grafic;
axis ij configureaza axele n modul matrix, adica originea axelor de
coordonate este coltul din stanga sus, axa i fiind verticala si marcata de sus n
jos, iar axa j este orizontala si este marcata de la stanga la dreapta;
24
Introducere n Matlab
axis xy configureaza axele n modul cartezian, mod implicit;
axis equal unitatile de masura pe cele doua axe au aceeasi marime;
axis image la fel cu axis equal, cu exceptia ca figura este restransa
la domeniul datelor;
axis square pune unitatile de masura pe cele doua axe de coordoante
astfel ncat figura sa fie prezentata ntrun patrat;
axis normal rearanjeaza axele n forma implicita;
axis off elimina axele de coordoante;
axis on insereaza axele de coordoante;
title(text) afiseaza textul specificat n partea de sus a graficului;
legend(str1,str2,...) afiseaza legenda prin care se efectueaza corespondenta dintre fiecare tip de curba a graficului si textele specificate
prin str1, str2 etc.;
legend(str1,str2,...,p) afiseaza legenda de tipul precizat
n pozitiile respectiv nafara axelor (p=-1), n interiorul axelor, dar pe cat e
posibil sa nu acopere figurile trasate (p=0), n partea dreapta sus (p=1), care
este pozitia implicita, n partea stanga sus (p=2), n partea stanga jos (p=3), n
partea dreapta jos (p=4);
legend off elimina legenda;
xlabel(text) eticheteaza axa abscielor cu textul precizat;
ylabel(text) eticheteaza axa ordonatelor cu textul precizat;
text(x,y,text) insereaza textul precizat prin text, n punctul de
coordonate (x,y), iar daca x si y sunt vectori (de aceeasi lungime), atunci
insereaza textul respectiv n toate punctele de coordoante
,
,
pe cand daca textul este dat printr-o matrice cu acelasi numar de linii cu cel al
lungimilor vectorilor x si y, atunci textul din linia i este inserat n punctul de
coordonate
,
gtext(text) afiseaza graficul, mpreuna cu cursorul plus, unde urmeaza sa fie inserat textul, cursorul putand fi pozitionat cu ajutorul mouse-ului sau
tastele cu sageti, dupa care prin apasarea oricarei taste (mouse sau keyboard),
se obtine inserarea textului;
25
si are ca efect reprezentarea grafica a functiei n coordonate polare, data prin expresia algebrica f, pe intervalul [a,b]. Al doilea parametru este optional. Valoarea
implicita este [0,2 ].
De exemplu, comanda
ezpolar(1+cos(theta))
va produce graficul din Figura 1.8. Mai remarcam faptul ca parametrul f poate fi
numele unei functii Matlab predefinite sau a utilizatorului.
26
Introducere n Matlab
0.8
0.6
0.4
0.2
0.2
0.4
0.6
0.8
Figura 1.7:
90
120
60
1.5
150
30
0.5
180
330
210
300
240
270
r = 1+cos()
Figura 1.8:
27
60
0.8
0.6
150
30
0.4
0.2
180
330
210
300
240
270
Figura 1.9:
e
Instructiunea colormap
Sistemul Matlab dispune de un set de gestiune a culorilor n reprezentarile grafice.
Intructiunea colormap permite definirea unui set propriu pentru gestiunea culorilor.
Lansarea unei instructiunii se face prin comanda
colormap(map)
colormap(default)
28
Introducere n Matlab
colormap spring
genereaza nuante de culori ntre rosu, trecand prin portocaliu spre galben;
colormap winter
29
Programul 1.7.9. Fie functia lui Haar, numita n analiza wavelet functie wavelet
mama
daca
Folosind functia
daca
n rest
daca
daca
n rest
j = input(j=);
r = input(r=);
s = input(s (>r)=);
rs = 2*s-2*r+3;
fprintf(rs=2s-2r+3=%2d\n,rs);
y = input(rs valori alternative [1, -1 ... 1]:);
y = 2(j/2)*y;
x = 1/2j*[r:1/2:s+1];
stairs(x,y)
Executia programului, pentru j=1, s=1, r=-2, produce graficul din Figura 1.10.
Singurul inconvenient la executia acestui program este legat de instructiunea
input prin care se initializeaza vectorul y. Cand numarul functiilor prin care
se defineste functia este mare, atunci rs este mare si introducerea listei lui y este
anevoioasa.
30
Introducere n Matlab
1.5
0.5
0.5
1.5
1
0.8
0.6
0.4
Figura 1.10:
0.2
0.2
0.4
0.6
0.8
31
Executia programului, pentru j=0, produce graficele din Figura 1.11. Se observa
Figura 1.11:
,
ca programul mai elimina axele sistemului Matlab, dar adauga axa absciselor trasata
punctat.
argumentele w, tip si color sunt optionale, dar cand sunt specificate, trebuie
sa pastreze aceasta ordine.
Parametrul x este un vector de lungime m.
Daca y este un vector de aceeasi lungime ca si x, atunci vor fi reprezentate grafic
n fiecare din punctele de abscise x ,
m, cate o bara de naltimile date prin y ,
32
Introducere n Matlab
Pentru r=2, graficul din partea stanga a Figurii 1.12, se obtine cand nu sa impus ca
unitatile de masura pe cele doua axe de coordoanate sa fie aceleasi, iar graficul din
partea dreapta sa obtinut dupa ce sa nlaturat acest neajuns cu instructiunea axis
square.
33
1.5
1.5
1
0.5
0.5
0
0
0.5
0.5
1
1.5
2
2
1.5
2
2
Figura 1.12:
,
,
,
34
Introducere n Matlab
Primele doua coloane grupate
20
20
15
15
10
10
10
15
10
15
20
In toate cazurile se reprezinta grafic functia numef, cu limitele pentru axa absciselor specificate prin lim=[xmin xmax] sau lim=[xmin xmax ymin ymax].
Tipul liniei folosit n reprezentarea grafica este specificat prin parametrul s, ca si
n cazul instructiunii plot, iar eroarea relativa folosita n reprezentarea grafica este
precizata prin parametrul tol, care are valoarea implicita tol=2e-3. Parametrul n
specifica faptul ca graficul se traseaza cu ajutorul a n+1 puncte, valoarea implicita a
xmin
lui n este n=1, iar valoarea maxima a pasului nu depaseste xmax
n
Remarcam faptul ca parametrii optionali s, tol si n pot fi luati n orice ordine.
Functia numef poate sa ntoarca, pentru un vector x, un vector y de aceeasi
lungime ca si x sau o matrice cu mai multe coloane si numar de linii ca si lungimea
lui x. In primul caz, se va reprezenta grafic o singura curba, iar n al doilea caz, pentru
fiecare coloana a matricei y cate o curba. Parametrul numef poate fi nlocuit si cu un
sir de caractere de tipul [f(x),g(x),...], unde f, g,... sunt nume de functii
Matlab, caz n care, pe aceeasi figura, se vor reprezenta grafic functiile respective.
De exemplu, instructiunea
fplot([sin(2*pi*x), cos(2*pi*x)],[0 1])
i
figur
a
,
funct
iile
.
35
produce graficul din Figura 1.14. Mai remarcam faptul ca parametrii f, x si y, pot fi
numele unor functii Matlab predefinite sau ale utilizatorului.
36
Introducere n Matlab
x = sin(3 t) cos(t), y = sin(3 t) sin(t)
0.4
0.2
0.2
0.4
0.6
0.8
0.8
Figura 1.14:
0.6
0.4
0.2
0
x
0.2
,
0.4
0.6
0.8
,
e
a = input{a=}; b = input(b=);
xmin = -3; xmax = 3;
fplot{1/sqrt(2*pi)*exp(-x2/2),[xmin xmax]}
x = a; y = 0;
t = a:0.01:b;
x = [x,t]; y = [y,1/sqrt(2*pi)*exp(-t.2/2)];
x = [x,b]; y = [y,0];
fill(x,y,c)
37
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
3
1.8.1 Instructiunea if
Trei forme de baza ale instructiunii if sunt:
if exp
secv
end
%%%%%%%%%%%%%%
if exp
secv
else
secv1
end
%%%%%%%%%%%%%%
if exp
secv
elseif exp1
secv1
else
secv2
end
unde exp si exp1 sunt expresii logice ce pot fi evaluate n acest punct, iar secv,
secv1 si secv2 sunt secvente de instructiuni Matlab.
Instructiunea if sub prima forma face sa se execute secventa de instructiuni
secv numai daca valoarea expresiei logice exp este adevarata, dupa care se trece la
prima instructiune ce urmeaza liniei end.
38
Introducere n Matlab
Rezultatul executiei acestei secvente atribuie lui p una din valorile 0, 1, 2, n functie
de faptul ca vectorul v are toate componentele numere pare, toate impare, respectiv
si pare si impare.
unde exp este o expresie aritmetica sau de tip caracter, iar secv1, secv2, . . . ,
secv sunt secvente de instructiuni Matlab. Daca valoarea expresiei exp coincide cu
cu una din valorile val1, val2, . . . atunci se executa secventa de instructiuni corespunzatoare secv1, secv2, . . . , iar n caz contrar se executa secventa de instructiuni
secv.
De exemplu, secventa de instructiuni
39
m=input(m=);
switch expr
case ones
A=ones(m)
case eye
A=eye(m)
case magic
A=magic(m)
otherwise
A=zeros(m)
end
si are ca efect executarea secventei de instructiuni secv atata timp cat valoarea expresiei logice exp este adevarata.
De exemplu, daca vrem sa calculam valoarea aproximativa a solutiei ecuatiei
, folosind metoda iterativa, impunand conditia de oprire prin aceea ca
numarul iteratiilor sa nu depaseasca o valoare data n si distanta dintre doua iterate
consecutive sa nu fie mai mare decat un epsilon 0 dat, atunci avem programul
n=input(n=);
epsilon=input(epsilon=);
xv=pi/4; k=1; d=1;
while d>epsilon & k<n
k=k+1; xn=cos(xv);
d=abs(xn-xv); xv=xn;
end
fprintf(k=%2d\n,k)
fprintf(d=%10.4f\n,d)
fprintf(x=%10.4f\n,xn)
0.0000
0.7391
40
Introducere n Matlab
unde v este variabila de ciclare, care ia toate valorile, ncepand cu valoarea expresiei
aritmetice vi pana la valoarea expresiei vf, folosind pasul dat prin expresia aritmetica pas. Pentru fiecare din aceste valori ale lui v se executa succesiv secventa secv
de instructiuni Matlab.
Daca pas=1, atunci putem folosi urmatoarea forma a instructii for:
for v=vi:vf
secv
end
Mai remarcam faptul ca n interiorul unui ciclu for poate exista un alt ciclu for
s.a.m.d.
De exemplu, secventa urmatoare va genera matricea h de tipul (m,n), numita
matricea lui Hilbert:
m=input(m=);
n=input(n=);
h=[];
for i=1:m
for j=1:n
h(i,j)=1/(i+j-1);
end
end
format rat
disp(h)
1/2
1/3
1/4
1/3
1/4
1/5
1/4
1/5
1/6
41
Se observa ca matricea V a fost intializata cu matricea vida, care este specificata prin
[], iar constructia efectiva sa facut prin operat
ia
de concatenare.
,
, se obtine
Executand programul pentru m=4 si a
m=4
a(i)=1
a(i)=2
a(i)=3
a(i)=4
1
1
1
1
1
2
4
8
1
3
9
27
1
4
16
64
si are ca efect executia primei secvente de instructiuni, secv, pana la aparitia unei
erori, dupa care se executa a doua secventa de instructiuni, secv1. Daca nici o
42
Introducere n Matlab
43
Daca instructiunea break se afla ntro instructiune de tipul if, switch sau
try...catch, atunci se abandoneaza executia acestei instructiuni, iar daca este
pozitionata n oricare alta parte, se ncheie executarea programului.
44
Introducere n Matlab
care are ca efect obtinerea caracterului global pentru variabilele din lista.
In corpul unei functii Matlab variabilele nargin si nargout specifica numarul
parametrilor de intrare, adica lungimea listei lista2, respectiv a parametrilor de
iesire, adica lungimea listei lista1.
Daca ntrun fisier script sau de la tastatura se da una din comenzile
nargin(numef)
nargout(numef)
Din acest motiv, partea de comentariu de la nceputul procedurii este bine sa contina
informatii, care sa descrie pe scurt cum trebuie sa fie apelata si folosita functia respectiva.
Mai remarcam prima linie de comentariu, notata cu H1, care are o nsusire aparte.
Cand se lanseaza comanda
lookfor key
care cauta cuvantul cheie key, aceasta se face numai n liniile H1 ale fisierelor cu
extensia .m, dupa care se listeaza numele fisierelor ce contin cuvantul cheie precizat.
In cadrul liniilor ce alcatuiesc corpul functiei pot exista de asemenea linii de
comentariu, care ncep cu simbolul %, dar care nu vor fi afisate odata cu lansarea
comenzii help. Mai mult aparitia simbolului % n interiorul unei linii face ca tot ce
urmeaza pe linia respectiva sa fie considerat comentariu.
45
Numele unei functii Matlab, numef, scrisa de utilizator, este de dorit sa fie diferit de numele functiilor deja existente n sistemul Matlab, iar numele fisierului, cu
extensia .m, ce va contine functia sa fie numef.m.
Daca lista parametrilor de intrare, lista2, este vida, atunci linia de definitie a
functiei este de forma
function [lista1] = numef
Daca lista variabilelor de iesire, lista1, este formata dintro singura variabila,
atunci se poate renunta la parantezele drepte, iar daca este vida se poate elimina
complet.
Cu aceste precizari, cea mai simpla linie de defintie a unei functii (proceduri) este
function numef
unde apel2 este lista parametrilor actuali, care poate fi vida sau formata din cel
mult atatea elemente cat are lista parametrilor formali, lista2, din linia de definitie
a functiei numef, de fiecare data facanduse legatura de tipul: primul parametru din
apel2 corespunde primului parametru din lista2, al doilea element din apel2
corespunde celui de al doilea parametru din lista2,..., corespondenta ncheindu
se cand se termina lista apel2. Desigur, daca apel2 are mai putine elemente decat
lista2, atunci trebuie gestionata aceasta situatie n corpul functiei numef cu ajutorul varaibilei nargin.
Rezultatele executarii functiei numef, se pastreaza n lista apel1 n primul caz,
respectiv n ans n al doilea caz. O discutie analoga asupra corespondentei dintre
apel2 si lista2, se face si n cazul apel1 si lista1.
O alta cale de apel a unei functii este dintrun alt program sau procedura Matlab, prin aparitia ntro instructiune Matlab a numelui functiei, mpreuna cu lista
parametrilor actuali de tipul listei apel2, mai sus precizata.
1.10.3 Subfunctii
Functiile pot avea n corpul lor apeluri la alte functii. Totdeauna ntoarcerea n unitatea care cheama se face, cand se ajunge la linia finala a corpului unitatii chemate
sau cand se ntalneste instructiunea return.
Exista doua situatii mai speciale n constructia functiilor n Matlab.
46
Introducere n Matlab
In primul rand, exista posibilitatea ca dupa corpul unei functii sa fie definite
una sau mai multe functii, pe care le numim subfunctii si care pot fi apelate din
corpul functiei. Forma unei astfel de functii ar fi:
function [lista1] = numef(lista2)
%
% comentariu
%
corp
function [list1] = numef1(list2)
%
% comentariu1
%
corp1
47
0.5
0.5
0.5
0.5
1
1
0.5
0.5
1
1
0.5
0.5
0.5
0.5
0.5
0.5
0.5
1
1
0.5
1
1
0.5
0.5
sau
opmatrix(+,A,B)
opmatrix(-,A,B)
opmatrix(&,A,B)
48
Introducere n Matlab
au respectiv urmatoarele efecte: prima are ca efect afisarea pe ecran a fisierului n derulare, a doua anuleaza acest efect, iar a treia are efectul primei forme, daca sistemul
se afla n mod off, iar daca se afla n mod off se va face trecerea la modul on.
Daca suntem n cazul functiilor Matlab cu extensia .m, atunci avem formele
echo
echo
echo
echo
echo
numef on
numef off
numef
on all
off all
Primele trei forme sunt analoge celor trei din cazul script, numai ca se mai specifica si
numele functiei la care se refera. Celelalte doua actioneaza asupra tuturor functiilor.
49
unde tic marcheaza nceputul contorizarii timpului, iar toc anunta ncheierea contorizarii, variabila toc continand timpul masurat n secunde.
m
n, cu aceeasi
de punctele de coordonate x y z pentru fiecare
observatie privind parametrul s, care precizeaza tipul curbei. In acest caz pe aceeasi
figura vor fi obtinute mai multe grafice.
Ultimele doua forme sunt extinderi ale primelor doua, pentru a putea controla
mai bine n special tipul curbelor cu ajutorul parametrilor de tip s.
Remarcam de asemenea extinderea actiunilor comenzilor ce controleaza un grafic
din cazul bidimensional pentru cazul tridimensional.
Programul 1.12.1. Prezentam un program care ilustreaza miscarea unei particule din
punctul A pe o spirala pana n punctul B.
50
Introducere n Matlab
pas=input(pas=); h=input(h=);
t=0:pas:h; r=exp(-0.2*t); th=pi*t*0.5;
x=r.*cos(th); y=r.*sin(th); z=t;
plot3(x,y,z), hold on
plot3([1,1],[-0.5,0],[0,0])
text(1,-0.7,0,A), n=length(t);
text(x(n),y(n),h+2,B)
xlabel(x), ylabel(x), zlabel(z)
doar ca spirala va fi trasata cu o anumita culoare, iar segmentul din planul xoy cu
alta. Daca vrem ca ntreaga curba sa fie trasata cu aceeasi culoare se poate apela la
parametrul de tip s.
Se mai observa ca pozitia initiala A a punctului si pozitia finala B sunt afisate
cu instructiunile text, iar etichetele celor trei axe de coordoante sunt date prin
instructiunile de tip label.
Dupa executarea programului, cu h=20 si pas=0.01, sa obtinut graficul din
Figura 1.17.
20
15
10
0
1
A
1
0.5
0.5
0
0
0.5
y
0.5
1
51
35
30
25
20
15
10
5
0
1
1
0.5
0.5
0
0
0.5
0.5
1
Figura 1.18:
,
,
,
, pe domeniul
52
Introducere n Matlab
de pe axele ox si oy si care sunt folosite la generarea retelei rectangulare x y
m, n.
Rezultatul executarii instructiunii meshgrid, are ca efect generarea matricelor
X si Y avand acelasi tip (n,m). Fiecare linie a matricei X este formata din componentele vectorului x, iar fiecare coloana a matricei Y esteformata din componentele
vectorului y. In acest fel punctul de coordonate x y al retelei rectangulare, se
poate exprima, cu ajutorul matricelor X si Y, prin perechea (X(j,i),Y(j,i)).
Inainte de a trece la a doua etapa, sa facem observatia ca daca x coincide cu y,
atunci se poate utiliza
[X,Y]=meshgrid(x)
mesh(Z)
mesh(Z,C)
mesh(x,y,Z)
mesh(x,y,Z,C)
mesh(X,Y,Z)
mesh(X,Y,Z,C)
53
surf(x,y,Z)
surf(x,y,Z,C)
surf(X,Y,Z)
surf(X,Y,Z,C)
e
, n doua figuri alaturate, odata cu instructiunea
pe domeniul
mesh si apoi cu instructiunea surf.
clear, clf
m=input(m=);
h=1/m; x=-1:h:1;
[X,Y]=meshgrid(x);
Z=1/(2*pi)*exp(-0.5*(X.2+Y.2));
subplot(1,2,1), mesh(X,Y,Z)
title(Grafica prin MESH)
xlabel(x), ylabel(y), zlabel(z)
subplot(1,2,2), surf(X,Y,Z)
title(Grafica prin SURF)
xlabel(x), ylabel(y), zlabel(z)
Executarea programului, cu
54
Introducere n Matlab
Grafica prin SURF
0.16
0.16
0.14
0.14
0.12
0.12
0.1
0.1
0.08
0.08
0.06
0.06
0.04
0.04
1
1
0.5
0.5
0.5
0.5
0
0.5
y
0
0.5
0.5
1
Figura 1.19:
e
0.5
1
m=input(m=);
h=1/m; x=-1:h:1;
[X,Y]=meshgrid(x);
Z=1/(2*pi)*exp(-0.5*(X.2+Y.2))
subplot(1,3,1), surf(X,Y,Z),
shading faceted
title(Umbrire - faceted)
subplot(1,3,2), surf(X,Y,Z),
shading flat
title(Umbrire - flat)
xlabel(x), ylabel(y), zlabel(z)
subplot(1,3,3), surf(X,Y,Z),
shading interp
title(Umbrire - interp)
, se poate
55
Umbrire faceted
Umbrire flat
Umbrire interp
0.16
0.16
0.16
0.14
0.14
0.14
0.12
0.12
0.12
0.1
0.1
0.1
0.08
0.08
0.08
0.06
0.06
0.06
0.04
0.04
0.04
1
1
0.5
0
1
1
0.5
0.5
0.5
1
0.5
0
0.5
56
Introducere n Matlab
[X,Y]=meshgrid(x);
Z=1/(2*pi)*exp(-0.5*(X.2+Y.2));
subplot(1,2,1), contour(Z,n)
title([n=,num2str(n), curbe de nivel])
subplot(1,2,2), contourf(Z,n)
title([n=,num2str(n), curbe de nivel umbrite])
Executarea programului, cu
Figura 1.21.
n=5 curbe de nivel
12
12
10
10
10
12
10
12
unde f este expresia matematica a unei functii de doua variabile, privita ca un sir de
caractere.
Parametrul lim este fie un vector de forma [xmin,xmax], fie de forma
[xmin,xmax,ymin,ymax]. Daca lipseste, se ia implicit [-2 ,2 ,-2 ,2 ],
iar daca este de prima forma se ia [xmin,xmax,xmin,xmax].
Parametrul n specifica faptul ca n reprezentarea grafica se foloseste o retea de
n n puncte (implicit se considera n=60).
De exemplu,
57
f=sqrt(x2+y2)
ezcontour(f,[-2,2])
, pe domeniul
si produc
curbele de nivel pentru functia
.
Instructiunea ezcontourf, fata de ezcontour executa si umbrirea ariilor
generate de curbele de nivel.
58
Introducere n Matlab
sin(x) sin(y)
0.5
0.5
sin(x) sin(y)
0.5
0.5
5
5
0
0
0
y
59
Reprezentare cu ezsurf
Reprezentare cu ezmesh
0.5
0.5
0.5
0.5
2
2
0
1
y
0
1
1
2
1
2
e
argumentele w, tip si color sunt optionale, dar cand sunt specificate, trebuie
sa pastreze aceasta ordine.
Parametrul y este un vector de lungime m, avand componentele ordonate
crescator sau descrescator. Daca y lipseste, atunci se considera implicit y=1:m.
Daca z este un vector de aceeasi lungime cu y, atunci vor fi reprezentate grafic m
m, de pe axa oy. Daca z este o mabare de lungimi z n dreptul punctelor y ,
trice de tipul (m,n), reprezentarile sunt efectuate pentru fiecare din cele n coloane
ale matricei, adica n fiecare punct y ,
m, de pe axa oy, vor fi reprezentate cate
n bare (batoane).
Parametrul w specifica grosimea barelor, implicit fiind w
, iar pentru w
barele se suprapun.
Daca parametrul tip=detached, care este valoarea implicita, atunci barele
din punctele y de pe axa oy vor fi detasate n adancime dupa axa ox. Daca
tip=grouped, barele (batoanele) vor fi grupate n punctele y , de pe axa oy, iar
daca tip=stacked, atunci barele vor fi stivuite n aceste puncte.
Parametrul color specifica culoarea barelor (batoanelor) si are una din urmatoarele valori: r (rosu), g (verde), b (albastru), y (galben), m (violet), c (ciclamen),
k (negru), w (alb).
Deosebirea ntre bar3 si bar3h este ca prima instructiune actioneaza pe verticala, iar a doua pe orizontala.
60
Introducere n Matlab
Programul
1.12.5. Sa scriem un program care genereaza o matrice magica de ordin
. Folosind primele trei coloane ale matricei magice, s
a reprezentam prin bare
verticale valorile acestora cu fiecare din tipurile detached, grouped si stacked.
Folosind ultimele trei coloane sa se faca astfel de reprezentari cu ajutorul barelor
orizontale.
m=input(m:); A=magic(m);
subplot(2,3,1), bar3(A(:,1:3),.6,detached)
title(Bar3 - detached)
subplot(2,3,2), bar3(A(:,1:3),grouped)
title(Bar3 - grouped)
subplot(2,3,3), bar3(A(:,m-2:m),.6,stacked)
title(Bar3 - stacked)
subplot(2,3,4), bar3h(A(:,m-2:m),.6,detached)
title(Bar3h - detached)
subplot(2,3,5), bar3h(A(:,m-2:m),grouped)
title(Bar3h - grouped)
subplot(2,3,6), bar3h(A(:,1:3),.6,stacked)
title(Bar3h - stacked)
colormap spring
Executarea acestui program, pentru m=4, produce graficele din Figura 1.24.
Bar3 grouped
Bar3 detached
20
Bar3 stacked
40
15
20
10
10
20
5
0
0
1
0
1
1
2
4
1
Bar3h detached
2
3
3
4
Bar3h grouped
Bar3h stacked
2
1
0
10
10
20
20
20
40
Capitolul 2
62
(2.1.1)
iar perechea
(ii)
(iii)
iar tripletul
si
algebrele
(2.2.1)
multimilor Borel
,
, daca este
Observat
Avand n vedere ca poate fi generat de familia de intervale
ia 2.2.2.
63
,
unde si ,
ale vectorului .
si
si variabila aleatoare
.
Definitia 2.3.1. Numim functie de repartitie atasata variabilei aleatoare , aplicatia
definita prin
Fie campul de probabilitate
(2.3.1)
dar avand n vedere ca sistemul Matlab foloseste formula (2.3.1), n definirea functiei
de repartitie, vom considera aceasta abordare n cele ce urmeaza.
64
,
, sunt independente
(2.4.1)
unde
.
Definitia 2.4.1. Numim distributia sau repartitia variabilei aleatoare de tip discret,
tabloul
, iar
este
,
65
vor reprezenta grafic respectiv functia de probabilitate prin simbolul precizat prin s,
functia de probabilitate prin bare si functia de repartitie (functie n scara).
Remarcam faptul ca daca ia o infinitate numarabila de valori, atunci trebuie
sa ne limitam la un numar finit de valori ale variabilei aleatoare, iar reprezentarile
grafice se vor face pe domeniul cuprins ntre valorile minima si maxima ale acestora.
Programul 2.4.2. Sa consideram variabila aleatoare
66
Functia de probabilitate
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
Functia de repartitie
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
1
unde legea este un sir de caractere predefinit pentru fiecare din legile de probabilitate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt pdf, iar cele ce le preced sunt cele care dau numele predefinit al legii de
probabilitate (ca si cele din parametrul legea).
In urma executarii uneia din cele doua instructiuni, se calculeaza matricea p
a probabilitat ilor legii precizata prin parametrii legea, respectiv numef, corespunzatoare valorilor date prin matricea x si avand parametrii dati prin matricele
par1, par2,... Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca
daca unele sunt scalari, acestia se extind la matricele constante de aceleasi dimensiuni
cu celelalte si care iau valorile scalarilor corespunzatori.
Functia cdf
Si pentru calculul valorilor functiei de repartitie functia cdf avem doua forme de
apel
67
cp=cdf(legea,x,par1,par2,...)
cp=numef(x,par1,par2,...)
unde legea este un sir de caractere predefinit pentru fiecare din legile de probabilitate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt cdf, iar cele ce le preced sunt cele care dau numele predefinit al legii de
probabilitate (ca si cele din parametrul legea).
In urma executarii uneia din cele doua instructiuni, se calculeaza matricea cp a
probabilitat ilor cumulate (valorile functiei de repartitie) a legii precizata prin legea
respectiv numef, corespunzatoare valorilor date prin matricea x si avand parametrii
dati prin matricele par1, par2,... Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca daca unele sunt scalari, acestia se extind la matricele constante
de aceleasi dimensiuni cu celelalte si care iau valorile scalarilor corespunzatori.
(2.4.2)
unde
,
, daca are
68
(2.4.3)
unde
, daca are
(2.4.4)
unde
, daca are
,
iar
si
.
Variabila aleatoare reprezinta numarul succeselor obtinute n repetari independente ale unui experiment.
Descoperirea legii binomiala este atribuita lui James Bernoulli si care se afla n
cartea Ars Conjectandi (1713). Pascal a considerat cazul particular
Functia de probabilitate este
Remarcam faptul ca variabila aleatoare se obtine ca suma a variabile aleatoare independente, ce urmeaza fiecare legea lui Bernoulli . Prin urmare, putem
spune si faptul ca legea lui Bernoulli se obtine din legea binomiala
,
pentru
.
Programul 2.4.3. Sa scriem un program Matlab care sa reprezinte grafic functia de
probabilitate (prin puncte si prin bare) si functia de repartitie ale legii de probabilitate
.
Executarea programului
69
n = input(n=);
p = input(p=); x = 0:n;
f = pdf(bino,x,n,p);
subplot(1,3,1), plot(x,f,o)
axis([-0.5 n+0.5 0 max(p)+0.02])
title(Functia de probabilitate)
subplot(1,3,2), bar(x,f)
axis([-.5 n+0.5 0 max(p)+0.02])
title(Functia de probabilitate)
f = cdf(bino,x,n,p);
subplot(1,3,3), stairs(x,f)
title(Functia de repartitie)
axis([0 n 0 1])
Functia de probabilitate
Functia de repartitie
1
0.3
0.3
0.9
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
(2.4.5)
unde
,
iar
70
clf;
M = input(M:);
K = input(K(K<=M):);
n = input(n(n<=K):)
x = 0:n; p=K/M;
fh = pdf(hyge,x,M,K,n);
fb = pdf(bino,x,n,p);
bar(x,[fh,fb])
colormap winter
(2.4.6)
unde
e , iar
, daca are
Variabila aleatoare , care urmeaza legea lui Poisson, numara de cate ori apare
un anumit eveniment ntrun interval de tip, pe o distanta , pe o suprafata etc. Poisson
71
0.35
0.3
0.25
0.2
0.15
0.1
0.05
10
si legea binomiala
(1837) a aratat ca legea, carei poarta numele, este un caz limita a legii binomiale,
, pentru . Altfel spus, cand este mare, trebuie sa
anume cand
fie mic, adica probabilitatea producerii evenimentului considerat este mica, de aici
denumirea de lege a evenimentelor rare.
Mai remarcam un rezultat cunoscut, care stabileste legatura dintre legea lui Poisson si legea exponentiala, care va fi prezentata mai ncolo. Anume, pe cand legea lui
Poisson numara evenimentele ce apar ntrun interval de timp, legea exponentiala da
lungimea intervalului dintre doua aparitii consecutive ale evenimentelor.
Programul 2.4.6. Vom scrie un program Matlab, care sa reprezinte grafic prin bare
functiile de probabilitate pentru
si
cu
.
Avand n vedere comportarea legii
, cand
, graficele functiilor de
probabilitate pentru cele doua legi de probabilitate trebuie sa se apropie.
are o infinitate (numarabila) de valori, prin
Mai remarcam faptul ca legea
urmare n reprezentarea grafica pentru aceasta lege de probabilitate ne vom limita la
un numar finit de valori.
Anume, vom considera numai valorile ntregi din intervalul
, alegere care va fi justificata mai tarziu.
Programul
clf;
n = input(n=); p = input(p=);
lambda = n*p;
vi = fix(lambda-3*sqrt(lambda));
vf = fix(lambda+3*sqrt(lambda));
x = vi:vf;
72
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
10
si legea Poisson
11
iar
si
. Variabila aleatoare ce urmeaza legea
reprezinta numarul insucceselor pana la aparitia succesului de rang , daca repetarile sunt
considerate independente.
Functia de probabilitate corespunzatoare legii
este
73
(2.4.7)
cu
(2.4.8)
functia
toare .
,
pentru orice
numinduse densitatea de probabilitate a variabilei alea-
74
, numinduse densitatea de probabilitate a vectorului aleator .
functia
daca
daca
75
Functia de repartit
ie pentru variabila aleatoare
tervalul , este
(2.5.1)
daca
daca
daca
si functia de
clf;
a = input(a=); b = input(b=);
x = a-1:0.01:b+1;
f = pdf(unif,x,a,b);
F = cdf(unif,x,a,b);
subplot(1,2,1), plot(x,f,k-)
axis([a-1 b+1 -0.1 1/(b-a)+0.1])
title(Densitatea de probabilitate)
subplot(1,2,2), plot(x,F,k-)
axis([a-1 b+1 -0.1 1.1])
title(Functia de repartitie)
76
Densitatea de probabilitate
0.4
0.35
0.3
0.8
0.25
0.6
0.2
0.15
0.4
0.1
0.05
0.2
0
0.05
0.1
Figura 2.5: Legea uniforma pe
.
e
pentru orice
e
este
erf
77
Remarcam ca functia
e
se numeste de asemenea functia lui Laplace. Intre cele doua functii Laplace exista
relatia
e
pentru legea
clf;
m = input(mu=); s = input(sigma=);
x = m-3*s:0.01:m+3*s;
f = pdf(norm,x,m,s);
F = cdf(norm,x,m,s);
subplot(1,2,1), plot(x,f,k-)
title(Densitatea de probabilitate)
subplot(1,2,2), plot(x,F,k-)
title(Functia de repartitie)
,
unde
78
Functia de repartitie
0.4
0.9
0.35
0.8
0.3
0.7
0.25
0.6
0.2
0.5
0.4
0.15
0.3
0.1
0.2
0.05
0.1
0
4
0
4
Daca
e
ln
unde
e
,
daca are
e
Cand
, legea gamma tinde la legea normala. Adica, daca urmeaza legea
, variabila aleatoare poate fi considerata ca urmand
, atunci pentru
legea
, cu si .
79
4.5
x 10
Legea normala
Legea gamma
4
3.5
2.5
1.5
0.5
0
700
800
900
1000
1100
si
1200
1300
e
,
, cand se ia
si
80
unde
,
e
,
Legea a fost descoperita de Weibull (1939) si modeleaza rezistenta la rupere a materialelor. De asemenea se pare ca modeleaza durata de viata mai bine decat legea
exponentiala. Se observa ca legea exponentiala este un caz particular, anume se obtine
cand si
.
Legea Rayleigh (rayl)
Variabila aleatoare urmeaza legea lui Rayleigh de probabilitate, notata prin
daca are densitatea de probabilitate:
e
,
81
Se observa ca este caz particular al legii Weibull,
,
.
Daca viteza unei particule n directiile si sunt doua variabile aleatoare independente, care urmeaza legi normale de probabilitate, cu mediile zero si dispersiile
egale, atunci distanta parcursa de particula pe unitate de timp urmeaza legea lui Rayleigh.
2.5.2 Legi de probabilitate continue statistice
Prezentam legile de probabilitate de tip continuu, denumite astfel n sistemul Matlab,
prin pachetul de programe Statistics toolbox, deoarece utilizarea lor este strans legata
de statistica.
Legea t (Student) (t)
Variabila aleatoare urmeaza legea t (Student) de probabilitate, notata
are densitatea de probabilitate
,
daca
.
urmeaza legea
Daca urmeaza legea
,
atunci
urmeaza legea .
, se ajunge la legea normala standard
Cand
.
Programul 2.5.8. Pentru ilustrarea ultimei afirmatii, vom scrie un program care sa
reprezinte pe aceeasi figura graficele densitat ilor de probabilitate pentru legile
si
.
Prin executarea programului Matlab
82
0.3
0.25
0.2
0.15
0.1
0.05
0
3
si legea
unde
e
si are den-
, generalizeaza legea
83
clf;
n = input(n=); d = input(delta=);
x = -5:0.01:5;
Fc = tcdf(x,n); Fnc = nctcdf(x,n,d);
plot(x,Fc,k-.,x,Fnc,k-)
legend(Legea Student,..
Legea Student necentrata,2)
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
5
si legea
Legea
(chi2)
Variabila aleatoare urmeaza legea sau legea HelmertPearson, vom nota prin
, daca are densitatea de probabilitate:
e
Legea este un caz particular al legii , cand , iar
.
Daca , , . . . , sunt independente, fiecare urmand legea normala de para
metri
si , atunci variabila aleatoare
84
urmeaza legea
respectiv legile
,
si
urmeaza
, varia-
.
urmeaza legea
Daca variabila aleatoare urmeaza legea
bila aleatoare urmeaza legea
, cu
,
si
atunci,
pentru
.
aceeas
.
Prin executarea programului Matlab
clf;
n = input(n=); s = sqrt(2*n);
x = n-3*s:0.01:n+3*s;
fn = normpdf(x,n,s); fchi = chi2pdf(x,n);
plot(x,fn,k-.,x,fchi,k-)
legend(Legea normala, Legea chi2,2)
0.05
0.04
0.03
0.02
0.01
10
15
20
25
30
si legea
35
40
45
50
85
necentrata (ncx2)
Legea
e
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
10
si legea
15
,
daca are
86
si urmeaza legile
si
,
.
urmeaza legea
, atunci va urma legea
Daca variabila aleatoare urmeaza legea
.
, atunci transformata lui FiDaca variabila aleatoare urmeaza legea
sher, adica log , urmeaza legea
, cand , unde
(2.5.2)
e e
clf
m = input(m=); n = input(n=);
mu = (1/n-1/m)/2; s = sqrt((1/n+1/m)/2);
x = mu-3*s:0.01:mu+3*s;
f1 = normpdf(x,mu,s);
f2 = 2*exp(2*x).*fpdf(exp(2*x),m,n);
plot(x,f1,k-.,x,f2,k-)
legend(Legea normala,Transformata Fisher,2)
si
.
este
87
2
Legea normala
Transformata Fisher
1.8
1.6
1.4
1.2
0.8
0.6
0.4
0.2
0
0.8
0.6
0.4
0.2
0.2
0.4
0.6
este
.
88
0.6
0.5
0.4
0.3
0.2
0.1
10
12
si legea
i
va
umbri
aria
cuprins
a ntre dreptele de ecuatii
de probabilitate a legii
s
i
(
), curba ce reprezinta graficul densitatii de probabilitate si axa
absciselor.
m = input(mu=); s = input(sigma=);
a = input(a:); b = input(b (b>a):);
p = normspec([a,b],m,s);
xlabel([a= ,num2str(a),
b= ,num2str(b)])
ylabel(Densitatea de probabilitate)
title([Probabilitatea intre a si b : ,num2str(p)])
,
.
Daca este functia de repartitie a vectorului , iar este functia vectorului
aleator , numinduse functie de repartitie marginala, atunci
89
0.35
Densitatea de probabilitate
0.3
0.25
0.2
0.15
0.1
0.05
0
4
0
a= 1.5
b= 2
adica se obtine integrand densitatea de probabilitate pe , n raport cu
toate variabilele independente, cu exceptia variabilelor , . . . , .
pentru fiecare
fixat.
90
Daca vectorul aleator
este de tip discret, adica are distributia data prin tabloul
sau
bidimensional
..
.
..
.
..
.
..
.
.
unde
Remarcam de asemenea ca are loc formula
(2.5.3)
este
data prin
unde
.
Daca vectorul aleator este de tip continuu, adica are densitatea de probabilitate , atunci densitatea de probabilitate a variabilei aleatoare conditionata de
este data prin
pentru
Exemplul 2.5.17 (Legea normala multidimensionala). Vectorul aleator, notat prin
, urmeaza legea normala multidimensionala, notam aceasta prin
, daca
are densitatea de probabilitate
(2.5.4)
det
91
unde este o matrice patratica de ordin pozitiv definita, iar este inversa matri
cei .
Daca
si notam prin vectorul aleator bidimensional corespunzator,
densitatea de probabilitate devine
(2.5.5)
unde si .
Se cunoaste ca fiecare din componentele si ale vectorului aleator urmeaza
s
legea normala respectiv
i
.
Densitatea de probabilitate conditionata se exprima n acest fel prin:
(2.5.6)
unde
normale
e
, adica se obtine densitatea de probabilitate a legii
92
0.1
0.08
0.06
0.04
0.02
0
6
4
2
0
1
0
2
6
r = input(r(-1<r<1):);
Y(1:3) = input(Y(trei valori):);
m = m1+s1*r*(Y-m2)/s2; s = sqrt(1-r2)*s1;
MM = max(m); mm = min(m);
X = []; X = mm-3*s:0.01:MM+3*s;
hold on
for i=1:3
P = []; P = normpdf(X,m(i),s);
if i==1 plot(X,P,k-.), end
if i==2 plot(X,P,k-), end
if i==3 plot(X,P,k--), end
end
title(Legea normala conditionata)
Prin executarea acestui program, pentru m1=1, m2=0, s1=1, s2=2, r=-0.5 si
Y=[-2,0,2], se obtin graficele din Figura 2.16. Graficul marcat prin punctlinie
este pentru prima valoare a lui Y, cel cu linie continua, pentru a doua valoare, iar prin
linie ntrerupta, pentru a treia.
93
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
2
Definitia 2.5.21. Daca variabila aleatoare de tip continuu are functia de repartitie
si densitatea de probabilitate , se numeste functie hazard sau functie de risc
instantaneu atasata variabilei aleatoare functia definita prin:
de unde
adica
94
(2.6.1)
unde integrala Stieltjes se impune sa fie absolut convergenta pentru ca valoarea medie sa existe.
Observat
ia 2.6.2. Daca variabila aleatoare este de tip discret, adica are distributia
care exista pentru cazul cand este variabila aleatoare simpla, altfel se impune ca
seria ce apare n aceasta formula sa fie absolut convergenta.
Daca variabila aleatoare este de tip continuu, adica are densitatea de probabilitate , atunci
este un vector aleator dimensional, iar functia
Mai remarcam faptul ca daca
sa fie o variabila aleatoare, atunci
este astfel ncat
care n cazul continuu devine
95
Definitia 2.6.3. Numim dispersie sau varianta caracteristica numerica atasata variabilei aleatoare definita prin:
(2.6.2)
.
(2.6.3)
(2.6.4)
, numim
Observatia 2.6.5. Pentru suma unui numar finit de variabile aleatoare avem:
96
(i)
sau
este
(2.6.5)
Demonstratie. (i) Transformarea liniara a unui vector aleator este vector aleator.
(ii) Avand n vedere proprietati ale valorii medii, pentru o componenta a vectoru, se poate scrie
lui
de unde rezulta
In mod analog se arata si a doua relatie.
(iii) Se poate proceda ca si pentru valoarea medie, daca se tine seama de proprietati ale corelatiei. Se scrie succesiv:
97
se poate scrie:
,
Demonstratie. Din algebra liniara este cunoscut faptul ca o matrice pozitiv definita
admite decompunerea
sau
fiind matricea unitate, iar este o matrice diagounde
nala cu elementele numere pozitive. Putem face precizarea ca diagonala matricei
contine valorile proprii ale matricei
, iar matricea este formata din vectorii proprii ortonormati corespunzatori.
98
Consideram vectorul aleator avand matricea covariantelor . Un astfel de vector aleator exista, avand n vedere de exemplu vectorul aleator care are ca si compo
nente variabile aleatoare independente ce urmeaza fiecare legea normala
.
Vectorul aleator
va avea ca matrice a covariantelor chiar matri
cea
.
Intradevar, daca se tine seama de relatia (2.6.5), se obtine:
Demonstratie. Folosinddescompunerea
si alegand
obtinem ca
este vectorul aleator cautat.
Pe de o parte avem
Pe de alta parte
,
Dar avem ca
si
fiecare
, ceea ce conduce la
, astfel ca
.
, pentru
99
unde numef este un sir de caractere, care definesc legea de probabilitate, din care
ultimele patru sunt stat, iar cele ce le preced sunt cele care dau numele legii.
In urma executarii instructiunii, se calculeaza matricele m si v ale valorilor medii
si ale dispersiilor pentru legea considerata, avand parametrii precizati prin matricele
par1, par2, ... Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca
daca unele sunt scalari, acestia se extind la matricele constante de aceleasi dimensiuni
cu celelalte si care iau valorile scalarilor corespunzatori.
Valorile medii si dispersiile se calculeaza, pentru fiecare lege de probabilitate n
parte, folosinduse formulele din Tabelul 2.1.
si
Daca vectorul aleator
..
.
..
.
fiind
..
.
va avea distributia
de
100
Legea
Denumirea
gam
logn
norm
weib
rayl
t
nct
f
ncx2
chi2
beta
exp
unif
geo
hyge
nbin
e e e
,
,
bino
poiss
unid
ncf
101
Daca vectorul aleator este de tip continuu, avand densitatea de probabilitate , atunci o realizare a variabilei aleatoare
este data prin
unde
Proprietatea 2.6.14.
.
Demonstratia se ncheie daca se retin extremitatile acestui sir de egalitati.
Proprietatea 2.6.16.
102
de unde se obtine ca
de unde
, se poate scrie:
Exemplul 2.6.17. Sa consideram vectorul aleator , care urmeaza legea normala, avand densitatea data prin (2.5.5). Este cunoscut ca parametrii acestei legi de
probabilitate au urmatoarele interpretari probabilistice:
iar
este coeficientul de corelatie dintre si .
Mai mult, pentru legea normala multidimensionala, avand densitatea de probabilitate data prin (2.5.4), se arata ca este valoarea medie a vectorului aleator ce
urmeaza legea normala multidimensionala, iar este matricea covariantelor.
Sa revenim la cazul bidimensional si sa constatam ca
103
Curbele de ecuatii
si vectorul aleator
dimensional
.
, res-
e
e
Utilitatea functiei caracteristice este data de netezimea ei, care este superioara
functiei de repartitie, aceasta din urma putand fi discontinua, pe cand functia caracteristica este uniform continua. In plus, pe baza formulei de inversiune, exista o
caracterizare completa a distributiei unei variabile aleatoare sau a unui vector aleator
cu ajutorul functiei caracteristice.
2.6.5 Momente
Definitia 2.6.19. Fie variabila aleatoare . Numim moment (initial) si respectiv
moment centrat de ordin , caracteristicile numerice
iar momentele centrate de ordinele doi si patru se folosesc pentru definirea excesului
(kurtosis)
sau
104
Avand n vedere proprietat i ale functiei de repartitie, conditiile (2.6.6) se pot scrie
echivalent sub forma
Daca variabila aleatoare este de tip continuu, relatiile (2.6.6) se reduc la relatia
, adica
.
In cazul discret, folosind (2.6.6) sar putea ca mediana sa nu fie determinata n
mod unic, de aceea se alege ca fiind cel mai mic numar pentru care
Definitia 2.6.21. Fie variabila aleatoare , care are functia de repartitie . Numim
cuantila de ordin
, caracteristica numerica , care satisface conditiile
(2.6.7)
si
105
unde legea este un sir de caractere predefinit pentru fiecare din legile de probabilitate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt inv, iar cele ce le preced sunt cele care dau numele predefinit al legii de
probabilitate (ca si cele din parametrul legea).
In urma executarii uneia din cele doua instructiuni, se calculeaza matricea x a
cuantilelor legii precizata prin parametrii legea, respectiv numef, corespunzatoare
valorilor date prin matricea P si avand parametrii dati prin matricele par1, par2,...
Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca daca unele sunt
scalari, acestia se extind la matricele constante de aceleasi dimensiuni cu celelalte si
care iau valorile scalarilor corespunzatori.
Programul 2.6.22. Pentru a ilustra grafic modul de calcul al cuantilelor, vom da un
program care calculeaza mediana pentru legea uniforma discreta si reprezinta grafic
acest lucru pentru doua valori distincte ale parametrului N, precum si cuartilele legii
normale.
clf, clear
N1 = input(N1=); N2 = input(N2=);
m = input(mu=); s = input(sigma=);
xu1 = 0:N1+1; yu1 = unidcdf(xu1,N1);
xu2 = 0:N2+1; yu2 = unidcdf(xu2,N2);
xn = m-3*s:0.01:m+3*s; yn = normcdf(xn,m,s);
me1 = icdf(unid,1/2,N1);
me2 = icdf(unid,1/2,N2);
Q = icdf(norm,[1/4,2/4,3/4],m,s);
subplot(3,1,1), stairs(xu1,yu1)
set(gca,Xlim,[0,N1+1]), set(gca,xtick,[me1])
set(gca,xticklabel,[me1]), hold on
plot([0,me1],[1/2,1/2],k:,me1,1/2,o)
plot([me1,me1],[0,1/2],k-.)
subplot(3,1,2), stairs(xu2,yu2)
set(gca,Xlim,[0,N2+1]), set(gca,xtick,[me2])
set(gca,xticklabel,[me2]), hold on
plot([0,me2],[1/2,1/2],k:,me2,1/2,o)
plot([me2,me2],[0,1/2],k-.)
subplot(3,1,3),
plot(xn,yn,[Q(1),Q(2),Q(3)],[1/4,2/4,3/4],o)
set(gca,xtick,[Q(1),Q(2),Q(3)])
set(gca,xticklabel,[Q(1),Q(2),Q(3)])
hold on
X = [m-3*s,Q(1);m-3*s,Q(2);m-3*s,Q(3)];
plot(X,[1/4,1/4;1/2,1/2;3/4,3/4],k:)
plot([Q(1),Q(1)],[0,1/4],k-.)
plot([Q(2),Q(2)],[0,2/4],k-.)
plot([Q(3),Q(3)],[0,3/4],k-.)
Executarea programului pentru N=5 si N=6, respectiv pentru mu=0 si sigma=2, are
ca rezulatat graficele din Figura 2.17.
106
0.5
0.5
0.5
1.34898
si
1.34898
si cuartilele pentru
107
, unde sa notat
108
Astfel, pentru
se obtine
ceea ce
nseamna ca probabilitatea ca valorile lui sa se abata de la valoarea medie
mai putin de trei ori abaterea standard este mai mare decat
cu
si
Cele doua inegalitati dau evaluari ale probabilitat ilor ca media aritmetica a variabilelor aleatoare sa se abata de la valoarea medie mai putin, respectiv mai mult, decat
fixat.
converge n proba
bilitate la variabila aleatoare , si vom nota
, daca pentru orice ,
avem ca
109
.
adica
adica
unde .
Prin urmare, media aritmetica a primelor variabile aleatoare din sirul considerat
.
si pierde caracterul aleator, pentru
Evident, deoarece
convergenta n probabilitate implica convergenta n repartitie,
, dar vom vedea imediat ca exista chiar un rezultat mai bun n
avem si
ceea ce priveste convergenta n repartitie.
110
atunci
, unde este o variabila aleatoare ce urmeaza legea normala
, adica
e
atunci
unde
unde
urmeaza legea
.
111
,
unde
Prin urmare, rezulta ca
Deoarece, abaterea medie
, avem
patratica a variabilei aleatoare ce urmeaza legea binomiala este
regula urmatoare cunoscut
a sub denumirea de regula celor trei : probabilitatea ca
frecventa absoluta sa se abata de la valoarea medie
mai putin de trei
ori abaterea medie patratica este mai mare decat
.
Observatia 2.7.13 (Corectie de continuitate). Avand n vedere procesul de aproximare a unei legi de tip discret (legea binomiala) cu una de tip continuu (legea
normala), pentru obtinerea unor rezultate mai bune n aplicarea formulei (2.7.1), se
impune aplicarea unei corectii de continuitate, data prin
unde
e
112
mare:
Programul 2.7.14. Pentru a ilustra rezultatele Teoremei MoivreLaplace, programul Matlab care urmeaza, reprezinta grafic prin bare functia de probabilitate a legii
binomiale
mpreun
densitatea de probabilitate a legii normale cores
a cu
.
punzatoare, adica
clf
n = input(n=); p = input(p=);
m = n*p; s = sqrt(n*p*(1-p));
x = 0:n; xx = -1:0.01:n+1;
P = binopdf(x,n,p); y = normpdf(xx,m,s);
bar(x,P,0.3), hold, plot(xx,y)
Executarea programului pentru n=15 si p=0.4, produce graficul din Figura 2.18.
0.25
0.2
0.15
0.1
0.05
0
2
10
si legea
12
14
16
Capitolul 3
Statistica descriptiva
Statistica se ocupa cu descrierea si analiza numerica a fenomenelor de masa,
dezvaluind particularitat ile lor de volum, structura, dinamica, conexiune, precum si
regularitat ile sau legile care le guverneaza.
Etapele principale ce se disting n cercetarea statistica a unui fenomen aleator se
pot considera ca fiind:
a). Definirea (conceptia) obiectului studiat, care contine definirea unitatilor statistice, conceperea chestionarului (ntrebarilor), planificarea culegerii datelor.
b). Observarea fenomenului (culegerea datelor) conform criteriilor stabilite la
etapa precedenta.
c). Descrierea statistica, ce cuprinde reprezentarea grafica a datelor statistice,
sistematizarea acestora, precum si calcularea indicatorilor numerici pentru punerea
n evidenta a unor proprietati si pentru sugerarea unor ipoteze referitoare la legile
care guverneaza fenomenul cercetat.
d). Modelarea probabilistica a fenomenului cercetat, care are ca obiectiv principal cercetarea fenomenului folosind ca instrument de lucru teoria probabilitat ilor
relativ la datele statistice obtinute conform etapelor precedente.
Daca primele doua etape pot fi considerate ca preliminare, etapa a treia conduce
la ceea ce numim statistica descriptiva, iar a patra etapa conduce la statistica matematica sau statistica inferentiala.
Desigur, nu se poate face o delimitare exacta ntre statistica descriptiva si statistica matematica, mai mult o descriere statistica fundamentata matematic va conduce la realizarea unei modelari a fenomenului, care pune n evidenta proprietatile
esentiale ale acestuia si legaturile dintre acestea. Ca o componenta de baza a statisticii descriptive, care s-a dezvoltat n mod impresionant odata cu explozia utilizarii
calculatoarelor n statistica, o reprezinta analiza datelor. Printre capitolele mai importante ale analizei datelor amintim metodele de clasificare si metodele factoriale.
113
114
Statistica descriptiva
115
116
Statistica descriptiva
astfel de modele matematice depind de niste parametri, fie aleatori, fie nealeatori.
Odata modelul matematic construit se are n vedere realizarea practica a acestuia.
Dar, apare o mare problema, este acest model matematic (teoretic) construit viabil? Avem doua alternative, sau realizam practic modelul respectiv si urmarim cum
functioneaza acesta (ceea ce, n general, nu e de dorit), sau simulam functionarea
modelului respectiv prin diferite particularizari ale parametrilor modelului si alegem
varianta convenabila. Daca relativ la parametrii nealeatori care intervin n modelul
teoretic nu se ridica probleme speciale, n privinta parametrilor aleatori apare o noua
problema, anume obtinerea valorilor acestor parametri. Deoarece parametrii aleatori
sunt, din punct de vedere al teoriei probabilitat ilor, variabile aleatoare, apare asadar
problema generarii de valori numerice ale acestor variabile aleatoare si care vor purta
denumirea de numere aleatoare. Desigur ca ntr-un fel vor fi generate aceste numere
aleatoare daca parametrul urmeaza, sa zicem, legea uniforma pe un anumit interval si
altfel cand urmeaza legea normala.
Deoarece pentru prezentarea notiunilor si rezultatelor teoretice ale statisticii matematice sunt necesare exemplificari ale acestora, iar culegerea unor date statistice
reale nu este ntodeauna la ndemana, de multe ori vom considera numerele aleatoare
ca fiind date statistice carora li se vor aplica metodele cercetarii statisticii.
Putem sa amintim de asemenea ca testarea programelor pe calculator, determinarea statistica a caracteristicilor numerice ale variabilelor aleatoare, care ne conduce
la metoda Monte Carlo, fac de asemenea necesara generarea numerelor aleatoare.
Metodele de generare a numerelor aleatoare se mpart n trei categorii:
tabelele cu numere aleatoare (uniforme) obtinute, de exemplu, din aruncarea
monedei, aruncarea zarului, jocul de ruleta, tabele matematice, tabele de recensamant etc.
procedeele fizice, care au la baza fenomene fizice, cum ar fi emiterea particulelor de o sursa radioactiva, intensitatea curentului la diferite momente, zgomotul
electronic etc.
procedeele aritmetice (analitice), care utilizeaza o formula de calcul de forma
Deoarece, de regula, se foloseste un volum mare de numere aleatoare, s-a impus generarea acestora cu ajutorul procedeelor aritmetice. Inconvenientul acestor procedee
analitice este legat de faptul ca nu poseda caracterul strict aleator, din moment ce
exista o legatura functionala ntre acestea. Dar exista posibilitatea de a alege astfel
de procedee analitice care produc siruri de numere pseudoaleatoare, foarte apropiate
din punct de vedere statistic de numerele aleatoare propriuzise.
117
In lucrarile [3] si [5] sunt prezentate proceduri pentru generarea de numere aleatoare pentru diferite legi de probabilitate.
Sistemul Matlab are implementate astfel de proceduri pentru generarea numerelor
aleatoare, fie prin Statistics toolbox, fie prin sistemul de baza din Matlab.
Functia random
Instructiunile prin care sunt generate numere aleatoare ce urmeaza una din legile de
probabilitate recunoscute de sistemul Matlab prin Statistics toolbox sunt de forma:
x=random(legea,par1,par2,...,m,n)
x=numef(par1,par2,...,m,n)
unde legea este un sir de caractere predefinit pentru fiecare din legile de probabilitate disponibile n Statistics toolbox, numef este un sir de caractere din care ultimele
trei sunt rnd, iar cele ce le preced sunt cele care dau numele predefinit al legii de
probabilitate (ca si cele din parametrul legea).
Executarea uneia din cele doua forme ale instructiunii random, are ca efect generarea matricei x, cu m linii si n coloane, de numere aleatoare ce urmeaza legea
de probabilitate corespunzatoare cu parametrii precizati prin matricele p1, p2, . . . .
Aceste matrice trebuie sa aiba aceleasi dimensiuni cu matricea x, cu exceptia cand
unele sunt scalari, caz n care acestea sunt extinse la matricele constante de aceleasi
dimensiuni cu celelalte si care iau valorile corespunzatoare scalarilor. Daca toti parametrii legii de probabilitate sunt scalari, cand lipsesc parametrii m si n se genereaza
un numar aleator, cand lipseste n, atunci trebuie ca m sa fie un vector cu doua componente, care contine dimensiunile matricei x. Daca cel putin unul din parametrii legii
probabilitate nu este scalar si daca parametrii m si n sunt prezenti, acestia trebuie sa
coincida cu dimensiunile matricelor.
Functiile mvnrnd si mvtrnd
Functiile mvnrnd si mvtrnd sunt singurele functii din Statistics toolbox, prin care
se genereaza legi de probabilitate multidimensionale, respectiv legile normala si t
(Student).
Apelurile acestor functii se pot face respectiv prin:
x=mvnrnd(mu,v,m)
x=mvtrnd(r,n,,m)
In primul caz, sunt generati m vectori aleatori ce urmeaza legea normala multidimensionala, avand vectorul valorilor medii mu si matricea covariantelor v (matrice
patratica pozitiv definita). Cei m vectori aleatori generati sunt obtinuti n matricea x,
care n consecinta va avea m linii, iar numarul coloanelor este dat de dimensiunea legii de probabilitate si care trebuie sa coincida cu lungimea vectorului mu si cu ordinul
matricei patratice v.
118
Statistica descriptiva
In al doilea caz, vor fi generati m vectori aleatori ce urmeaza legea Student multidimensionala.
Parametrul r reprezinta matricea coeficientilor de corelatie, care este matrice pozitiv definita avand pe diagonala principala toate elementele . Daca aceasta ultima
conditie nu este ndeplinita, adica daca este matricea covariantelor, atunci sistemul
Matlab calculeaza prima data, din matricea r, matricea coeficientilor de corelatie.
Parametrul n reprezinta numarul gradelor de libertate, putand fi un scalar sau un
vector de lungime m.
Cei m vectori aleatori sunt obtinuti n cele m linii ale matricei x si care are atatea
coloane cat este dimensiunea legii de probabilitate.
Trebuie sa remarcam faptul ca o linie a matricei x se obtine dintrunvector aleator ce urmeaza legea normala multidimensionala, avand valoarea medie si matricea
covariantelor data prin parametrul r, ale carui componente se mpart la un numar
aleator ce urmeaza legea cu n grade de libertate.
Functiile rand si randn
Sistemul Matlab de baza contine doua functii pentru generarea de numere aleatoare
, prin rand, respectiv legea normala standard
ce urmeaza legea uniforma
, prin randn.
Apelul acestor functii se poate face prin instructiuni de forma:
x=rand
x=rand(m)
x=rand(m,n)
x=randn
x=randn(m)
x=randn(m,n)
In urma executarii unor astfel de instructiuni este generat un numar aleator ce ur
meaza legea
respectiv
, cand nu este folosit nici un argument, o matrice patratica de ordin m de numere aleatoare, cand apare un argument si o matrice
de numere aleatoare de tipul (m,n), cand sunt folosite ambele argumente.
Unele situatii impun regasirea unui anumit sir de numere aleatoare generat prin
una din cele doua functii rand si respectiv randn. Pentru aceasta avem la dispozitie
ceea ce se numeste starea generatorului.
Obtinerea starii generatorului rand si randn la un moment dat se poate face
prin:
s=rand(state)
s=randn(state)
119
rand(state,s)
randn(state,s)
rand(state,0)
randn(state,0)
rand(state,sum(100*clock))
randn(state,sum(100*clock))
Functia randperm
Generarea unei permutari a primelor n numere naturale se realizeaza prin instructiunea
perm=randperm(n)
120
Statistica descriptiva
..
.
..
.
iei
valorii
Prin urmare are loc relatia
.
Definitia 3.2.5. Fie caracteristica de tip continuu , care ia valori din intervalul
, descompus n intervale disjuncte, numite clase, prin punctele care satisfac
relatiile
..
.
..
.
sau
..
.
..
.
unde
este
frecventa absolut
a a aparitiei clasei printre datele primare
Daca se considera varianta din dreapta pentru tabelul
, iar
sistematizat, se obtine aceeasi forma de tabel ca si n cazul caracteristicii discrete.
In acest fel s-a ajuns la o unificare a prezentarii prin tabele sistematizate a tipurilor
discrete si continue de caracteristici.
Observatia 3.2.7. Prin stabilirea claselor unei caracteristici continue (care pot fi de
lungimi egale sau nu) s-a efectuat o grupare a datelor statistice primare, si care se
efectueaza si n cazul caracteristicilor de tip discret, daca au un numar mare de valori
distincte.
si
Cand
este
si
si
infinit, atunci
121
Exemplul 3.2.10. Se considera un lot de becuri din punct de vedere al caracteristicii , ce reprezinta durata de viata n mii ore. Datele statistice obtinute sunt:
1.318
3.426
3.972
2.128
1.548
1.937
2.500
3.128
1.690
2.637
2.465
2.298
1.977
2.641
2.758
3.537
0.842
2.316
1.875
2.206
1.631
1.583
2.214
2.256
2.262
3.394
1.681
1.864
2.517
2.219
1.708
1.962
1.931
1.960
2.015
2.304
2.072
1.628
1.802
1.179
3.281
2.502
1.155
2.726
2.345
2.230
1.946
2.838
2.444
3.156
1.403
1.855
3.460
1.355
2.525
2.636
2.807
2.493
1.546
1.493
3.006
1.553
2.337
2.879
1.560
3.852
3.093
2.455
2.676
1.966
de unde rezulta ca
pentru calculul amplitudinii claselor, se obtine
. In acest caz numarul
claselor va fi
de unde
.
al
122
Statistica descriptiva
Se observa ca folosind cele doua metode s-au obtinut valori distincte pentru
numarul claselor. Aceste formule au mai mult rolul de a da o prima informatie relativa la numarul claselor.
In continuare vom considera numarul claselor
,
,
,
si
.
Folosind aceasta grupare se obtine tabelul sistematizat
sau
se obtin rezultatele:
ns= 7,
ds= 0.45
na= 12,
da= 0.25
Tabelul sistematizat
|
|
|
|
|
|
|
|
|
|
|
123
1
2
9
9
10
15
10
5
4
3
2
Se observa ca prima comanda citeste datele statistice din fisierul x.dat, care este un
fisier ascii.
Definitia 3.2.13. Numim frecvente cumulate ascendente, respectiv frecvente cumulate descendente frecventele date de relatiile
unde
si
.
,
si
tabloul de forma
sau
unde ,
, sunt clasele considerate, iar
frecventele absolute si frecventele relative.
si
,
, sunt respectiv
Exemplul 3.2.16. Consideram datele statistice de la Exemplul 3.2.10. Atunci distributia statistica a caracteristicii poate fi scrisa, fie cu ajutorul frecventelor absolute,
fie cu ajutorul frecventelor relative. Astfel avem ca
124
Statistica descriptiva
..
.
..
.
..
.
..
.
..
.
sau
Definitia 3.2.17. Fie colectivitatea relativ la care sunt cercetate doua caracteristici
si . Numimtabel de contingenta , un tablou care contine clasele caracteristicilor
si respectiv , mpreuna cu frecventele absolute ale acestor clase.
Observatia 3.2.18. Daca pentru cele doua caracteristici si avem respectiv cla
,
sele date prin
, si ,
, iar datele primare sunt date prin pere
, atunci tabelul de contingenta este Tabelul 3.1
chile
n datele primare ,
unde
este frecventa absoluta a aparitiei clasei
. Dupa cum se vede tabelul a fost completat cu o linie si o coloana ale caror
elemente sunt date prin formulele
126
127
128
129
130
131
132
133
134
135
136
137
24
25
26
27
1
3
4
1
3
4
5
2
1
1
1
1
7
6
7
6
2
16
30
28
29
1
9
36
27
10
1
1
2
6
17
56
16
7
1
84
106
30
1
4
6
39
26
10
2
1
89
31
1
2
18
7
11
4
2
45
32
1
4
2
6
7
3
1
24
125
33
1
1
2
3
1
2
1
11
34
1
1
1
2
2
7
35
1
1
2
6
9
21
29
70
152
64
38
18
8
6
4
425
unde x este un vector cu valori pozitive. Prin executarea unei astfel de instructiune,
se obtine pe ecran respectiv n t un tabel statistic sistematizat avand trei coloane.
Prima coloana contine valorile distincte ale lui x, a doua contine frecventele absolute
ale acestor valori distincte, iar ultima reprezinta frecventele relative n procente.
Programul 3.2.21. Vom scrie un program Matlab, care genereaa N numere aleatoare
, dup
ce urmeaza legea uniforma
a care construies te tabelul sistematizat, considerand numarul claselor n dat prin regula lui Sturges, iar clasele fiind identificate
prin mijloacele lor.
clear
a=input(a:); b=input(b (a<b):);
N=input(N=); n=fix(1+10/3*log10(N));
xx=unifrnd(a,b,1,N); c=a:(b-a)/n:b;
for i=1:N
for j=1:n
if c(j)<=xx(i) & xx(i)<c(j+1)
x(i)=j;
end
end
end
126
Statistica descriptiva
t=tabulate(x);
for j=1:n
t(j,1) =(c(j)+c(j+1))/2;
end
fprintf( Clasa
f
frel\n)
fprintf( ______________________\n)
fprintf(%7.3f %5d %8.2f%%\n,t)
Functia crosstab
Apelul functiei crosstab se poate face prin:
crosstab(x,y,z,...)
t=crosstab(x,y,z,...)
unde x, y, z, ... sunt vectori cu valori nntregi pozitive avand aceleasi lungimi. Prin
executarea unei astfel de instructiune, se obtine pe ecran respectiv n t un tabel statistic sistematizat t, cu atatea intrari cati parametri (vectori) exista. Daca sunt doi
parametri, x si y, se obtine tabelul de contingenta .
Programul 3.2.22. Programul Matlab care urmeaza, genereaza N vectori aleatori ce
urmeaza legea normala bidimensionala, dupa care construies te tabelul de corelatie cu
m clase n raport cu prima variabila, respectiv n clase n raport cu a doua variabila.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
N=input(N=); m=input(m=); n=input(n=);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
X=mvnrnd(mu,v,N); xx=X(:,1); yy=X(:,2);
xmin=min(xx); xmax=max(xx);
ymin=min(yy); ymax=max(yy);
cx =xmin:(xmax-xmin)/m:xmax;
cy =ymin:(ymax-ymin)/n:ymax;
127
& (xx(k)<cx(i+1))
(xx(k)<=cx(m+1))
& (yy(k)<cy(j+1))
(yy(k)<=cy(n+1))
2 1
m=6 si n=4, se obtine tabelul de
1 3
2
7
14
17
12
1
0
0
6
8
12
1
0
0
1
1
3
3
si are ca efect scrierea datelor din matricea obs de tip caracter n fisierul cu numele
file.
Functia caseread
Apelul functiei caseread are sintaxa
obs=caseread(file)
si are ca efect citirea datelor din fisierul cu numele file n matricea obs de tip
caracter.
128
Statistica descriptiva
Functia tblwrite
Sintaxa functiei tblwrite este:
tblwrite(t,va,obs,file)
si are ca efect scrierea n fisierul cu numele file a matricelor va, obs de tip
caracter si a datelor din matricea numerica t.
Matricele va si obs trebuie sa aiba atatea linii cate coloane, respectiv cate linii are matricea t. Liniile celor doua matrice de tip caracter vor reprezenta etichete
pentru coloanele, respectiv liniile matricei t, si drept urmare vor fi asezate n dreptul
coloanelor si liniilor corespunzatoare.
Functia tblread
Sintaxa functiei tblread este:
[t,va,obs]=tblread(file)
si are ca efect citirea din fisierul cu numele file a matricelor va, obs de tip caracter
si a datelor din matricea numerica t.
Programul 3.2.23. Programul care urmeaza completeaza Programul 3.2.22, pentru
obtinerea n tabelul de contingenta si a mijloacelor claselor pentru cele doua variabile.
. . . . . . . . . . . . . .
t=crosstab(x,y);
fy=fopen(ly.txt,w+);
for j=1:n
laby(j)=(cy(j)+cy(j+1))/2;
ly=num2str(laby(j));
fprintf(fy,%s\n,ly);
end
fx=fopen(lx.txt,w+);
for i=1:m
labx(i)=(cx(i)+cx(i+1))/2;
lx=num2str(labx(i));
fprintf(fx,%s\n,lx);
end
va=caseread(ly.txt); obs=caseread(lx.txt);
tblwrite(t,va,obs,clase.txt);
type clase.txt, fclose(all);
In urma executarii programului cu aceleasi date de intrare folosite n Programul 3.2.22, prin instructiune type este afisat pe ecran tabelul de contingenta :
2.5895
3.8424
5.0952
6.348
7.6008
8.8537
7.5244
4
4
1
2
1
0
9.7152
6
16
13
12
1
0
11.906
2
7
12
9
4
1
14.0967
0
0
0
1
3
1
129
Se observa ca datele din tabelul obtinut nu sunt aceleasi cu cele obtinute prin executarea Programului 3.2.22, desi se dau aceleasi date de intrare. Lucru de asteptat,
avand n vedere ca se genereaza un alt set de numere aleatoare.
Se observa de asemenea, n noul program, ca apar instructiunile fopen,
fclose, caseread, tblwrite.
Instructiunea fopen este folosita pentru deschiderea fisierelor lx.txt si
ly.txt, care vor contine etichetele claselor celor doua variabile. Acestea sunt
date de mijloacele claselor si sunt transformate n siruri de caractere prin comanda
num2str. Parametrul w+, are ca efect crearea unui fisier nou sau actualizarea
unuia deja existent, dupa ce a fost anulat continutul sau, n vederea scrierii sau citirii
n respectivul fisier. Evident instructiunea fclose este folosita n vederea nchiderii
fisierelor.
Prin instructiunile caseread sunt citite etichetele claselor din fisierele lx.txt
si ly.txt, care apoi sunt folosite pentru scrierea acestora n fisierul clase.txt,
cu ajutorul comenzii tblwrite, mpreuna cu elementele tabelului de contingenta .
130
Statistica descriptiva
Exemplul 3.2.28. Daca se considera datele statistice din Exemplul 3.2.10, si avand
n vedere sistematizarea acestora, atunci histograma frecventelor absolute este prezentata n Figura 3.1.
16
14
12
10
0
0.4
0.7
1.3
1.6
1.9
2.2
2.5
2.8
3.1
3.4
3.7
4.3
mobile.
Metoda ferestrei mobile consta n construirea clasei
, , pen
tru fiecare , si determinarea frecventei a acestei clase, cu ajutorul careia
se obtine curba data prin
Daca se considera functia indicatoare a intervalului
, adica
(3.2.1)
,
,
daca
daca
131
Pentru a obtine o forma mai regulara pentru se pot considera si alte tipuri de
functie nucleu , care de regula este o densitate de probabilitate simetrica.
Mai des se utilizeaza nucleul Gaussian
(3.2.2)
e
daca
,
daca
.
(3.2.4)
(3.2.5)
(3.2.6)
daca ,
daca
daca ,
daca ,
daca ,
daca .
132
Statistica descriptiva
y=3/(4*sqrt(5))*(1-x.2/5).*y;
case 4
y=(abs(x)<1);
y=15/16*(1-x.2).2.*y;
case 5
y=((x>0)&(x<1));
y=(1+cos(2*pi*x)).*y;
case 6
y=(abs(x)<1); y=abs(x).*y;
otherwise
error(Eroare)
end
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
4
0
4
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
4
0
4
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
4
0
4
133
Pentru trasarea diagramelor integrale, n tabelul urmator calculam frecventele absolute ascendente si respectiv descendente, conform formulelor
134
Statistica descriptiva
16
14
12
10
0
0.55
0.85
1.15
1.45
1.75
2.05
2.35
2.65
2.95
3.25
3.55
3.85
4.15
Daca legatura liniara
este usor de observat din norul statistic, pen
, prin logaritmare se
tru celelalte se ncearca liniarizarea. De exemplu, daca
, , si se
. Se noteaza
ajunge la
obtine legatura liniara
, pentru si . Pentru
se va repre aceasta
zenta grafic norul statistic dat de punctele
,
. Daca punctele
din acest nor statistic sunt situate n jurul unei drepte, atunci se poate considera ca
legatura dintre si este de forma
.
135
70
60
50
40
30
20
10
0
0.4
0.7
1.3
1.6
1.9
2.2
2.5
2.8
3.1
3.4
3.7
4.3
136
Statistica descriptiva
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,n,p);
case hyge
M = input(M=); K = input(K=);
n = input(n=);
x = random(lege,M,K,n,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,M,K,n);
case poiss
lambda = input(lambda=);
x = random(lege,lambda,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,lambda);
case nbin
r = input(r=); p = input(p=);
x = random(lege,r,p,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,r,p);
case geo
p = input(p=);
x = random(lege,p,1,N);
t = tabulate(x+1);
P =N*pdf(lege,t(:,1)-1,p);
otherwise
error(Lege discreta necunoscuta)
end
bar(t(:,1),[t(:,2),P])
legend(Frecvente observate, Frecvente teoretice,1)
unde valorile pentru N si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>diag1(50,poiss)
are ca efect apelul functiei pentru legea lui Poisson, iar pe ecran se va cere introducerea parametrului lambda, dupa care pe ecran va fi reprezentat graficul din Figura 3.5,
n cazul n care lambda=7. Sa remarcam totusi ca la un nou apel, cu aceeasi parametri, graficul difera, deoarece sunt generate alte numere aleatoare.
Functia 3.2.37. Urmatoarea functie Matlab, va genera N numere aleatoare ce urmeaza o lege de probabilitate de tip discret, va construi diagrama cumulativa ascendenta pentru datele astfel obtinute, iar pe aceeasi figura va reprezenta, pentru
comparatie, functia de repartitie a legii de probabilitate considerate. Pentru o vizualizare corecta a comparatiei, se impune, fie amplificarea functiei de repartitie cu factorul N, fie mpartirea frecventelor cumulate ale distributiei statistice cu N, adica prin
considerarea frecventelor relative cumulate. In cele ce urmeaza vom considera a doua
varianta.
137
9
Frecvente observate
Frecvente teoretice
8
10
12
14
16
function diag2(N,lege)
% Functia diag2 produce diagrama cumulativa
% N - reprezinta volumul datelor generate
% lege - reprezinta denumirea legii de probabilitate
clf
switch lege
case unid
n=input(n (parametrul legii uniforme discrete):);
x=random(lege,n,1,N);
t=tabulate(x);
xx=[t(1,1)-1;t(:,1);t(end,1)+1];
cf=[0;cumsum(t(:,2));N]/N;
P=cdf(lege,xx,n);
stairs(xx,cf,k-),hold on,
stairs(xx,P,k-.),return
case bino
n=input(n=); p=input(p=);
x=random(lege,n,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,n,p);1];
case hyge
M=input(M=); K=input(K=);
n=input(n=);
x=random(lege,M,K,n,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
18
138
Statistica descriptiva
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,M,K,n);1];
case poiss
lambda=input(lambda=);
x=random(lege,lambda,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,lambda);1];
case nbin
r=input(r=); p=input(p=);
x=random(lege,r,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,r,p);1];
case geo
p=input(p=);
x=random(lege,p,1,N);
t=tabulate(x+1);
xx=[t(1,1)-2;t(:,1)-1;t(end,1)];
cf=[0;cumsum(t(:,2));N]/N;
P=[0;cdf(lege,t(:,1)-1,p);1];
otherwise
error(Lege discreta necunoscuta)
end
stairs(xx,cf,k-),hold on,
stairs(xx,P,k-.)
De exemplu, comanda
>>diag2(50,bino)
are ca efect apelul functiei pentru legea binomiala, iar pe ecran se vor cere introducerea parametrilor n si p, dupa care pe ecran va fi reprezentat graficul din Figura 3.6,
n cazul n care n=7 si p=0.4. Diagrama cumulativa este reprezentata prin line continua, iar functia de repartitie teoretica prin linie-punct. Si aici remarcam ca la un
nou apel, cu aceeasi parametri, graficul difera, deoarece sunt generate alte numere
aleatoare.
Cazul continuu
Reprezentari grafice pentru distributia statistica a unei caracteristici (variabile) de tip
continuu se obtin, fie prin utilizarea functiei plot si bar, fie prin functiile hist,
139
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1
140
Statistica descriptiva
Toate formele accepta parametrul y ca fiind matrice, caz n care operatia se executa pentru fiecare coloana a matricei.
Functia histc
Apelul functiei histc se poate face prin:
n=histc(y,a)
[n,nb]=hist(y,a)
141
plot(a,FA,k-o,a,FD,k-o)
axis([0.4 4.3 0 70])
set(gca,xtick,[0.4:0.3:4.3]), grid on
142
Statistica descriptiva
case beta
a=input(a=); b=input(b=);
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case weib
a=input(a=); b=input(b=)
x=random(lege,a,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a,b);
case rayl
b=input(b=);
x=random(lege,b,1,N);
[f,c]=hist(x,n); h=c(2)-c(1);
t=c(1)-h:0.01:c(end)+h;
y=pdf(lege,t,a);
otherwise
error(Lege continua necunoscuta)
end
subplot(1,2,1), hist(x,n)
subplot(1,2,2), bar(c,f/(N*h),1)
hold on, plot(t,y,k-)
De exemplu, comanda
>>hist0(500,norm)
are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introducerea parametrilor mu si sigma, dupa care pe ecran va fi reprezentat graficul din
Figura 3.7, n cazul n care mu=0 si sigma=1.
Functia scatter
Sistemul Matlab este prevazut cu functia scatter pentru reprezentarea norului statistic n cazul bidimensional. Apelul functiei se face prin:
scatter(x,y)
scatter(x,y,s)
scatter(x,y,s,c)
scatter(x,y,s,c,m)
scatter(x,y,s,c,m,filled)
Efectul executarii unei astfel de instructinui este producerea norului statistic precizat
prin vectorii x si y, care au aceeasi lungime.
Parametrul optional s specifica marimea marcajelor (cerculete) punctelor norului. Acesta poate sa fie un scalar, n care caz toate marcajele vor avea aceleasi marimi
143
0.45
0.4
120
0.35
100
0.3
80
0.25
0.2
60
0.15
40
0.1
20
0.05
0
4
0
4
sau poate sa fie un vector de aceeasi lungime cu x si y, caz n care se pot specifica
marimi diferite pentru puncte diferite.
Parametrul c specifica culoarea marcajelor si poate lua una din cele opt culori
folosite si la functia plot. Daca c este vector, atunci trebuie sa aiba aceeasi lungime
cu ceilalti parametri de tip vector, caz n care se pot specifica culorile fiecarui marcaj
n parte.
Parametrul m permite nlocuirea marcajului implicit (cerculet), prin marcajul precizat prin m.
Prezenta optiunii filled atrage dupa sine umbrirea interiorului marcajului.
Remarcam faptul ca se poate folosi cu succes functia plot, daca se foloseste un
singur tip de marcaj.
Functia scatter3
Sistemul Matlab este prevazut cu functia scatter3 pentru reprezentarea norului
statistic n cazul tridimensional. Apelul functiei se face cu aceleasi instructiuni ca si
n cazul functiei scatter, doar ca se mai insereaza nca un parametru z, a treia
dimensiune, dupa primii doi parametri x si y.
144
Statistica descriptiva
Functia gscatter
Statistics toolbox dispune de functia gscatter pentru reprezentarea norului statistic n cazul bidimensional pe grupe de puncte. Apelul functiei se face prin:
gscatter(x,y,g)
gscatter(x,y,s)
gscatter(x,y,c,m,s)
gscatter(x,y,c,m,s,leg)
gscatter(x,y,c,m,s,leg,xl,yl)
Efectul executarii unei astfel de instructinui este producerea norului statistic precizat
prin vectorii x si y, care au aceeasi lungime, folosind gruparea specificata prin vectorul g de aceeasi lungime. Punctele norului vor fi marcate la fel pentru valori identice
corespunzatoare ale lui g.
Parametrul c specifica culorile marcajelor si are valoarea implicita data
prinbgrcmyk.
Parametrul optional m este un tablou de tip caractere recunoscute de functia
plot, valoarea implicita fiind caracterul . (punct).
Parmetrul s specifica marimea marcajelor punctelor norului. Acesta poate sa fie
un scalar, n care caz toate marcajele vor avea aceleasi marimi sau poate sa fie un
vector.
Daca nu sunt specificate valori suficiente pentru toate grupele, sistemul Matlab
efectueaza o ciclare a valorilor specificate.
Parametrul leg precizeaza daca se doreste afisarea unei legende (implicit acesta
este on), sau nu se doreste legenda, cand se va specifica valoarea off.
Parametrii xl si yl precizeaza etichetele pentru cele doua axe de coordoante. Daca acesti parametri lipsesc, sistemul Matlab eticheteaza axele de coordoante cu denumirile variabilelor x si respectiv y.
Programul 3.2.39. Programul ce urmeaza genereaza n vectori aleatori ce urmeaza
legea normala bidimensionala si n numere aleatoare ce urmeaza legea uniforma discreta. Folosind aceste date, se va reprezenta norul vectorilor aleatori bidimensionali,
efectuand gruparea conform numerelor aleatoare uniforme generate.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N(parametrul legii uniforme):);
n=input(n=); X=mvnrnd(mu,v,n);
x=X(:,1); y=X(:,2); g=unidrnd(N,n,1);
gscatter(x,y,g,k,o*.+)
145
2 -1
si N=4, se obtine Figura 3.8.
-1 3
1
2
3
4
13
12
11
10
6
x
Functia plotmatrix
Sistemul de baza Matlab contine functia plotmatrix, care reprezinta pe aceeasi
figura mai multi nori statistici. Formele de apel ale functiei sunt
plotmatrix(x)
plotmatrix(x,y)
plotmatrix(x,y,s)
unde x si y sunt matrice cu aceleasi numar de linii, dar numarul coloanelor poate fi
diferit, fie acesta m si respectiv n. Executarea unei instructini de acest tip, produce
m n nori statistici, pentru fiecare coloana a matricei x cu fiecare coloana a matricei
y, cu marcajele specificate prin parametrul optional s, care are sintaxa de la functia
plot.
Prima forma este echivalenta cu
plotmatrix(x,x)
146
Statistica descriptiva
clear, mu(1)=input(m1=);
mu(2)=input(m2=); mu(3)=input(m3=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(3,3)=input(sigma32=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
v(1,3)=input(Cov(X,Z)=); v(3,1) =v(1,3);
v(2,3)=input(Cov(Y,Z)=); v(3,2) =v(1,3);
N=input(N=); X=mvnrnd(mu,v,N);
plotmatrix(X,o)
2 -1 1
-1 3 0
1
0 1
se obtine Figura 3.9.
10
8
6
4
15
10
5
18
16
14
12
0
10
10
15
10
15
20
Functia gplotmatrix
Statistics toolbox contine functia gplotmatrix, care are n principal acelasi efect
ca si functia plotmatrix, avand nsa posibilitatea afisa rii punctelor norului statisitic n functie de grupele la care apartin.
Formele de apel sunt cele de la functia gscatter, doar ca x si y, n acest caz,
sunt matrice cu acelasi numar de linii, iar numarul coloanelor putand fi diferite.
147
n urma careia se produce o fereastra grafica interactiva (demonstrativa) privind generarea numerelor aleatoare si ilustrarea acestora cu ajutorul histogramelor.
Fixarea (stabilirea) legii de probabilitate n scop demonstrativ se face prin alegerea din meniul legilor de probabilitate situat n partea stanga sus a ferestrei.
Volumul numerelor aleatoare, ce urmeaza a fi generate, se precizeaza prin introducerea acestuia n fereastra din partea dreapta sus.
Pentru stabilirea valorilor parametrilor legii de probabilitate considerate se poate
proceda n doua moduri. Fie prin introducerea n ferestrele corespunzatoare ale valorilor dorite, fie prin deplasarea barelor atasate acestora. In plus, limite pentru parametrii legii de probabilitate considerate pot fi precizate prin introducerea acestora n
ferestrele considerate.
Activarea butonului output are ca efect salvarea numerelor aleatoare curente n
varaibila ans sau n variabila precizata de utilizator, iar butonul resample permite
repetarea generarii de numere aleatoare cu acelasi volum si aceeasi parametri.
unde x este un vector avand componentele pozitive si normalizate, adica astfel ncat
suma acestora sa fie 1. Daca suma acestora va fi mai mica decat 1, atunci numai o
parte a cercului va fi reprezentata grafic.
Parametrul ex este optional si specifica sectoarele de cerc ce urmeaza sa fie
detasate pe figura, acesta, daca este prezent, trebuie sa fie un vector numeric de
aceeasi lungime cu vectorul x.
Parametrul optional label, specifica etichetele sectoarele de cerc, acesta, daca
este prezent, trebuie sa fie un vector de aceeasi lungime cu vectorul x, dar care contin
numai siruri de caractere.
Programul 3.2.41. Programul
ce urmeaza genereaza n numere aleatoare ce urmeaza
legea uniforma discreta
, construies te tabelul sistematizat, dupa care reprezinta
datele sistematizate folosind functiile pie si pie3.
n=input(n=); N=input(N=);
x=unidrnd(N,1,n);
t=tabulate(x); d=length(t(:,3));
148
Statistica descriptiva
ex=zeros(1,d); ex(1)=1;
subplot(2,1,1), pie(t(:,3)/100,ex)
subplot(2,1,2), pie3(t(:,3)/100,ex)
colormap summer
Prin executia acestui program, cu datele n=50 si N=4, se obtin reprezentarile grafice
din Figura 3.10.
28%
32%
28%
32%
22%
18%
22%
18%
, relative la caracteristica
, din
este
149
log
Observatia 3.3.5. Intre cele trei medii definite mai nainte exista relatiile cunoscute
.
150
Statistica descriptiva
daca
daca
.
,
Observatia 3.3.8. Cand datele statistice sunt grupate, atunci se determina prima data
intervalul median astfelncat pentru
frecventele cumulate si sa fie
satisfacute inegalitatile
si . Folosind apoi interpolarea liniara se
ia ca mediana
.
si are ca efect calculul medianei pentru componentele vectorului x, iar daca x este
matrice, atunci operatia se executa pentru fiecare coloana a matricei. Prin urmare, n
acest ultim caz, rezultatul este un vector avand atatea componente cate coloane are
matricea x.
dupa ce s-a
ncat sa aiba loc
determinat
intervalul cuartilic inferior , astfel
si ,respectiv intervalul cuartilic superior , astfel ncat
si
151
si
.
,
unde
,
. Formula
se obtine
cu
usor daca se intersecteaza interpolantul liniar al punctelor
interpolantul liniar al punctelor ,
.
Cand caracteristica cercetata este de tip discret, avem ca
152
Statistica descriptiva
Definitia 3.3.17. Numim abatere cuartilica (interval intercuartilic) a distributiei statistice a lui
a dintre cuartila superioara si cuartila inferioara, adica
, diferent
.
diferenta
Observatia 3.3.18. Mai ntalnim, n aplicatii, variatia intercuartilica data prin formula
Observatia 3.3.19. Daca
, atunci distributia se considera intens concentrata, iar n caz contrar, intens dispersata.
unde
.
, valoa-
al distributiei statistice
, va-
153
Observatia 3.3.24. Se observa ca pentru calculul dispersiei ar fi necesar sa fie parcurse datele statistice de doua ori, odata pentru calculul mediei aritmetice , iar apoi
pentru calculul lui , care foloseste pe . Prezentam o metoda pentru calculul dispersiei printr-o singura parcurgere a datelor statistice.
Pentru aceasta introducem notatiile
si
ce trebuie aratat.
, iar . Prin urmare formula de recurenta de
Observam ca
la punctul precedent permite calculul lui odata cu calculul lui , deci printr-o
parcurgere a datelor statistice.
Algoritmul de calcul poate fi descris prin urmatoarele etape:
1.
,
.
2. Pentru
3.
;
,
.
154
Statistica descriptiva
, raportul
care de regula se exprima n procente (
).
, iar daca
Observat
lui Yule satisface relatiile
ia 3.3.28.
Coeficientul
( ), atunci
, n caz contrar
.
(3.3.1)
(skewness)
(kurtosis)
(coeficient de asimetrie)
,
Definitia 3.3.30. Numim coeficienti ai lui Fisher relativ la distributia statistica a lui
, valorile numerice
(3.3.2)
(asimetria)
(excesul)
Observatia 3.3.31. Pentru curba lui Gauss avem ca
, deci
. Cand
, maximul curbei distributiei este deplasat spre dreapta n raport cu valoarea
medie, iar cand , maximul este deplasat spre stanga.
155
pentru curba lui Gauss avem ca
, deci
. Astfel, daca
De asemenea,
atunci
curba
distribut
iei
este
mai
ngustat
a
dec
a
t
curba
lui Gauss,
distributia numindu-se leptocurtica. Daca
curba
distribut
iei este
w
x
x
wx
Forma a treia pentru var, cand parametrul optional 1 este prezent, are ca efect
calculul lui v dupa formula momentului centrat de ordinul 2.
In toate cazurile, daca x este matrice, se opereaza pe fiecare coloana n parte.
156
Statistica descriptiva
r=range(x)
iq=iqr(x)
md=mad(x)
sk=skewness(x)
k=kurtosis(x)
157
y
y
x
x
x
x
k=1
k=2
Diferentele de ordin doi pentru x sunt diferentele de ordinul ntai pentru y. Daca x
este vector, atunci parametrul k lipseste, iar operatia se executa asupra componentelor
vectorului.
158
Statistica descriptiva
Avand n vedere ca
159
Mediana, care se obtine dupa ordonarea crescatoare a datelor statistice. Anume, avem
ca
Datele statistice dublu ncadrate fiind la mijlocul acestei ordonari (numar par de date
statistice) obtinem mediana ca fiind
Cuartila inferioara se obtine din aceeasi ordonare a datelor statistice, luand data
statistica cu numarul de ordine , prima ncadrata, adica
, iar cuartila
superioara, luand data statistica cu numarul de ordine , a doua ncadrata, adica
.
Printre parametrii statistici care masoara gradul de mprastiere i calculam pe cei
care urmeaza.
Intervalul de variatie este
Deoarece
concentrata.
Abaterea cuartila relativa este
160
Statistica descriptiva
Folosind legaturile dintre momentele obisnuite si momentele centrate se obtin acestea din urma cu formulele
(skewness)
(asimetria)
(kurtosis)
(excesul)
161
162
Statistica descriptiva
(skewness)
(kurtosis)
(asimetria)
(excesul)
Programul 3.3.33. Sa scriem un program, care sa calculeze o parte din acesti parametri statistici din exemplul precedent. Ne vom opri numai la acei parametri, care
sunt definiti prin functii Matlab, dar evident ca odata deteminati acesti parametri, se
pot calcula usor si ceilalti parametri din exemplul precedent.
load x.dat -ascii% fisierul x.dat contine datele
% primare din exemplul precedent
ma=mean(x);
fprintf(ma=
%6.4f\n,ma)
mg=geomean(x); fprintf(mg=
%6.4f\n,mg)
mh=harmmean(x); fprintf(mh=
%6.4f\n,mh)
m=median(x);
fprintf(mediana=%6.4f\n,m)
Q=prctile(x,[25,75]);
fprintf(Q1=
%6.4f\n,Q(1)),
fprintf(Q3=
%6.4f\n,Q(2))
md=mad(x);
fprintf(md=
%6.4f\n,md)
mu=moment(x,2); fprintf(mu2=
%6.4f\n,mu)
mu=moment(x,3); fprintf(mu3=
%6.4f\n,mu)
mu=moment(x,4); fprintf(mu4=
%6.4f\n,mu)
r=range(x);
fprintf(range= %6.4f\n,r)
iq=iqr(x);
fprintf(iq=
%6.4f\n,iq)
s=std(x);
fprintf(s=
%6.4f\n,s)
v=var(x);
fprintf(v=
%6.4f\n,v)
sk=skewness(x); fprintf(sk=
%6.4f\n,sk)
k=kurtosis(x); fprintf(k=
%6.4f\n,k)
2.2708
2.1725
163
mh=
2.0704
mediana=2.2430
Q1=
1.8020
Q3=
2.6410
md=
0.5277
mu2=
0.4379
mu3=
0.1156
mu4=
0.5402
range= 3.1300
iq=
0.8390
s=
0.6666
v=
0.4443
sk=
0.3988
k=
2.8164
164
Statistica descriptiva
x=normrnd(t,1);
[ma,s,fr,nume]=grpstats(x,g);
fprintf(
Mediile pe grupe \n)
disp(ma)
fprintf(
Abaterile standard pe grupe \n)
disp(s)
fprintf(
Frecventele grupelor \n)
disp(fr)
fprintf(
Etichetele grupelor \n)
disp(nume)
3.0692
3.2620
3.0223
3.0419
standard pe grupe
0.1701
0.2033
0.1793
0.2763
0.1723
0.1574
0.1670
0.1859
Frecventele
24
24
23
23
27
27
26
26
grupelor
24
23
27
26
Etichetele grupelor
1
2
3
165
In mijloacele laturilor de jos si de sus ale dreptunghiurilor sunt trasate spre exterior segmente verticale de lungimi date prin
respectiv
2 -2
si
-2 3
166
Statistica descriptiva
14
13
12
Valorile variabilelor
11
10
2
Numarul variabilelor
..
.
..
.
..
.
..
.
..
.
i
tele statistice primare sunt
, care dupa grupare sunt prezentate n
Tabelul de corelatie 3.2. unde reprezinta frecventa absoluta a clasei
. De
asemenea, avem ca
al distributiei statistice a carac-
unde
167
.
al distributiei statistice
unde
Definitia 3.4.4. Numim coeficient de corelatie (al lui Pearson) al distributiei statis
tice bidimensionale , raportul
Observatia 3.4.5. Folosind datele statistice negrupate avem formulele de calcul pentru coeficientul de corelatie
sau
168
Statistica descriptiva
Obtinem astfel ca
cm
kg
169
Covarianta dintre si
Cov
se calculeaza cu formula
170
Statistica descriptiva
vy= 3.35188
cov=2.56323
r= 0.753374
n
171
unde
care se nmulteste cu
. Astfel se obtine
si se nsumeaza dupa
si le nsumam dupa
172
Statistica descriptiva
, atunci
Observatia 3.4.15. Cand
, prin urmare
, ceea ce nseamna absenta dependentei n medie. Pe de
alta parte,
cand
,
, adica pentru fiecare clasa valorile
caracteristicii sunt aceleasi.
se obtine ca
deci
Aplicatia 3.4.16. (Determinarea curbelor de regresie). Prezentam n continuare metoda celor mai mici patrate pentru determinarea ecuatiilor curbelor de regresie.
,
, curba de
Presupunem ca din reprezentarea n plan a punctelor
. Vom
regresie a lui n raport cu
este
de forma
determina parametrii
, astfel ncat
sa fie minima.
173
Punctul de minim
lui normal de ecuatii, rezultat din
pentru
al functiei
.
Aplicatia 3.4.17. (Drepte de regresie). Consideram cazul liniar, adica ecuatia curbei
de regresie este
. Expresia minimizata este
sau
n raport cu ca fiind
174
Statistica descriptiva
In mod analog se ajunge la ecuatia dreptei de regresie a lui n raport cu
(3.4.1)
, atunci
Se arata ca unghiul
meaza
3.
,
;
luand
6.
7.
8.
175
e
sau
,
, luand
ln
, luand
ln
;
e si
Aceasta ultima legatura este un caz particular al legaturii logistice definita prin
,
si
In mod analog se obtin valorile medii conditionate si dispersiile conditionate ale lui
in raport cu .
Aceste valori calculate sunt trecute n tabelele urmatoare.
176
Statistica descriptiva
si
n raport cu va fi
unde
de unde
In mod analog,
177
unde
adica
este
fata de este
Avand n vedere ca
avem ecuatiile
178
Statistica descriptiva
tg
de unde
tg
adica
rad.
Programul 3.4.20. Calculele de mai sus se pot face cu programul Matlab, care urmeaza:
f=[1,1,3,1,zeros(1,8);
0,3,4,1,0,1,zeros(1,6);
1,4,5,7,1,2,1,zeros(1,5);
0,1,2,6,9,6,4,1,zeros(1,4);
zeros(1,2),1,7,36,17,6,2,1,zeros(1,3);
zeros(1,2),1,6,27,56,39,18,4,1,zeros(1,2);
zeros(1,3),2,10,16,26,7,2,1,zeros(1,2);
zeros(1,4),1,7,10,11,6,2,1,0;
zeros(1,5),1,2,4,7,3,1,0; zeros(1,6),1,2,3,1,1,0;
zeros(1,8),1,2,2,1; zeros(1,9),1,2,1];
x=[126:137]; y=[24:35]; fx=sum(f); fy=sum(f);
xa=sum(fx.*x)/(sum(fx)); ya=sum(fy.*y)/(sum(fy));
vx=(sum(fx.*x.2)-(sum(fx.*x))2/sum(fx))/sum(fx);
vy=(sum(fy.*y.2)-(sum(fy.*y))2/sum(fy))/sum(fy);
cov=(x*f*y-sum(fx.*x)*sum(fy.*y)/sum(fx))/sum(fx);
r=cov/(sqrt(vx*vy));
yb=f*y./fx; xb=f*x./fy;
for i=1:12
syb(i)=f(i,:)*(y-yb(i)).2/fx(i);
end
for j=1:12
sxb(j)=f(:,j)*(x-xb(j)).2/fy(j);
end
syx=sum(fx.*syb)/sum(fx);
179
sxy=sum(fy.*sxb)/sum(fx);
syxb=sum(fx.*(yb-ya).2)/sum(fx);
sxyb=sum(fy.*(xb-xa).2)/sum(fx);
eyx=sqrt(syxb/vy); exy=sqrt(sxyb/vx);
ayx=r*sqrt(vy/vx); axy=r*sqrt(vx/vy);
tang=(1-r2)/r2*sqrt(vx*vy)/(vx+vy);
arctan=atan(tang); arc=180*arctan/pi;
fprintf( i | yb
| syb
|
j |
xb
| sxb\n)
for i=1:12
fprintf(%3d |%6.2f |%6.3f |%7d |%6.3f |%6.3f\n,...
i,yb(i),syb(i),i,xb(i),sxb(i))
end
fprintf(\n syx=%8.5f, sxy=%8.5f,syx,sxy)
fprintf(\n eyx=%8.6f, exy=%8.6f,eyx,exy)
fprintf(\n ayx=%8.6f, axy=%8.6f,ayx,axy)
fprintf(\n tg=%9.3f, alpha=%6.0f,tang,arc)
|
|
|
|
|
|
|
|
|
|
|
|
|
yb
25.67
26.11
26.62
28.14
28.43
29.32
29.56
30.63
31.67
31.88
33.50
34.00
|
|
|
|
|
|
|
|
|
|
|
|
|
syb
0.889
1.432
2.141
1.843
1.045
1.363
1.340
1.706
1.444
1.359
0.917
0.500
syx= 1.39279,
eyx=0.764509,
ayx=0.742203,
tg=
0.381,
|
|
|
|
|
|
|
|
|
|
|
|
|
j
1
2
3
4
5
6
7
8
9
10
11
12
|
xb
|127.000
|127.556
|127.813
|129.433
|130.464
|130.943
|131.438
|132.000
|133.125
|134.091
|135.429
|136.500
|
|
|
|
|
|
|
|
|
|
|
|
|
sxb
1.000
0.691
1.902
2.112
0.844
1.204
1.280
1.778
2.276
2.992
1.959
0.250
sxy= 1.40291
exy=0.770568
axy=0.764713
alpha=
21
Functia cov calculeaza matricea covariantelor pentru matricea x, unde fiecare coloana este considerata a fi o variabila:
C
x
x x
x
180
Statistica descriptiva
Daca x este vector este returnata varianta vectorului, caz n care se poate folosi si parametrul optional y, care este vector de aceeasi dimensiune cu x, cand este calculata
covarianta dintre x si y, pe langa variantele lui x respectiv y, adica
x x y y
Prin urmare, n acest caz, cov(x,y) produce acelasi rezultat ca si cov([x y]).
Remarcam faptul ca instructiunea diag(cov(x)) genereaza vectorul variantelor
fiecarei coloane a matricei x, iar sqrt(diag(cov(x))) este vectorul abaterilor standard pentru fiecare coloana a matricei x.
Functia corrcoef calculeaza matricea coeficientilor de corelatie pentru matricea x, unde fiecare coloana este considerata o variabila:
r
CC C
Programul 3.4.21. Programul urmator genereaza n vectori aleatori, care urmeaza legea normala bidimensionala, n matricea X de tipul n 2, dupa care, folosind functiile
cov si corrcoef, calculeaza matricele covariantelor si a coeficientilor de corelatie,
pentru cele doua coloane ale matricei X.
clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); X=mvnrnd(mu,v,n);
v=cov(X); r=corrcoef(X);
fprintf(Matricea covariantelor\n), disp(v)
fprintf(Matricea coeficientilor de corelatie\n), disp(r)
5 4
si
4 4
181
m
182
Statistica descriptiva
ma=mean(Z); s=std(Z);r=corrcoef([X,Y]);
m=s(2)/(r(1,2)*s(1)); n=ma(2)-m*ma(1);
plot(X,Y,.), lsline, refline(m,n)
text(ma(1),ma(2),o Centrul de greutate)
1
-0.8
se obtin grafi-0.8
1
o Centrul de greutate
3
2
1.5
0.5
0.5
1.5
183
p x
px
p
daca p are
componente.
Functia poly calculeaza coeficientii polinomului caracteristic al matricei patratice a:
iar cand a este un vector calculeaza coeficientii polinomului care are ca radacini
elementele vectorului, adica ai lui
184
Statistica descriptiva
clf, clear, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=Z(:,2); p=polyfit(X,Y.3,3);
scatter(X,Y.3,7,filled), hold on,
m=mu(1); s=sqrt(v(1,1));
x=m-3*s:0.01:m+3*s;
y=polyval(p,x); plot(x,y)
1
-0.9
se obtine grafi-0.9
1
10
10
15
20
25
3
185
unde numef reprezinta numele functiei, care defineste legatura cautata dintre variabila dependenta, cu valorile continute de vectorul coloana y, variabilele independente, cu valorile continute n coloanele matricei x. Matricea x trebuie sa aiba acelasi
numar de linii ca si lungimea vectorului y.
Parametrul a0 reprezinta valorile de pornire (initiale) ale parametrilor a, care
urmeaza sa fie calculati.
Functia numef poate fi o functie Matlab proprie, care are linia de definitie
function z=numef(a,x)
beaX
186
Statistica descriptiva
clf, mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
N=input(N=); Z=mvnrnd(mu,v,N);
X=Z(:,1); Y=exp(Z(:,2));
a=nlinfit(X,Y,expo,[1,1]);
p=polyfit(X,log(Y),1);
a1=p(1); b1=exp(p(2));
scatter(X,Y,7,filled), hold on
m=mu(1); s=sqrt(v(1,1));
x=m-3*s:0.01:m+3*s;
y=expo(a,x); y1=b1*exp(a1*x);
plot(x,y,-,x,y1,--)
1
-0.9
se obtin
-0.9
1
10
0
3
187
In urma lansarii se produce un grafic interactiv (demonstrativ) privind ajustarea datelor continute n vectorul coloana y si matricea x, avand tipul legaturii precizat prin
parametrul numef, care poate fi o functie Matlab proprie.
Pe figura este reprezentat graficul de ajustare (cu linie continua).
Prin introducerea valorii unui argument n fereastra de jos sau prin deplasarea
dreptei verticale pe pozitia abscisei , pe axa ordonatelor se obtine valoarea cores
punzatoare pentru .
Elementele obtinute, prin lansarea acestei functii, pot fi salvate n spatiul de lucru,
workspace, partial sau n totalitate, prin utilizarea butonului export.
Pe langa aceste elemente, graficul demonstrativ contine si alte elemente, care
se refera la notiuni ce urmeaza a fi prezentate n capitolele ce urmeaza, cum ar fi
intervale de ncredere.
Definit
ia 3.4.25. Fie ,
, rangurile datelor statistice primare
,
, obtinute prin ordonarea crescatoare dupa prima, respectiv a
doua componenta. Numim coeficient de corelatie al rangurilor sau coeficientul lui
Spearman, valoarea numerica
unde si sunt noile caracteristici care definesc rangurile datelor statistice, res
pectiv pentru si .
Proprietatea 3.4.26. Daca notam
diferenta rangurilor aceluiasi
individ, atunci
Deoarece
si
, rezulta ca
188
Statistica descriptiva
adica
cele
sunt
189
Observatia 3.4.29. Cand exista doua sau mai multe date statistice primare care au
aceeasi valoare, atunci rangurile acestora se considera toate egale (ex-aequo) cu media aritmetica a rangurilor pe care le ocupa aceste date n ordonarea crescatoare.
corespunzator vom face modificarea lui .
Daca n ordonarea dupa caracteristica avem grupe de date statistice care
coincid, fiecare grupa continand
, date statistice si daca n ordonarea dupa
caracteristica
avem grupe de date statistice ce coincid, fiecare grupa continand
, date statistice, atunci se modifica dupa cum urmeaza
unde
si
sign
unde
.
deci
.
Valoarea minima a lui se obtine cand este minim,
pentru fiecare
, caz n care
deci
.
,
190
Statistica descriptiva
cele
doua
sunt
componenta. Fie aceasta
calculeaza apoi numarul
, cu
sign
Se
obtinandu-se astfel .
Remarcam de asemenea ca toate formulele relative la coeficientul lui Kendall
raman adevarate dac
a se lucreaza cu rangurile , corespunzatoare datelor statis
,
tice primare
, asa cum s-au introdus pentru definirea coeficientului
lui Spearman.
Observatia 3.4.34. Cand n cele doua clasamente sunt valori egale (ex-aequo) se
procedeaza ca la Observatia 3.4.29, adica se nlocuiesc toate rangurile pentru valorile
egale prin media aritmetic
a a rangurilor pe care le ocupa n ordonare. Corespunzator
se face modificarea lui prin formula
unde
si
cu
definiti la
Observatia 3.4.29. Pentru calculul lui pentru fiecare pereche ex-aequo valoarea lui
ramane neschimbata.
Exemplul 3.4.35. Echipele diviziei nationale de fotbal sunt clasificate dupa numarul
n primele
de goluri primite si dupa numarul cartonaselor galbene primite
meciuri ale campionatului. Datele statistice sunt trecute n tabelul urmator
Echipa
E E E E E E E E E E E E E E E E E E
15 13 10 13 12 11 16 11 13
10
14
15
10
11
13 9 11 11 12 8
10
11
10
13
14
Sa calculam coeficientii lui Spearman respectiv al lui Kendall. Pentru aceasta ordonam crescator echipele dupa caracteristica , dupa care folosind regula ex-aequo
stabilim rangurile datelor statistice.
Calculele sunt efectuate n tabelul urmator.
191
Echipa
E
E
E
E
8
9
9
9
10
10
10
11
11
11
12
13
13
13
14
15
15
16
E
E
E
E
E
E
E
E
E
E
E
E
E
E
Rang
5
8
9
10
11
8
13
8
6
14
12
9
11
9
10
13
11
7
1
3
3
3
6
6
6
9
9
9
11
13
13
13
15
16.5
16.5
18
Rang
1
5
8
10.5
13
5
16.5
5
2
18
15
8
13
8
10.5
16.5
13
3
0
2
5
7.5
7
1
10.5
4
7
9
4
5
0
5
4.5
0
3.5
15
0
4
25
56.25
49
1
110.25
16
49
81
16
25
0
25
20.25
0
12.25
225
0
2
4
6
7
2
9
2
0
8
6
1
3
1
1
2
1
0
17
12
9
7
4
9
1
8
9
0
1
4
1
3
2
0
0
0
715
55
87
Total
. Avem astfel
192
Statistica descriptiva
Programul 3.4.36. Programul Matlab, care urmeaza, calculeaza cei doi coeficienti,
Spearman si Kendall, fara tratarea cazurilor ex-aequo.
x=[15,13,10,13,12,11,16,11,13,9,10,14,15,9,8,9,10,11];
y=[13,9,11,11,12,8,7,6,9,8,8,10,11,9,5,10,13,14];
[xord,ind]=sort(x); [yord,jnd]=sort(y);
for i=1:18
rx(ind(i))=i; ry(jnd(i))=i;
end
d=abs(rx-ry); d2=d.2;
sp=1-6*sum(d2)/18/(182-1);
ke=0;
for i=1:18
for j=1:18
if i<j
ke=ke+sign((rx(i)-rx(j))*(ry(i)-ry(j)));
end
end
end
ke=2*ke/(18*17);
fprintf( x |
y |rang(x)|rang(y)|
d | d2 \n)
for i=1:18
fprintf(%3d |%4d |%5d |%5d |%4d |%4d\n,...
x(i),y(i),rx(i),ry(i),d(i),d2(i))
end
fprintf(\n sp=%5.3f,
ke=%5.3f,sp,ke)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y
13
9
11
11
12
8
7
6
9
8
8
10
11
9
5
10
13
14
sp=0.269,
|rang(x)|rang(y)|
|
16 |
16 |
|
12 |
7 |
|
5 |
12 |
|
13 |
13 |
|
11 |
15 |
|
8 |
4 |
|
18 |
3 |
|
9 |
2 |
|
14 |
8 |
|
2 |
5 |
|
6 |
6 |
|
15 |
10 |
|
17 |
14 |
|
3 |
9 |
|
1 |
1 |
|
4 |
11 |
|
7 |
17 |
|
10 |
18 |
ke=0.203
d
0
5
7
0
4
4
15
7
6
3
0
5
3
6
0
7
10
8
| d2
|
0
| 25
| 49
|
0
| 16
| 16
| 225
| 49
| 36
|
9
|
0
| 25
|
9
| 36
|
0
| 49
| 100
| 64
193
Daca se ia
iar
Daca se ia
astfel ca
sign
se obtine coeficientul
al lui Kendall.
sign
194
Statistica descriptiva
cu matricea
unde
Cand cele clasamente sunt identice, deci coloanele din matricea ranguri
lor sunt identice, totalurile
formeaza o permutare a elementelor
prin urmare
.
Cand
atunci se obtine valoarea minima
avem independenta ntre caracteristicile cercetate.
, caz n care
195
unde
196
Statistica descriptiva
Programul 3.4.42. Un program Matlab, care efectueaza aceste calcule, este prezentat n continuare
x=[332,428,354,1437;293,559,388,1527;372,767,562,1948;
406,563,341,1509;386,608,396,1501;438,843,689,2345;
534,660,367,1620;460,699,483,1856;385,789,621,2366;
655,776,423,1848;584,995,548,2056;515,1097,887,2630];
N=12; p=4;
[x1,i1]=sort(x(:,1)); [x2,i2]=sort(x(:,2));
[x3,i3]=sort(x(:,3)); [x4,i4]=sort(x(:,4));
for i=1:12
r1(i1(i))=i; r2(i2(i))=i; r3(i3(i))=i; r4(i4(i))=i;
end
r=[r1,r2,r3,r4]; sb=sum((sum(r)-sum(sum(r))/12).2);
w=12*sb/(p2*(N3-N));
fprintf(
Matricea rangurilor\n)
for i=1:12
fprintf(%6d |%3d |%3d |%3d\n,r1(i),r2(i),r3(i),r4(i))
end
fprintf(\n
w=%5.3f,w)
rangurilor
| 2 | 1
| 4 | 4
| 9 | 8
| 1 | 3
| 5 | 2
| 11 | 10
| 3 | 5
| 7 | 7
| 10 | 11
| 6 | 6
| 8 | 9
| 12 | 12
w=0.735
Capitolul 4
Teoria selectiei
Studiul statistic al unei colectivitat i din punct de vedere al uneia sau mai multor caracteristici prin considerarea tuturor indivizilor colectivitatii de multe ori este
imposibil de efectuat sau foarte costisitor. Daca ne gandim, de exemplu, la studiul calitatii produselor unei fabrici de conserve, ne dam seama ca nu are sens considerarea
tuturor acestor produse pentru efectuarea controlului, ceea ce ar duce la distrugerea
ntregii productii. De asemenea, daca se are n vedere recensamantul populatiei unei
ta ri, ne dam seama de costul ridicat al acestei operatii, motiv pentru care astfel de
recensaminte sunt destul de rare.
Si numai din cele doua exemple amintite nainte, ne dam seama ca ar fi potrivit
ca sa fie considerata pentru studiu numai o parte a colectivitat ii cercetate, iar apoi
rezultatele obtinute relative la aceasta parte sa fie extinse la ntreaga colectivitate.
198
Teoria selectiei
selectie tipica, cand, cunoscandu-se informatii anterioare referitoare la colectivitate, sunt considerati indivizi cu valori medii apropiate de valoarea medie a
ntregii colectivitat i;
selectie stratificata, cand colectivitatea este clasificata (stratificata) dupa anumite criterii, cunoscanduse proportia indivizilor pentru fiecare strat. Esantionul se ia astfel ncat sa fie respectate aceste proportii pentru fiecare strat.
unde
este o functie masurabila, iar
numeste valoarea functiei de selectie.
se
199
iar
si
si dis-
Demonstratie. Folosind proprietat ile valorii medii si ale dispersiei si avand n vedere
ca selectia este repetata avem succesiv
si dis-
, iar cand urmeaza
converge n repartitie la legea normala
, cand
legea normala
afirmatia are loc pentru orice valoare a lui .
200
Teoria selectiei
Functia 4.2.8. Pentru ilustrarea proprietat ii precedente, scriem o functie Matlab, care
genereaza o matrice de tipul (n,m), ale carei elemente sunt numere aleatoare ce urmeaza o lege de probabilitate precizata. Pentru fiecare coloana a matricei generate, se
calculeaza valoarea zn , folosind formula (4.2.1), dupa care se reprezinta grafic histo .
grama valorilor zn , mpreuna cu densitatea de probabilitate a legii normale
function hist2(n,m,lege)
% Comportare asimptotica a mediei de selectie
% lege - legea de probabilitate
% (n,m) - tipul matricei generate
switch lege
case unid
N=input(N=);
X=unidrnd(N,n,m); [med,var]=unidstat(N);
case bino
nn=input(n=); p=input(p=);
X=binornd(nn,p,n,m); [med,var]=binostat(nn,p);
case hyge
M=input(M=); K=input(K=); nn=input(n=);
X=hygernd(M,K,nn,n,m); [med,var]=hygestat(M,K,nn);
case poiss
la=input(lambda=);
X=poissrnd(la,n,m); [med,var]=poisstat(la);
case nbin
r=input(r=); p=input(p=);
X=nbinrnd(r,p,n,m); [med,var]=nbinstat(r,p);
case geo
p=input(p=);
X=geornd(p,n,m); [med,var]=geostat(p);
case unif
a=input(a:); b=input(b(a<b):);
X=unifrnd(a,b,n,m); [med,var]=unifstat(a,b);
case norm
mu=input(mu=); s=input(sigma=);
X=normrnd(mu,s,n,m); [med,var]=normstat(mu,s);
case logn
mu=input(mu=); s=input(sigma=);
X=lognrnd(mu,s,n,m); [med,var]=lognstat(mu,s);
case gam
a=input(a=); b=input(b=);
X=gamrnd(a,b,n,m); [med,var]=gamstat(a,b);
case exp
mu=input(mu=);
X=exprnd(mu,n,m); [med,var]=expstat(mu);
case beta
a=input(a=); b=input(b=);
X=betarnd(a,b,n,m); [med,var]=betastat(a,b);
case weib
a=input(a=); b=input(b=);
201
X=weibrnd(a,b,n,m); [med,var]=weibstat(a,b);
case rayl
b=input(b=);
X=raylrnd(b,n,m); [med,var]=raylstat(b);
case t
nn=input(n=);
X=trnd(nn,n,m); [med,var]=tstat(nn);
case chi2
nn=input(n=);
X=chi2rnd(nn,n,m); [med,var]=chi2stat(nn);
case f
mm=input(m=); nn=input(n=);
X=frnd(mm,nn,n,m); [med,var]=fstat(mm,nn);
otherwise
error(Lege necunoscuta)
end
Z=mean(X); Z=(Z-med)/sqrt(var/n);
hist(Z,fix(1+10/3*log10(m)), hold on
x=-3:0.01:3; f=normpdf(x,0,1);
plot(x,f,k-), colormap spring
unde valorile pentru n, m si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>hist2(25,35,unif)
are ca efect apelul functiei pentru legea uniforma, iar pe ecran se va cere introducerea
parametrilor a si b (a b), dupa care pe ecran va fi reprezentat graficul din Figura 4.1,
n cazul n care a=-1 si b=1. Sa remarcam totusi ca la un nou apel, cu aceeasi
parametri, graficul difera, deoarece sunt generate alte numere aleatoare.
iar
functia de selectie
Proprietatea
4.2.11. Fie
caracteristica
ordin ,
, atunci
si
.
202
Teoria selectiei
12
10
0
3
, avem ca
.
203
iar
functia de selectie
unde
si
, si de asemenea
unde
204
Teoria selectiei
Pe de alta parte avem ca
apoi
deoarece
avem
, pentru orice
,
.
Calculam pe rand termenii din membrul drept al aceste relatii. Astfel avem
de unde se obtine
. Pentru aceasta avem
Termenii lui
ca factor pe
205
deoarece
, cand
.
Asadar
deci
, caz n care
, deci
adica
, avem ca statisticile si sunt necorelate
Deoarece
, iar daca are distributia simetrica ( ), atunci si sunt
pentru
necorelate pentru orice .
206
Teoria selectiei
De asemenea se poate arata ca statistica
, cand
iar valoarea numerica
(4.2.2)
Ca urmare avem ca
Proprietatea 4.2.18.
Fie caracteristica
retic
, deci au loc egalita-
207
. Astfel din inegalitatea lui Sch
sau
In cazul
, se calculeaza direct
208
Teoria selectiei
ln atunci urmeaza aproximativ legea normala
, avem densitatea de probabilitate a lui exprimata prin
In cazul particular
a
ln si dac
.
iar statistica
(4.2.3)
urmeaza legea Student cu
grade de libertate.
Programul 4.2.22. Vom scrie un program, care genereaza de N ori cate n vectori
aleatori, ce urmeaza legea normala bidimensionala, avand coeficientul de corelatie
dintre cele doua componente nul, adica r=0. Folosind aceste date se vor calcula
N numere aleatoare dupa regula precizata prin statistica (4.2.3), iar histograma corespunzatoare acestor noi date va fi reprezentata grafic mpreuna cu densitatea de
probabilitate a legii Student cu n-2 grade de libertate.
clear,clf,
mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=0; v(2,1)=0;
209
n=input(n=); N=input(N=);
for k=1:N
Z=mvnrnd(mu,v,n); r=corrcoef(Z); r12=r(1,2);
t(k)=sqrt(n-2)*r12/sqrt(1-r122);
end
x=-3:0.01:3; f=tpdf(x,n-2);
nn=fix(1+10/3*log10(N));
[fr,cl]=hist(t,nn); h=cl(2)-cl(1);
bar(cl,fr/(h*N),1),hold on, plot(x,f,k-)
colormap spring
2 0
se obtin graficele din Figura 4.2.
0 3
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
3
.
210
Teoria selectiei
,
Variabilele aleatoare
adica faptul ca
care legea normala
.
Proprietatea 4.2.24. Fie caracteristica , ce urmeaza legea normala
si va
riabilele de selectie
, ce corespund unei selectii repetate de volum ,
atunci statisticile
si respec-
211
si
si
Proprietatea 4.2.25. Fie caracteristica , ce urmeaza legea normala
variabilele de selectie
, ce corespund unei selectii repetate de volum , atunci statisticile
212
Teoria selectiei
care sunt variabile aleatoare independente ce urmeaza fiecare legeanormala
.
Prin aplicarea Proprietatii 4.2.24 pentru variabilele aleatoare ,
, se obtine
afirmatia facuta. Intr-adevar avem ca
si
(4.2.4)
urmeaza legea Student cu
grade de libertate.
Din teoria probabilitat ilor se stie ca raportul dintre o variabila aleatoare, ce urmeaza
legea normala
si radicalul unei variabile aleatoare ce urmeaza legea , raportata la numarul gradelor de libertate, n cazul n care cele doua variabile aleatoare
sunt independente, este o variabila aleatoare, ce urmeaza legea Student cu acelasi
numar al gradelor de libertate ca legea considerata (a se vedea legile si pre
zentate n Capitolul 2). Avand n vedere cine sunt si rezulta afirmatia din
enuntul proprietatii.
213
Programul 4.2.27. Pentru ilustrarea acestui rezultat, programul Matlab, care urmeaza, genereaz
a legea nor a o matrice de tipul (n,m) de numere aleatoare, ce urmeaz
mala
, dupa care pentru fiecare coloana a matricei generate, se construiesc
datele aleatoare conform statisticii (4.2.4). Pentru aceste date se reprezinta grafic histograma corespunzatoare, mpreuna cu densitatea de probabilitate a legii Student cu
n-1 grade de libertate.
clear,clf, mu=input(mu=); sigma=input(s=);
n=input(n=); m=input(m=);
Z=normrnd(mu,sigma,n,m);
t=(mean(Z)-mu)./sqrt(var(Z)/n);
x=-3:0.01:3; f=tpdf(x,n-1);
nn=fix(1+10/3*log10(m));
[fr,clasa]=hist(t,nn);
h=clasa(2)-clasa(1);
bar(clasa,fr/(h*m),1)
hold on, plot(x,f,k-)
colormap([.7,.7,.7])
Pentru n=15, m=100, mu=5 si sigma=2, se obtin graficele din Figura 4.3.
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
3
214
Teoria selectiei
, atunci statistica
(4.2.5)
unde
grade de libertate.
. Prin urmare
statistica
urmeaza legea normala
.
Pe de alta parte, folosind Proprietatea 4.2.25, se obtine ca statistica
cu grade de libertate, fiind suma a doua variabile
urmeaza legea
aleatoare
independente, ce urmeaza legea
grade de libertate.
cu
urmeaza legea
Student cu
grade de libertate. Mai ramane de aratat ca aceasta statistica
este chiar statistica . Intr-adevar, avem succesiv
215
i
dac
a
avem variabilele
de selectie
, ce corespund unei select
ii
repetate
de
volum
relativa
ce corespund unei
la caracteristica si variabilele
de
select
ie
selectii repetate de volum
relativa la caracteristica , atunci statistica
urmeaza legea normala
.
(4.2.6)
si
grade de libertate.
urmeaza fiecare legea
cu
si
grade de libertate.
Pe de alta parte, deoarece si sunt independente,
si
sunt indepen
dente. Din calculul probabilitat ilor (a se vedea legea f prezentata n Capitolul 2) este
cunoscut ca raportul a doua variabile aleatoare independente, ce urmeaza legea ,
raportate fiecare la numarul gradelor de libertate corespunzator, este o variabila aleatoare, ce urmeaza legea FisherSnedecor cu numarul gradelor de libertate date de
numerele gradelor de libertate ale celor doua legi . Asadar avem ca
si
grade de libertate.
216
Teoria selectiei
,
este echivalenta cu
sau cu
relatia
Comparand ultima relatie cu relatia care defineste
cuantila , se obtine relatia dintre cele doua cuantile mai sus precizata.
pe
Programul 4.2.32. Pentru ilustrarea Proprietatilor 4.2.28 si 4.2.30, vom genera doua
matrice de tipurile (n1,m) si (n2,m), ale
aror elemente
sunt numere aleatoare, ce
c
s
i
urmeaza respectiv legile normale
. Folosind cele doua matrice se vor determina, pentru fiecare pereche de coloane cu acelasi numar de ordine,
din cele doua matrice, datele construite conform definitiilor statisticilor (4.2.5) si
(4.2.6). Datele astfel obtinute se reprezinta grafic folosind histogramele corespunzatoare, mpreuna cu densitatea legii Student cu n1+n2-2 grade de libertate, respectiv
a legii FisherSnedecor cu n1-1 si n2-1 grade de libertate.
clear,clf
mu1=input(mu1=); s1=input(sigma1=);
mu2=input(mu2=); s2=input(sigma2=);
n1=input(n1=); n2=input(n2=); m=input(m=);
X1=normrnd(mu1,s1,n1,m); X2=normrnd(mu2,s2,n2,m);
t=(mean(X1)-mean(X2)-mu1+mu2);
t=t./sqrt((n1-1)*var(X1)+(n2-1)*var(X2));
t=t*sqrt((n1+n2-2)/(1/n1+1/n2));
f=(var(X1)/s12)./(var(X2)/s22);
x1=-3:0.01:3; x2=0:0.01:6;
f1=tpdf(x1,n1+n2-2); f2=fpdf(x2,n1-1,n2-1);
nn=fix(1+10/3*log10(m));
[fr1,c1]=hist(t,nn); [fr2,c2]=hist(f,nn);
h1=c1(2)-c1(1); h2=c2(2)-c2(1);
subplot(1,2,1)
bar(c1,fr1/(m*h1),1), hold on, plot(x1,f1,k-)
hold off
subplot(1,2,2)
bar(c2,fr2/(m*h2),1), hold on, plot(x2,f2,k-)
colormap([.7,.7,.7])
217
0.5
0.9
0.45
0.8
0.4
0.7
0.35
0.6
0.3
0.5
0.25
0.4
0.2
0.3
0.15
0.2
0.1
0.1
0.05
0
4
si
unde
iar
card
legea
card
daca
daca
218
Teoria selectiei
Pentru demonstratia unui rezultat fundamental al statisticii matematicii, descoperit de matematicianul rus Glivenko, vom prezenta doua leme.
Lema 4.2.35. Fie sirul de evenimente
astfel ncat
, avem .
atunci, pentru evenimentul
,
,
conduce la .
ca proprietatea are
loc pentru
Presupunem
. Din nou avem ca
sau
.
Cand sirul de evenimente este infinit, avem n vedere scrierea lui ca urmatoarea
intersectie de evenimente
adica
unde evenimentele intersectiei satisfac relatiile
219
Din calculul probabilitat ilor este cunoscuta forma tare a teoremei lui Bernoulli
sau teorema lui Borel si care o dam sub forma unei leme.
Lema 4.2.36. Se considera repetari independente ale
unui experiment. La fiecare
repetare evenimentul apare cu probabilitatea . Fie frecventa absoluta a aparitiei
evenimentului n cele repetari, atunci
Teorema 4.2.37 (Glivenko). Fie caracteristica care are functia de repartitie teoretica si fie o selectie repetata de volum relativa la caracteristica cu variabi
lele de selectie
si functia de repartitie de selectie corespunzatoare, atunci
,
card
Prin urmare este frecventa relativa a aparitiei evenimentului si conform
si
220
Teoria selectiei
1
y=k/r
xr,k
y=k/r
r,k
y=k/r
xr,k
. Se poate renunta la valoarea
, deoarece
.
Notam prin evenimentul
cand
Deoarece ,
, conform Lemei 4.2.35, rezulta ca
pentru
fiecare
nseamna
unde evenimentul
cand
, se obtine ca
si
pentru fiecare
evenimentul
, care nseamna
si
221
cand
atunci
.
Daca se considera evenimentul
cand
, care nseamna
, conform Lemei 4.2.35, avem
atunci
. In acest fel, daca
, adica
deci
si
de unde se obtine
222
Teoria selectiei
Pe de alta parte, din modul de definire a numerelor ,
de unde
si
, avem ca
de unde
Folosind cele doua inegalitati obtinute rezulta ca
, unde
de unde
, pentru orice .
, care conduce la
In final avem ca
223
cu variabilele de selectie
selectie , atunci
unde
iar
daca
daca
daca
daca
Prima forma reprezinta grafic functia de repartitie de selectie corespunzatoare datelor continute de vectorul x, caracteristici cum ar fi culoarea, tipul liniei etc. sunt
considerate implicit de sistemul Matlab. Pentru modificarea unor astfel de caracteristici, adica alegerea acestora de catre utilizator, se recomanda a doua forma, prin care
parametrul h poate fi folosit n comanda set.
224
Teoria selectiei
Parametrul stats contine, dupa executarea functiei, o parte din parametrii statsitici pentru x. Acestia sunt: valoarea minima (stats.min), valoarea maxima
(stats.max), valoarea mediei de selectie (stats.mean), valoarea medianei
(stats.median) si abaterea standard (stats.std).
Functia 4.2.42. Functia Matlab care urmeaza genereaza n numere aleatoare, care urmeaza o lege de probabilitate precizata, dupa care reprezinta grafic, pe aceeasi figura,
functia de repartitie teoretica prin linie-punct, mpreuna cu functia de repartitie de
selectie.
function compar(n,lege)
% Functie de repartitie de selectie
% lege - legea de probabilitate
% n - volumul datelor
clf
switch lege
case unid
N=input(N=);
X=unidrnd(N,n,1); [med,var]=unidstat(N);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,N);
case bino
m=input(n=); p=input(p=);
X=binornd(m,p,n,1); [med,var]=binostat(m,p);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,m,p);
case hyge
M=input(M=); K=input(K=); m=input(n=);
X=hygernd(M,K,m,n,1); [med,var]=hygestat(M,K,m);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,M,K,m);
case poiss
la=input(lambda=);
X=poissrnd(la,n,1); [med,var]=poisstat(la);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,la);
case nbin
r=input(r=); p=input(p=);
X=nbinrnd(r,p,n,1); [med,var]=nbinstat(r,p);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,r,p);
case geo
p=input(p=);
X=geornd(p,n,1); [med,var]=geostat(p);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,p);
case unif
a=input(a:); b=input(b(a<b):);
X=unifrnd(a,b,n,1); [med,var]=unifstat(a,b);
225
226
Teoria selectiei
X=frnd(m1,m2,n,1); [med,var]=fstat(m1,m2);
x=med-3*sqrt(var):0.01:med+3*sqrt(var);
f=cdf(lege,x,m1,m2);
otherwise
error(Lege necunoscuta)
end
plot(x,f,k-.), hold on, cdfplot(X), grid off
title(Functia de repartitie de selectie)
unde valorile pentru n si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>compar(25,bino)
are ca efect apelul functiei pentru legea binomiala, iar pe ecran se va cere introducerea
parametrilor n si p, dupa care pe ecran va fi reprezentat graficul din Figura 4.6, n
cazul n care n=7 si p=0.4.
Functia de repartitie de selectie
1
0.9
0.8
0.7
F(x)
0.6
0.5
0.4
0.3
0.2
0.1
0
2
Comanda
>>compar(15,norm)
are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introducerea parametrilor mu si sigma, dupa care pe ecran va fi reprezentat graficul din
Figura 4.7, n cazul n care mu=5 si sigma=2.
227
0.9
0.8
0.7
F(x)
0.6
0.5
0.4
0.3
0.2
0.1
0
2
10
12
228
Teoria selectiei
Capitolul 5
Teoria estimatiei
Relativ la colectivitatea este cercetata caracteristica , care urmeaza legea de pro
babilitate data prin functia de probabilitate , ce reprezinta functia de frecventa
daca este de tip discret, respectiv densitatea de probabilitate n cazul continuu, iar
este un parametru real necunoscut. Se considera o selectie repetata de volum
avand corespunzator variabilele de selectie
.
unde
.
229
230
Teoria estimatiei
. Deoarece variabilele aleatoare
Consideram statistica
e
e
Se poate considera
e
e
e
, avem succesiv
231
Asadar
valorii statisticii .
, care are
Daca se considera
atunci
si
232
Teoria estimatiei
ln
obtinandu-se
ln
ln
ln
233
ln
ln
Asadar am obtinut ca
ln
ln
nu depinde de
ln
ln
deoarece
ln
ln
deoarece
ln
ln
234
Teoria estimatiei
avem ca
e
ln
relativa la parametrul
continuta n statistica
nu depaseste cantitatea de
.
informatie continuta de selectia considerata, adica
Demonstratie. Daca
este functia de frecventa (n cazul discret), respectiv
densitatea de probabilitate (n cazul continuu) pentru statistica , atunci
(5.1.1)
deci
ln
ln
ln
ln
235
relativa la dispersia teoretica
parametru.
se obtine
ln
ln
si
Rezulta astfel ca
deci
urmeaza legea cu
grade de libertate. Avand n vedere legatura dintre statisticile si rezulta ca densitatea de probabilitate pentru este data prin
Astfel se obtine ca
ln
C
ln
e
ln
236
Teoria estimatiei
de unde
ln
ln
si
deci
Observatia 5.1.16. Deoarece, n cazul unei statistici suficiente, avem ca functia
nu depinde de rezulta ca n acest caz. Acest
Astfel obtinem:
, iar valoarea
numerica
se
pentru orice
, iar valoarea numerica
estimatie consistenta pentru parametrul .
se numeste
237
(i)
(ii)
. Facand pe
, se obtine
pentru orice
pentru orice
, ceea ce trebuie demonstrat.
(5.2.1)
238
Teoria estimatiei
si
obtinem
e
adica
Pana aici am aratat ca statistica
cand
Proprietatea
5.2.7. Fie caracteristica
pentru care exista momentul teoretic de
ordinul , , si fie o selectie repetata de volum , atunci momentul de
Remarcam ca
selectie de ordin
.
239
si de asemenea
.
este
(i)
(ii)
pentru
si
pentru
, de unde daca
vom avea ca
. Prin urmare avem
, pentru
240
Teoria estimatiei
Deoarece
, pentru
, rezulta ca
p
de unde
, ceea ce trebuie aratat.
Proprietatea
5.2.11. Fiecaracteristica pentru care exista momentul teoretic de
ordin ,
,si fie o selectie repetata de volum , atunci momentul
centrat de selectie de ordin
De asemenea, avem
.
241
, adica
este functia de verosimilitate.
unde
Prin derivarea n raport cu a acestei relatii se obtine ca
sau
ln
avem
ln
adica
ln
ln
242
Teoria estimatiei
Se aplica acum inegalitatea lui Schwarz si se obtine
adica
ln
ln
ln
ln
ln
Dar avem ca
ln
ln
Stim ca
si
deci
243
ln
de unde
e
Se calculeaza usor
Avem astfel eficienta estimatorului
e
adica estimatorul nu este estimator eficient pentru parametrul .
Considerand
( oarecare),
ln
ln
244
Teoria estimatiei
de unde
ln
ln
si prin urmare
de unde
pentru orice
. Rezulta de aici ca
si daca se noteaza
nu depinde de . Prin
, atunci
245
ln
ln
de unde
ln
de unde
ln
adica
exp
de unde, deoarece
si se ajunge la
Deoarece
, rezulta ca
de unde
, am obtinut astfel ca
si obtinem
246
Teoria estimatiei
deci
Pe de alta parte
deci
ln
Exemplul 5.2.18.
, cu
cunoscut si necunoscut. Vrem sa aratam ca media de selectie este estimator eficient
pentru parametrul necunoscut
. Pentru aceasta vom considera o
selectie repetata de volum relativa la aceasta caracteristica.
de unde
ln
deci
unde
ca
ln
si
ln
ln
ln ln
Considerand
ln
ln
ln
ln
ln
avem
ln
ln
ln
247
Observatia 5.2.20. Un estimator eficient este optimal, invers proprietatea nu are loc.
Proprietatea 5.2.21. Estimatorul optimal al unui parametru este unic.
si
doi
Demonstratie. Fie
estimatori optimali distincti pentru parametrul . Daca se considera functia de selectie
, atunci este estimator nedeplasat pentru , deoarece
Pe de alta parte
unde
.
Din inegalitatea lui Schwarz se obtine
. Prin urmare, putem scrie ca , ceea
ce contrazice
faptul ca , sunt
estimatori optimali, afara de cazul n care
, adica
. Avand n vedere aceste rezultate, putem
deci
scrie:
adica
faptul ca
. Dar avem ca
, ceea ce implica
, n contradictie
248
Teoria estimatiei
Dar avem ca
fixat, avem
const.,
249
de unde
Definitia 5.2.23. Statistica
, daca
de legi de probabilitate ,
implica faptul ca
a.s.
este
completa pentru familia
, pentru orice ,
Pe de alta parte
urmeaza legea lui Poisson de parametru , deci
, pentru orice
, conduce la
pentru orice
,ceea ce are loc numai daca fiecare coeficient este nul, adica
, cand
.
Asadar avem ca
de unde
completa rezulta ca
.
sau
, si
a.s., deci
este
a.s., de unde
250
Teoria estimatiei
In final
adica
, pentru
Exemplul 5.2.26. Fie caracteristica , care urmeaza legea lui Poisson de parametru
. Vrem s
.
a determinam un estimator optimal pentru parametrul
Functia de frecventa a caracteristicii
este
ln
atunci
are distributia
card
deci
daca
daca
, , atunci avem ca
deci
Aplicam Teorema RaoBlackwell si obtinem
Pentru
, avem
251
de unde se obtine ca
, care este dat prin
, iar
Observatia 5.3.2. Metoda momentelor este una din cele mai vechi metode de estimare a parametrilor, folosita initial n mod empiric. Este fundamentata teoretic pe
faptul ca momentele de selectie sunt estimatori absolut corect
momentele
a.s.ipentru
teoretice corespunzatoare. Este cunoscut de asemenea ca
cand
252
Teoria estimatiei
Prin urmare, avem sistemul de ecuatii
e
si
iar
parametrul .
Observatia 5.3.5. In definitia estimatorului de verosimilitate maxima nu este necesar ca sa fie diferentiabila n raport cu . De asemenea, nu este neaparat
unic si nedeplasat.
253
ln
e
de unde
sau
254
Teoria estimatiei
si .
pentru parametrii
Exemplul 5.3.8. Caracteristica urmeaza legea uniforma pe intervalul
, unde
parametrul este necunoscut. Relativ la caracteristica se considera o selectie
repetata de volum . Vrem sa se determinam estimatorul de verosimilitate maxima
, pentru parametrul necunoscut .
Estimatorul de verosimilitate maxima pentru se determina astfel ncat functia
de verosimilitate
. Deoarece
se obtine ca
Se observa ca n acest exemplu nu s-a putut folosi ecuatia de verosimilitate ma
xima, deoarece domeniul valorilor caracteristicii , care este
, depinde de parametrul estimat.
Vom arata, n continuare, ca estimatorul astfel construit este estimator corect pen
tru parametrul . Apoi vom folosi acest estimator pentru obtinerea unui estimator
absolut corect pentru .
Functia de repartitie a statisticii este
deci
cand
Se calculeaza usor
255
Astfel se obtine ca
corect
, rezulta ca
Punand conditia
de unde se obtine
si n final
Deoarece
cand
, rezulta ca
decimaximul lui , dupa , se obtine atunci si numai atunci cand se obtine maximul
lui dupa . Astfel ca se exprima n functie de .
este functie de estimatie eficient
Teorema 5.3.10. Daca
a
pentru parametrul , atunci este estimator de verosimilitate maxima pentru .
Demonstratie. Deoarece
este estimator eficient pentru , din inegalitatea Rao
Cramer (cu egalitate), avem ca
ln
Astfel ca
ln
deci
256
Teoria estimatiei
se numeste estimatie cu
se obtine cand este minima expresia
, atunci valoarea lui se poate scrie n felul
257
ln
ln
indicatorul de verosimilitate
ln
ln
unde statisticile si sunt astfel ncat
iar intervalul
numeric
intervalului de ncredere pentru parametrul .
se numeste valoarea
Observatia 5.3.18. Cu cat este mai mic si intervalul de ncredere are lungimea mai
mica cu atat estimatia parametrului necunoscut este mai buna.
Observatia 5.3.19. Din relatia
, intervalul nu este
determinat n mod unic.
De la problema la problema se mai adauga o conditie suplimentara, de exemplu
fixarea valorii fie a lui , fie a lui . De asemenea, se poate considera o legatura
ntre si data de anumite ipoteze de lucru.
258
Teoria estimatiei
ie
repetat
a
de
volum
s
i
consider
a
m
probabilitatea
de
ncredere
data,
.
Se construies te statistica
care urmeaza legea normala
(a se vedea Observatia 4.2.6). Prin urmare, pen
tru dat determinam intervalul numeric astfel ncat
unde
este echivalenta cu
rezulta ca
adica este un interval de ncredere
pentru media teoretica .
Desigur ca intervalul numeric nu este n mod unic determinat. Daca nu
exista nici o informatie suplimentara relativa la valoarea medie, atunci se va considera
intervalul de ncredere de lungime minima, pentru fixat,
si se obtine cand
.
In acest caz
, va fi dat prin relatia
ceea
ce este echivalent cu
Cand se foloseste functia lui Laplace definita prin
atunci se determina din relatia
de ordin
Intervalul de ncredere pentru parametrul
(5.3.1)
259
are extremitatile
y=
0
z
260
Teoria estimatiei
numeric
,
Pe baza teoremei limita centrala avem ca rezultatul obtinut se mentine cand ur
meaza o lege de probabilitate oarecare, pentru (a se vedea Proprietatea 4.2.7).
Exemplul 5.3.22. Relativ la populatia se cerceteaza caracteristica privind media teoretica
. Stiind ca dispersia teoretica a caracteristicii este
, sa se stabileasca un
interval de ncredere pentru media teoretica
cu probabilitatea de ncredere
, utilizand distributia empirica de
selectie
Deoarece volumul selectiei este
, putem considera ca statistica
unde
. Asadar, extremitat ile intervalului de ncredere penurmeaza legea normala
tru media teoretica sunt date prin (5.3.1). Calculam valorile acestor extremitat i pe
baza datelor de selectie.
Valoarea mediei de selectie este
iar din Anexa I, pentru
De asemenea, avem ca
, se gaseste
.
261
x=[22.7,22.8*ones(1,3),22.9*ones(1,7),23*ones(1,4),...
23.1*ones(1,6),23.2*ones(1,7),23.3*ones(1,5),23.4*ones(1,2)];
s=sqrt(0.35)*norminv(0.975)/sqrt(35);ma=mean(x);
m1=ma-s; m2=ma+s;
fprintf( (m1,m2)=(%6.3f,%6.3f),m1,m2)
unde
grade de libertate.
este functia de repartitie a legii Student cu grade de libertate si care este tabelata,
pentru anumite valori, n Anexa II.
Luand
, avem ca
iar
, deci, intervalul de ncredere pentru media teoretica
are extremitatile date prin
(5.3.2)
262
Teoria estimatiei
In mod analog, daca se cunoaste ca valoarea medie nu este limitata inferior, atunci
, care conduce la intervalul de ncredere
intervalul numeric
Observatia 5.3.25. Geometric, daca se consider
a graficele functiei de repartitie si
densitat ii de probabilitate a legii Student cu
grade de libertate, modul de obtinere
a cuantilei
este prezentat n Figura 5.2.
1
y=
0
t
tn1,
n1,
Din teorema limita centrala avem ca rezultatele pot fi aplicate pentru o caracte
ristica ce urmeaza o lege de probabilitate oarecare, pentru .
Exemplul 5.3.26. Pentru receptionarea unei marfi ambalata n cutii, se efectueaza un
control, prin sondaj, privind greutatea a cutiilor. Pentru
de cutii cantarite s-a
obtinut distributia empirica de selectie, relativ la caracteristica :
Folosind probabilitatea de ncredere
, sa determinam un interval de ncredere
pentru valoarea medie a greutatii cutiilor, presupunand ca urmeaza legea normala
.
263
264
Teoria estimatiei
Statistica ce se considera n acest caz este
cu
care, conform Proprietatii 4.2.25, urmeaza legea
Se determina intervalul numeric
astfel nat
grade de libertate.
este functia de repartitie a legii
cu
grade de libertate si este tabelata, pentru
unde
se obtine
(5.3.3)
si
, unde
unde
265
y=
2
n1,
2
n1,
si
266
Teoria estimatiei
v1=10*va/c2; v2=10*va/c1; s1=sqrt(v1); s2=sqrt(v2);
fprintf( (v1,v2)=(%6.3f,%6.3f)\n,v1,v2)
fprintf( (s1,s2)=(%6.3f,%6.3f),s1,s2)
In urma executarii, se obtin intervalele de ncredere pentru dispersie si respectiv pentru abaterea standard:
(v1,v2)=( 0.008, 0.052)
(s1,s2)=( 0.091, 0.229)
care, conform
Proprietatii 4.2.30, urmeaza legea FisherSnedecor cu
grade de libertate.
Se determina intervalul numeric astfel ncat
unde
si
atunci
(5.3.4)
si
Aceasta relatie pune n evidenta intervalul de ncredere pentru raportul celor doua
dispersii.
267
y=
0
f
fm,n,
m,n,
Sa se calculeze
de ncredere pentru raportul abaterilor standard, adica
un interval
268
Teoria estimatiei
si
grade
pe baza Anexei IV. Facem observatia ca n acest calcul s-a avut n vedere ca
adica
269
f1=finv(0.025,10,15); f2=finv(0.975,10,15);
r1=f1*r; r2=f2*r; s1=sqrt(r1); s2=sqrt(r2);
fprintf( (r1,r2)=(%6.3f,%6.3f)\n,r1,r2)
fprintf( (s1,s2)=(%6.3f,%6.3f),s1,s2)
si
Se considera statistica
sunt cunoscute.
(5.3.5)
(a se vedea Observatia 4.2.29). Astfel, pencare urmeaza legea normala
data, se poate determina intervalul numeric
tru probabilitatea de risc
astfel ncat
Anume,
, unde
se calculeaza din relatia
e
270
Teoria estimatiei
unde
si
Se considera statistica
(5.3.7)
unde
si care urmeaza legea Student cu
grade de libertate (a se vedea
Proprietatea 4.2.28).
Ca la punctul precedent se obtin extremitatile intervalului de ncredere
(5.3.8)
unde
C. Abaterile standard
si
Se considera statistica
grade de libertate.
(5.3.9)
unde
271
Exemplul 5.3.34. Masinile si ambaleaz
a carne n pachete de
grame.
Greutatea cutiilor este o caracteristic
a
,
ce
urmeaz
a
legea
normal
a
si
respectiv o caracteristica , ce urmeaza legea normala
.
Cantarind de pachete din cele produse de masina
sa obtinut valoarea
mediei de selectie
grame, iar din cantarirea a de pachete de la masina
grame.
sa obtinut
Folosind probabilitatea
de
ncredere
, sa determinam intervalul
de ncredere
pentru diferenta
, daca se stie ca abaterile standard sunt
si
.
Se foloseste statistica (5.3.5), care
urmeaz
a
legea
normal
a
.
Astfel,
inter
valul de ncredere pentru diferenta
este dat prin (5.3.6), unde se deter
.
mina astfel ca
. Folosind Anexa I, obtinem
De asemenea, avem ca
este
conduce la rezultatul:
(m1,m2)=( 3.968, 6.032)
272
Teoria estimatiei
Cu probabilitatea de
ncredere
, vrem sa se construim un interval de ncredere
pentru diferenta
, daca este necunoscut.
Folosind statistica (5.3.7), care urmeaza legea Student cu
grade de libertate, se va construi intervalul de ncredere pentru
. Anume,
acest interval de ncredere este precizat prin (5.3.8).
Pentru a determina valoarea numerica a intervalului de ncredere, se calculeaza
pe rand
si
va fi
, obtinem
,
Exemplul 5.3.38.
Se
consider
a
dou
a
aparate
de
mbuteliat
vin
n
sticle
de
ml. Fie
a cantitatea de vin (n ml) mbuteliata de primul aparat
caracteristica ce reprezint
ntr-o sticla si respectiv aceeasi caracteristica pentru al doilea aparat. Pentru compararea modului de mbutliere pentru cele doua aparate, se considera cate o selectie
din sticlele mbuteliate de cele doua aparate, respectiv
273
Cuantila
Pe de alta parte
Astfel avem ca
274
Teoria estimatiei
Pentru cazul
Astfel avem ca
iar apoi
al gradelor de libertate.
Avand n vedere ca
de unde avem ca
.
Extremitatile intervalului de ncredere sunt date prin
rezulta ca
275
Fie caracteristica cercetata, cu legea de probabilitate , unde
este un parametru necunoscut. Consideram o selectie repetata de volum relativa la
caracteristica , pentru care avem variabilele de selectie
.
definite
pentru
, atunci statistica
ln
.
rezulta ca
ln
.
Pentru probabilitatea
de ncredere
data se va determina intervalul numeric
astfel ncat
Functia
Ceea ce revine la determinarea cuantilei astfel ncat
a lui Laplace este aici, cea tabelata n Anexa I.
Prin operatii algebrice se nlocuieste inegalitatea
inega , cu dubla
litate echivalenta de forma
care
defineste intervalul de ncredere pentru parametrul .
Aplicatia 5.3.41.
si
cu probabilit
at ile
Fie caracteristica ce ia numai valorile
si respectiv
, adica are functia de frecventa
unde
este un parametru necunoscut.
276
Teoria estimatiei
Vom folosi metoda intervalelor de ncredere pentru selectii mari n vederea estimarii parametrului .Consideram o selectie repetata de volum
(mare) si probabi
litatea de ncredere
. Deoarece ln ln
ln avem
ca
ln
rezulta
ln
Stiind ca
Statistica
sau
.
si care urmeaza legea normala
, cand
Pentru dat, se determina
astfel ncat
Putem scrie ca
este echivalenta cu
devine asadar
Discriminantul trinomului este pozitiv, anume
deci inecuatia n are solutia de forma unui interval si care va reprezenta
intervalul de ncredere pentru parametrul .
Astfel extremitatile intervalului de ncredere au urmatoarele expresii:
277
iar apoi
conditia
, echivalenta cu
selectiei.
Mai jos prezentam un tabel cu valorile optime ale volumului selectiei pentru diferite valori ale nivelului de ncredere si ale lui :
0.90
0.95
0.98
0.01
6760
9600
13530
0.02
1700
2400
3380
0.05
270
380
540
278
Teoria estimatiei
Functia histfit
Functia histfit are drept rezultat reprezentarea pe aceeasi figura a histogramei si
.
a densitat ii legii normale
Lansarea executarii functiei se face prin una din formele
histfit(x)
histfit(x,nc)
unde x este un vector ce contine datele ce urmeaza a fi prelucrate, iar nc este numarul
claselor. Daca parametrul nc este absent, atunci numarul claselor se considera ca
fiind radicalul volumului datelor, adica radicalul lungimii vectorului x.
Programul 5.3.43. Programul urmator genereaza n numere aleatoare, ce urmeaza
legea normala
, dupa care
apeleaza la functia histfit, iar graficul obtinut,
pentru n=100,
si
, este prezentat n Figura 5.5.
n=input(n=); mu=input(mu=);
s=input(sigma=);x=normrnd(mu,s,1,n);
histfit(x), colormap spring
20
18
16
14
12
10
10
12
14
16
Functia mle
Pentru estimarea parametrilor, folosind metoda verosimilitat ii maxime, precum si
metoda intervalelor de ncredere, poate fi utilizata functia mle. Apelul functiei se
poate face prin una din instructinile:
279
P=mle(lege,x)
[P,int]=mle(lege,x)
[P,int]=mle(lege,x,alpha)
[P,int]=mle(lege,x,alpha,n)
unde lege specifica una din legile: bernoulli, unid, bino, poiss, geo,
unif, norm, gam, exp, beta, weib si rayl. Parametrul x este un vector, iar n
urma executarii unei astfel de instructiune, P si int vor contine estimatori de verosimilitate maxima, respectiv intervale de ncredere, pentru parametrii legii considerate,
obtinute pe baza datelor continute de x.
Parametrul optional alpha, avand valoarea implicita alpha=0.05, specifica
probabilitate de ncredere, 1-alpha, n construirea intervalelor de ncredere.
Ultima forma este specifica numai legii binomiale, adica lege=bino, parame
trul n fiind parametrul cel de la legea n . Daca x si n sunt scalari, se returneaza
n P raportul acestora, daca x este vector si n este scalar, se va returna n P fiecare
element a lui x mpartit la n, iar daca x si n sunt vectori de aceleasi dimensiuni, P va
contine rapoartele pe componente ale lui x si n.
Mai remarcam ca pentru prima data ntalnim legea lui Bernoulli, care reprezinta
cazul particular al legii binomiale, . Daca lege=bernoulli, atunci x, desigur, trebuie sa contina numai valorile 0 si 1.
Functia 5.3.44. Vom scrie o functie, care genereaza n numere aleatoare ce urmeaza
una din legile de probabilitate: uniforma discreta, Poisson, uniforma, normala, Gamma, exponentiala, Weibull si Rayleigh. Se va apela aceasta functie pentru obtinerea
estimatiilor de verosimilitate maxima ale parametrilor legii de probabilitate considerate. De asemenea, se va reprezenta grafic, pe aceeasi figura, functia de repartitie a
legii de probabilitate considerata, mpreuna cu functia de repartitie a aceleasi legi, dar
avand parametrii precizati nlocuiti cu estimatiile acestora.
function veros(lege,n)
switch lege
case unid
P1=input(N=);
case poiss
P1=input(lambda=);
case unif
P1(1)=input(a=); P1(2)=input(b=);
case norm
P1(1)=input(mu=); P1(2)=input(sigma=);
case gam
P1(1)=input(a=); P1(2)=input(b=);
case exp
P1=input(mu=);
case beta
P1(1)=input(a=); P1(2)=input(b=);
case weib
P1(1)=input(a=); P1(2)=input(b=);
280
Teoria estimatiei
case rayl
P1=input(b=);
otherwise
error(Eroare)
end
if length(P1)==1
x=random(lege,P1,1,n);
else
x=random(lege,P1(1),P1(2),1,n);
end
P2=mle(lege,x); xx=min(x):0.01:max(x);
if length(P1)==1
F1=cdf(lege,xx,P1); F2=cdf(lege,xx,P2);
else
F1=cdf(lege,xx,P1(1),P1(2)); F2=cdf(lege,xx,P2(1),P2(2));
end
plot(xx,F1,k-.,xx,F2,k-)
legend(Functia de repartitie teoretica,...
Functia de repartitie estimata,2)
unde valorile pentru n si lege, fie ca sunt precizate n acest apel, fie sunt precizate
nainte. De exemplu, comanda
>>veros(poiss,50)
are ca efect apelul functiei pentru legea lui Poisson, iar pe ecran se va cere introducerea parametrului lambda, dupa care pe ecran va fi reprezentat graficul din Figura 5.6,
n cazul n care lambda=7. Sa remarcam totusi ca la un nou apel, cu aceeasi parametri, graficul difera, deoarece sunt generate alte numere aleatoare.
Daca se considera comanda
>>veros(norm,50)
are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introducerea parametrilor mu si sigma, dupa care pe ecran va fi reprezentat graficul din
Figura 5.7, n cazul n care mu=10 si sigma=2.
Functiile normlike, gamalike,betalike si weiblike
Functiile normlike, gamlike, betalike si weiblike sunt specifice pentru
Statistics toolbox si se pot apela cu una din comenzile
L=numef(par,x)
[L,cov]=numef(par,x)
281
1
Functia de repartitie teoretica
Functia de repartitie estimata
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
10
12
14
1
Functia de repartitie teoretica
Functia de repartitie estimata
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
10
11
12
13
14
282
Teoria estimatiei
parametrul x fiind un vector, iar n precizeaza parametrul ntreg pozitiv al legii binomiale n . Pentru functiile poiss si exp, respectiv pentru gam, beta, rayl
si weib, apelurile sunt de forma:
P=numef(x)
[P,int]=numef(x,alpha)
unde parametrul numef reprezinta numele functiei, iar x este fie un vector, fie o
matrice, pentru prima grupa de functii, iar pentru a doua, numai vector. Daca x este
matrice, atunci functia opereaza pentru fiecare coloana n parte.
Pentru legile unif si norm, apelurile sunt:
[par1,par2,int1,int2]=unifit(x)
[par1,par2,int1,int2]=normfit(x,alpha)
unde x poate fi vector sau matrice. In al doilea caz, operatiunea se executa pentru
fiecare coloana n parte.
De regula, estimatiile punctuale returnate, sunt obtinute prin metoda verosimilitatii maxime, folosinduse datele continute n parametrul x, n parametrii P, par1
si par2. Intervalele de ncredere sunt returnate n parmetrii int, int1 si int2, si
sunt determinate folosind probabilitatea de ncredere 1-alpha. Valoarea implicita
pentru alpha fiind alpha=0.05.
Pentru legile unif si norm, n comenzile de apel pot lipsi int2, int1 si par2,
caz n care sunt returnate numai valorile parametrilor ramasi.
Mai remarcam faptul ca int, int1 si int2 au cate doua componente, extremitatile intervalului de ncredere corespunzator.
283
Functia 5.3.45. Vom scrie o functie, care genereaza n numere aleatoare, ce urmeaza
una din legile Gamma, Beta, Weibull si Rayleigh. Folosind aceste numere, se vor
da estimatii punctuale pentru parametrii acestora, precum si intervale de ncredere,
considerand o probabilitate de ncredere 1-alpha specificata. Folosind estimatiile
punctuale obtinute pentru parametri, se vor reprezenta grafic densitatile de probabilitate, folosind parametrii estimati si respectiv parametrii considerati la generarea
numerelor aleatoare. De asemenea, se vor afisa intervalele de ncredere obtinute.
function estimat(lege,n,alpha)
switch lege
case gam
a=input(a=); b=input(b=);
x=gamrnd(a,b,n,1); [P,I]=gamfit(x,alpha);
case beta
a=input(a=); b=input(b=);
x=betarnd(a,b,n,1); [P,I]=betafit(x,alpha);
case weib
a=input(a=); b=input(b=);
x=weibrnd(a,b,n,1); [P,I]=weibfit(x,alpha);
case rayl
b=input(b=); x=raylrnd(b,n,1);
[P,I]=raylfit(x,alpha);
otherwise
error(Eroare)
end
t=min(x):0.01:max(x);
if length(P)==1
y=pdf(lege,t,P); yy=pdf(lege,t,b);
fprintf( bbarat=%6.3f\n,P)
fprintf( (b1,b2)=(%6.3f,%6.3f)\n,I)
else
y=pdf(lege,t,P(1),P(2)); yy=pdf(lege,t,a,b);
fprintf( abarat=%6.3f, bbarat=%6.3f\n,P)
fprintf( (a1,a2)=(%6.3f,%6.3f)\n,I(1,1),I(2,1))
fprintf( (b1,b2)=(%6.3f,%6.3f)\n,I(1,2),I(2,2))
end
plot(t,y,k-,t,yy,k-.), plot(t,y,k-,t,yy,k-.)
legend(Legea estimata, Legea teoretica)
unde valorile pentru n, lege si alpha, fie ca sunt precizate n acest apel, fie sunt
precizate nainte. De exemplu, comanda
>>estimat(beta,500,0.01)
are ca efect apelul functiei pentru legea Beta, iar pe ecran se va cere introducerea
parametrilor a si b, dupa care pe ecran va fi reprezentat graficul din Figura 5.8, n
cazul n care a=3 si b=7. Sa remarcam totusi ca la un nou apel, cu aceeasi parametri,
graficul difera, deoarece sunt generate alte numere aleatoare. De asemenea, se vor
afisate si estimatiile punctuale, respectiv intervalele de ncredere:
284
Teoria estimatiei
3
Legea estimata
Legea teoretica
2.5
1.5
0.5
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Capitolul 6
286
,
dat,
unde
sunt variabilele de selectie corespunzatoare unei selectii de
volum considerata.
6.2 Testul
(testul
bilateral),
(testul
unilateral dreapta),
(testul
,
unde
, cu una
unilateral stanga).
Pentru verificare ipotezei nule cu una din alternativele precizate mai nainte,
urmeaza legea normala
. Prin urmare, pentru
interval numeric
astfel ncat
.
si un nivel de semnificatie
, daca
, unde
, adica
, unde
, daca
;
;
6.2. Testul
, unde
287
, daca
.
Aici s-a folosit notatia .
Intr-adevar, pentru fiecare din cele trei regiunui critice scrise mai nainte, avem
ca
Modul n care am ales regiunea critica ne
conduce respectiv la testul bilateral, unilateral dreapta si unilateral stanga.
Mai tarziu va fi fundamentata riguros modalitatea de construire a regiunii critice
pentru alternativele considerate.
Odata construita regiunea critica , ipoteza nula va fi admisa daca datele de
, iar n caz contrar va fi respinsa.
selectie satisfac conditia
Remarcam de asemenea ca regiunea critica corespunde multimii complemen
tare intervalului .
Etapele aplicarii testului
1. Se dau:
;
2. Se calculeaza intervalul
s-a precizat mai nainte);
astfel ncat
3. Se calculeaza
4. Concluzia: daca
este respinsa.
unde
(dupa cum
288
Exemplul 6.2.2. Caracteristica reprezinta cheltuielile lunare n mii lei pentru abonamentele la ziare si reviste ale unei familii. Sa se verifice, cu nivelul de semnificatie
, daca media acestor cheltuieli lunare pentru o familie este de mii lei,
stiind ca abaterea standard
mii lei si avand o selectie repetata de volum
,
care ne da distributia empirica de selectie
Deoarece
si abaterea standard
pentru verificarea ipotezei nule
Pentru
cu ipoteza alternativa
.
Calculam succesiv
Deoarece
, rezulta ca se accepta ipoteza ca cheltuielile
medii lunare ale unei familii pentru abonamentele la ziare si reviste sunt de 16 mii
lei, cu nivelul de semnificatie
.
Programul 6.2.3. Programul Matlab, care urmeaza, executa aceste calcule si afiseaza
intervalul de ncredere, mpreuna cu valoarea calculata a statsiticii .
x=[11 13 15 17 20]; f=[4 6 12 10 8];
z=(sum(x.*f)/40-16)/(3/sqrt(40));
z1=norminv(0.005,0,1); z2=norminv(0.995,0,1);
fprintf( (z1,z2)=(%6.3f,%6.3f)\n,z1,z2)
fprintf(
z=%6.3f,%6.3f),z)
6.2. Testul
289
adica
ipoteza nula va fi respinsa daca , adica
.
adica
daca
daca
daca
290
291
Definitia 6.3.2. Se numeste eroare de genul (speta) al doilea admiterea unei ipoteze
false, iar probabilitatea acestei erori se numeste risc de speta a doua (risc al benefi
ciarului) si este notata ,
Observatia 6.3.3. Producerea unei erori de genul al doilea este mai grava decat a
unei erori de genul ntai, cand verificam concentratia unui medicament, care peste
un anumit grad de concentratie devine daunator. Pe de alta parte, producerea unei
erori de genul ntai este mai grava decat cea a unei erori de genul doi, cand verificam
calitatea unui articol de mbracaminte.
Definitia 6.3.4. Numim puterea unui test probabilitatea respingerii unei ipoteze false,
adica
cand este parametrul asupra caruia se face ipoteza statistica, iar este regiunea
critica construita sub ipoteza nula cu nivelul de semnificatie
fixat.
Observatia 6.3.5. Daca testul considerat se refera la ipoteza nul
a
, atunci
ipoteza alternativa
si
cu
Aplicatia 6.3.6. Calculam n continuare puterea testului , cand avem ipoteza alter .
nativa
Dupa cum am vazut la testul regiunea critica n acest caz este
292
a testului avem
de unde avem ca
(6.3.1)
adica
(6.3.2)
, vom
Deoarece
si
, rezulta ca pentru
avea
, adica
. Asadar, putem determina, din relatia precedenta
valoarea lui (volumul selectiei) astfel ncat puterea testului (corespunzator riscul
de speta a doua) sa fie atinsa pentru acel .
Exemplul 6.3.7. Relativ la caracteristica s-a efectuat o selectie de volum
,
obtinandu-se datele de selectie
Stiind ca urmeaza legea normala
cu abaterea standard teoretica cunos
cuta
, vrem sa verificam ipoteza nula
, cu nivelul de semnificatie , cand,
se considera ipoteza alternativa
iar apoi sa calculam puterea testului, cand
, si sa determinam
volumul optim al selectiei cand se considera alternativa
, si riscul de
speta a doua
.
293
se foloseste testul
din relatia
bilateral. Se
astfel ca
Deoarece
, ipoteza
este admisa.
Formula de calcul a puterii testului bilateral este (6.3.2). Prin urmare, se obtine
Cand este astfel
ncat
, se observa ca valoarea
nu poate
fi atinsa. Daca
, atunci , astfel avem
.
Prin urmare, pentru determinarea
lui optim avem relatia
,de
si folosind Anexa I se obtine
, adica
unde se obtine
.
Programul 6.3.8. Programul Matlab, ce urmeaza, pe langa faptul ca va efectua calculele din exemplul precedent, va reprezenta grafic si functia putere. Punctele de pe
curba puterii, ale caror valori au fost calculate n exemplul de mai sus, sunt marcate
prin cerculete n Figura 6.1.
294
295
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
si aratam ca
, obtinem succesiv
de unde avem ca
296
adica
(6.3.3)
Pentru fiecare integrala din membrul drept aplicam formula de medie. Prin urmare
astfel ncat
si
exista
297
Dar integrala din membrul drept este pozitiva, iar din modul cum s-a definit regiunea
critica avem ca
deci
si ca urmare
. Ceea cencheie partea ntai a demonstratiei.
In partea a doua aratam existenta constantei .
Notam prin urmatoarea regiune
si prin
, urmatoarea probabilitate
Se observa ca
, iar
De asemenea, avem ca funct
ia este monoton
descrescatoare. Prin urmare,
fixat, exista
astfel ncat
, adica
pentru
adica puterea testului este mai mare decat riscul de speta ntai se numeste test nedeplasat.
298
Proprietatea 6.3.13.Cel mai puternic test dat de lema NeymanPearson este un test
nedeplasat, adica
.
Demonstratie. Cu notatiile de la lema NeymanPearson, avem ca
Distingem dou
a cazuri.
Daca avem , atunci obtinem
de unde
.
In cazul cand
de unde
, avem
Observat
ia 6.3.14. Prin micsorarea riscului de speta ntai, pentru fixat, creste con, deci creste riscul de speta a
stanta si prin urmare scade puterea testului,
doua.
Aplicatia 6.3.15. Fie caracteristica ce urmeaza legea normala
, unde
este necunoscut si este cunoscut. Fie ipoteza nula
, cu
ipoteza alternativa
. Vrem sa determinam cel mai puternic test
pentru verificarea acestei ipoteze nule.
Pentru aceasta aplicam lema Neyman-Pearson.
Prima data determinam regiunea critica .
Deoarece
299
rezulta ca
sau
adica
ln
ln
Daca
,
ln
Pentru determinarea constantei
(cazul
),
se scrie relatia
sau
ln
300
Prin urmare,
se va determina astfel ncat
In cazul
,
de unde
unde functia
a lui
.
(testul
Observatia 6.3.17. Cand se considera ipoteza alternativa
bilateral), utilizand lema NeymanPearson, nu putem construi un cel mai puternic
test. Alta metoda va fi prezentata pentru construirea acestuia n acest caz.
Aplicatia 6.3.18. Vrem sa determinam n continuare puterea testului
Aplicatia 6.3.15.
Din nou distingem cele doua cazuri.
Daca , avem succesiv
stabilit la
301
, cand , adica .
Se vede, nca odata, n ambele cazuri, ca
Pe de alta parte,
rescrie n felul urmator
adica
de unde se obtine o alta relatie ce l contine pe , anume
parand cele doua relatii ce l contin pe , avem ca
(6.3.4)
In cazul
,
Com-
si
de unde se obtine
(6.3.5)
se
de unde se obtine
,
302
si prin urmare
In cazul testului
deci
de unde se obtine
.
303
de unde se obtine
.
304
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
1
0.8
0.6
0.4
0.2
0
6.4 Testul
, cu ambii parametri
Fie caracteristica ce urmeaza legea normala
si necunoscuti. Relativ la valoarea medie a acestei caracteristici, se face ipoteza
, cu una din alternativele
nula
305
unde
unde
este functia de repartitie pentru legea Student cu
grade de libertate (tabelata n
Anexa II, pentru anumite valori).
Intervalul numeric pentru statistica nu este determinat n mod unic din
conditia de mai sus. In functie de alternativa aleasa, se considera suplimentar:
unde
, daca
, daca
,
a legii Student cu
Corespunzator intervalului
prin:
,
, daca
,
definite
306
Aici s-au utilizat notatiile
, respectiv
Se verifica imediat ca
iar cele trei moduri de
definire a regiunii critice ne conduc respectiv la testul bilateral, unilateral dreapta
si unilateral stanga.
,
Odata construita regiunea critica , folosind datele de selectie
ipoteza nula va fi admisa daca
, iar n caz contrar va fi
respinsa. Remarcam de asemenea ca regiunea critica corespunde multimii comple
mentare intervalului .
Etapele aplicarii testului
1. Se dau:
4. Concluzia: daca
respinsa.
unde
Observatia 6.4.1. Cand numarul gradelor de libertate tinde la infinit, conform teoremei limita centrala, avem ca legea Student converge n repartitie la legea normala
. Prin urmare, daca volumul al selectiei este mare
se poate utiliza
testul pentru verificarea ipotezei nule
, prin utilizarea statisticii n
loc de statistica . Toate rezultatele de la testul raman, asadar, adevarate n acest
caz.
Observatia 6.4.2. Avand n vedere ca functia de repartitie a legii Student este strict
crescatoare, iar pentru determinarea intervalului este necesara inversarea
acestei functii, se poate renunta la operatia de inversare. Pentru aceasta se determina
ceea ce se numeste valoare critica, ca si la testul , si pe care o notam prin . Vom
analiza pe rand cele trei alternative.
307
adica
ipoteza nula va fi respinsa daca , adica
.
adica
daca
daca
daca
308
, iar ca ipoteze alternative se considera, pe rand, cele trei, care conduc, respectiv la testele bilateral, unilateral stanga si unilateral dreapta. Programul va
determina, de asemenea, intervalele de ncredere pentru media teoretica, n cele trei
cazuri, folosind alpha=0.01.
x=[11*ones(1,4),13*ones(1,6),15*ones(1,12),...
17*ones(1,10),20*ones(1,8)];
fprintf( h
c
ci
\n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest(x,16,0.01,i);
fprintf( %d %5.4f
(%4.2f,%4.2f) \n,h,c,ci)
end
unde
este functia de verosimilitate. Din felul cum a fost definita statistica , avem ca
, iar ipoteza va putea fi acceptata daca este apropiata de . Fo
losind aceasta observatie, pentru un nivel de semnificatie
dat, se determina
regiunea critica din relatia
unde
este cuantila de ordin ,
309
Cand ipoteza
este dat prin
e
Pe de alta parte, pentru determinarea numitorului statisticii , vom cauta estima si necunoscuti.
torii de verosimilitate maxima pentru parametrii
Sistemul de verosimilitate maxima
ln
ln
si , anume
310
Obtinem astfel ca
e
avem ca
atunci
, care este
acelasi lucru cu
. Altfel spus, determinarea
cuantilei
.
revine la determinarea lui
, astfel ncat
Dar statistica , n ipoteza , urmeaza legea Student cu
grade de libertate
(Proprietatea
4.2.26),
deci
,
adic
a
cuantila
de
ordin
a legii Student
cu
grade de libertate. Putem scrie n final regiunea critica:
Regiunea critica , pentru
311
Teorema
6.5.2. Fie statistica
a raportului verosimilitatilor, atunci statistica
, fiind numarul
ln urmeaza legea cu grade de libertate, cand
parametrilor necunoscuti.
Demonstratie. Vom considera numai cazul .
Folosind formula lui Taylor cu doi termeni avem ca
ln
ln
ln
ln
unde sau
pentru , prin urmare
Pede alta parte, daca ipoteza
adevarata, se stie ca
a.s.
, cand . Putem scrie atunci este
ca
ln
ln
ln
ln
ln
deci avem ca
. Dar
ln
a.s.
, deci
ln
ln a.s.
ln
de unde
sau
ln
ln
cand
, de unde avem ca statistica
grad de libertate, ceea ce trebuia aratat.
312
6.6 Testul
bilateral,
unilateral dreapta,
unilateral stanga.
este
urmeaza legea cu
grade de libertate.
Folosind un nivel de semnificatie
dat, se poate determina un interval
numeric
astfel
nc
a
t
unde
Intervalul numeric pentru statistica nu este determinat n mod unic
din conditia de mai sus. In functie de alternativa aleasa se considera suplimentar:
unde
daca
daca
daca
a legii
cu
6.6. Testul
313
, astfel determinat, se considera respec-
Usor se verifica faptul ca
iar cele trei moduri
astfel ncat
2. Se determina intervalul
(dupa cum s-a precizat nainte);
3. Se calculeaza
4. Concluzia: daca
respinsa.
unde
ipoteza este admisa, n caz contrar
este
314
Cand
avem testul
si
Deoarece
deci
6.6. Testul
315
de unde
deci
Programul 6.6.2. Programul urmator, efectueaza calculele cerute n exemplul precedent. In plus, reprezinta grafic functia putere, cea din Figura 6.3, n cazul testului
bilateral, marcand prin cerculete punctele curbei putere, care au fost determinate n
exemplu.
316
pi(1.5)=0.200
pi(1.6)=0.128
pi(1.7)=0.080
pi(1.8)=0.050
pi(1.9)=0.031
6.6. Testul
317
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
1.5
unde
.
, cand
urmeaza legea normala
De exemplu, daca ipoteza alternativa este
, se va ajunge la regiunea
critica
unde este cuantila de ordin de la legea normala
.
Observatia 6.6.4. Daca se considera statistica
exista relatia
318
Deoarece
gea cu
statistica.
, avem ca statistica urmeaza leurmeaza legea normala
de libertate. Cele prezentate mai nainte pot fi rescrise cu aceasta
grade
i
urmeaz
a legea
nor
mala
si respectiv pentru si urmeaza legea normala
.
Relativ la dispersiile
teoretice ale celor doua caracteristici se face ipoteza nula com
pusa
, cu una din alternativele:
si . Notam datele de select
ie
prin
s
i
respectiv
cu variabilele de selectie
si
Conform Proprietatii 4.2.30, statistica
unde
319
numeric , astfel ca
unde
Se verifica imediat ca
iar
cele trei alternative ne conduc la cele trei regiuni critice, care definesc respectiv testul
bilateral, unilateral dreapta si unilateral stanga.
Odata construit
critica , folosind
datele de selectie, ipoteza nula va fi
admisa daca
iar n caz contrar va fi respinsa.
Remarcam de asemenea ca regiunea critica corespunde multimii complementare
intervalului .
320
unde
3. Se calculeaza
4. Concluzia: daca
pinsa.
ipoteza este admisa, n caz contrar este res-
respectiv
, iar statistica
Considerand nivelul
de semnificatie
, vrem sa verificam
ipoteza
nula com
pusa
, respectiv cu fiecare din alternativele
,
,
. Vom considera ca cele dou
a caracteristici si
sunt independente
si ca urmeaza legile normale
si respectiv
.
Se considera statistica
grade de libertate,
321
este
322
Programul 6.7.3. Programul Matlab, care urmeaza, efectueaza calculele din exemplul precedent, dupa care afiseaza valoarea f a statisticii , precum si intervalele
numerice (f1,f2), pentru fiecare din cele trei alterantive.
x1=[1021,980,988,1017,1005,998,1014,985,995,...
1004,1030,1015,995,1023,1008,1013];
x2=[1003,988,993,1013,1006,1002,1014,997,...
1002,1010,975];
f=var(x1)/var(x2);
fprintf(
Bilateral\n)
f1=finv(0.025,15,10); f2=finv(0.975,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)
fprintf(
Unilateral dreapta\n)
f1=finv(0,15,10); f2=finv(0.95,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)
fprintf(
Unilateral stanga\n)
f1=finv(0.05,15,10); f2=finv(1,15,10);
fprintf( f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n,f,f1,f2)
si
323
si
(6.8.1)
.
care urmeaza legea normala
Se aplica prin urmare testul pentru compararea celor doua medii teoretice.
Pentru nivelul de semnificatie
dat, se obtin regiunile critice corespunzatoare celor trei alternative:
;
,
2. Se determina intervalul astfel ncat
unde
este functia lui Laplace tabelata n Anexa I. Intervalul numeric este res
pectiv pentru cele trei alternative considerate:
,
,
;
unde
3. Se calculeaza
4. Concluzia: daca
pinsa.
Exemplul 6.8.1. La o unitate de mbuteliere a laptelui exista doua masini care efectueaza aceasta operatie n sticle de litru. Pentru a cerceta reglajul de mbuteliere
la cele doua masini sau efectuat doua selectii relative la sticlele mbuteliate de cele
doua masini si sau obtinut datele de selectie:
324
n ml
,
Folosind nivelul de semnificatie
, vrem sa verificam daca mediile de
umplere a sticlelor
de
c
a
tre
cele
dou
a
mas
ini
sunt
aceleasi, n cazul n care abaterile
standard sunt
ml
s
i
ml.
Caracteristicile si , ce reprezinta cantitatea de lapte (n ml) continuta de
o sticla mbuteliata de prima masina, respectiv
de a doua masina, se considera ca
si
urmand legile de probabilitate normale
.
Verificarea ipotezei nule
, cu alternativa
, se va
face cu testul , deoarece sunt cunoscute abaterile standard.
Folosind nivelul de semnificatie
, se determina din Anexa I valoarea
astfel ncat
Anume, se obtine ca
, care ne da intervalul
tistica , data prin formula (6.8.1).
Se calculeaza succesiv:
pentru sta-
Deoarece
, rezulta ca mediile de umplere a sticlelor nu
difera semnificativ pentru cele doua masini.
Programul 6.8.2. Programul Matlab, care urmeaza, efectueaza calculele din exemplul precedent.
x1=[990*ones(1,7),995*ones(1,9),1000*ones(1,11),...
1005*ones(1,8),1010*ones(1,5)];
x2=[985*ones(1,5),990*ones(1,5),995*ones(1,6),...
1000*ones(1,7),1005*ones(1,6),1010*ones(1,4)];
ma1=mean(x1); ma2=mean(x2);
z=(ma1-ma2)/sqrt(62/40+7.52/33);
z2=norminv(0.995); z1=-z2;
fprintf( z=%7.3f\n z1=%6.3f\n z2=%6.3f,z,z1,z2)
325
si
sunt necunoscute si
(6.8.2)
grade
dat, se
unde
;
326
unde
3. Se calculeaza
4. Concluzia: daca
pinsa.
Exemplul 6.8.3. Se cerceteaza doua loturi de ulei pentru automobile, din punct de
vedere al vascozitat ii, obtinanduse datele de selectie
327
Deoarece
, rezulta ca vascozitat ile medii ale celor
doua loturi de ulei nu difera semnificativ.
Programul 6.8.4. Programul Matlab urmator efectueaza calculele de mai sus, dupa
care afiseaza valoarea t a statisticii , mpreuna cu capetele intervalului (t1,t2).
x1=[10.27*ones(1,3),10.28*ones(1,2),10.29,10.3,10.32];
x2=[10.26,10.26,10.27,10.29,10.3,10.31*ones(1,3)];
ma1=mean(x1); ma2=mean(x2);
v1=var(x1); v2=var(x2);
t=(ma1-ma2)/sqrt(7*v1+7*v2)*sqrt(14/(1/8+1/8));
t2=tinv(0.975,14); t1=-t2;
fprintf( t=%7.3f\n t1=%6.3f\n t2=%6.3f,t,t1,t2)
328
si
(6.8.4)
329
al gradelor de libertate
unde
Sa ajuns la testul , care pentru nivelul de semnificatie
dat, conduce
la regiunile critice corespunzatoare alternativelor considerate, respectiv:
;
astfel nc
at
2. Se determina intervalul
unde
este functia de repartitie pentru legea Student cu grade de liber
tate calculat cu formula (6.8.4), iar intervalul numeric este respec
tiv, pentru cele trei alternative considerate,
,
,
;
unde
3. Se calculeaza
4. Concluzia: daca
pinsa.
330
Exemplul 6.8.6. Se cerceteaza capacitatea fiolelor farmaceutice de ml, care provin de la doua fabrici. In acest scop, se considera cate o selectie pentru doua loturi
de fiole provenite respectiv de la cele doua fabrici. Selectiile obtinute au distributiile
empirice de selectie
respectiv, pentru : , , , , , , , , , , , ,
, , , , , , , .
Folosind nivelul de semnificatie
, vom compara dispersiile celor doua
caracteristici. Apoi, pe baza acestui rezultat, vom compara mediile celor doua carac
teristici, utilizand acelasi nivel de semnificatie
.
Vom considera
c
a
cele
dou
a
caractersitici
s
i
sunt repartizate normal, res
pectiv
si . Se poate aplica testul , pentru compararea dispersiilor teoretice si .
Calculam pe rand:
Deoarece
avem ca
Pe de alta parte, pentru
, se considera statistica
FisherSnedecor cu
Daca se consider
a ipoteza nula
care urmeaza legea
grade de libertate.
cu alternativa
, avem din Anexa IV ca
331
Deoarece
, respingem ipoteza ca mediile teoretice
pentru fiolele produse de cele doua fabrici nu difera semnificativ.
Programul 6.8.7. Calculele din exemplul de mai sus, se pot efectua cu urmatorul
program Matlab:
x1=[100,101,102*ones(1,2),103*ones(1,3),...
104*ones(1,4),105*ones(1,5),106*ones(1,4),...
107,108*ones(1,3),109];
x2=[110,101,112,120,117,105,109,111,118,113,...
106,108,115,113,112,100,116,112,114,112];
f=var(x2)/var(x1);
c1=finv(0.01,19,24); c2=finv(0.99,19,24);
fprintf( f=%6.2f, c1=%5.2f, c2=%5.2f\n,f,c1,c2)
ma1=mean(x1); ma2=mean(x2);
v1=var(x1); v2=var(x2); c=(v1/25)/(v1/25+v2/20);
n=c2/24+(1-c)2/19; n=ceil(1/n);
t=(ma1-ma2)/sqrt(v1/25+v2/20);
t2=tinv(0.99,n); t1=-t2;
fprintf( t=%7.3f, t1=%6.3f, t2=%6.3f,t,t1,t2)
332
ele
,
pentru
care
, oricare a fi
.
Problema poate fi reformulata.
Se considera o populatie , pentru care se cerceteaza caracteristica , care ur
meaza legea normala
, cu necunoscut.
Vrem sa verificam ipoteza nula
, cu una din alternativele
, cand obtinem testul bilateral,
and obtinem testul unilateral dreapta,
, c
, cand obtinem testul unilateral stanga.
Conform Proprietatii 4.2.26, statistica
unde
unde
este functia de repartitie pentru legea Student cu
grade de libertate (tabelata n
Anexa II, pentru anumite valori).
Intervalul numeric pentru statistica nu este determinat n mod unic din
conditia de mai sus. In functie de alternativa aleasa, se considera suplimentar:
unde
333
, daca
, daca
, daca
,
,
,
a legii Student cu
grade de libertate.
4. Concluzia: daca
respinsa.
Programul 6.8.10. Vom scrie un program, care genereaza n vectori aleatori, care
urmeaza legea normala bidimensionala. Folosind testul pentru perechi, vom verifica ipoteza nula, ca mediile celor doua variabile sunt egale, precum si intervalul de
ncredere pentru diferenta mediilor, respectiv cand se aplica testele bilateral, unilateral dreapta si unilateral stanga. Nivelul de semnificatie folosit este alpha=0.05.
mu(1)=input(m1=); mu(2)=input(m2=);
v(1,1)=input(sigma12=);
v(2,2)=input(sigma22=);
v(1,2)=input(Cov(X,Y)=); v(2,1) =v(1,2);
if det(v) <= 0
error(Matricea v nu e pozitiv definita!)
end
n=input(n=); Z=mvnrnd(mu,v,n);
d=diff(Z,1,2);
fprintf( h
c
ci
\n)
fprintf(___________________________\n)
for i=-1:1
[h,c,ci]=ttest(d,0,0.05,i);
fprintf( %d %5.4f
(%4.2f,%4.2f) \n,h,c,ci)
end
2 2
si n=30, sunt
2 3
334
Deoarece h=0, pentru fiecare alternativa n parte, testul nu respinge ipoteza ca cele
doua medii sunt egale. Acest lucru se vede si din faptul ca valoarea critica satisface
inegalitatea c alpha=0.05.
Programul mai calculeaza intervalul de ncredere pentru diferenta celor doua medii. Se observa ca acesta difera, n functie de parametrul tail=-1,0,1. De asemenea, se observa ca am considerat nivelul de semnificatie alpha=0.05, dar acesta
poate fi usor modificat n apelul functiei ttest.
6.9 Testul
pentru concordanta
Se considera colectivitatea cercetata din punct de vedere al caracteristicii cantitativa sau calitativa. Fie numarul claselor caracteristicii si
evenimentul ca
un individ luat la ntamplare din colectivitatea sa apartina clasei cu numarul de
ordine .
Notand
, , atunci .
a
,
, cu ipoteza
Relativ la caracteristica facem ipoteza nul
.
alternativa : exista astfel ncat
Pentru a verifica aceasta ipoteza se considera o selectie repetata de volum . Fie
. Folosind aceste date de selectie se obtin frecventele
datele de selectie
absolute ale claselor caracteristicii . Vom nota prin
frecventa absoluta a clasei
cu numarul de ordine . Altfel spus, numara de cate ori a aparut evenimentul
n
selectia considerata.
Corespunzator frecvent
elor absolute ,
, avem variabilele aleatoare (de
, ce iau aceste valori.
selectie) ,
Asadar, pornind de la caracteristica
, care poate fi si calitativa, s-a ajuns la
variabilele de selectie ,
, care sunt componentele unui vector aleator
dimensional
, ce urmeaza legea multinomiala. Anume, avem:
unde
,
Daca privim ipoteza nula
legi multinomiale.
,
, .
, constatam ca aceasta se refera la parametrii unei
6.9. Testul
pentru concordanta
335
urmeaza legea
e . Astfel,
e
e
unde este o constanta pozitiva. Logaritmand aceasta relatie obtinem
ln
si notand
ln
ln
adica
rezulta ca
ln
ln
ln
ln
ln
ln
deci
ln
336
Dar avem ca
deci
, obtinem
Daca se noteaza
ln
sau
ln
e
e
pentru
, urmeaza o lege normala dimensionala degenerata, deoarece fiecare
componenta se poate exprima ca si combinatie liniara a celorlalte componente.
Din teoria probabilitat ilor se cunoaste ca suma patratelor componentelor unui
vector aleator ce urmeaza legea normala si ntre care exista o legatura liniara este
o variabila aleatoare ce urmeaza legea cu numarul gradelor de libertate dat de
numarul componentelor vectorului mai putin unu. Ceea ce trebuie demonstrat.
Pe baza proprietatii precedente, pentru nivelul de semnificatie
poate determina cuantila astfel ncat
dat, se
, deci
, respectiv va fi respinsa n caz
6.9. Testul
pentru concordanta
. (sirul datelor de select
ie
este un sir avand ca elemente evenimentele
,
, din
1. Se dau:
337
astfel ncat
);
Se calculeaza
ipoteza este admisa, n caz contrar ipoteza
Concluzia: daca
este respinsa.
Folosind nivelul de semnificatie
, sa verificam daca zarul respectiv este fals
sau nu.
Se aplica testul , privind parametrii legii multinomiale. Intr-adevar, evenimen
tul
reprezinta aparitia fetei cu numarul ,
. Se face ipoteza nula
cu alternativa
astfel ncat
, care are
Pe de alta parte, din Anexa III, avem cuantila
, deci
, ceea ce conduce la respingerea ipotezei nule,
rezulta
adica acceptam ipoteza ca zarul este fals.
338
Programul 6.9.4. Programul Matlab, care urmeaza, efectueaza calculele din exemplul precedent:
x=1:6; f=[15,7,4,11,6,17]; p=1/6*ones(1,6);
x2=sum((f-60*p).2./(60*p));
cuant=chi2inv(0.95,5);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)
De asemenea, evenimentul
va fi evenimentul ca un individ luat la ntamplare din
colectivitatea cercetata sa apartina clasei . Prin urmare, s-a ajuns la aplicarea
testului privind
concordanta. Ipoteza nula, mai sus precizata, devine n acest fel
,
, iar ipoteza alternativa se va rescrie : exista astfel ncat
, unde
neparametric
;
, si probabilitat ile
3. Se calculeaza
4. Se calculeaza
fiind
6.9. Testul
pentru concordanta
339
Folosind nivelul de semnificatie
, sa verificam daca urmeaza legea bino
miala. Daca urmeaza legea binomiala cu
, atunci are distributia teoretica
de
Seva aplica
testul
Cum
se obtine
x2=
cuant=
4.5
9.49
340
si
1. Se dau:
3. Se calculeaza
4.
Se calculeaza
, si probabilitat ile
astfel ncat
Aplicatia 6.9.9. (Testul parametric privind concordanta). Se considera caracteristica care urmeaza legea de probabilitate cu functia de repartitie necunoscuta.
Relativ la legea de probabilitate se face ipoteza nula
cu ipoteza alter
nativa
. Fata de cazul neparametric, functia de repartit
ie se consi
dera ca depinde de parametri necunoscuti. Fie acesti parametri
, adica
.
In acest caz, fata de cazul neparametric, la nceput se estimeaza parametrii necunoscuti, folosind datele de selectie considerate, cu ajutorul metodei verosimilitat ii
maxime. Fie estimatiile de verosimilitate maxima ale parametrilor mai sus precizati,
respectiv
.
In continuare, cele expuse la cazul neparametric raman neschimbate cu doua observatii. In primul rand, probabilitat ile claselor considerate se calculeaza prin formula
pentru
libertate.
grade de
6.9. Testul
pentru concordanta
parametric
1. Se dau:
341
4. Se calculeaza
5. Se calculeaza
6. Concluzia: daca
pentru para-
, si probabilitat ile
astfel ncat
se accept
a ipoteza ca urmeaza legea de
probabilitate data prin functia de repartitie
n caz
contrar ipoteza este respinsa.
Exemplul 6.9.10. O substanta radioactiva este observata n intervale de timp de
lungimi egale ( secunde). Pentru fiecare interval de timp este nregistrat numarul
particulelor emise. Rezultatele obtinute sunt:
Nr. part.
Se calculeaz
at ile de la legea lui Poisson, cu parametrul
aapoiprobabilit
adica
Astfel se obtin valorile:
,
342
de unde
Pe de alta parte, folosind Anexa III, avem cuantila
si prin urmare
, deci ipoteza ca urmeaza legea lui Poisson este
acceptata.
Aplicatia 6.9.12. (Testul parametric privind normalitatea). Relativ la caracteristica se considera ipoteza nula , unde
si
6.9. Testul
pentru concordanta
Avand n vedere ca
unde
343
rezulta ca
e
si probabilitat ile
;
, estimatiile
3. Se calculeaza
4. Se calculeaza
astfel ncat
frecv.
344
utilizand testul de concordanta , cu nivelul de semnificatie
.
Prima data se estimeaza parametrii de la legea normala
, adica media
teoretica
si abaterea standard teoretica
, folosind metoda
de verosimilitate maxima. Se cunoaste ca estimatiile de verosimilitate maxima pentru
si sunt respectiv
de unde calculam
, n cazul de fata ), este frecventa clasei , iar
6.9. Testul
pentru concordanta
345
, folosind Anexa III.
, pentru statistica
, adica intervalul numeric pentru
Anume, se obtine ca
statistica este .
Calculele pentru valoarea numerica se aranjeaza n urmatorul tabel:
Se determina intervalul
Deoarece
risticii .
este
Programul 6.9.14. Toate calculele din tabelul precedent pot fi efectuate prin programul Matlab:
x=1.625:0.05:2.025; f=[11,14,17,17,18,16,13,10,8];
ma=sum(f.*x)/124; s=sqrt(sum(f.*(x-ma).2)/124);
a=[-inf,1.65:0.05:2,inf];
F=normcdf(a,ma,s); p=diff(F);
x2=sum((f-124*p).2./(124*p));
cuant=chi2inv(0.95,6);
fprintf( x2= %6.1f\n cuant= %5.2f,x2,cuant)
346
6.10 Testul
pentru compararea
mai multor caracteristici
..
.
..
.
Vol. selectiei
..
.
..
.
Total
Total
..
.
..
.
Elementul
, iar
6.10. Testul
347
cand ipoteza nula este adevarata. Avand n vedere relatia dintre probabilitat ile
, se obtine ca
ln
ln
ln
ln
de unde rezulta ca
cu
348
2. Se calculeaza
3.
4.
,
;
,
, astfel ncat
Se calculeaza
Se calculeaza
5. Concluzia: daca
respinge.
;
,
, n caz contrar se
urmeaza legea cu
grade de libertate. Aplicarea testului,
n acest caz, se adapteaza n mod corespunzator.
Exemplul 6.10.4. S-au considerat trei loturi de bolnavi de emfizem pulmonar, n
functie de numarul tigarilor fumate zilnic: mai putin de un pachet, unul sau doua
pachete si respectiv mai mult de doua pachete. Pentru emfizemul pulmonar sunt considerate stadii notate de la I la IV. Rezultatele cercetarilor sunt trecute n urmatorul
tabel sistematizat
Categoria
Stadiul
pachet
pachete
pachete
II
III
IV
6.11. Testul
349
Vrem sa sa verificam, cu nivelul de semnificatie
, ipoteza ca numarul
de tigari fumate zilnic nu influenteaza repartizarea bolnavilor n cele patru stadii
ale bolii. Verificam ipoteza facuta cu ajutorul testului privind compararea aceluiasi atribut, dar pentru
iidiferite.
Numarul gradelor de libertate este dat
populat
prin formula
pentru care se obtine cuantila
.
Se calculeaza apoi valoarea
6.11 Testul
350
cu
. Fie
,
,
. Daca se noteaza
si
..
.
..
.
unde
,
iar
..
.
..
.
.
..
.
,
ln
este adevarata. Prin logaritmare se obtine
ln
ln
ln
6.11. Testul
351
ln
sau
deci
Asadar
,
adica
.
;
,
, astfel nc
at
,
;
352
4.
5. Concluzia: daca
respinge.
si
, n caz contrar se
este valoarea unei variabile aleatoare ce urmeaza legea cu
grade
unei legi
de libertate. Aceasta rezulta din faptul ca prima suma corespunde
cu
grade de libertate, a doua sum
grade de
a corespunde unei legi cu
cu
libertate, iar a treia unei legi
grade de libertate. Prin urmare
de unde
Aplicarea testului, n acest caz, se face prin adaptarea corespunzatoare a cazului precedent.
Observatia 6.11.4. Testul pentru tabele de contingenta si respectiv pentru compararea mai multor caracteristici, pare sa fie acelasi . Dar, remarcam faptul ca problemele de la care se porneste sunt complet diferite.
Exemplul 6.11.5. Pentru cercetarea dependentei dintre culoarea
a ochilor si cuindivizi. Rezultatele
loarea a parului, s-a considerat un esantion format din
sunt trecute n tabelul sistematizat urmator
A
B
Albastri
Gri sau verzi
Caprui
Blonzi
Sateni
Bruneti
Roscati
Folosind nivelul de semnificatie
, vom verifica ipoteza ca cele doua caracteristici (atribute) sunt independente.
Se
foloses
tetestul
tabele
decontingenta cu numarul gradelor de liber pentru
tate
.
353
Pe de o parte avem ca
354
e
. Anu-
a lui Kolmogorov fiind tabelata pentru anumite valori n Anexa V.
functia
De asemenea,
, pentru testele unilaterale dreapta si stanga ale lui Kolmo
si
adica
gorov.
va fi admisa cand valorile calcuCorespunz
ator celor trei alternative, ipoteza
ale statisticilor , ,
late , , , pe baza datelor de selectie
, satisfac respectiv conditiile
(1)
(2)
(3)
, c
and
, cand
, cand
,
,
,
iar n caz contrar va fi respinsa.
Prezentam, n cele ce urmeaza, mpreuna, cele trei teste (bilateral, unilateral
dreapta, unilateral stanga) ale lui Kolmogorov. Remarcam ca cele trei teste sunt teste
distincte, alegerea unuia dintre ele se face apriori.
355
;
;
2. Se determina
(1)
(2)
(3)
astfel nc
at
astfel nc
at
astfel ncat
, cand
, cand
, cand
,
,
;
3. Se calculeaza
(1)
(2)
(3)
, cand
, cand
, cand
,
,
;
4. Concluzia: daca
(1)
(2)
(3)
ipoteza este admisa, cand
este admisa, cand
ipoteza
este admisa, cand
ipoteza
,
,
,
356
formule de calcul
Observatia 6.12.3. Cand datele sunt grupate, avand clasele date prin punctele
, pentru de
Folosind nivelul de semnificatie
, stiind
mm si
abaterea standard
mm, se cere verificarea normalitatii caracteristicii , cu ajutorul testului lui Kolmogorov bilateral, iar apoi cu ajutorul testului
neparametric.
Ipoteza care se face este ca functia de repartitie a lui este
357
unde
. Pentru verificarea acestei ipoteze, folosind criteriul lui
,
Kolmogorov, se calculeaza
, iar
este functia de repartitie
,
unde
de selectie.
Pentru calculul valorilor functiei de repartitie se tine seama de faptul ca
cu functia lui Laplace
tabelata n Anexa I.
Pe de alta parte, valorile functiei de repartitie de selectie se calculeaza cu formula
pentru
, de unde rezulta ca
si admitemipoteza de
.
358
unde
si
. Astfel avem
de unde
, conform Anexei III.
, rezult
a ca ipoteza de normalitate este
Programul 6.12.5. Vom scrie un program Matlab, pentru aplicarea testului lui Kolmogorov si a testului , n cazul datelor din exemplul precedent.
% Testul lui Kolmogorov
a=97.75:0.5:102.75;
n=[0,21,47,87,158,181,201,142,97,41,25];
F0=normcdf(a,100.25,1); Fn=cumsum(n)/1000;
dn=max(abs(F0-Fn)); ks=sqrt(1000)*dn;
fprintf( ks=
%6.4f\n,ks)
% Testul chi2
F0(1)=0; F0(end)=1;n=n(2:end);
p0=diff(F0); x2=sum((n-1000*p0).2./(1000*p0));
cuant=chi2inv(0.95,9);
fprintf( x2= %6.4f\n,x2)
fprintf( cuant=%6.2f,cuant)
Exemplul 6.12.6. Se tin sub observatie
motoare electrice pana la defectarea
ultimului dintre ele. Se considera caracteristica , ce reprezinta numarul miilor de
ore de functionare pana la defectare. Rezultatele observatiilor sunt date n tabelul
urmator
Durata
Frecv.
359
e
parametru necunoscut
unde
si care conduce la
Aici
, iar
n tabelul urmator.
360
Asadar avem ca
exponentialitatea lui este admisa.
deci
Programul 6.12.7. Vom scrie un program Matlab, care efectueaza calculele din
exemplul precedent:
% Testul chi2
clear
a=[0:30:180,300]; f=[13,10,5*ones(1,4),7];
mij=[15:30:165,240]; mu=sum(mij.*f)/50;
F0=expcdf(a,mu);F0(end)=1; p0=diff(F0);
x2=sum((f-50*p0).2./(50*p0));
cuant=chi2inv(0.95,5);
fprintf( x2= %6.4f\n,x2)
fprintf( cuant= %4.2f\n,cuant)
% Testul lui Kolmogorov
F0=F0(2:end);F0(end)=expcdf(a(end),mu);
Fn=cumsum(f)/50;
dn=max(abs(F0-Fn)); ks=sqrt(50)*dn;
fprintf( ks=
%6.4f,ks)
Comenzile de acest tip lanseaza executia testului lui Kolmogorov bilateral (cand
tail=0, valoare implicita), unilateral dreapta (cand tail=1), respectiv unilateral
stanga (cand tail=-1), prin considerarea datelor continute de vectorul x, iar functia
361
de repartitie ipotezata fiind precizata prin prametrul cdf. Implicit se considera cdf
corespunzand legii normale standard.
Daca parametrul cdf este prezent, trebuie sa fie o matrice cu doua coloane, care
contine n coloana a doua valorile functiei de repartitie ipotezate pe punctele precizate
n prima coloana. Ar fi de dorit ca prima coloana a matricei cdf sa coincida cu
vectorul x, altfel functia va efectua un proces de interpolare pentru calculul valorilor
functiei ipotezate pe punctele lui x, folosind punctele precizate prin matricea cdf.
Din acest motiv, se impune ca toate componentele lui x sa aiba valorile continute n
intervalul determinat de valoare minima si valoarea maxima a componentelor primei
coloane a lui cdf.
Parametrul alpha (implicit alpha=0.05) reprezinta nivelul de semnificatie.
Rezultatele obtinute au urmatoarele semnificatii. Daca h=1 ipoteza nula se res
pinge, ceea ce corespunde faptului ca valoarea critica c satisface relatia c alpha,
iar daca h=0, ipoteza nula nu poate fi respinsa. Mai
remarcam faptul ca ks va
contine respectiv
valoarea
calculat
a
a
statisticilor
,
si ,
si verific
iile
anrelat
si,
c
n
,
pentru
testul
bilateral,
respectiv
c
n pentru testele unilaterale.
c
respectiv graficele din Figura 6.4 Se observa, n mod surprinzator, ipoteza nula nu
poate fi respinsa. Acest lucru se datoreaza faptului ca testul lui Kolmogorov este bazat
pe un rezultat asimptotic, adica se aplica pentru valori mari ale volumului selectiei.
362
0.9
0.8
0.7
F(x)
0.6
0.5
0.4
0.3
0.2
0.1
0
3
Comenzile de acest tip lanseaza executia testului Lilliefors, prin considerarea datelor
continute de vectorul x, iar functia de repartitie ipotezata fiind cea de la legea normala
.
Parametrul alpha (implicit alpha=0.05) reprezinta nivelul de semnificatie.
Rezultatele obtinute au urmatoarele semnificatii. Daca h=1 ipoteza nula se res
pinge, ceea ce corespunde faptului ca valoarea critica c satisface relatia c alpha,
iar daca h=0, ipoteza nula nu poate fi respinsa.
Mai remarcam faptul ca ls va contine respectiv valoarea calculata a statisticii
, iar c este valoarea critica, care se calculeaza cu ajutorul lui ls, folosinduse
tabelele construite de Lilliefors. Daca n aceste tabele nu se afla valoarea corespunzatoare, atunci c=NaN, dar h indica nca daca ipoteza nula este respinsa sau nu.
Programul 6.12.9. Sa aplic
am testul lui Lilliefors pentru n numere aleatoare ce urmeaza legea normala
, continute de vectorul x, cu nivelul de semnificatie
363
0.9
0.8
0.7
F(x)
0.6
0.5
0.4
0.3
0.2
0.1
10
x
12
14
16
364
(1)
(2)
(3)
Pentru verificarea ipotezei nule , cu una din alternativele precizate, se considera cate o selectie repetata de volum si respectiv , cu datele de selectie
si variabilele de selectie , corespunzatoare pen
tru caracteristica si datele de selectie
, corespunzatoare pentru caracteristica . si variabilele de selectie
Se considera statisticile
e
adica
365
adica
(1)
(2)
(3)
,
,
,
, cand
, cand
, cand
;
;
2. Se determina
(1)
(2)
(3)
astfel nc
at
astfel nc
at
3. Se calculeaza
(1)
(2)
(3)
astfel ncat
, cand
, cand
, cand
4. Concluzia: daca
, cand
, cand
, cand
,
;
;
,
;
;
366
este admisa, cand
ipoteza
este admisa, cand
ipoteza
ipoteza este admisa, cand
(1)
(2)
(3)
,
,
,
,
ipoteza nula
daca valoarea critica
. Astfel, se va respinge
satisface inegalitatea
367
[h,c,ks]=kstest2(x,y,[],i);
fprintf( %d %5.4f
%4.2f\n,h,c,ks)
end
h1=cdfplot(x); hold on, h2=cdfplot(y);
title(Functiile de repartitie de selectie)
set(h1,linestyle,--)
set(h2,linestyle,-)
respectiv graficele din Figura 6.6. Testul KolmogorovSmirnov este bazat pe un reFunctiile de repartitie de selectie
1
0.9
0.8
0.7
F(x)
0.6
0.5
0.4
0.3
0.2
0.1
0
2
368
Anexe
369
e
370
Anexe
Anexa II (Legea Student)
Anexe
371
)
372
Anexe
Anexa IV (Legea FisherSnedecor)
Anexe
373
Anexa IV (continuare)
374
Anexe
Anexa IV (continuare)
Anexe
375
Anexa IV (continuare)
376
Anexe
Bibliografie
[1] Abramowitz, M., Stegun, I. A., Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables, tenth ed., Dover Publications, Inc.,
New York, 1972.
[2] Blaga, P., Calculul probabilitat ilor. Culegere de probleme, Universitatea
BabesBolyai, ClujNapoca, 1984.
[3]
[4]
, Calculul probabilitat ilor si statistica matematica. Vol. II. Curs si culegere de probleme, Universitatea BabesBolyai, ClujNapoca, 1994.
[5]
[6]
[7]
[8] Blaga, P., Lupas, A., Muresan A. S., Matematici aplicate, Vol.III, Promedia
Plus, ClujNapoca, 1999.
[9] Blaga, P., Muresan A. S., Matematici aplicate n economie, Vol.III, Transilvania Press, ClujNapoca, 1996.
[10] Blaga, P., Radulescu, M., Calculul probabilitat ilor, Universitatea Babes
Bolyai, ClujNapoca, 1987.
[11] Ciucu, G., Elemente de teoria probabilitat ilor si statistica matematica, Editura
didactica si pedagogica, Bucuresti, 1963.
377
378
Bibliografie
[12] Ciucu, G., Craiu, V., Probleme de statistica matematica, Editura didactica si
pedagogica, Bucuresti, 1968.
[13]
[14]
[15]
[16] Ciucu, G., Craiu, V., Stefanescu, A., Statistica matematica si cercetari operationale, Vol. I, Editura didactica si pedagogica, Bucuresti, 1974.
[17] Ciucu, G., Tudor, C., Probabilitat i si procese stochastice. Vol. I, Editura Academiei, Bucuresti, 1978.
[18] Craiu, V., Verificarea ipotezelor statistice, Editura stiintifica si enciclopedica,
Bucuresti, 1972.
[19] Craiu, V., Enache, R., Basca, O., Teste de concordanta cu programe n FORTRAN, Editura stiintifica si enciclopedica, Bucuresti, 1974.
[20] Cramer, H., Mathematical methods of statistics, Princeton University Press,
Princeton, 1951.
[21] DacunhaCastelle, D., Duflo, M., Exercises de probabilites et statistiques.
1. Probl`emes a` temps fixe. Tome 1, Masson, Paris, 1990.
[22]
[23] Deak, I., Random number generators and simulation, Akademiai Kiado, Budapest, 1990.
[24] Dumitrescu, M., Florea, D., Tudor, C., Probleme de teoria probabilitat ilor si
statistica matematica, Editura Tehnica, Bucuresti, 1985.
[25] Enders, W., Applied econometric. Time series, John Wiley & Sons, 1995.
[26] Ermakov, S. M., Metoda Monte Carlo si probleme nrudite, Editura Tehnica,
Bucuresti, 1976.
[27] Feller, W., An introduction to probability theory and its applications. Vol. I,
John Wiley, New York, 1957.
Bibliografie
[28]
379
[29] Gnedenko, B. V., The theory of probability, Mir Publishers, Moscow, 1976.
[30] Good, Ph. I., Resampling Methods. A Practical Guide to Data Analysis,
Birkhauser, Boston Basel Berlin, 1999.
[31] Griffiths, D. F., An Introduction to Matlab, Version 2.1, University of Dundee,
1997.
[32] Grinstead, Ch. M., Snell, J. L., Introduction in probability, Second edition, American Mathematical Society, 1997.
[33] Gurski, E. I., Culegere de probleme pentru teoria probabilitat ilor si statistica
matematica (l. rusa), Edit. Inv. superior Minsk, Minsk, 1984.
[34] Hoel, P. J., Introduction to mathematical statistics, Fourth edition, John Wiley
& Sons, New YorkLondonSydneyToronto, 1971.
[35]
[36] HoffmannJrgensen, J., Probability with a view toward statistics, Vol. I-II,
Chapman & Hall, New YorkLondon, 1994.
[37] Iosifescu, M., Mihoc, Gh., Theodorescu, R., Teoria probabilitat ilor si statistica
matematica, Editura Tehnica, Bucuresti, 1966.
[38] Iosifescu, M., Moineanu, C., Trebici, V., Ursianu, E., Mica enciclopedie de statistica, Editura stiintifica si enciclopedica, Bucuresti, 1985.
[39] Jansson, B., Random number generators, Victor Petterson Bokindustri Aktiebolag, Stockholm, 1966.
[40] Johnson, N. L., Kotz, S., Distributions in statistics. Discrete distributions, Houghton Mifflin Company, Boston, 1969.
[41] Kendall, M. G., Stuart, A., The advanced theory of statistics. Vol. 1. Distribution
theory, Second edition, Charles Griffin & Company Limited, London, 1961.
[42]
[43]
380
Bibliografie
[44] Knuth, D. E., The art of computer programming, Vol. II. Seminumerical algorithms, Addison-Wesley, Mass., 1969.
[45] Lebart, L., Morineau, M. G., Fenelon, J.-P., Traitment des donnees statistiques.
methodes et programmes, Dunod, Paris, 1982.
[46] Lecoutre, J.-P., Tassi, Ph., Statistique non parametrique et robustesse, Economica, Paris, 1987.
[47] Lehmann, E. L., Testing statistical hypotheses, Second edition, Springer, New
YorkBerlin, 1997.
[48] Malita, M., Zidaroiu, C., Incertitudine si decizie, Editura stiintifica si enciclopedica, Bucuresti, 1980.
[49] Mihoc, Gh., Ciucu, G., Craiu, V., Teoria probabilitat ilor si statistica matematica, Editura didactica si pedagogica, Bucuresti, 1970.
[50] Mihoc, Gh., Ciucu, G., Muja, A., Modele matematice ale asteptarii, Editura
Academiei, Bucuresti, 1973.
[51] Mihoc, Gh., Craiu, V., Tratat de statistica matematica. Vol. I. Selectie si
estimatie, Editura Academiei, Bucuresti, 1976.
[52]
, Tratat de statistica matematica. Vol. II. Verificarea ipotezelor statistice, Editura Academiei, Bucuresti, 1977.
[53] Mihoc, Gh., Firescu, D., Statistica matematica, Editura didactica si pedagogica,
Bucuresti, 1966.
[54] Mihoc, I., Calculul probabilitat ilor si statistica matematica. Part. I, II, lito.
Univ. BabesBolyai, ClujNapoca, 1994,1995.
[55] Nakamura, S., Numerical Analysis and Graphic Visualization with MATLAB,
Prentice Hall PTR, Upper Saddle River, New Jersey, 1996.
[56] Oancea, E., Radulescu, M., Calculul probabilitat ilor si statistica matematica,
lito. Univ. BabesBolyai, ClujNapoca, 1974.
[57] Ogden, R. T., Essential wavelets for statistical applications and data analysis,
Birkhauser, Boston Basel Berlin, 1997.
[58] Onicescu, O., Numere si sisteme aleatoare, Editura Academiei, Bucuresti, 1962.
Bibliografie
381
382
Bibliografie
[79] Wahba, G., Spline models for observational data, Society for Industrial and
Applied Mathematics, Philadelphia, 1990.
[80] Yule, G. U., Kendall, M. G., Introducere n teoria statisticii, Editura stiintifica,
Bucuresti, 1969.
Index
Abatere
cuartilica, 152
medie absoluta, 152
medie patratica, 152
standard, 107, 152
abs, 9
acos, 9
acosh, 9
acot, 9
acoth, 9
acsc, 9
acsch, 9
all, 15
Amplitudinea, 152
clasei, 120
and, 14
angle, 9
ans, 12
any, 14
asec, 9
asech, 9
Asimetrie, 103, 154
asin, 9
asinh, 9
atan, 9
atan2, 9
atanh, 9
Atribut, 114
axis, 23
bar3h, 58
barh, 31
beta, 80
betafit, 282
betalike, 280
bino, 68
binofit, 282
boxplot, 164
Camp de evenimente, 62
Camp de probabilitate, 62
calendar, 6
Cantitate de informatie, 232
Caracteristica, 114
calitativa (atribut), 114
cantitativa, 114
continua, 115
discreta, 115
caseread, 127
casewrite, 127
cd, 4, 10
cdf, 65, 66, 74, 107
cdfplot, 223
ceil, 9
Centile, 104, 151
Centru de greutate, 174
chi2, 83
cla, 23
Clase, 120
clear, 11
clf, 23
clock, 6
384
Coeficientii
lui Fisher, 154
lui Pearson, 154
Coeficient de asimetrie
intercuartil, 154
Coeficient de corelatie, 95
al lui Pearson, 167
al rangurilor, 187
de selectie, 207
Coeficient de regresie, 174
Coeficient de variatie, 154
intercuartil, 154
Coeficientul
lui Kendall, 189
lui Spearman, 187
Coeficientul de concordanta
al lui Kendall, 194
Colectivitate, 114
colormap, 27
combnk, 10
Concatenare, 9
conj, 9
contour, 54
contourf, 55
Convergenta
n probabilitate, 108
n repartitie, 108
Corectiile
Sheppard, 158
Corelatie, 95, 165
Corp borelian, 62
corrcoef, 180
cos, 9
cosh, 9
cot, 9
coth, 9
cov, 179
Covarianta , 95
crosstab, 126
Index
csc, 9
csch, 9
Cuantila, 104
Cuartila, 104, 150
inferioara, 104, 150
superioara, 104, 150
cumprod, 157
cumsum, 157
Curba de regresie, 103, 170
date, 6
Date de selectie, 198
dbclear, 16
dbcont, 16
dbdown, 16
dbmex, 17
dbquit, 17
dbstack, 16
dbstatus, 16
dbstep, 16
dbstop, 16
dbtype, 16
dbup, 17
Decile, 104, 151
delete, 17
demo, 4
Densitate de probabilitate, 73, 74
marginala, 89
det, 10
diag, 10
Diagrama
cumulativa ascendenta, 129
integrala cumulativa, 132
prin batoane (bare), 129
diary, 11, 43
diff, 157
dir, 4
disp, 10
Dispersie, 95, 152
conditionata, 101, 170
Index
de selectie, 206
Distributie, 64
statistica, 123
Distributie marginala, 88
disttool, 107
Drepte de regresie, 173
Esantion, 197
echo, 48
edit, 16
Eficienta , 242
eps, 6
eq, 14
erf, 76
Eroare
de speta ntai, 291
de speta a doua, 291
Estimatie, 236
absolut corecta, 237
consistenta, 236
corecta, 239
cu minim, 256
de verosimilitate maxima, 252
nedeplasata, 236
Estimator, 236
absolut corect, 237
consistent, 236
corect, 239
cu minim, 256
de verosimilitate maxima, 252
nedeplasat, 236
optimal, 247
Eveniment
cert, sigur, 62
Exces, 103
exit, 2
exp, 9, 79
Experiment, 62
expfit, 282
eye, 6
385
ezcontour, 56
ezcontourf, 57
ezmesh, 57
ezmeshc, 57
ezplot, 35
ezplot3, 51
ezpolar, 25
ezsurf, 57
ezsurfc, 57
f, 85
factor, 10
factorial, 10
feval, 47
Fisiere script, 15, 43
figure, 23
file, 17
fill, 35
fix, 9
floor, 9
flops, 48
format, 5
Formula lui Daniels, 193
fplot, 33
fprintf, 13
Frecventa
absoluta, 120, 124
cumulata
ascendenta, 123
descendenta, 123
relativa, 123
Functia eroare, 76
Functia Laplace, 76, 77
Functia lui Euler
de speta ntai, 80
de speta a doua, 78
Functie caracteristica, 103
Functie de estimatie, 236
absolut corecta, 237
corecta, 239
386
eficienta, 242
nedeplasata, 236
Functie de probabilitate, 65
Functie de repartitie, 6365, 74
conditionata, 89
de selectie, 216
marginala, 88
Functie de selectie, 198
Functie de supravietuire, 93
Functie de verosimilitate, 229
Functie hazard, 93
Functie nucleu, 131
Gaussian, 131
parabolic (Epanechnikov), 131
Functie wavelet, 29
mama, 29
Functii Matlab, 43
Functiile lui Haar, 29
gam, 78
gamfit, 282
gamlike, 280
gcd, 10
ge, 14
geo, 73
geomean, 149
ginput, 13
gline, 181
global, 44
gplotmatrix, 146
grid, 24
grpstats, 163
Grupare, 120
gscatter, 144
gt, 14
gtext, 24
harmmean, 149
help, 2, 44
helpdesk, 4
Index
helpwin, 3
hist, 138, 139
histc, 139, 140
histfit, 278
Histograma, 129
hold, 22
hyge, 69
i, 6
icdf, 104, 107
imag, 9
Indicatorul
de verosimilitate, 257
lui Berkson, 257
lui Kullbach, 257
lui Neyman, 257
lui Pearson, 257
Indice
de dilatare, 29
de translatare, 29
inf, 6
input, 13
Instructiunea
break, 42
de atribuire, 12
error, 43
for, 40
if, 37
pause, 42
return, 42
switch, 38
try...catch, 41
while, 39
Instructiuni
de citire, 13
de scriere, 13
Interval
intercuartilic, 152
Interval de ncredere, 185, 187, 257
inv, 10
Index
Ipoteza statistica, 285
alternativa, 285
compusa, 285
nula, 285
simpla, 285
iqr, 155
j, 6
kstest, 360
kstest2, 366
kurtosis, 155
lcm, 10
ldivide, 8
le, 14
Lege de probabilitate
de tip continuu, 74
clasica, 74
statistica, 81
de tip discret, 64
clasica, 67
Legea
, 83
necentrata, 85
arcsin, 80
Bernoulli, 67
beta, 80
binomiala, 68
binomiala negativa, 72
Cauchy, 81
evenimentelor rare, 71
exponentiala, 71, 79
F (FisherSnedecor), 85
necentrata, 86
gamma, 78
geometrica, 73
hipergeometrica, 69
lognormala, 78
normala, 76
normala multidimensionala, 90
387
Pascal, 72
Poisson, 70
Rayleigh, 80
t (Student), 81
necentrata, 82
uniforma, 74
discreta, 68
Weibull, 80
Legea numerelor mari, 109
legend, 24
length, 10
lillietest, 362
load, 11
log, 9
log10, 9
log2, 9
logn, 78
lookfor, 3, 44
lsline, 181
lt, 14
mad, 155
magic, 6
Matrice vida, 12
Matricea covariantelor, 95
Matricea informatiei lui Fisher, 232
max, 156
mean, 149
median, 150
Mediana, 104, 149
Medie
aritmetica, 148
armonica, 149
geometrica, 148
Medie de selectie, 199
mesh, 52
meshgrid, 52
Metoda ferestrei mobile, 130
Metode de selectie
nerepetate, 198
388
repetate(bernoulliene), 198
min, 156
minus, 8
mkdir, 4, 10
mldivide, 8
mle, 278
Mod, 151
Moment, 151, 166
centrat, 103, 152, 167
centrat de seletie, 203
de seelctie, 201
initial, 103
moment, 155
mpower, 8
mrdivide, 9
mtimes, 8
mvnrnd, 117
mvtrnd, 117
NaN, 6
nanmax, 158
nanmean, 158
nanmedian, 158
nanmin, 158
nanstd, 158
nansum, 158
nargin, 44
nargout, 44
nbin, 72
ncf, 86
nchoosek, 10
nct, 82
ncx2, 85
ndims, 10
ne, 14
Nivel de semnificatie, 286
nlinfit, 185
nlintool, 186
Nor statistic, 133
norm, 76
Index
normfit, 282
normlike, 280
normspec, 87
not, 14
Numere
aleatoare, 116
pseudoaleatoare, 117
Observare
curenta, 115
partiala, 115
periodica, 115
totala, 115
ones, 6
or, 14
pdf, 65, 66, 74, 107
perms, 10
pi, 6
pie, 147
pie3, 147
plot, 17, 25, 28, 65, 74, 138
plot3, 49
plotmatrix, 145
plus, 8
poiss, 70
poissfit, 282
polar, 25
poly, 183
polyfit, 182
polytool, 184
polyval, 183
polyvalm, 183
Populatie, 114
power, 8
prctile, 151
primes, 10
Proba, 62
Probabilitate, 62
Probabilitate de ncredere, 185
Index
Proceduri Matlab, 43
prod, 157
Puterea unui test, 291
quit, 2
rand, 118
randn, 118
random, 117
randperm, 119
randtool, 147
range, 155
rank, 10
Raport de corelatie, 171
rayl, 80
raylfit, 282
rdivide, 8
real, 9
realmax, 6
realmin, 6
refcurve, 182
refline, 181
Regiune critica, 286
Regula lui Sturges, 120
rem, 9
Repartitie, 64
reshape, 7
Risc
de speta ntai, 291
de speta a doua, 291
roots, 183
round, 9
save, 11, 43
scatter, 142
scatter3, 143
sec, 9
sech, 9
Selectie, 197
cu probabilitat i egale, 198
sistematica, 197
389
stratificata, 198
tipica, 198
shading, 53
sign, 9
sin, 9
sinh, 9
Sistemul ecuatiilor
de verosimilitate maxima, 253
size, 10
skewness, 155
Sondaj, 197
sort, 156
sortrows, 156
Spatiul probelor, 62
sqrt, 9
stairs, 28, 65, 134
Statistica, 198
completa, 249
suficienta, 229
std, 155
Subfunctii Matlab, 45
subplot, 32
sum, 157
surf, 52
t, 81
Tabel de contingenta , 124, 349
Tabel de corelatie, 124
Tabel statistic
nesistematizat, 119
sistematizat, 119, 120
tabulate, 125
tan, 9
tanh, 9
tblread, 128
tblwrite, 128
Teorema limita
centrala, 110
MoivreLaplace, 110
Test, 285
390
cel mai puternic, 297
nedeplasat, 297
neparametric, 285
parametric, 285
Testul
, 318, 321
bilateral, 318, 321
unilateral dreapta, 318, 321
unilateral stanga, 318, 321
, 304, 325, 329
bilateral, 304, 310, 332
unilateral dreapta, 304, 332
unilateral stanga, 304, 332
, 286, 323
bilateral, 286
unilateral dreapta, 286
unilateral stanga, 286
, 312, 334, 346, 349
bilateral, 312
neparametric, 338
parametric, 340, 342
unilateral dreapta, 312
unilateral stanga, 312
FisherSnedecor, 318
bilateral, 318
unilateral dreapta, 318
unilateral stanga, 318
Kolmogorov, 353
bilateral, 353
unilateral dreapta, 353
unilateral stanga, 353
Kolmogorov-Smirnov, 363
bilateral, 363
unilateral dreapta, 364
unilateral stanga, 364
raportului verosimilitatilor, 308
Student, 304
bilateral, 304, 332
unilateral dreapta, 304, 332
Index
unilateral stanga, 304, 332
text, 24
tic, 49
times, 8
title, 24
toc, 49
trace, 10
transpose, 10
trimmean, 149
ttest, 307
ttest2, 327
unid, 68
unif, 74
unifit, 282
Valoare medie, 94, 95
conditionata, 99, 170
Valoarea functiei de selectie, 198
var, 155
Variatie
intercuartilica, 152
Variabila
nominala, 114
ordinala, 114
Variabila aleatoare, 62
(absolut) continua, 73
de tip continuu, 63
de tip discret, 63
simpla, 63
Variabile aleatoare
independente, 64
Variabile de selectie, 198
Varianta , 95
conditionata, 101
Vector aleator, 63
(absolut) continuu, 74
version, 4
Volumul
colectivitat ii, 114
Index
weib, 80
weibfit, 282
weiblike, 280
what, 17
which, 17
who, 11
whos, 11
workspace, 43
xlabel, 24
xor, 14
ylabel, 24
zeros, 6
zoom, 25
zscore, 290
ztest, 290
391
392
Index