Proba
Proba
Proba
Quels cas traiter en classe de B.T.S.A ? Cet article se limite aux tests paramtriques, seuls aux programmes de la plupart des sections de B.T.S.A. 1. Echantillons indpendants Position du problme : On considre deux populations dans lesquelles on tudie un mme caractre quantitatif, on en dduit alors deux variables alatoires X1 et X2. On dsire comparer les moyennes 1 et 2 de ces deux variables alatoires. Pour cela, on prlve dans chacune des populations un chantillon alatoire et simple. On note respectivement n1 et n2 les tailles de 2 ces chantillons, x1 et x 2 leurs moyennes, s1 et s 2 leurs variances. 2 Quels sont les cas qui peuvent se prsenter ? Les populations sont distribues normalement ou pas (ou on n'en sait rien).
2 Les variances respectives, 1 et 2 , des populations sont connues (c'est 2 assez rare) ou pas.
Les variances des populations sont gales ou pas. On a parfois de bonnes raisons de penser qu'elles sont gales, par exemple, lorsqu'on sait que le facteur considr peut avoir une influence sur la moyenne mais pas sur la variance de la grandeur tudie. On peut galement tester leur galit. Quels cas sait-on traiter dans le cadre des tests paramtriques ? Cas o les populations sont distribues normalement et de variances connues. Dans ce cas, la dmonstration est tout fait accessible aux tudiants. Si les chantillons sont de grande taille la condition de normalit n'est pas indispensable grce au thorme "central-limit". Cas o les populations sont distribues normalement et de mme variance (ces variances tant inconnues). On peut alors demander aux tudiants de donner une estimation ponctuelle de la variance commune (voir bulletin n2 "Test de Student pour comparer deux moyennes" et bulletin n 7 " Rsum sur les lois de probabilit "). En principe, on ne sait pas traiter les autres cas par des tests paramtriques. Cependant, si les chantillons sont de grande taille (effectifs suprieurs 30) on peut procder par approximation(s) :
Comparaison de deux moyennes
Bulletin du GRES n9
- Si les populations sont distribues normalement lapproximation consiste remplacer les variances inconnues par leurs estimations ponctuelles pour se ramener au cas o les variances sont connues. Cette approximation se justifie par le fait que la variance de lestimateur non biais de la variance dune population, cest--dire V (S ) ou V( ) suivant la notation utilise, tend vers 0 quand n tend vers +. - Si les populations ne sont pas distribues normalement, une deuxime approximation est ncessaire : lapproximation de la loi de X1 X2 par une loi normale en vertu du thorme central-limit. Dans la pratique, avec nos tudiants, tant donn l'intitul des programmes ("Cas des petits et des grands chantillons"), on ne se proccupe pas de la normalit des populations ni de l'galit des variances lorsque les chantillons sont de grande taille. D'o l'ordre des cas dans l'organigramme prsent la page suivante. Quelques remarques Lorsque les populations sont distribues normalement et de variances ingales (on peut alors se demander quel est l'intrt de comparer les moyennes) on met en uvre d'autre tests qui ne sont pas au programme des classes de B.T.S.A. (voir, par exemple, l'ouvrage de P.DAGNELIE "Statistique thorique et applique", Tome 2) Lorsqu'on parle de tests statistiques il y a plusieurs approches - L'approche purement scolaire : que les tudiants sachent rsoudre "proprement" les exercices qu'on trouve dans les annales ; c'est le but vis par l'organigramme de la page suivante. - Une approche qui vise l'utilisation des statistiques pendant les stages et la future vie professionnelle de nos tudiants. Il est alors bon d'insister sur l'importance du protocole d'exprimentation : que les chantillons soient de vrais chantillons alatoires dont les tailles ont t choisies, qu'il n'y ait pas de biais flagrant [ex : pour comparer deux "concentrs" (produit de complment une ration animale), on compare les rsultats de deux chantillons d'exploitations sans se proccuper du fait que la ration de base est trs variable d'une exploitation l'autre, sans compter qu'il faudrait travailler par animal et non par exploitation]. Pour ce qui est du choix des tailles d'chantillons : de grandes tailles d'chantillons rendent ces tests plus robustes la non normalit, des chantillons de mme taille les rendent plus robustes l'ingalit des variances (DAGNELIE, ancienne dition). 2. Echantillons apparis
2
Bulletin du GRES n9
Les programmes ne disent pas tous explicitement si ce cas doit tre trait ou pas. Dans le doute, il est prfrable de le faire. L'article suivant donne un exemple d'exercice de ce type. On pourra utiliser l'organigramme suivant inspir d'un ancien fascicule du C.N.P.R. : H0 : 1 = 2
oui Echantillons apparis non Pas de test
2 1 et 2 2
Echantillons indpendants
non
oui
oui
connus
Populations distribues normalement ou grands chantillons
non Sous H0, la v.a X1 X 2 U0 = 2 s1 s2 + 2 n1 1 n 2 1 est approximativement de loi N(0, 1) non Sous H0, la v.a oui
2 1 = 2 2
n1 > 30 et n2 > 30
oui
non
est 1 + 1 + n n1 + n 2 2 1 n 2 de loi de Student n1 + n2 - 2 ddl. n S 2 + n 2S 2 2 ( 1 1 est un estimateur n1 + n 2 2 sans biais de la variance commune)
2 n 1 S1
T0 =
X1 X 2 n 2S 2 2
Bulletin du GRES n9
Exercices
Exercice 1 (D'aprs un sujet du B.T.S.A I.A.A) On dsire comparer le travail de deux doseuses pour botes de haricots verts de quantit nominale gale 800 g. Les deux distributions sont supposes normales et 2 les variances des deux machines sont : 1 = 20 g et 2 = 16 g . On prlve un 2 chantillon de 20 lments sur chacune des deux machines, ce qui donne les deux valeurs moyennes suivantes : x1 = 807 g pour la premire machine et
x 2 = 805 g pour la deuxime machine
Les dosages moyens de ces deux machines sont-ils diffrents au risque de 5%?
Exercice 2 (d'aprs un sujet du B.T.S.A "Productions animales")
Les poids la naissance (en kg) de deux chantillons de veaux de deux races diffrentes sont les suivants : Race Parthenaise : 53, 49, 40, 48, 43, 42, 43, 46, 42, 43, 38, 40, 50, 44. Race Charolaise : 46, 46, 48, 38, 42, 42, 40, 53, 55, 41, 47, 30. 1. Calculer la moyenne et l'cart type de chacun de ces chantillons. 2. A l'aide d'un test bilatral, au risque de 5%, dire si l'on peut considrer que les variances des deux populations sont gales. 3. Peut-on conclure, au vu de ces chantillons et au risque de 5%, que les poids moyens la naissance des deux races sont diffrents ?
Remarque : l'nonc ne prcise pas que les populations sont distribues normalement, on est donc amen le supposer. Pour la comparaison de deux variances voir le bulletin n4.
[30 ; 35[ 3
[35 ; 40[ 8
[40 ; 45[ 17
[45 ; 50[ 10
[50 ; 55[ 2
1. Calculer la moyenne et l'cart type de cette srie statistique. 2. Dans un autre chantillon de 50 parcelles, galement de un hectare chacune, avec un mode de culture diffrent, on a obtenu une masse moyenne de 44,6 quintaux avec un cart type de 6,12 quintaux. La diffrence entre les moyennes des deux chantillons de parcelles est-elle significative, au seuil de 5%, d'une diffrence entre les deux modes de culture ?
Bulletin du GRES n9
Indications de correction Exercice 1 H0 : 1 = 2 H1 : 1 2 Nous sommes dans le cas d'chantillons indpendants issus de populations distribues normalement et de variances connues. Sous H0, la variable alatoire U0 = X1 X 2
2 1
2 2 n2
On ne rejette donc pas H0 au seuil de 5%. On ne peut pas conclure que les dosages moyens des deux machines sont diffrents. Exercice 2 1. Moyennes des chantillons en kg : x1 44,36 et x 2 = 44.
2 H0 : 1 = 2 2 2 H1 : 1 2 2
On suppose que les populations sont distribues normalement, les chantillons n S2 n S2 sont indpendants, donc, sous H0, la variable alatoire F0 = 2 2 1 1 n 2 1 n1 1 est de loi de Fisher-Snedecor k1 = 11 et k2 = 13 ddl. Le test est bilatral, = 5%. On rejettera H0 si f0 est suprieur f0,975. 3,05 < f0,975 < 3,25. f0 2,47. (calcul effectu avec les valeurs non arrondies des variances) On ne rejette pas H au risque de 5%. Les variances des deux populations 0 peuvent donc tre considres comme gales. 3. H0 : 1 = 2 H1 : 1 2 Nous sommes dans le cas de populations supposes distribues suivant des lois normales de mme variance. Les chantillons sont indpendants.
Bulletin du GRES n9
X1 X 2
2 n1S1 + n 2S2 1 1 2 + n1 + n 2 2 n1 n 2
n1 + n2 2 ddl. Le test est bilatral, = 5%. On refusera H0 si t0 est en dehors de l'intervalle [-t0,975 ; t0,975]. Le nombre de degrs de libert est 24. t0,975 = 2,06.
2 n1s1 + n 2s 2 2 30,80 . Ce nombre est une estimation ponctuelle de la variance n1 + n 2 2 commune des deux populations. (calcul effectu avec les valeurs non arrondies des variances)
t0 0,16. On ne rejette pas H0 au risque de 5%, on ne peut donc pas conclure, au vu de ces chantillons, que les poids moyens la naissance des deux races sont diffrents. Exercice 3 1. Moyenne de l'chantillon en quintaux : x = 42,5. Ecart type de l'chantillon en quintaux : s 4,87. 2. H0 : 1 = 2 H1 : 1 2 Les chantillons sont indpendants et de grande taille donc, sous H0, la variable X1 X 2 alatoire U 0 = est approximativement de loi N(0, 1). 2 s1 s2 + 2 n1 1 n 2 1 Le test est bilatral, = 5%, donc on rejette H0 si u0 est l'extrieur de l'intervalle [-1,96; 1,96]. u0 -1,79 On ne rejette donc pas H0 au seuil de 5%. La diffrence entre les moyennes de ces deux chantillons n'est pas significative d'une diffrence entre les deux modes de culture.
Bulletin du GRES n9