Projet Ac

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 15

Projet acp

NANA RUDDY LUTHER

13/07/2021

1) importation des données


setwd("C:/Users/Dell/Documents")
base=read.csv2("projet acp.csv", row.names = 1)
print(base)

## PAO PAA VIO VIA POT LEC RAI PLP


## AGRI 167 1 163 23 41 8 6 6
## SAAG 162 2 141 12 40 12 4 15
## PRIN 119 6 69 56 39 5 13 41
## CSUP 87 11 63 111 27 3 18 39
## CMOY 103 5 68 77 32 4 11 30
## EMPL 111 4 72 66 34 6 10 28
## OUVR 130 3 76 52 43 7 7 16
## INAC 138 7 117 74 53 8 12 20

str(base)

## 'data.frame': 8 obs. of 8 variables:


## $ PAO: int 167 162 119 87 103 111 130 138
## $ PAA: int 1 2 6 11 5 4 3 7
## $ VIO: int 163 141 69 63 68 72 76 117
## $ VIA: int 23 12 56 111 77 66 52 74
## $ POT: int 41 40 39 27 32 34 43 53
## $ LEC: int 8 12 5 3 4 6 7 8
## $ RAI: int 6 4 13 18 11 10 7 12
## $ PLP: int 6 15 41 39 30 28 16 20

dim(base)

## [1] 8 8

2) tableau des statistiques descriptive


summary(base)

## PAO PAA VIO VIA


## Min. : 87.0 Min. : 1.000 Min. : 63.00 Min. : 12.00
## 1st Qu.:109.0 1st Qu.: 2.750 1st Qu.: 68.75 1st Qu.: 44.75
## Median :124.5 Median : 4.500 Median : 74.00 Median : 61.00
## Mean :127.1 Mean : 4.875 Mean : 96.12 Mean : 58.88
## 3rd Qu.:144.0 3rd Qu.: 6.250 3rd Qu.:123.00 3rd Qu.: 74.75
## Max. :167.0 Max. :11.000 Max. :163.00 Max. :111.00
## POT LEC RAI PLP
## Min. :27.00 Min. : 3.000 Min. : 4.00 Min. : 6.00
## 1st Qu.:33.50 1st Qu.: 4.750 1st Qu.: 6.75 1st Qu.:15.75
## Median :39.50 Median : 6.500 Median :10.50 Median :24.00
## Mean :38.62 Mean : 6.625 Mean :10.12 Mean :24.38
## 3rd Qu.:41.50 3rd Qu.: 8.000 3rd Qu.:12.25 3rd Qu.:32.25
## Max. :53.00 Max. :12.000 Max. :18.00 Max. :41.00

au regard du tableau descriptif ci dessus nous pouvons dire que le pain ordinaire est en
moyenne la denéées la plus consommés au contraire des legummes sec qui sont en
moyenne faiblement consommée
3)tableau des corrélations entre les variables
matrice.corr=cor(base[,1:8])
matrice.corr

## PAO PAA VIO VIA POT LEC


## PAO 1.0000000 -0.7736643 0.9261878 -0.9057929 0.6563525 0.8885594
## PAA -0.7736643 1.0000000 -0.6040133 0.9044415 -0.3328879 -0.6733710
## VIO 0.9261878 -0.6040133 1.0000000 -0.7501607 0.5170754 0.7917256
## VIA -0.9057929 0.9044415 -0.7501607 1.0000000 -0.4185661 -0.8386021
## POT 0.6563525 -0.3328879 0.5170754 -0.4185661 1.0000000 0.6029189
## LEC 0.8885594 -0.6733710 0.7917256 -0.8386021 0.6029189 1.0000000
## RAI -0.8334273 0.9588178 -0.6690062 0.9239285 -0.4099317 -0.8244519
## PLP -0.8558457 0.7712209 -0.8279862 0.7197908 -0.5539561 -0.7509231
## RAI PLP
## PAO -0.8334273 -0.8558457
## PAA 0.9588178 0.7712209
## VIO -0.6690062 -0.8279862
## VIA 0.9239285 0.7197908
## POT -0.4099317 -0.5539561
## LEC -0.8244519 -0.7509231
## RAI 1.0000000 0.8344475
## PLP 0.8344475 1.0000000

Dans l’ensemble, les variables sont assez corrélées entre elles. On note cependant une
corrélation relativement forte entre pain ordinaire et vin ordinaire et une corrélation
relativement faible entre autre pain et pommes de terre
4) Dans le tableau de corrélations ci-dessus nous avons autant de signes ‘+’ que de
signe ‘-’. nous pouvons donc dire que la consomation en 1972 à éte presque
homogène pour toutes les denrées
5)verifions s’il y’a solution factoriel
KMO(matrice.corr)

## Error in solve.default(r) :
## le système est numériquement singulier : conditionnement de la
réciproque = 2.92432e-18

## matrix is not invertible, image not found


## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = matrice.corr)
## Overall MSA = 0.5
## MSA for each item =
## PAO PAA VIO VIA POT LEC RAI PLP
## 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5

puisque Overall MSA = 0.5<0.60 alors il y’a pas solution factoriel mais nous poursuivrons
notre etude dans le but de comprendre cet methode
6)Lançons l’ACP
res.pca=PCA(base, scale.unit=TRUE, ncp=5, graph=TRUE)
7) Affichons les
valeurs propres issues de l’ACP
valeur.propre=get_eigenvalue(res.pca)
valeur.propre
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 6.207946839 77.59933549 77.59934
## Dim.2 0.879681393 10.99601741 88.59535
## Dim.3 0.415961123 5.19951404 93.79487
## Dim.4 0.306454670 3.83068337 97.62555
## Dim.5 0.168441497 2.10551872 99.73107
## Dim.6 0.018067709 0.22584636 99.95692
## Dim.7 0.003446769 0.04308461 100.00000

8) la somme des valeur propre correspond au total d’information apportée par chaque
axe

9) axes factoriel à reténir : a)d’apres le tableau des valeurs propres préccedent, Le


pourcentage d’inertie cumulé du nuage de point projeté sur les deux premiers axes
est de 88.59%. Donc d’après Le critère du taux d’inertie nous pouvons retenir les
deux premiers axes

b) La règle de Kaïser d’apres le tableau des valeurs propres préccedent, nous


avons une seule valeur propre superieur à 1 donc d’après le règle de Kaizer ,
seul l’axe 1 est retenu
c) La règle du coude
screen.plot=fviz_eig(res.pca, addlabels=T, ylim=c(0,50))
screen.plot

au regard de
l’histogramme des valeurs propres nous pouvons retenir les deux premiers axes par la règle
du courde
10) les individus les moins bien et mieux représenter par le premier plan factoriel
fviz_pca_ind(res.pca, col.ind = "cos2", gradient.cols = c("#00AFBB",
"#E7B800", "#FC4E07"), repel = TRUE, ggtheme = theme_minimal())

vue le graphe ci-


dessus, les individus les moins bien réprésentés sont ceux des professions independantes et
les ouvriers. Et les individus les mieux réprésentés sont les cadres supérieurs , les inactifs et
les salariés agricoles.
11) les individus les moins bien et mieux représenter par les deux axes
fviz_cos2(res.pca, choice="ind", axes=1:2, top=8)
l’individus le moins
bien représenté par les deux axes est la catégorie des ouvriers et celui la mieux representer
est la categorie des Inactifs
12)les individus les individus qui contribut a la formation des deux axes:
fviz_contrib(res.pca, choice="ind", axes=1:2, top=10)
au regard
l’histogramme ci-dessus les cadres superieurs , les salariés agricoles et les exploitants
agricoles sont les individus qui contribut a la formation des deux axes.
• Les individus contribuant à la formation des axes de manière individuel:
a) axes 1
fviz_contrib(res.pca, choice="ind", axes=1, top=8)
au regard
l’histogramme ci-dessus les cadres superieurs , les salariés agricoles et les exploitants
agricoles sont les individus qui contribut a la formation de l’axe 1.
b) axe 2
fviz_contrib(res.pca, choice="ind", axes=2, top=8)
au regard
l’histogramme ci-dessus les cadres superieurs , seul les inactifs contribut majoritairement la
formation de l’axe 2.
13) les variables les mieux représentées:
fviz_pca_var(res.pca, col.var="black", col.quanti="blue",repel=T)
au regard du graphe
ci-dessus, les variables pain ordinaire,raisin de tables, autres pain et autre vin sont les
mieux représentées car elles sont les plus proche du cercle de corrélation .
14) les variables qui contribut le plus a la formation des deux axes:
fviz_contrib(res.pca, choice="var", axes=1:2, top=8)
vue l’histogramme
ci-dessus les variables pain ordinaire , raisin de tables , autre vin et autre pain contribuent
le plus à la formation des deux axes.
• Les variables contribuant à la formation des axes de manière individuel:
a) axes 1
fviz_contrib(res.pca, choice="var", axes=1, top=8)
vue l’histogramme
ci-dessus les variables pain ordinaire, autre vin, raisin de tables ,légumes secs et plats
préparés contribuent le plus à la formation de l’axe 1.
b) l’axe 2
fviz_contrib(res.pca, choice="var", axes=2, top=8)
vue l’histogramme
ci-dessus les variables pommes de terre et pain ordinaire contribuent le plus à la formation
de l’axe 2.
15) corrélations des variables au prémier facteur:
res.var=get_pca_var(res.pca)

res.var$cor

## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5


## PAO -0.9749797 0.12926598 0.10429757 0.06606998 0.1206810
## PAA 0.8687483 0.41323074 0.20635173 0.12063082 -0.1089416
## VIO -0.8700402 0.18916036 0.43897378 -0.01598936 0.1008460
## VIA 0.9309151 0.24414749 0.04739248 -0.21952071 -0.1418418
## POT -0.6138529 0.69764474 -0.35966296 -0.04096049 0.0721205
## LEC -0.9089814 0.12007291 0.02089707 0.28724855 -0.2746472
## RAI 0.9294859 0.30574089 0.16397854 0.03526677 0.1114413
## PLP 0.9011429 -0.04710881 -0.10428318 0.39199413 0.1366334

au regard de la sortie ci-dessus, les variables pain ordinaire, vin ordinaire, pommes de terre
et legumes sec sont corrélées negativement avec le premier facteur tandisque les variables
autres pain , autre vin, raisin de tables et plats préparés sont corrélées positivement avec le
premier facteur. On peut donc conclure que la première composante met en opposition
deux catégories de denrées de consomations totalement opposé, d’un cô té, une catégorie de
denrées qu’on peut qualifier d’ordinaire et d’un autre cô té, une deuxième catégorie de
denrées qu’on peut qualifier d’autre genre.
16) commentons l’acp
fviz_pca_biplot (res.pca, repel = TRUE, ggtheme = theme_minimal ())

au regard du graphe
ci-dessus, nous pouvons dire les denrées legumes sec, vin ordinaire et pain ordinaire sont
les plus consommées par les exploitants agricoles, les ouvriers et les salariés agricoles. par
contre les individus de professions indépendants et les cadre supérieurs sont ceux qui
consomme le plus les plats préparés , autre vin et raisin de tables. deplus les personnes
inactifs ont tendance à plus consommé des pommes de terre.

Vous aimerez peut-être aussi