Statistiques Derscriptives, 1

Télécharger au format odt, pdf ou txt
Télécharger au format odt, pdf ou txt
Vous êtes sur la page 1sur 15

Bibliographie

Les bactéries lactiques appartiennent à un groupe de bactéries bénéfiques, dont les vertus se
ressemblent, et qui produisent de l’acide lactique comme produit final du processus de fermentation.
Elles sont partout dans la nature, et se trouvent aussi dans le système digestif de l’homme. Si elles
sont surtout connues pour le rôle qu’elles jouent dans la préparation des laitages fermentés, elles
sont utilisées également dans le saumurage des légumes, la boulangerie, la fabrication du vin, le
saurissage des poissons, des viandes et des salaisons. Des aliments fermentés sont consommés par
l’Homme depuis plus de 5000 ans, mais ce n’est que durant la deuxième moitié du 19ème siècle que
les travaux de Louis Pasteur mettent pour la première fois en lumière les ferments lactiques qui en
sont responsables. Les bactéries lactiques en tant que telles ont ensuite été définies en 1919 par
Orla-Jensen, comme un ensemble de genres bactériens ayant la capacité de fermenter les glucides en
produisant de l’acide lactique à partir de l’hydrolyse du lactose, et de la fermentation du glucose
et/ou du galactose.

Ils en améliorent ainsi la conservation, et agissent sur les textures et les saveurs qui se révèlent
différentes de celles de l’aliment à son état originel.

Définition et caractéristiques :

La pression: dans la fermentation lactique, elle dépend de plusieurs facteurs, notamment la souche
de bactéries lactiques utilisée, la température, la concentration de substrats (comme le lactose), et la
durée de la fermentation. Une surveillance attentive de ces paramètres est cruciale pour contrôler la
pression et favoriser une fermentation lactique réussie.

La concentration de substrat: fait référence à la quantité de matière première (substrat) présente


dans une réaction chimique ou biologique. Cela peut être crucial pour déterminer le taux de réaction
et influencer les résultats. Des concentrations appropriées sont souvent nécessaires pour atteindre
des performances optimales dans divers processus.

Le temps de réaction: peut varier en fonction des conditions spécifiques, telles que la température, la
concentration en micro-organismes (bactéries lactiques), le type de substrat (par exemple, le lait), et
d'autres facteurs environnementaux. En général, la fermentation lactique peut prendre de quelques
heures à plusieurs jours. Des températures optimales et des conditions bien contrôlées peuvent
accélérer le processus.

La biomasse: désigne l'ensemble de la matière organique d'origine végétale ou animale utilisée


comme source d'énergie renouvelable. Cela inclut des matériaux tels que le bois, les résidus
agricoles, les déchets organiques et d'autres substances biologiques. La biomasse peut être convertie
en énergie sous forme de biogaz, de bioéthanol, de biocarburants ou utilisée directement comme
combustible. Son utilisation contribue à réduire les émissions de gaz à effet de serre et à promouvoir
la durabilité énergétique.

Lactobacillus acidophilus, est une bactérie lactique de la famille des Lactobacillaceae,

en forme de bâtonnet aux extrémités arrondies, de 1,5 - 6 µm de long non mobile apparaissant
isolée, par paires ou en courtes chaînes homofermentaire obligatoire (produisant exclusivement de
l'acide lactique à partir du glucose, capable de fermenter l'amidon pour la majorité des souches mais
incapable de fermenter les pentoses).

Demandant les facteurs de croissance suivants : pantothénate de calcium, acide folique, niacine et
riboflavine. La thiamine n'est pas nécessaire.

Croissant à 35-45 °C pour la plupart des souches et ne croissant pas à moins de 15 °C et à plus de 45-
48 °C suivant les souches. Le pH optimum de croissance se situant à 5,5 - 6,0 ; la croissance est
possible pour pH>3,5.

Anaérobie (parmi les lactobacilles c'est la moins tolérante de l'oxygène) en tant que Lactobacillus, elle
est Gram-positive et non sporulée.

Ce lactobacille a été isolé dans la cavité buccale et le tractus digestif de l'humain et de l'animal, et
dans la flore vaginale de la femme. Il est présent dans le lait, le levain panaire et le vin.

Il est classé parmi les probiotiques et est utilisé en cette qualité dans des laits fermentés à
l'acidophilus et comme anti-infectieux intestinal dans plusieurs produits .

Lactobacillus casei, est une espèce de bactérie lactique de la famille des Lactobacillaceae. Cette
bactérie a été isolée dans le lait, le fromage et le tractus gastro-intestinal de l'homme, du cochon et
des oiseaux.Ce probiotique a des effets bénéfiques sur la digestion et la capacité de réduire
'l'intolérance au lactose et constipation. Cependant, une équipe de scientifiques de la 'Université
Simón Bolívar à Caracas, en Venezuela a conclu que, en utilisant Lactobacillus casei en fermentation
naturelle de légume, ceux-ci contiennent des quantités beaucoup plus faibles de composés qui
causent flatulence sur la digestion.

Certaines souches de L. casei sont utilisées comme probiotique dans l'industrie des laits fermentés et
comme ferments lactiques participant au développement des arômes dans l’affinage des fromages
(emmental, comté, saint-nectaire, parmesan, cheddar).

Le streptocoque thermophile, (ou Streptococcus thermophilus) est une bactérie alimentaire,


thermophile (optimum de croissance à 43 °C), présente seulement dans la fermentation du lait, où
elle est notamment utilisée en association avec la bactérie Lactobacillus bulgaricus pour la fabrication
du yaourt. Cette bactérie lactique appartient à la famille des Streptococcaceae, comportant deux
genres phylogénétiquement très proches Streptococcus et Lactococcus. Suivant une classification
récente de Moschioni et als (2010), basée sur les séquences de l'ARNr 16 S, on peut distinguer cinq
groupes majeurs de Streptococcus. La bactérie S. thermophilus fait partie du « groupe salivarius» qui
comprend aussi Streptococcus peroris, Streptococcus salivarius et Streptococcus vestibularis, des
streptocoques commensaux de la cavité buccale humaine. En outre, il produit également diverses
substances de type antibiotique et des protéines bactéricides appelées bactériocines, qui aident à
prévenir plusieurs types d’infections de différents microbes pathogènes.

Streptococcus salivarius, est un type de bactérie de l'espèce Streptococcus, du groupe des


streptocoques viridans. Ce sont des bactéries de forme sphérique ou ovoïde, anaérobies facultatives,
et de type Gram positif. S. salivarius est un streptocoque α-hémolytique qui colonise l'être humain,
quelques heures après la naissance : la bouche, la peau, l'oropharynx, le tube digestif et les voies
génito-urinaires, ce qui rend l'exposition à la bactérie inoffensive.

La bactérie est considérée comme un pathogène opportuniste, trouvant sa place dans la circulation
sanguine, mais elle est aussi impliquée dans de rares cas, le plus souvent, de méningite et de
bactériémie, ainsi que d'autres types d’infections comme l'abcès pancréatique, l'endocardite
multimicrobienne, l'endophtalmie, l'impétigo bulleux, jéjunite aiguë, l'ostéite fémorale, la péricardite,
la péritonite bactérienne spontanée, la sinusite, et la septicémie néonatale précoce (chez les
personnes ayant une neutropénie).

Plus important encore, dans le laboratoire, S. salivarius peut présenter distinctement des zones
claires sur les plaques GYC, c'est parce que S. salivarius peut fermenter le glucose en produisant de
l'acide lactique, et qu'ensuite, cet acide lactique réagit positivement avec le carbonate de calcium.

L'agglutination de Streptococcus salivarius est souvent utilisée dans le diagnostic de pneumonie


atypique causée par Haemophilus influenzae.

Des micro-organismes probiotiques, sont des modulateurs naturels vivants du microbiome intestinal.
Ils restaurent le microbiome intestinal du fait que les micro-organismes probiotiques se fixent à
l’épithélium intestinal, la communication réciproque entre les bactéries s’améliore et les réactions
immunitaires sont modulées. La majorité des souches probiotiques produisent des métabolites
comme des acides gras à chaîne courte qui servent de nutriments à l’épithélium intestinal et le
renforcent. Les probiotiques ont un effet cliniquement réputé sur divers symptômes tels que la
diarrhée, le syndrome du côlon irritable (SCI) et les troubles intestinaux inflammatoires. Pour la survie
des bactéries probiotiques, il est important qu’ils soient résistants au suc gastrique.

Problématique :
L'optimisation de la production de composés chimiques à partir de bactéries lactiques est un enjeu
majeur pour divers secteurs industriels, notamment l'industrie alimentaire et pharmaceutique.
Cependant, il est essentiel de comprendre les conditions de culture optimales et les facteurs
influençant le rendement de production pour maximiser l'efficacité de ce processus. Comment les
paramètres tels que la température, le pH, la pression, et la concentration de substrat impactent-ils la
production de composés chimiques par les bactéries lactiques?

Questions de recherche:

-Comment la concentration du substrat utilisé par les bactéries lactiques impacte-t-elle la


production de composés chimiques ?

-Existe-t-il une concentration optimale de substrat pour favoriser une production maximale ?

La méthode
Les tests effectués dépendant de notre hypothèse et le type de variable choisi pour cette
hypothèse.

On a deux variables quantitatives :

-Le rendement

-La concentration de substrat

Nous avons émis l'hypothèse que la concentration de substrat a un impact significatif sur le
rendement de production des composés chimiques par les bactéries lactiques. Plus
précisément, nous avons supposé que des variations dans la concentration de substrat
influenceraient de manière notable le rendement, avec une concentration optimale
conduisant à un rendement maximal.

Classement des Tests Effectués :

Test descriptive : L'analyse descriptive des statistiques, comme présentée dans ce test, vise à
révéler la tendance centrale, la dispersion, et la forme de la distribution des données de
concentration de substrat et de rendement. Ces informations sont essentielles pour
comprendre la variabilité et la symétrie des observations, offrant ainsi un éclairage
approfondi sur les performances du rendement dans le contexte de la concentration de
substrat.

Test de normalité: Les tests de normalité ont été utilisés pour évaluer si les données des
variables étudiées suivent une distribution normale. Les p-values élevées suggèrent que les
données ne s'écartent pas significativement de la distribution normale, permettant ainsi
l'application de tests paramétriques. dans nous cas on trouve que les deux variables suivent
la loi normal

STATISTIQUES DERSCRIPTIVES

Statistique Concentratio Rendement


n de Substrat (%)
Nb. d'observations 30 30
Minimum 90,000 84,200
Maximum 120,000 94,100
1er Quartile 98,500 86,575
Médiane 104,000 88,400
3ème Quartile 109,000 90,200
Moyenne 103,967 88,550
Variance (n) 54,632 6,387
Variance (n-1) 56,516 6,607
Ecart-type (n) 7,391 2,527
Ecart-type (n-1) 7,518 2,570
Coefficient de variation 0,071 0,029
Asymétrie (Pearson) 0,054 0,373
Asymétrie (Fisher) 0,057 0,393
Asymétrie (Bowley) -0,048 -0,007
Aplatissement (Pearson) -0,710 -0,706
Aplatissement (Fisher) -0,614 -0,609
Erreur standard(Asymétrie (Fisher)) 0,427 0,427
Erreur standard(Aplatissement
(Fisher)) 0,833 0,833
Ecart absolu médian 5,500 1,850

Box plot (Rendement (%))


96

94

92
Rendement (%)

90

88

86

84

Moyenne et Medianne :

La différence entre la moyenne et la médiane est relativement faible dans ce cas, ce qui suggère que
la distribution est probablement assez symétrique. Cependant, la différence peut indiquer une légère
asymétrie à droite, car la moyenne est légèrement plus élevée que la médiane.
Quartiles :

La longueur de l'IQR est la différence entre Q3 et Q1, soit


90,200−86,575=3,62590,200−86,575=3,625. Une longueur d'IQR modérée suggère une dispersion
interquartile modérée, indiquant que la moitié centrale des données est relativement concentrée,
mais il y a une certaine variabilité.

En conclusion, bien que la moyenne et la médiane ne soient pas parfaitement superposables, la


différence est relativement petite, indiquant une symétrie probable dans la distribution. La longueur
différente des quartiles suggère une dispersion interquartile modérée, montrant que la concentration
des données autour de la médiane n'est pas extrêmement étroite, mais il n'y a pas de dispersion
extrême non plus.

• Tendances de dispertion :

Variance (n) et Variance (n-1) :

La variance mesure la dispersion des données par rapport à la moyenne. Les résultats montrent que
la variance (n-1) est légèrement plus élevée que la variance (n). La différence entre les deux variances
est relativement petite, indiquant une dispersion modérée des données.

Ecart-type (n) et Ecart-type (n-1) :

L'écart-type est la racine carrée de la variance. Les écarts-types mesurent la dispersion des données
autour de la moyenne. Dans notre cas, les deux écarts-types sont assez proches l'un de l'autre,
indiquant une dispersion modérée des données.

Coefficient de variation :

Le coefficient de variation (CV) est une mesure relative de la dispersion. Un coefficient de variation
plus bas indique une dispersion relativement faible par rapport à la moyenne. Dans notre cas, le
coefficient de variation est plus faible pour �−1n−1, suggérant une dispersion relative plus faible
lorsque vous utilisez �−1n−1 observations. Cependant, ces différences sont assez petites, et le
coefficient de variation est généralement utilisé pour comparer la dispersion relative entre différentes
distributions.

Lorsque l'on parle d'une dispersion modérée des données dans le contexte des valeurs d'un
rendement de 30 échantillons, cela signifie que les valeurs du rendement ne sont pas très éloignées
les unes des autres. En d'autres termes, les observations du rendement sont relativement regroupées
autour de la moyenne ou du centre de la distribution.

La dispersion modérée suggère que les valeurs du rendement ne sont ni très concentrées ni très
étalées. Les échantillons ont une certaine variabilité, mais cette variabilité n'est pas extrême. Cela
peut être interprété comme une certaine cohérence ou homogénéité dans les performances de
rendement entre les échantillons.

Interpréter les coefficients d’asymétrie et d’aplatissement

a. Interprétation du coefficient d'asymétrie

Asymétrie (Pearson) : 0,373

Une valeur positive indique une légère inclinaison vers la droite de la distribution.
Dans ce cas, l'asymétrie de Pearson est 0,373, suggérant une inclinaison légèrement positive de la
distribution du rendement. Cela signifie qu'il y a une légère concentration de valeurs du rendement
du côté gauche de la distribution.

Asymétrie (Fisher) : 0,393

L'asymétrie de Fisher est une version normalisée de l'asymétrie de Pearson.

Comme pour l'asymétrie de Pearson, une valeur positive indique une légère inclinaison vers la droite.

Ici, l'asymétrie de Fisher est 0,393, confirmant la tendance à l'inclinaison positive de la distribution du
rendement.

Asymétrie de Bowley : -0,007

Une valeur proche de zéro suggère une distribution relativement symétrique.

L'asymétrie de Bowley étant très proche de zéro (-0,007), cela indique une symétrie générale de la
distribution du rendement.

En d'autres termes, la distribution du rendement semble être relativement symétrique sans


inclinaison prononcée vers la gauche ou la droite.

b. Interprétation de l’aplatissement

Aplatissement (Pearson) : -0,706

Une valeur négative indique une distribution moins pointue que la distribution normale.

Dans ce cas, l'aplatissement de Pearson est -0,706, suggérant une distribution du rendement qui est
moins pointue que la distribution normale. Cela peut indiquer que les valeurs du rendement sont
relativement dispersées, avec moins de poids dans les queues de la distribution.

Aplatissement (Fisher) : -0,609

L'aplatissement de Fisher est une version normalisée de l'aplatissement de Pearson.

Comme pour l'aplatissement de Pearson, une valeur négative indique une distribution moins pointue.

Ici, l'aplatissement de Fisher est -0,609, confirmant la tendance à une distribution moins pointue du
rendement
125 Box plot (Concentration de Substrat)

120

Concentration de Substrat 115

110

105

100

95

90

La tendance centrale

a. Interpréter la tendance centrale

-La plage des données s'étend de 90,000 à 120,000, avec une distribution relativement
concentrée.
-La moyenne est légèrement inférieure à la médiane, suggérant une asymétrie négative
minime.
-La médiane (104,000) est bien alignée avec le 2ème quartile, indiquant une distribution
relativement symétrique.
-Les quartiles suggèrent une dispersion relativement uniforme des données.

B. Interpréter la dispersion

-La variance et l'écart-type mesurent la dispersion des données. Une variance (ou écart-type)
plus élevée indique une plus grande dispersion.
-L'utilisation de la variance (n-1) et de l'écart-type (n-1) suggère que ces mesures sont basées
sur un échantillon plutôt que sur l'ensemble de la population.
-Le coefficient de variation relativement bas (7.1%) indique une faible variabilité relative par
rapport à la moyenne.

C. Interpréter les coefficients d’asymétrie et d’aplatissement

1. Interprétation du coefficient d'asymétrie


Asymétrie (Pearson) : 0,054

Une valeur proche de zéro suggère une distribution relativement symétrique.


Dans ce cas, l'asymétrie de Pearson est légèrement positive (0,054), indiquant une légère
inclinaison vers la droite de la distribution. Cependant, la valeur est très proche de zéro, ce
qui suggère une asymétrie très faible.
En d'autres termes, la distribution des données semble être relativement symétrique avec
une légère tendance vers la droite.

Asymétrie (Fisher) : 0,057

L'asymétrie de Fisher est une version normalisée de l'asymétrie de Pearson.

Comme pour l'asymétrie de Pearson, une valeur proche de zéro indique une distribution
relativement symétrique.

Ici, l'asymétrie de Fisher est également très proche de zéro (0,057), confirmant que la
distribution des données est globalement symétrique avec une inclinaison très légère vers la
droite.

2. Interprétation de l’aplatissement

Aplatissement (Pearson) : -0,710

Une valeur négative indique une distribution légèrement aplatie par rapport à une
distribution normale.

Dans ce cas, l'aplatissement de Pearson est -0,710, suggérant une légère aplatisation de la
distribution par rapport à une distribution normale. Cependant, la magnitude de
l'aplatissement est relativement modérée.

Aplatissement (Fisher) : -0,614

L'aplatissement de Fisher est une version normalisée de l'aplatissement de Pearson.

Comme pour l'aplatissement de Pearson, une valeur négative indique une distribution
légèrement aplatie.

Ici, l'aplatissement de Fisher est -0,614, confirmant la tendance à l'aplatissement de la


distribution, bien que la magnitude soit relativement modérée
TEST HYPOTHESES

I. TEST DE NORMALITE

Test de Shapiro-Wilk (Concentration de Substrat) :

W 0,986
p-value (bilatérale) 0,959
alpha 0,05

Interprétation du test :

H0 : La variable dont provient l'échantillon suit une loi Normale.

Ha : La variable dont provient l'échantillon ne suit pas une loi Normale.

Etant donné que la p-value calculée est supérieure au niveau de signification seuil alpha=0,05, on ne
peut pas rejeter l'hypothèse nulle H0.

Test de Shapiro-Wilk (Rendement (%)) :

W 0,972
p-value (bilatérale) 0,58
alpha 0,05

• Interprétation du test :

H0 : La variable dont provient l'échantillon suit une loi Normale.

Ha : La variable dont provient l'échantillon ne suit pas une loi Normale.

Etant donné que la p-value calculée est supérieure au niveau de signification seuil alpha=0,05, on ne
peut pas rejeter l'hypothèse nulle H0.

TESTS PARAMETRIQUES

Tests t et z pour deux échantillons

Statistiques descriptives :
Obs. avec Obs. sans
données données
Observatio manquant manquant
Variable ns es es Minimum Maximum Moyenne Ecart-type
Concentra
tion de
Substrat 30 0 30 90,000 120,000 103,967 7,518
Rendemen
t (%) 30 0 30 8,500 94,100 85,883 14,840
Test t pour deux échantillons indépendants / Test bilatéral :
Intervalle de confiance à 95% autour de la différence des moyennes :
] 12,004; 24,163 [
Différence 18,083
t (Valeur observée) 5,954
|t| (Valeur critique) 2,002
DDL 58
p-value (bilatérale) < 0,0001
alpha 0,05

Interprétation du test :

H0 : La différence entre les moyennes est égale à 0.

Ha : La différence entre les moyennes est différente de 0.

Etant donné que la p-value calculée est inférieure au niveau de signification alpha=0,05, on doit
rejeter l'hypothèse nulle H0, et retenir l'hypothèse alternative Ha.

Le risque de rejeter l'hypothèse nulle H0 alors qu'elle est vraie est inférieur à 0,01%.

L’intervalle de confiance à 95% autour de la différence entre les deux moyennes (18,083) n’inclut pas
la différence supposée que nous avions choisie (0), ce qui indique que la différence entre les deux
moyennes a une faible probabilité d’être nulle. L’information portée par la p-value est similaire : p<
0.0001, valeur inférieure au niveau de signification alpha (0.05). Ceci signifie que nous pouvons
rejeter l’hypothèse nulle avec un risque faible de nous tromper. En d’autres termes, la différence de
moyennes est statistiquement significative.

Test de fisher

Les résultats qui apparaissent dans une montre qu’il faut rejeter l’hypothèse H0 car la p-value est de
0,00000 qui est inférieure à la limite de 0,05. Ainsi les variances ne peuvent être considérées comme
étant égales– ne suivent pas la même distribution.
Régression de la variable Rendement (%) :
 Coefficients d'ajustement (Rendement (%)) :

Statistique Echantillon d'apprentissage Jeu de validation


Observations 21,000 21,000
Somme des poids 21,000 21,000
DDL 19,000 19,000
R² 0,595 0,595
R² ajusté 0,574 0,574
MCE 2,353 2,353
RMCE 1,533 1,533
MAPE 1,322 1,322
DW 1,128 1,128
Cp 2,000 2,000
AIC 19,869 19,869
SBC 21,957 21,957
PC 0,490 0,49 0
R²= 59,5% (>0,5) de la variabilité du Rendement est expliquée par la concentration du
substrat. Le reste de la variabilité est dû à des effets (autres variables explicatives) qui ne
sont pas pris en compte dans notre hypothèse.

 Analyse de la variance (Rendement (%)) :

Somme des Moyenne


Source DDL carrés des carrés F Pr > F
Modèle 1 66,230 66,230 24,362 < 0,0001
Erreur 19 51,652 2,719
Total corrigé 20 117,883
Calculé contre le modèle Y=Moyenne(Y)

La probabilité associée au F est inférieure à 0.0001, ça veut dire qu’on prend un risque de se tromper
de moins de 0.01%.

On peut conclure que la concentration de substrat (variable explicative) apporte une quantité
d'information significative au modèle. Et que la moyenne du rendement suffit pour décrire les
résultats obtenus.

 Paramètres du modèle (Rendement (%)) :

Borne Borne
Erreur inférieure supérieure
Source Valeur standard t Pr > |t| (95%) (95%)
Constante 62,413 5,312 11,749 < 0,0001 51,294 73,531
Concentratio
n de
Substrat 0,247 0,050 4,936 < 0,0001 0,142 0,352

Nous voyons que si le paramètre de la concentration de substrat a un intervalle de confiance assez


étroit, celui de la constante du modèle est assez large.

 Equation du modèle (Rendement (%)) :

Rendement (%) = 65,0051581187175+0,224961479198767*Concentration de Substrat

Le paragraphe suivant propose une analyse des résidus, en mettant particulièrement l'accent
sur les résidus centrés réduits. Conformément aux hypothèses de la régression linéaire, ces
résidus doivent suivre une distribution normale N (0,1), indiquant que 95% d'entre eux
devraient se situer dans l'intervalle sur l’intervalle de confiance. Parmi les 30 observations,
n’a aucun valeur hors de ce intervalle
Le premier graphique offre une visualisation des données, de la droite de régression et des
deux intervalles de confiance. Puisque toutes les valeurs se situent dans l'intervalle de
confiance d'une régression linéaire, cela indique une adéquation du modèle aux données et
renforce la validité de la relation linéaire établie.

Le graphique suivant permet de comparer les prévisions aux valeurs observées. Les limites de
confiance permettent, comme pour le graphique de régression présenté ci-dessus, d'identifier
les valeurs extrêmes
En résumé, la concentration du substrat explique 60% de la variabilité du rendement. Cela
signifie que pour expliquer le reste de la variabilité, il est nécessaire de considérer d'autres
sources de variations dans le modèle.

Vous aimerez peut-être aussi