Révisions - Régressions Linéaires
Révisions - Régressions Linéaires
Révisions - Régressions Linéaires
La régression linéaire est une technique d'analyse statistique des données. Cette technique est utilisée
pour déterminer dans quelle mesure il existe une relation linéaire entre une variable d’intérêt et une
ou plusieurs variables explicatives. Par exemple, dans notre fichier Affiliates, le Revenu Total est une
variable d’intérêt naturelle puisque nous pouvons penser que c’est ce qui intéresse la direction de
l’entreprise. Les dépenses de publicité par canal (PPCC, PPCR, etc.) sont des variables explicatives
potentielles. Pour étudier l’impact des variables explicatives sur la variable d’intérêt, les statisticiens
inventent des modèles. L’objectif de ce chapitre est d’apprendre à évaluer de tels impacts en calculant
des paramètres. L’objectif de ce chapitre n’est pas d’apprendre à construire des modèles. Les étudiants
apprendront à construire leurs propres modèles avec un peu de pratique.
Supposons que le Revenu Total soit lié aux dépenses de publicité (PPCC, PPCR, AffC et AffR) par la
relation (1) ci-dessous :
La relation (1) est appelée un modèle en économie ou un modèle de régression linéaire en statistique.
• la variable qui est à gauche de l’équation est appelée variable à expliquer ou variable
endogène. On la note par la lettre y.
• les variables qui sont à droite de l’équation sont appelées des variables explicatives ou des
variables exogènes.
• les coefficients 𝑎 0 ,𝑎1 , 𝑎 2 , 𝑎 3 ,𝑎 4 sont des nombres inconnus dont on cherche à calculer les
valeurs numériques. Ces nombres sont appelés des coefficients ou des paramètres.
Remarque :
Le paramètre 𝑎 0 est appelé la constante (constant or intercept en anglais) parce que le modèle (1)
peut s’écrire :
1
Voici quelques exemples supplémentaires de modèles :
Modèle 2
Ici,
Modèle 3
Ici,
Modèle 4
1
= 𝑎 0 + 𝑎1 𝑃𝑃𝐶𝐶 + 𝑎 2 𝑙𝑛√𝑃𝑃𝐶𝑅 + 𝑎 3 √𝐴𝑓𝑓𝐶 (4)
√(𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙)
Ici,
1
• la variable endogène est le ,
√𝑅𝑒𝑣𝑒𝑛𝑢 𝑇𝑜𝑡𝑎𝑙
• les variables exogènes sont 𝑃𝑃𝐶𝐶, 𝑙𝑛√𝑃𝑃𝐶𝐶𝑅 et √𝐴𝑓𝑓𝐶 et
• les paramètres sont 𝑎 0 , 𝑎1 , 𝑎 2 et, 𝑎 3 .
Afin de calculer les paramètres d’un modèle, on dit aussi estimer les paramètres d’un modèle ou
encore estimer le modèle, nous devons respecter les trois étapes suivantes.
Etape 1 : Il faut transformer les données originales conformément à la nature du modèle pour obtenir
une colonne que nous appellerons y et un tableau que nous appellerons la matrice X.
2
Etape 2 : Il faut écrire les paramètres sur une seule colonne que nous appellerons b.
La feuille intitulée « Modèles » du fichier Excel intitulé « chapitre 3.xlsx » vous guidera pas à pas pour
réaliser les deux premières étapes.
Etape 3 : Il suffit d’appliquer dans tous les cas, c’est-à-dire quel que soit le modèle, la formule suivante :
𝑏 = (𝑋′𝑋) −1 𝑋′𝑦
Cette formule est très simple à appliquer. Si vous avez examiné la feuille « Modèles », alors vous savez
construire y et X. Donc, il suffit de décomposer cette formule par petits bouts afin de trouver les
paramètres b. Pour ce faire, il suffit de suivre les étapes suivantes :
Les feuilles « Estimation 1» à « Estimation 4 » vous guideront pour réaliser l’estimation de ces
modèles.
Nous avons calculé ces paramètres dans la feuille « Modèle 2» et nous avons trouvé :
𝑎1 = 0.015. Nous dirons que si les dépenses de publicité dans le canal PPCC augmentaient de 1%, alors
le TotRev augmenterait de 0.015%.
𝑎 2 = 0.315. Nous dirons que si les dépenses de publicité dans le canal PPCR augmentaient de 1%, alors
le TotRev augmenterait de 0.315%.
𝑎 3 = 0.574. Nous dirons que si les dépenses de publicité dans le canal AffC augmentaient de 1%, alors
le TotRev augmenterait de 0.574%.
3
D’une manière générale, si notre modèle s’écrit sous la forme :
Alors,
Cette application est illustrée dans la feuille « Estimation 1 » à partir de la ligne numéro 100.
Les modèles de régressions linéaires peuvent être employés pour réaliser des prévisions. Prenons
l’exemple du modèle (1). Supposons que la direction de cette entreprise souhaite faire une prévision
de son Revenu Total durant la semaine 33 si elle engageait est les dépenses de publicité données sur
la ligne numéro 131 du fichier Excel, c’est-à-dire :
4
Deuxième application : Détermination de l’allocation optimale d’un budget publicitaire
Cette application est illustrée dans la feuille « Estimation 2 » à partir de la ligne numéro 100.
Dans la deuxième section de ce cours qui est relative à l’interprétation des paramètres, nous avons vu
que lorsque le modèle est logarithmique, alors les paramètres sont des élasticités. Nous avons vu aussi
que ces élasticités nous donnent très précisément l’impact d’une hausse de 1% d’une variable
explicative sur la variable à expliquer. Donc, si notre objectif est celui de la recherche de l’allocation
optimale d’un budget publicitaire, alors nous avons intérêt à privilégier le recours aux modèles
logarithmiques.
Supposons que notre entreprise n’admet que trois canaux publicitaires : PPCC, PPCR et AffC. Donc,
dans cet exemple, il faut ignorer totalement l’existence des autres canaux publicitaires qui sont sur le
fichier Excel. Supposons aussi que le Revenu Total est lié aux dépenses de publicité selon la relatio n du
modèle 2 étudié dans la feuille « Estimation 2 ». Nous pouvons à présent aller légèrement plus loin
dans l’analyse de ce modèle pour en déduire l’allocation optimale du budget publicitaire. Pour ce faire,
il suffit de suivre les étapes suivantes :
1. Relever toutes les élasticités positives. Rappelez-vous qu’ici les paramètres 𝑎1 , 𝑎 2 , et 𝑎 3 sont
des élasticités. Dans cet exemple toutes les élasticités sont positives. Elles valent
respectivement en arrondissant à trois chiffres : 0.015, 0.315 et 0.575.
2. Faire la somme de toutes les élasticités positives.
élasticité du canal
3. La part optimale de chaque canal publicitaire est alors égale à .
somme de toutes les élasticités positives
Cette application est détaillée dans le fichier Excel « Ranking individuals given their inputs and
outputs.xlsx » qui vous a déjà été envoyé. Nous ne reviendrons pas dessus ici.