Logiciel D'économétrie Des Séries Temporelles: Institut Des Hautes Etudes À Tunis Année Universitaire 2020-2021
Logiciel D'économétrie Des Séries Temporelles: Institut Des Hautes Etudes À Tunis Année Universitaire 2020-2021
Logiciel D'économétrie Des Séries Temporelles: Institut Des Hautes Etudes À Tunis Année Universitaire 2020-2021
Logiciel
d’Économétrie des Séries
temporelles
Master Professionnel en Administration des affaires
Master Professionnel en Ingénierie financière
1
Plan du cours
2
Chapitre 1
Introduction au logiciel Stata
3
La meilleure façon d’apprendre
à utiliser un nouveau logiciel
c’est la pratique!
4
Les fenêtres de Stata
5
Les fenêtres de Stata
Stata se présente sous la forme de 4 fenêtres :
Results : utilisée pour afficher tous les résultats des commandes tapées par
l'utilisateur.
6
On trouve au dessus de ces fenêtres une barre de menu, permettant d’exécuter les
commandes les plus courantes sous Stata sans avoir à se servir de la fenêtre Command. On
trouve par exemple deux icônes permettant d’afficher la base de données (Data Editor ou
Data Browser), commandes également accessibles par le biais du menu (Data/Data Editor
Editor/New file, ou en entrant doedit dans la fenêtre Command. L’utilisation de ces barres
de menu est donc facultative, et finalement assez rare lorsqu’on utilise Stata. 7
8
Création d'un répertoire de travail
L'utilisation de Stata nécessite une base de données et un fichier do. Nous verrons par la
suite qu'il est possible de créer des fichiers de résultats (log, résultats de régressions,
graphiques). Afin de ne pas disperser ces fichiers et de ne pas devoir indiquer le chemin
des fichiers à chaque fois, il est utile de créer un répertoire de travail en début de son
fichier do.
cd "C:\Formation Stata\Espace de travail "
Ainsi, par la suite, si on souhaite sauvegarder la base de données, on tapera seulement
save table.dta au lieu de
save "C:\Formation Stata\Espace de travail\table.dta"
9
Création d'un fichier log: journal des commandes effectuées et des résultats
Afin de garder une trace de toutes les commandes effectuées et des résultats, il est conseillé
d'ouvrir un fichier log en début de travail:
log using trace.log
ou, si on n'a pas crée de répertoire de travail :
log using "C:\Formation Stata\Espace de travail\trace.log"
Il se ferme en tapant la commande log close
Pour importer une base de données sous Stata:
use table.dta [, clear]
Il faut parfois rajouter l'option clear afin d'effacer le fichier de données déjà utilisé par le
logiciel. Par précaution, on peut l‘écrire tout le temps. 10
Sauvegarder sa base de données
11
Types de variables
Les variables sous Stata peuvent être numériques ou alphanumériques:
Les variables numériques: variables quantitatives contenant des entiers ou des réels. Elles peuvent
être de différents types, selon la précision nécessaire.
Format général %g %9.0g 1.414114
Format fixé %f %9.2f 1.41
Format scientifique %e %9.2e 1.41e+00
Les variables alphanumériques: variables qualitatives (en rouge dans browser) sont des chaînes de
caractères quelconques. Elles sont enregistrées sous forme str# (string).
# renvoyant à la place allouée à l’écriture de la variable, la longueur maximale est de 80 caractères .
12
Décrire et lire les données
count: cette commande permet de connaître le nombre d’observations.
générale : pour chaque variable, elle retourne le format dans lequel la variable est
stockée (double, float, int), le format dans lequel la variable s'affiche (%9.0g,
%9s, …), le label de la variable ainsi que celui de ses modalités. Si on n'indique
pas les variables à décrire, Stata décrit toute la base de données, en fournissant
14
browse: la commande browse ouvre la base de données, mais ne permet pas de la modifier à
la main.
15
list
La commande list permet d'afficher la base de données ou un extrait de cette base
dans la fenêtre des résultats. Attention, si on ne précise pas quelles variables et quelles
observations à afficher (en tapant seulement list), toute la base de données s'affiche
dans la fenêtre Results.
list age etudes m3 in 1/5
+----------------------+
| age etudes m3 |
|----------------------|
1. | 39 16 homme |
2. | 4 0 homme |
3. | 11 3 homme |
4. | 6 0 femme |
5. | 25 10 femme |
+----------------------+
16
codebook
codebook var1
var1 age
-----------------------------------------------------------------------------------
type: numeric (float)
range: [0,98] units: 1
unique values: 95 missing .: 0/12749
mean: 21.699
std. dev: 17.2764
percentiles: 10% 25% 50% 75% 90%
3 8 17 32 46 17
En Résumé
On débute le programme avec la commande clear afin de vider la mémoire de Stata.
On crée un répertoire de travail:
cd "C:\StataSE12\formation stata\Espace de travail "
On indique la base à utiliser:
use data.dta
ou bien use "C:\StataSE12\formation stata\Espace de travail\etudiant.dta "
Il est conseillé d'ouvrir un fichier log :
log using résultat.log
On commence le programme (describe, rename, replace…)
Sauvegarder les modifications et fermer le fichier log:
save data.dta
log close
18
Création des variables
La commande principale pour créer une variable est la commande generate. Sa syntaxe possède
une partie supplémentaire :
generate [varlist] [=exp] [if exp] [,options]
C'est dans [=exp] qu'on indique comment construire la variable, par exemple :
19
egenerate (extended generate) : s'impose lorsque les calculs se complexifient un peu ou
lorsque l'utilisation de fonctions statistiques spécifiques est nécessaire.
egen y = count (x) /* y est une constante égale au nombre d’observations de la variable x*/
egen y = sd(x) /* y est une constante égale à l’écart-type de la variable x*/
egen y = mad(x) /* y est une constante égale à la médiane de la variable x*/
egen y = max(x) /* y est une constante égale à la valeur max de la variable x*/
egen y = min(x) /* y est une constante égale à la valeur min de la variable x*/
egen y = sum(x) /* y est une constante égale à la somme de la variable x*/
egen y = mean(x) /* y est une constante égale à la moyenne de la variable x*/
egen y= rsum(x,z) /* y est une constante égale à la somme des variable x et z*/
egen y= rmax(x,z) /* y est une constante égale au maximum des valeurs des variable x et z*/
egen y= rmean(x,z) /* y est une constante égale à la moyenne des variable x et z*/
20
Addition + Soustraction -
Multiplication * Division /
Égalité = Inégalité !=
Exposant ^ Partie entière int()
Racine sqrt() Exponentielle exp()
Logarithme log() Valeur absolue abs()
Sup. (resp. Inf.) >(resp. <) Sup. (resp. Inf) ou égal >= (resp. <=)
Ou | Et &
Minimum min() Maximum max()
21
22
Statistiques descriptives
• Les statistiques descriptives regroupent toutes les techniques
utilisées pour décrire et résumer des données quantitatives et
qualitatives.
homme femme
24
Exemple: la commande « graph »
25
20
graph bar m4, over(m3) over(strate)
mean of m4
15
10
5
0
homme
femme homme
femme homme
femme homme
femme homme
femme homme
femme
01 02 03 04 05 06
homme
01
femme
homme
02
femme
homme
03
femme
homme
05
femme
homme
06
femme
0 5 10 15 20 25
mean of m4
25
Exemple: la commande « graph »
graph dot m4, over(m3) over(strate)
homme
01
femme
homme
02
femme
homme
03
femme
homme
04
femme
homme
05
femme
homme
06
femme
0 5 10 15 20 25
mean of m4
26
Exemple : la commande « graph »
6
relation inverse entre la variable
5
situation de famille
dépendante m6 et la variable
4
indépendante m4.
3
graph twoway scatter m4 m6
2
1
0 20 40 60 80 100
age
27
Exemple: la commande «histogram »
4000
• bin (#): spécifie le nombre
3000
d’intervalles à utiliser pour les
Frequency
barres.
2000
• freq: fréquence relative de
1000
l’axe des ordonnées.
• normal: dessine la distribution
0
0 20 40 60 80 100
age
normale.
histogram m4, bin(10) frequency
28
La boite à moustache
graph box m4
100
80
60
age
40
20
0
29
describe : cette commande fournit une description non-statistique de ou
des variables (type, nombre, label, taille de la base de données).
Exemple:
summarize m3,detail
Su m3,det
30
Exemple: tabulate oneway, tabulate twoway
Tabulate (tab) : cette commande fournit le tableau des fréquences
d'une variable (les variables catégoriques à k modalités).
Pour une seule variable, la commande tabulate fournit pour chaque
modalité le nombre d'observations, le pourcentage et le pourcentage
cumulé.
tab m3
31
Exercice
• Pour des raisons de sécurité publique, on s’intéresse à la concentration d’ozone dans
l’air (en microgrammes par millilitre). En particulier, on cherche à savoir s’il est possible
d’expliquer le taux maximal d’ozone par la température à midi. Les données sont:
Température à 12h 23.8 16.3 27.2 7.1 25.1 27.5 19.4 19.8 32.2 20.7
O3 max 115.4 76.8 113.8 81.6 115.4 125 83.6 75.2 136.8 102.8
32
• Créer, sur le bureau, un dossier appelé exercice.
• Créer un répertoire de travail dans le dossier
“C:\Users\Dell\Desktop\exercice”.
• Créer un fichier log nommé exe.log.
• Sauvegarder les données ci-dessus sous le nom données.dta.
• Présenter le tableau des statistiques descriptives de la variable O3 max.
• Existe-t-il une corrélation entre la concentration maximale d’ozone et la
température à midi?
• Représenter graphiquement la concentration maximale d’ozone en
fonction de la température à midi.
• Fermer le fichier log.
33
Chapitre 2
Introduction aux séries
temporelles
34
Dans le cours d’économétrie 1, l’estimation se fait à partir de relations
structurelles censées traduire des mécanismes économiques. La
modélisation consiste à traduire en équations la théorie économique.
Dans ce cours d’économétrie des séries temporelles, ces éléments
structurels disparaissent.
35
C'est le cas pour des phénomènes complexes dans lesquels il y a de
nombreuses actions et réactions simultanées pour lesquelles il est
difficile de faire apparaître clairement un enchaînement de causes et
d'effets. (Exemple : cours d'une valeur mobilière au jour le jour). Cela
peut aussi être le cas de variables extrêmement volatiles.
36
Une des causes de mauvaise performance des modèles explicatifs vient
du fait qu'ils sont beaucoup plus performants pour analyser des
tendances que des fluctuations. Une grande partie de leur pouvoir
explicatif est tiré du parallélisme des évolutions. Cet argument laisse
entendre que certaines corrélations ne correspondent pas véritablement
à des relations entre variables, mais peuvent tout simplement résulter
d'une évolution semblable des variables sous des influences n'ayant rien
à voir avec le problème étudié.
37
Dans tous ces cas, quand on a besoin de faire une prévision à court
terme et quand les enjeux de cette prévision sont économiquement
importants on préfère utiliser des modèles non explicatifs mais assez
performants en prévision qui sont donc des modèles de série temporelle.
Ce sont des structures légères qu'on peut facilement réestimer. Le
modèle peut donc être mis à jour tous les jours. Le coût de la prévision
est relativement faible. Un économètre bien formé avec un bon logiciel
peut assurer au quotidien la prévision au jour le jour.
38
Un des domaines d'application est le domaine des variables financières (taux
d'intérêt, taux de change, taux de rendement). La méthode consiste à rechercher
dans l'histoire de la variable des régularités susceptibles d'aider à prévoir ses
valeurs futures.
40
Évolution journalière du nombre de décès par le coronavirus en Tunisie
41
42
Processus stochastique
43
Les propriétés des processus stationnaires
• E(𝜀𝑡 )=0, ∀ t,
• V(𝜀𝑡 )=𝜎 2 , ∀ t,
• Cov(𝜀𝑡 ,𝜀𝑡+𝑘 )=0, ∀ 𝑘0.
46
Fonction d’auto-covariance
• La fonction d’auto-covariance 𝛾 est définie par :
𝛾: ℤ →ℝ
k→ 𝛾(𝑘)= Cov(𝑦𝑡 , 𝑦𝑡+𝑘 ).
2
Pour K=0, on a 𝛾(0)= V(𝑦𝑡 )=𝜎𝑦𝑡 .
47
Fonction d’autocorrélation
• La fonction d’autocorrélation 𝜌 est décrite par :
𝜌: ℤ →[-1, 1]
Cov (𝑦𝑡 ,𝑦 𝑡+𝑘 )
k→ 𝜌(𝑘)= .
𝜎𝑦 𝑡 𝜎𝑦 𝑡+𝑘
48
• Si le processus est stationnaire, alors sa variance est invariante au cours du
temps, ainsi,
49
• Si le processus est stationnaire, ces coefficients d'autocorrélation diminueront
assez rapidement. Un processus non stationnaire peut avoir une résonance de
la période t à une période plus éloignée, de telle sorte que des coefficients
d'autocorrélation élevés puissent exister pour des valeurs élevées de k.
• Seuls les processus stationnaires sont intéressants car ils sont stables. Il est
possible de tester la stationnarité d'un processus c'est-à-dire en fait la
décroissance rapide de ses coefficients d'autocorrélation. C'est la première
opération à faire lorsqu'on étudie une série.
50
Fonction d’autocorrélation partielle
Commande Stata
gen air1=L.air
Gen air2=L2.air 52
Airline passengers data (Stata)
53
Pour représenter graphiquement l’évolution du nombre de passagers aériens
en fonction du temps:
• Commandes Stata:
tsset t, monthly
tsline air
54
ou bien en utilisant la barre de menu:
55
56
57
58
59
Coefficients d’autocorrélation et coefficients d’autocorrélation partielle
La commande Stata est :
corrgram air, lags(20)
60
Corrélogramme avec Stata
ac var
61
62
63
64
65
Corrélogramme partiel avec Stata
pac var
66
67
68
69
70
71
72
73
74
75
76
77
78
79
Exercice
• Créer un répertoire de travail dans le dossier “C :\Dell\Desktop\bases ”.
• Créer un fichier log nommé exe.log.
• Importer la base data.dta se trouvant dans votre répertoire de travail.
• Présenter le tableau des statistiques descriptives du taux de change EUR\TND.
Interpréter.
• Présenter graphiquement l’évolution du taux de change EUR\TND au cours du temps.
Enregistrer le graphique sous le nom graph.png.
• Créer la variable « taux1 » retardée une fois du taux de change EUR\TND.
• Calculer la valeur de 𝜌 𝑘 pour k=0,1,…,5. Interpréter.
• Présenter le corrélogramme du taux de change EUR\TND . Interpréter.
Enregistrer le graphique sous le nom cor.png.
• Donner les valeurs de 𝜙11 , 𝜙22 , 𝜙55 𝑒𝑡 𝜙77 . Interpréter.
• Tracer le corrélogramme partiel du taux de change EUR\TND . Interpréter.
Enregistrer le graphique sous le nom corp.png.
• Fermer le fichier log.
80
Chapitre 3
Les modèles linéaires
de séries temporelles
81
Les modèles linéaires de séries temporelles
83
Les modèles autorégressifs d’ordre 1 : AR(1)
𝑦𝑡 = +∞ 𝜑
𝑖=0 1
𝑖
= 𝜀𝑡 +𝜑 𝜀
1 𝑡−1 +𝜑 2
𝜀
1 𝑡−2 +𝜑 3
1 𝜀𝑡−3 +…..
C’est la représentation moyenne-mobile infinie de 𝑦𝑡 .
• E(𝑦𝑡 ) = 0.
𝜎2
• 𝛾(0) =V(𝑦𝑡 )= 2 .
1−𝜑1
• 𝜙11 = 𝜌(1)= 𝜑1 et 𝜙𝑘𝑘 =0 ∀ k>1.
84
• Pour un processus AR (1), les coefficients d'autocorrélation 𝜌(𝑘) décroissent de
façon exponentielle.
• Comme indiqué dans le graphique suivant, la fonction d’autocorrélation est
marquée par une décroissance exponentielle de termes soit tous positifs si 𝜑1 > 0,
soit alternant en signe si 𝜑1 < 0.
85
Les modèles autorégressifs d’ordre 2 : AR(2)
• Un processus autorégressif d’ordre 2 peut être exprimé comme suit :
𝑦𝑡 =𝜑1 𝑦𝑡−1 + 𝜑2 𝑦𝑡−2 + 𝜀𝑡 , avec 𝜀𝑡 ~𝐵𝐵(0, 𝜎 2 )
(1-𝜑1 𝐿 − 𝜑2 𝑙 2 ) 𝑦𝑡 = 𝜀𝑡
Φ 𝐿 =1-𝜑1 𝐿 − 𝜑2 𝑙 2
• Le processus 𝑦𝑡 est stationnaire si est seulement si les racines du polynôme Φ 𝐿 = 0
sont de module>1.
• Un processus AR(2) est inversible, on a :
• 𝑦𝑡 = Φ−1 (𝐿) 𝜀𝑡 = +∞ 𝑖=0 𝜔𝑖 𝜀𝑡−𝑖 (représentation moyenne mobile infinie de 𝑦𝑡 )
• E(𝑦𝑡 ) = 0
1−𝜑2
• 𝛾(0) =V(𝑦𝑡 )=𝜑1 𝛾 1 + 𝜑2 𝛾 2 + 𝜎2= 𝜎 2.
[1+𝜑2 ][(1−𝜑2) 2 −𝜑1 2 ]
• 𝜌(𝑘) =φ1 𝜌(𝑘 − 1)+ φ2 𝜌(𝑘 − 2),∀ k>0.( les équations de Yule-Walker)
φ1
• 𝜙11 = 𝜌(1)= ; 𝜙22 = 𝜑2 et 𝜙𝑘𝑘 =0 ∀ k>2
1−φ2
86
Les modèles autorégressifs d’ordre p : AR(P)
𝝓𝒌𝒌 =0 ∀ k> 𝒑
87
Les modèles moyennes-mobiles (Yule, 1921-1926)
88
Les modèles moyennes-mobiles d’ordre 1 : MA(1)
• 𝑦𝑡 = 𝜀𝑡 − θ1 𝜀𝑡−1 , avec 𝜀𝑡 ~𝐵𝐵(0, 𝜎 2 )
𝑦𝑡 = (1 − θ1 𝐿) 𝜀𝑡
𝑦𝑡 = 𝜃(L)𝜀𝑡
• Un processus MA(1) est stationnaire.
• Si |θ1 |<1 alors le processus est inversible, on a :
+∞
𝜀𝑡 = 𝜃1 𝑖 𝑦𝑡−𝑖
𝑖=0
2
𝜀𝑡 = 𝑦𝑡 +θ1 𝑦𝑡−1 +θ1 𝑦𝑡−2 +… ; c’est la représentation autorégressive infinie du
processus.
• E(𝑦𝑡 )=0
• 𝛾 0 = 𝜎 2 1 + θ12
• 𝜌 𝑘 = 0 si k>1 89
Les modèles moyennes-mobiles d’ordre 2 : MA(2)
90
Les modèles moyennes-mobiles d’ordre q : MA(q)
Pour un processus MA (q), les coefficients d'autocorrélation sont nuls
pour tout décalage k > q,
𝜌(𝑘)= 0 si k>q
91
Les modèles ARMA (p,q) (Box-Jenkins, 1971)
• Les modèles ARMA sont représentatifs d’un processus généré par une
combinaison des valeurs passées et des erreurs passées. Un
processus ARMA(p,q) est une combinaison d’un processus AR(p) et
d’un processus MA(q).
• Un processus ARMA (p,q) est défini par l’équation suivante :
• Φ 𝐿 𝑦𝑡 = 𝜃(L)𝜀𝑡 , avec 𝜀𝑡 ~𝐵𝐵(0, 𝜎 2 )
• Φ 𝐿 = 1 − 𝜑1 𝐿 − 𝜑2 𝐿2 − ⋯ − 𝜑𝑝 𝐿𝑝 ,
• 𝜃(L)=1 − θ1 𝐿 − θ2 𝐿2 −…−θq 𝐿𝑞
92
La méthodologie de Box-Jenkins
93
Les étapes de la méthodologie de Box-Jenkins
94
Étape 1:Stationnarisation de la série
95
Étape 2: Identification
96
Étape 3: Estimation
97
Étape 4: Validation
98
Les critères d’information
99
Étape 5: Prévision
100
Application de la méthodologie de Box-Jenkins
sur Stata pour la modélisation et la prévision du
taux de change EUR/TND
101
Présentation des données
102
Étape 1: Stationnarisation de la série
103
104
Test de Dickey-Fuller
Les hypothèses du test
H0 : Présence de racine unitaire (série non stationnaire)
H1 : Absence de racine unitaire (série stationnaire)
La règle de décision
Si p-value≤ 5% , on rejette H0 ,
Si p-value> 5% , on accepte H0 .
• 5% est le seuil de signification
105
106
107
108
Test de Dickey-Fuller sur la série D.cloture
109
• P-value=0.000<5% donc on rejette H0 ainsi la série différenciée est
stationnaire.
110
Étape 2: Identification
111
112
113
114
Ainsi, les modèles ARIMA sélectionnés sont ARIMA(1,1,1), ARIMA(2,1,1) et
ARIMA(3,1,1).
115
Étape 3: Estimation des modèles ARIMA retenus
116
117
118
119
120
121
122
Étape 4: Validation
Cette étape consiste à retenir le meilleur modèle ARIMA. Le
modèle ARIMA le plus approprié pour modéliser le taux de change
EUR\TND est celui qui présente les caractéristiques suivantes :
. estat ic
124
Test de Significativité des coefficients
Les hypothèses du test
H0 : Le coefficient =0 (le coefficient est statistiquement non significatif au seuil de
5%)
H1 : Le coefficient≠ 0 (le coefficient est statistiquement significatif au seuil de
5%)
La règle de décision
Si p-value≤ 5% , on rejette H0 ,
Si p-value> 5% , on accepte H0 .
• 5% est le seuil de signification
125
Test de significativité des paramètres du modèle ARIMA(3,1,1)
126
127
128
129
Bibliographie
• Becketti Sean et al., Introduction to time series using Stata, College Station, TX : Stata
Press, 2013.
• Bernard H., Économétrie appliquée, ESTEM-Editions scientifiques techniques et
médicales, 1996.
• Bourbonnais Régis, Économétrie-10e éd.: Cours et exercices corrigés, Dunod, 2018.
• Casin P., Econométrie, Éditions Technip, 2009.
• Hurlin C., Économétrie Appliquée Séries Temporelles, Cours tronc commun, UFR
Economie appliquée, 2001.
• Leblond S., Guide d’économétrie appliquée, Université de Montréal, 2003.
• Ouellet E., BELLEY-FERRIS I., et LEBLOND S., Guide d’économétrie appliquée pour
Stata Pour ECN 3950 et FAS 3900, 2005.
• Wooldridge J., Introductory Econometrics: A Modern Approach, (5th edition),
SouthWestern College Publishing, 2012.
• Traduit en français : Introduction à l’économétrie : Une approche moderne, De Boeck-
Ouvertures Économique, 2015. 130