SCSP

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 35

Chapitre 3: Séries chronologiques

Arnaud Rousselle
[email protected]
http://arousselle.perso.math.cnrs.fr/

Année universitaire 2023-2024


Semestre 2

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 1 / 35


1 Définitions et motivations

2 Analyse d’une série chronologique

3 Estimation des composantes

4 Prédiction

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 2 / 35


Définitions et motivations

Définition
On appelle série chronologique ou série temporelle toute suite (finie) y
d’observations numériques d’une grandeur effectuées au cours de plusieurs années
à intervalle de temps réguliers, appelés saisons.

Notations
On note :
▶ yt la valeur de la t e observation,
▶ n le nombre d’années,
▶ p le nombre de saisons (périodes) dans une année.

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 3 / 35


Définitions et motivations

Exemple 1

On a relevé les chiffres d’affaires trimestriels, exprimés en K¤, d’une entreprise au


cours des années 2012 à 2015. Ceux-ci sont présentés dans le tableau suivant.
XXX
XXX Trimestre
XXX 1 2 3 4
Année XX X
2012 20 25 50 70
2013 35 30 65 105
2014 40 34 75 135
2015 50 37 80 170

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 4 / 35


Définitions et motivations

Exemple 1 (en image)

y

150

100 •

• •
• •
50 • •
• • • • •
• •
t
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Figure – Chiffres d’affaires yt (en K¤) de la t e période (Exemple 1).

Ici, le nombre d’années est n = 4, le nombre de périodes par année est p = 4 et on


a y1 = 20, y2 = 25, y3 = 50, y4 = 70, y5 = 35, . . ., y16 = 170.
Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 5 / 35
Définitions et motivations

Exemple 2

On a relevé la consommation mensuelle en eau, exprimée en Hm3 , d’un


producteur de melons au cours des années 2013 à 2015. Les relevés sont présentés
dans le tableau suivant.
HH Janv. Fév. Mars Avr. Mai Juin Juil. Août Sept. Oct. Nov. Déc.
H
2013 1 1,5 3 5 10 20 45 50 30 2 1 0,5
2014 3,5 3 5,5 9 11 24 49 50 31 4 4 3,5
2015 7 6 8 9 15 25 52 55 37 7 5 6

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 6 / 35


Définitions et motivations

Exemple 2 (en image)

y


50 • •••

40 •
30 •
• •
20 •

10 • •• • •• •••

•••••
• ••• •
••• t
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Figure – Consommation d’eau yt (en Hm3 ) au cours du t e mois (Exemple 2).

Ici, le nombre d’années est n = 3, le nombre de périodes par année est p = 12 et


on a y1 = 1, y2 = 1, 5,. . ., y12 = 0, 5, y13 = 3, 5, . . ., y36 = 6.

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 7 / 35


Définitions et motivations

Motivations et ...

Pour toute série chronologique, trois questions essentielles se posent :


▶ Une tendance générale (≪ trend ≫) se dégage-t-elle de la série ? Quelle est
l’évolution de la série en temps long ?
▶ Peut-on détecter des phénomènes saisonniers ? L’évolution de la série
présente-t-elle des caractéristique se répétant d’année en année ?
▶ Peut-on prévoir des valeurs futures de la série ?
Composantes d’une série chronologique :
▶ la tendance générale (appelée ≪ trend ≫),
▶ une composante saisonnière,
▶ une composante aléatoire (imprévisible).

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 8 / 35


Définitions et motivations

objectifs

Pour répondre aux questions posées ci-dessus, nous fournirons des méthodes
permettant :
▶ de décomposer une série chronologique en composantes générale, saisonnière
et aléatoire afin de l’analyser (voir Section 2) ;
▶ d’estimer les composantes de la série chronologique (voir Section 3) ;
▶ prédire les valeurs futures de la série (voir Section 4).

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 9 / 35


Analyse d’une série chronologique

1 Définitions et motivations

2 Analyse d’une série chronologique

3 Estimation des composantes

4 Prédiction

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 10 / 35


Analyse d’une série chronologique

Décomposition d’une série chronologique

On veut écrire toute valeur yt d’une série chronologique sous la forme :

yt = f (gt , st , at ),

où f est une certaine fonction et :


▶ gt désigne la composante ≪ tendance générale ≫ de la série au temps t,
▶ st désigne la composante ≪ saisonnière ≫ de la série au temps t,
▶ at désigne la composante ≪ aléatoire ≫ de la série au temps t.
Différentes fonctions f conduisent à des modèles différents. Dans la suite, on
s’intéressera aux modèles additif et multiplicatif.

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 11 / 35


Analyse d’une série chronologique

Exemple 1 (suite)

Graphiquement, on constate que les chiffres d’affaires ont tendance à augmenter


d’année en année. Rigoureusement, on peut justifier ce fait en faisant une
régression linéaire. On constate que la tendance générale à une faible courbure, ce
qui rend légitimes les calculs que nous ferons dans la suite.

On voit que le chiffre d’affaire présente des ≪ pics positifs ≫ au 4e trimestre de


chaque année et des ≪ pics négatifs ≫ lors des deux premiers trimestres de chaque
année. On cherchera, dans la suite, à décrire l’impact d’une saison (ici un
trimestre) sur la série chronologique. On supposera que la composante saisonnière
est périodique de période p (sk+p = sk , pour tout k) et a une influence nulle sur
une année.

La composante aléatoire est plus délicate à visualiser. Elle correspond aux


irrégularités des cycles de la série. Nous supposerons par la suite que celle-ci est
négligeable.

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 12 / 35


Analyse d’une série chronologique

Modèle additif
Définition
On parle de modèle additif si yt = gt + st + at où gt désigne la composante
≪ tendance générale ≫, st désigne la composante saisonnière et at désigne la

composante aléatoire de la série au temps t.

Remarque
▶ composante saisonnière
p-périodique : sk+p = sk , pour tout k
d’influence nulle sur une année : s1 + s2 + · · · + sp = 0
▶ composante aléatoire négligeable : at ≃ 0, pour tout t.

Critère
Pour savoir si le modèle additif est adapté, on trace les lignes polygonales passant
par les pics ≪ positifs ≫ d’une part et ≪ négatifs ≫ d’autre part. Si celles-ci sont
proches de droites et si la largeur de la bande délimitée par celles-ci est
essentiellement constante, on choisit d’utiliser le modèle additif.
Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 13 / 35
Analyse d’une série chronologique

Exemple 2 (suite)

Le modèle additif est adapté pour l’Exemple 2.


y


50 • •••

40 •
30 •
• •
20 •

10 • •• •••• •••
• • •••
••• ••••• t
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Figure – Consommation d’eau yt (en Hm3 ) au cours du t e mois de l’Exemple 2 (bleu) et


les lignes polygonales passant par les pics ≪ positifs ≫ (rouge) et ≪ négatifs ≫ (vert).

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 14 / 35


Analyse d’une série chronologique

Modèle multiplicatif
Définition
On parle de modèle multiplicatif si yt = gt × st × at où gt désigne la composante
≪ tendance générale ≫, st désigne la composante saisonnière et at désigne la

composante aléatoire de la série au temps t.

Remarque
▶ composante saisonnière
p-périodique :sk+p = sk , pour tout k
d’influence nulle sur une année : s1 × s2 × · · · × sp = 1
▶ composante aléatoire négligeable : at ≃ 1, pour tout t.

Critère
Pour savoir si le modèle multiplicatif est adapté, on trace les lignes polygonales
passant par les pics ≪ positifs ≫ d’une part et ≪ négatifs ≫ d’autre part. Si celles-ci
sont proches de droites et si la largeur de la bande délimitée par celles-ci est
clairement croissante ou décroissante, on choisit d’utiliser le modèle multiplicatif.
Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 15 / 35
Analyse d’une série chronologique

Exemple 1 (suite)
Le modèle multiplicatif est adapté pour l’Exemple 1.
y

150

100 •

• •
• •
50 • •
• • • • •
• •
t
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Figure – Chiffres d’affaires yt (en K¤) du t e trimestre de l’Exemple 1 (bleu) et les lignes
polygonales passant par les pics ≪ positifs ≫ (rouge) et ≪ négatifs ≫ (vert).

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 16 / 35


Estimation des composantes

1 Définitions et motivations

2 Analyse d’une série chronologique

3 Estimation des composantes

4 Prédiction

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 17 / 35


Estimation des composantes

Estimation de la tendance générale

Une première méthode possible pour estimer la tendance générale gt est


d’effectuer une régression de yt en fonction de t. Celle-ci conduit à des calculs
assez simples mais n’est pas toujours adaptée à cause des effets saisonniers. Nous
détaillons ici une autre méthode basée sur l’utilisation de moyennes mobiles pour
estimer la tendance générale.
Définition
Soit y une série chronologique portant sur n années décomposées en p saisons et
soit k ∈ {2, . . . , np}. On appelle moyenne mobile (ou glissante) d’ordre k au
temps t ∈ {1 + ⌊ k2 ⌋, . . . , np − ⌊ k2 ⌋} la quantité :
  
 1 y k−1 + · · · + yt + · · · + y k−1 si k est impair
(k)
Mt =
k
 yt−k 2 t+ 2
yt+ k  .
t−
 1
2 + yt− k +1 + · · · + yt + · · · + yt+ k −1 + 2 si k est pair
2 2
k 2 2

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 18 / 35


Estimation des composantes

Moyennes mobiles (exemples)

(2) 1  yt−1 yt+1 


Mt = + yt + ,
2 2 2
(3) 1
Mt = (yt−1 + yt + yt+1 ) ,
3
(4) 1 y t−2 yt+2 
Mt = + yt−1 + yt + yt+1 +
4 2 2
et
(5) 1
Mt = (yt−2 + yt−1 + yt + yt+1 + yt+2 ) .
5
Remarque
1 L’utilisation des moyennes mobiles permet de lisser la courbe et
≪ supprimer ≫ la composante aléatoire par moyennisation.

2 Lorsque k est un multiple de p, la composante saisonnière n’influe pas sur la


moyenne mobile d’ordre k.
3 Il est nécessaire de choisir convenablement l’ordre k des moyennes mobiles
utilisées. En général, on choisit k = p (le nombre de période dans l’année).
Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 19 / 35
Estimation des composantes

Estimation de la tendance générale

Proposition
Soit y une série chronologique dont la tendance générale est notée gt .
Alors, un estimateur de gt est donné par :
(k)
ĝt = Mt .

Autrement dit, on peut considérer que :


(k)
gt ≃ ĝt = Mt .

Remarque
L’estimation de la tendance générale ne dépend pas du fait que l’on utilise un
modèle additif ou multiplicatif.

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 20 / 35


Estimation des composantes

Exemple 1 (suite)

L’estimation de la tendance des chiffres d’affaires trimestriels de l’Exemple 1 par


des moyennes mobiles d’ordre 4 est donnée dans le tableau suivant et représentée
dans la figure suivante.
XXX
XXX Trimestre
XXX 1 2 3 4
Année XX X
2012 43,125 45,625
2013 48,125 54,375 59,375 60,5
2014 62,25 67,25 72,25 73,875
2015 74,875 79,875

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 21 / 35


Estimation des composantes

Exemple 1 (suite et image)

y

150

100 •

• • • • • •
• • •
• • • • •
50 • • • • • •
• •
• •
t
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Figure – Chiffres d’affaires yt (en K¤) du t e trimestre (bleu, Exemple 1) et estimation


(4)
de la tendance gt par ĝt = Mt (rouge).

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 22 / 35


Estimation des composantes

Exemple 2 (suite)

Les valeurs approchées à une décimale de l’estimation de la tendance la


consommation mensuelle d’eau de l’Exemple 2 par des moyennes mobiles d’ordre 7
sont données dans le tableau suivant et représentées dans la figure suivante.
H Janv. Fév. Mars Avr. Mai Juin Juil. Août Sept. Oct. Nov. Déc.
H
H
2013 12,2 19,2 23,3 23,1 22,6 21,2 18,9 12,9 6,5
2014 3,5 4,8 8,1 15 21,6 25,6 25,4 24,7 23,6 21,2 15,1 9,1
2015 5,9 7,5 10,5 17,4 24,3 28,7 28,6 28 26,7

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 23 / 35


Estimation des composantes

Exemple 2 (suite en image)

y


50 • •••

40 •
30 • ••••
•••• •••• ••
20 •• •• •
• ••
• • •
•• •
10 ••••
• •••

•••••
•• •••
•• •• •
••• •
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
t

Figure – Consommation d’eau yt (en Hm3 ) au cours du t e mois (bleu, Exemple 2) et


(7)
estimation de la tendance gt par ĝt = Mt (rouge).

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 24 / 35


Estimation des composantes

Estimation de la composante saisonnière

L’estimation de la composante saisonnière st dépend du fait que l’on utilise un


modèle additif ou multiplicatif.

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 25 / 35


Estimation des composantes

Estimation de la composante saisonnière dans le modèle additif


On veut écrire les éléments de la série sous la forme :
yt = gt + st + at
avec la composante aléatoire at négligeable donc
yt ≃ ĝt + ŝt .
On effectue les étapes suivantes :
1 pour t ∈ {1 + ⌊ k2 ⌋, . . . , np − ⌊ k2 ⌋}, on calcule les écarts entre la valeur de la
série et l’estimation de la tendance au temps t : et = yt − ĝt ;
2 pour t ∈ {1, . . . , p}, on calcule la moyenne arithmétique ēt des écarts
correspondant à la même période de l’année, i.e. des et+kp ;
ē +···+ē
3 on calcule la moyenne arithmétique ē des ēt : ē = 1 p p ;
4 pour t ∈ {1, . . . , p}, on calcule les coefficients saisonniers normalisés
ŝt = ēt − ē.
Proposition
Dans le cadre d’un modèle additif, une estimation de la composante saisonnière
est donnée par ŝt défini ci-dessus.
Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 26 / 35
Estimation des composantes

Exemple 2 (suite)

Le tableau suivant donne les valeurs approchées à une décimale près des écarts
et = yt − ĝt obtenus pour chaque période t ∈ {4, . . . , 33}, celles des moyennes ēt
des écarts correspondant à chacun des mois d’une année :
e13 + e25 e15 + e27 e4 + e16 + e28 e9 + e21 + e33
ē1 = , . . . , ē3 = , ē4 = , . . . , ē9 = ,
2 2 3 3
e10 + e22 e12 + e24
ē10 = , . . . , ē12 = ,
2 2
ainsi que l’estimation de la composante saisonnière ŝt = ēt − ē où
ē = ē1 +ē2 +···+ē
12
12
≃ 0, 05.
HH Janv. Fév. Mars Avr. Mai Juin Juil. Août Sept. Oct. Nov. Déc.
H
2013 -7,2 -9,2 -3,3 21,9 27,4 8,8 -16,9 -11,9 -6
2014 0 -1,8 -2,6 -6 -10,6 -1,6 23,6 25,3 7,4 -17,2 -11,1 -5,6
2015 1,1 -1,5 -2,5 -8,4 -9,3 -3,7 23,4 27 10,3
ēt 0,5 -1,6 -2,5 -7,2 -9,7 -2,9 23 26,6 8,8 -17 -11,5 -5,8
ŝt 0,5 -1,7 -2,6 -7,2 -9,8 -2,9 22,9 26,5 8,8 -17,1 -11,5 -5,8

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 27 / 35


Estimation des composantes

Estimation de la composante saisonnière dans le modèle multiplicatif


On veut écrire les éléments de la série sous la forme :
yt = gt × st × at
avec la composante aléatoire at négligeable donc
yt ≃ ĝt × ŝt .
Pour cela, on effectue les étapes suivantes :
1 pour t ∈ {1 + ⌊ k2 ⌋, . . . , np − ⌊ k2 ⌋}, on calcule les ratios entre la valeur de la
série et l’estimation de la tendance au temps t : rt = ĝytt ;
2 pour t ∈ {1, . . . , p}, on calcule la moyenne géométrique r¯t des ratios
correspondant à la même période de l’année, i.e. des rt+kp ;

3 on calcule la moyenne géométrique r¯ des r¯t : r¯ = p r¯1 × · · · × r¯p ;
r¯t
4 pour t ∈ {1, . . . , p}, on calcule les coefficients saisonniers normalisés ŝt = r¯ .

Proposition
Dans le cadre d’un modèle multiplicatif, une estimation de la composante
saisonnière est donnée par ŝt défini ci-dessus.
Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 28 / 35
Estimation des composantes

Exemple 1 (suite)
Le tableau suivant donne les valeurs approchées à deux décimales près des ratios
rt = ĝytt obtenus pour chaque période t ∈ {3, 4, . . . , 14}, celles des moyennes r¯t des
ratios correspondant à chacun des trimestres d’une année :
√ √ √ √
r¯1 = 3 r5 r9 r13 , r¯2 = 3 r6 r10 r14 , r¯3 = 3 r3 r7 r11 , et r¯4 = 3 r4 r8 r12 ,

ainsi√que l’estimation de la composante saisonnière ŝt = r¯r¯t où


r¯ = 4 r¯1 r¯2 r¯3 r¯4 ≃ 0, 89.
XX
XXTrimestre
XXX
1 2 3 4
Année XXX
XX
2012 1,16 1,53
2013 0,73 0,55 1,09 1,74
2014 0,64 0,51 1,04 1,83
2015 0,67 0,46
r¯t 0,68 0,51 1,10 1,69
ŝt 0,76 0,57 1,23 1,90

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 29 / 35


Prédiction

1 Définitions et motivations

2 Analyse d’une série chronologique

3 Estimation des composantes

4 Prédiction

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 30 / 35


Prédiction

Prédiction

Étant donnée une série chronologique y portant sur n années découpées en p


saisons, on souhaite prédire les valeurs futures de la série. Pour cela, on effectue la
démarche suivante.
(k)
1 On estime la tendance à l’aide de moyennes mobiles ĝt = Mt ,
t ∈ {1, . . . , np}.
2 On estime la composante saisonnière par ŝt .
3 On effectue une régression linéaire sur les ĝt pour prédire leurs valeurs futures
.
4 On en déduit des prédictions des valeurs futures de la série en utilisant que :
yt ≃ ĝt + ŝt si l’on utilise un modèle additif,
yt ≃ ĝt × ŝt si l’on utilise un modèle multiplicatif.

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 31 / 35


Prédiction

Exemple 1 (suite)

En utilisant les résultats déjà obtenus dans les sections précédentes, on obtient
que la droite de régression de ĝt en t a pour équation :

y = ĝt = 3, 37t + 33, 15.

On en déduit les prédictions suivantes pour l’année 2016 :

y17 ≃ (3, 37 × 17 + 33, 15)ŝ17 ≃ (3, 37 × 17 + 33, 15) × 0, 76 ≃ 68, 73,

y18 ≃ (3, 37 × 18 + 33, 15)ŝ18 ≃ (3, 37 × 18 + 33, 15) × 0, 57 ≃ 53, 47,


y19 ≃ (3, 37 × 19 + 33, 15)ŝ19 ≃ (3, 37 × 19 + 33, 15) × 1, 22 ≃ 118, 56,
y20 ≃ (3, 37 × 20 + 33, 15)ŝ20 ≃ (3, 37 × 20 + 33, 15) × 1, 89 ≃ 190, 04.
Celles-ci sont représentées dans la figure suivante.

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 32 / 35


Prédiction

Exemple 1 (suite et fin en image)


y
200


150


100 •

• •
• • •
50 • • •
• • • • •
• •
t
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Figure – Chiffres d’affaires yt (en K¤) de la t e période de l’Exemple 1 (bleu) et


prédictions pour l’année 2016 (rouge).

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 33 / 35


Prédiction

Exemple 2 (suite)

En utilisant les résultats déjà obtenus dans les sections précédentes, on obtient
que la droite de régression de ĝt en t a pour équation :

y = ĝt = 0, 04t + 17, 1.

On en déduit les prédictions pour l’année 2016, en calculant, pour


t ∈ {37, . . . , 48},
yt ≃ 0, 04t + 17, 1 + ŝt .
Les prédictions sont les suivantes et sont représentées dans la figure suivante :

y37 ≃ 19, 08, y38 ≃ 16, 92, y39 ≃ 16, 06, y40 ≃ 11, 4, y41 ≃ 8, 94, y42 ≃ 15, 88,

y43 ≃ 41, 72, y44 ≃ 45, 36, y45 ≃ 27, 65, y46 ≃ 1, 84, y47 ≃ 7, 48, y48 ≃ 13, 19.

Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 34 / 35


Prédiction

Exemple 2 (suite et fin en image)

y


50 • •••
• •
40 •

30 • •
• •
20 • ••
• • •
•• •
10 • •• • •• •• • •

•••••
• •• • •
••• • t
1 2 3 4 5 6 7 8 9 101112131415161718192021222324252627282930313233343536373839404142434445464748

Figure – Consommation d’eau yt (en Hm3 ) au cours du t e mois de l’Exemple 2 (bleu) et


prévisions pour l’année 2016 (rouge).

Exercice : Reprendre l’Exemple 2 en effectuant un choix correct de l’ordre des


moyennes mobiles et constater l’amélioration de la prédiction.
Arnaud Rousselle Séries chronologiques Année universitaire 2023-2024, S2 35 / 35

Vous aimerez peut-être aussi