Chapitre 3 - Collecte Et Analyse Statistique Des Données
Chapitre 3 - Collecte Et Analyse Statistique Des Données
Chapitre 3 - Collecte Et Analyse Statistique Des Données
1. Bathymétrie et morphologie
2
Collecte et analyse statistique des données
BATHYMÉTRIE ET MORPHOLOGIE
La topographie est la description des caractéristiques géométriques de la surface du sol au-dessus de l’eau. Trois
méthodes sont habituellement utilisées
Nivellement classique
BATHYMÉTRIE ET MORPHOLOGIE
La bathymétrie est la description de la surface du sol sous l’eau. Il s’agit d’une condition aux limites particulièrement
importante pour le dimensionnement géométrique et structurel des ouvrages. Elle a une influence significative sur le volume
de dragage, le volume d’enrochement nécessaire ainsi que sur les actions hydrauliques. À la côte, par exemple, la hauteur
d’eau peut limiter la hauteur de la houle. Sur les cartes marines, le niveau du fond de la mer est défini par rapport à un niveau
de référence (p. ex. cote marine), généralement égal au niveau de plus basse mer astronomique du site.
La bathymétrie d’une zone est normalement déterminée à l’aide d’un bateau équipé d’un sondeur acoustique mono faisceau
(travaillant point par point) ou multifaisceaux (travaillant profil par profil).
4
Collecte et analyse statistique des données
BATHYMÉTRIE ET MORPHOLOGIE
Dans la pratique, ces levés sont effectués à partir d’un bateau, à l’exception des zones intertidales et en eau peu profonde
pour lesquelles il est possible d’employer des méthodes topographiques.
• la position horizontale (X, Y) du bateau, qui est généralement obtenue à l’aide d’instruments topographiques
classiques tels que le GPS différentiel (DGPS), le laser ou des dispositifs optiques;
• la hauteur d’eau (d), donnée par le sondeur ;
• la position verticale (Z) du niveau de l’eau qui est obtenue soit à l’aide d’équipements topographiques classiques (tels
que le DGPS, le laser, les dispositifs optiques), soit par la mesure de la marée ou à l’aide d’échelles référencées.
5
Collecte et analyse statistique des données
BATHYMÉTRIE ET MORPHOLOGIE
La morphodynamique est la description des processus de sédimentation et d’érosion qui se produisent sur le fond. À cause
de l’érosion et de la sédimentation, il est possible que la bathymétrie évolue avec le temps. Ces variations sont
problématiques lorsque l’on effectue des mesures pour déterminer la bathymétrie à des fins de dimensionnement ou de
construction.
La vitesse d’évolution morphologique du fond dépend de l'intensité du transport sédimentaire. Des taux de transport
élevés entraînent généralement une évolution relativement rapide du fond. Ces variations morphologiques sont toutefois
très lentes comparées aux variations des conditions aux limites hydrauliques ; en règle générale, elles s'étalent sur plusieurs
années voire des dizaines d'années, à l'exception de l'affouillement local près des ouvrages.
6
Collecte et analyse statistique des données
Il est fondamental de connaître la bathymétrie et la morphologie du fond de la mer pour dimensionner des ouvrages
côtiers, par exemple dans le cas de hauteurs de houle limitées par la profondeur d'eau. Dans bien des cas, la connaissance
des variations morphologiques du fond au cours du temps est tout aussi essentielle au dimensionnement que la
détermination du niveau moyen du fond, dans la mesure où il faut déterminer le niveau du fond le plus bas devant
l'ouvrage, pour son dimensionnement.
De fait, que le fond de la mer soit en équilibre dynamique ou instable sur le plan morphologique, l’amplitude des variations
du niveau du fond à prendre en compte dans le dimensionnement doit être identifiée
7
Collecte et analyse statistique des données
Wavewatch III
WAM : Puertos del esatados
8
Collecte et analyse statistique des données
Le niveau d'eau de projet est la somme du niveau de la marée la plus haute, des décotes et des surcotes dues à des
conditions météorologiques particulières et de la valeur prévisible pour une période de retour de 100 ans de
remontée lente du niveau de la mer due aux altérations climatiques :
9
Collecte et analyse statistique des données
2. Dans des conditions atmosphériques exceptionnelles, le vent peut provoquer des surélévations de niveau de
l’ordre de 0,20 à 0,30 m.
3. Dans la majorité des cas un vent soufflant à 30 m/s en provenance de la mer est associé à une dépression
barométrique de 990 mbar (donnant naissance une surcote de +0,25 m)
4. A partir de l'analyse systématique de la longue série d'observations marégraphiques disponibles pour certains
sites du Globe, il a été conclu que le niveau de la mer est dans une phase d'ascension, avec une tendance
d'environ 0.5 à 0.6 mm / an.
10
Collecte et analyse statistique des données
2. Dans des conditions atmosphériques exceptionnelles, le vent peuvent provoquer des abaissements de niveau de
l’ordre de 0,20 à 0,30 m.
11
Collecte et analyse statistique des données
Les ouvrages en mer, construites généralement pour protéger les ports de la houle, sont soumises à son action. La
connaissance des valeurs extrêmes est donc un élément clé pour leur conception. La houle projet appelée aussi la
houle de dimensionnement est la hauteur de houle significative caractérisée par une période de retour X (dont X est la
durée de vie de projet).
La période de retour, ou temps de retour, caractérise le temps statistique entre deux occurrences d'un événement
naturel d'une intensité donnée. Ce terme est très utilisé pour caractériser les risques naturels.
Le concept de période de retour quand on traite de probabilités combinées est moins simple que lorsqu’on a affaire
à une seule variable. Un extrême de probabilité combinée peut être défini comme la probabilité qu’une hauteur de
la houle spécifique soit dépassée simultanément au dépassement d’un niveau d’eau donné.
12
Collecte et analyse statistique des données
Fréquence relative
Opérateur différentiel
Capteur de pression
Datawell
14
Collecte et analyse statistique des données
16
Collecte et analyse statistique des données
Période de retour
Calcul de Hs Projet
17
Collecte et analyse statistique des données
la première, dénommée block maxima method (BM) et la seconde approche est désignée sous le terme Peaks-Over-
Threshold method (POT). En pratique, on se ramène dans les deux cas à un cadre de statistique paramétrique et
d’ajustement de paramètres sur les données. Selon le contexte, l’une ou l’autre des approches peut se révéler mieux
adaptée, mais il est le plus souvent utile de les mettre toutes deux en œuvre et d’en comparer les résultats
18
Collecte et analyse statistique des données
19
Collecte et analyse statistique des données
Cette méthode d’analyse que les valeurs maximales sur un intervalle de temps est donné souvent pour un an (maxima
annuels)
20
Collecte et analyse statistique des données
21
Collecte et analyse statistique des données
22
Collecte et analyse statistique des données
La théorie des valeurs extrêmes par méthode POT, propose différentes méthodes pour estimer un seuil au-delà
duquel une observation sera considérée comme valeur extrême. La sélection du seuil pour l'application de la
méthode Peaks Over Threshold (POT) à un seul échantillon est un sujet de longue date qui n'est toujours pas résolu
[Davison et Huser, 2015; Cavanaugh et al., 2015]. Bien qu'il y ait eu diverses propositions pour automatiser la
sélection des seuils [par exemple, Dupuis, 1998; Thompson et al., 2009; Solari et Losada, 2012, entre autres], la
pratique la plus courante consiste à utiliser des méthodes graphiques (voir Coles [2001].
La fonction moyenne des excès (FME), qui permet de décrire la prédiction du dépassement du seuil u lorsqu’un
excès se produit, est définie par :
23
Collecte et analyse statistique des données
Cette fonction moyenne des excès est estimée par la somme des excès dépassant un certain seuil élevé u, divisé par le
nombre d’observations qui dépassent ce seuil.
Dans le travail de (DAVISON & SMITH, 1990), l’étude de sensibilité au changement du seuil de sélection des évènements a
montré qu’à partir du seuil optimal, l’espérance résiduelle des excès devient approximativement linéaire. Cette approche
pratique visant à choisir le seuil u consiste à tracer l’estimateur empirique de l’espérance résiduelle et à choisir u de manière
à ce que ên(u) soit approximativement linéaire.
24
Collecte et analyse statistique des données
25
Collecte et analyse statistique des données
26
Collecte et analyse statistique des données
27
Collecte et analyse statistique des données
28
Collecte et analyse statistique des données
Log.normal
La méthode graphique est cependant insuffisante pour choisir les modèles
411.4272 414.3586
adéquats à l’estimation. Il est nécessaire donc de faire intervenir les deux critères
statistiques AIC (Akaike Information Criterion) (Akaike, 1973) et BIC (Bayesian
Gamma Normal
Information Criterion) (Schwarz, 1978). 438.3114 441.2429
416.8131 419.7446
Ces deux critères permettent de classifier les lois selon une performance d’estimation.
La loi qui obtient les plus faibles valeurs des deux critères est la plus performante
Exp
431.2351 432.7009
pour la prédétermination des événements extrêmes.
Weibull
422.3308 425.2623
Ces critères se définissent de la façon suivante :
AIC = -2*logLik+2*K
BIC = -2*logLik+K*log(N)
Weibull
400.01 398.85
Où LogLik représente la log-vraisemblance des paramètres associés aux données,
K désigne le nombre de paramètres indépendants du modèle.
N est le nombre d’individus composant l’échantillon. 29
Collecte et analyse statistique des données
Période de retour
Par définition, la période de retour T de la valeur x est l’espérance mathématique de la variable aléatoire définie
comme la durée séparant deux dépassements successifs (dépassements vers les valeurs supérieures) de cette
valeur (associée à une probabilité P. Cette définition rigoureuse permet pour un processus donné d’attribuer à
toute valeur x sa période de retour T(x) et, inversement, d’attribuer une valeur x(T) à toute période de retour T.
Cette notion est primordiale dans la détermination des houles extrêmes : si X désigne une hauteur significative
de houle, x(T = 100) désignera la valeur de la houle centennale, à condition que la période de retour soit
exprimée en années.
Cette remarque nous amène d’ailleurs à introduire un paramètre d’importance dans l’analyse des échantillons de
valeurs extrêmes par méthode de renouvellement (POT). Le taux moyen des évènements de tempêtes, ou mean
rate. Soit NT le nombre de tels évènements sur une période de K années. Alors, le taux moyen λT est défini
comme suit :
30
Collecte et analyse statistique des données
Période de retour
1
𝑇(𝑥) =
(1 − 𝐹 𝑥 )
La période de retour correspondant à fonction de répartition de
la loi F(x) dans le cas de la méthode de renouvellement (ou Sur une durée de vie planifiée de N années pour
méthode POT : Peaks Over Threshold-Pics au-dessus du seuil) est une structure (pas nécessairement la même que la
donnée par l’équation (Coles 2001) : période de retour de projet), la probabilité de
rencontrer la condition d'une houle caractérisée
1
𝑇(𝑥) = par une période de retour TR, au moins une fois,
𝜆𝑡(1 − 𝐹(𝑥)) est donnée par la distribution de Poisson:
Où 𝝀𝒕 est le nombre moyen d’évènements supérieurs au seuil
par an.
31
Collecte et analyse statistique des données
Il existe quelques logiciels pour pouvoir travailler sur les valeurs extrêmes sans tout fois programmer soi-même.
Exemple (HYFRAN).
32
Collecte et analyse statistique des données
Après détermination des périodes de retour des Hs (Hauteur significative de la houle), il est nécessaire de tracer la
correspondance entre Hs/Tp (Période de pic) et Hs/Direction
20.00
18.00
16.00
14.00
12.00
Tp (s)
10.00
8.00
6.00
4.00
2.00
0.00
0 1 2 3 4 5 6 7 8 9
Hs (m)
33
Collecte et analyse statistique des données
Après détermination des périodes de retour des Hs (Hauteur significative de la houle), il est nécessaire de tracer la
correspondance entre Hs/Tp (Période de pic) et Hs/Direction
350
300
250
Direction (°N)
200
150
100
50
0
0 1 2 3 4 5 6 7 8 9
Hs(m)
34
Collecte et analyse statistique des données
TP : ANALYSE DES EXTREMS : A partir des données ci-dessous, représentant les valeurs de Hs maximale annuelle
enregistrées sur la période 2005-2018, calculer les Hs associées aux période de retour :
• Tr = 10 ans
• Tr=50 ans
• Tr=100 ans
Nb: La loi adoptée pour le calcul des Hs Projets doit être justifiée
35
Collecte et analyse statistique des données
Analyse statistiques
Analyse fréquentielle
36
Collecte et analyse statistique des données
La statistique constitue un outil indispensable pour effectuer un calcul de fréquence afin de tirer profit au mieux de
toutes les informations concernant les fréquences d’occurrences (Hs/Direction, Hs/Tp, Tp/Direction et
Direction/Hs/Tp.
En statistiques, le concept de fréquence absolue est le nombre d'apparitions (occurrences) d'une valeur dans une série
statistique. Il suffit de prendre la fréquence absolue et de la rapporter au nombre total d'éléments de la série. En
langage statistique, la fréquence relative s'obtient en divisant la taille de la classe par la taille de la population.
37
Collecte et analyse statistique des données
1. Préparation d’un ensemble de données (encore appelé échantillon ou population). Dans notre
cas, ça concerne les paramètres Hs, Tp et direction.
2. Choix d’une valeur particulière ou plutôt d’un intervalle de valeur (ex : 1>Hs>1.25)
3. Calcul de la fréquence absolue ; à savoir le nombre d'apparitions (appelées aussi
occurrences) de la valeur en question ou plutôt des valeurs à l’intérieur d’un intervalle.
4. Calcul de la fréquence relative dans la série. Il suffit de diviser la fréquence absolue par la taille de
la série qui corresponde au nombre total d'éléments de la série.
NB : En additionnant les fréquences relatives de tous les éléments d'une série, on doit obtenir une
valeur de 100%.
38
Collecte et analyse statistique des données
La largeur Δx (ΔHs pour la hauteur significative de la houle, ΔTp pour la période de pic et Δ𝜃° pour la direction de la
houle) de l'intervalle utilisé pour calculer les fréquences est choisi de manière à ce qu'un nombre suffisant d'observations se
retrouve à l'intérieur de chacun des intervalles de telle manière que les variations de l'histogramme soient suffisamment
douces.
Si le nombre d'observations "ni" est compris dans l'intervalle "i" des données [xi − Δx , xi ] , et si le nombre total
d'observations est "n", alors la Fonction de Fréquence Relative s'écrit : ni/N
39
Collecte et analyse statistique des données
40
Collecte et analyse statistique des données
=(NB.SI.ENS(B:B;">20";B:B;"<=40";C:C;"<="&Lx;C:C;">"&Ky)/$M$z)*100
Où ;
=(NB.SI.ENS(B:B;">20";B:B;"<=40";C:C;"<="&Lx;C:C;">"&Ky)/$M$z)*100
Où ;
44
Collecte et analyse statistique des données
45
Collecte et analyse statistique des données
46
Collecte et analyse statistique des données
47
Collecte et analyse statistique des données
Calculer le pourcentage d’occurrence des houles provenant de la direction 40-50 degrés par rapport au
Nord avec (40 et 50 incluses).
Calculer le pourcentage d’occurrence des houles provenant de la direction 100-180 degrés ayant des Hs
entre 0 et 5m (intervalles incluses).
Calculer le pourcentage d’occurrence des houles provenant de la direction 0-80 degrés ayant des Tp entre
6 et 12s (intervalles incluses).
Calculer le pourcentage d’occurrence des houles provenant de la direction 5-40 degrés ayant des Hs entre
0 et 5m et des période entre 6s et 16s (intervalles incluses).
48