Memoire SERGEEVA Daria
Memoire SERGEEVA Daria
Memoire SERGEEVA Daria
________________________________
Directeur de mémoire en entreprise :
Membres présents du jury de l’Institut du Risk
Nom : Christophe NEVES
Management :
Nicolas BARADEL Signature :
__________________________________
__________________________________ Invité :
Nom : _____________________________________
__________________________________
Signature :
__________________________________
Secrétariat :
Signature(s) du candidat(s)
Bibliothèque :
TABLE DES MATIERES
REMERCIEMENTS ............................................................................. - 5 -
RESUME ......................................................................................... - 6 -
ABSTRACT ...................................................................................... - 7 -
-2-
3.5. Conclusion ............................................................................. - 38 -
CONCLUSION ................................................................................ - 80 -
BIBLIOGRAPHIE ............................................................................. - 82 -
-3-
ABREVIATIONS .............................................................................. - 84 -
ANNEXES ...................................................................................... - 87 -
-4-
REMERCIEMENTS
Je tiens à exprimer ma gratitude envers Alexis Pennes et Christophe Neves, pour l’aide
et les encouragements.
Merci à mes amis de la promotion CEA 2019 – Josh, Cécile, Thibault et Béatrice, pour
les échanges et la motivation.
-5-
RESUME
Mots clés : Assurance roulant, Tarification, Modèle linéaire généralisé, GLM, Modèle
fréquence-coût, Optimisation d’un portefeuille d’assurance
-6-
ABSTRACT
The purpose of this dissertation is to examine the possibilities for optimizing the
profitability of several two-wheel insurance portfolios in France. First through the change of
the pricing model, then through the adaptation of the product. In order to lighten the
presentation, the results are limited to the civil liability guarantee. A proposal for alternative
pricing model is based on an ACM analysis and segmentation of the insured population into
typical profiles. Two GLM-based models are explored (frequency x severity and pure premium
Tweedie). The models obtained are confronted to the current pricing and the decision making
criteria for pricing change. The impact of the tariff increase on profitability is assessed
through an analysis of profitability sensitivity to the rate of conversion and renewal. In the
event that the change in pricing is not justified, we provide an overview of possible product
adaptations, always with the aim of improving profitability.
-7-
INTRODUCTION A LA PROBLEMATIQUE
-8-
La première partie du mémoire consiste en une analyse des portefeuilles existants,
dans l’objectif de répartir la population des assurés en un nombre de profils-types à l’aide
d’une ACM. Puis, une étude segmentée permettra d’identifier les écarts de rentabilité
éventuels entre les profils.
La deuxième partie propose une tarification alternative par profil-type en utilisant deux
modèles GLM alternatives - fréquence x coût moyen et détermination de la prime pure
directement en utilisant la distribution Tweedie. L’impact tarifant de la variable profil-
type dans les deux modèles est testé sur le portefeuille global étudié. L’objectif étant de
déterminer si la nouvelle tarification permet une meilleure adéquation au risque. Cette
partie inclut également une validation de seuil de sinistralité attritionnelle et l’ajustement
des données techniques pour tenir compte de l’inflation des coûts de sinistres par rapport
aux données historiques utilisées.
Dans la troisième partie, la tarification obtenue est confrontée aux contraintes internes
et externes et des méthodes alternatives de redressement de portefeuille sont explorées,
telles que l’adaptation du produit ou la sélection des risques.
-9-
PREMIERE PARTIE :
- 10 -
Dans cette première partie nous présentons d’abord le marché, le produit étudié ainsi
que le contexte de l’entreprise. Nous nous positionnons du point de vue d’un assureur
de taille moyenne, se situant juste derrière les 10 plus grands acteurs du marché
d’assurance deux roues en France. Cela implique plusieurs contraintes métier comme la
disponibilité limitée des données, la rareté des ressources et la relativement faible force
de frappe commerciale pour faire concurrence aux leaders du marché. Dans ce contexte
que nous pouvons qualifier de situation d’information imparfaite, nous analyserons les
données disponibles pour l’étude d’optimisation du tarif et proposerons un moyen de
segmentation plus fine.
Selon les statistiques annuelles agrégées de la FFA pour les véhicules de 3ème catégorie
[18], composée principalement de véhicules à deux roues motorisés, le ratio S/P hors
commission en 2019 s’élève à 83%, niveau le plus bas depuis l’année 2014 (Figure 1).
- 11 -
Figure 1 - Ratio sinistres à primes (Véhicules de 3e catégorie)
Au sein de la catégorie deux roues se trouvent les sous-catégories de cyclo, moto mais
également ce qu’on appelle NVEI (Nouveaux Véhicules Electriques Individuels). Cette
abréviation désigne les trottinettes électriques, gyroroues, gyropodes, hoverboards et
tout autre bolide électrique et individuel. Notre étude se focalisera sur la sous-catégorie
moto.
- 12 -
Blessures ou décès d’un passager, d’un piéton ou de l’occupant d’un autre
véhicule…
Dégâts matériels aux autres scooters, motos, deux-roues, voitures, immeubles
Cette garantie couvre les conducteurs autorisés ou non autorisés. Après avoir
indemnisé les victimes, l’assureur peut disposer d’un recours à l’encontre des
conducteurs non autorisés.
La garantie dommages tous accidents (DTA) – cette garantie couvre tous les
dommages matériels subis par le deux-roues, quel que soit le type d’accident ou
la faute commise par son conducteur.
La garantie dommages collision quant à elle ne joue qu’en cas de collision avec un
piéton, un autre véhicule ou un animal dont le propriétaire est identifié.
La garantie Accessoires permet d’assurer la prise en charge de certains accessoires
hors-série.
Les garanties incendie et vol permettent de recevoir une indemnité égale à la
valeur du véhicule le jour de l’incendie ou du vol, ou à une valeur précisée dans le
contrat. Comme le précise la FFA, en principe, la garantie incendie inclut aussi
l’indemnisation des conséquences d’une explosion, de la chute de la foudre ou
d’une combustion spontanée.
Le contrat d’assurance définit les conditions d’application de la garantie vol ainsi
que les modalités d’indemnisation. L’assureur peut exiger des mesures de
prévention contre le vol (gravage des pièces, antivol « U », alarme, remise du
deux-roues à moteur la nuit dans un garage fermé à clef …).
Le vol d’accessoires et de pièces de rechange n’est, le plus souvent, pas couvert.
Il est parfois couvert lorsqu’il est associé à une tentative de vol du deux-roues ou
en cas d’effraction du local dans lequel le véhicule est garé.
- 13 -
Si le contrat comporte une garantie dommages au véhicule (tous accidents,
dommages collision, vol, incendie…), le deux-roues est automatiquement couvert en cas
de catastrophe naturelle, catastrophe technologique et attentat :
Si le deux-roues est assuré par une garantie dommages au véhicule, les dégâts
causés par une catastrophe naturelle (inondation, avalanche, tremblement de
terre…), seront indemnisés après parution au Journal Officiel de l’arrêté
interministériel constatant l’état de catastrophe naturelle. Une franchise de 380
euros est applicable.
La garantie catastrophes technologiques couvre les dommages résultant des
catastrophes technologiques ayant fait l’objet d’un arrêté au Journal Officiel. Les
dommages sont alors réglés sans franchise.
La garantie attentat couvre les dommages résultant d’actes de terrorisme et
d’attentats commis sur le territoire national, la franchise applicable sera la même
que celle prévue par la garantie incendie.
La garantie du casque ;
La garantie des accessoires hors-série en cas de vol total du véhicule ou d’un
dommage (top case, bulle…) ;
La garantie contre la détérioration des équipements de protection du motard
(gants, blouson, combinaison) à la suite d’un accident couvert par une garantie
dommages ;
La garantie des bris d’optiques (éléments vitrés du deux-roues) ;
Une option intempéries est parfois proposée : elle tient compte de l’utilisation
saisonnière de la moto. La période de non-utilisation, le plus souvent comprise
entre trois et six mois, est fixée à la souscription.
- 14 -
La garantie du conducteur :
Lorsque le conducteur est blessé lors d’un accident de la circulation dans lequel il est
fautif ou dans lequel aucun responsable n’est désigné, la garantie du conducteur lui
permet d’être indemnisé. Par exemple, cette garantie prend en charge, selon les contrats
d’assurance :
De type forfaitaire, avec des capitaux fixés par le contrat en cas d’incapacité
permanente ou de décès. Sans précision particulière au contrat, les prestations
s’ajoutent aux indemnités qu’un tiers responsable peut être amené à verser ;
De type indemnitaire, avec une indemnisation de l’ensemble du préjudice de
l’assuré, avec, parfois, des plafonds de garantie et une franchise.
Tableau 1 – Statistiques FFA : Fréquence et coût moyen des sinistres par garantie (Véhicules de 3ème
catégorie)
- 16 -
1.3. Environnement réglementaire
Il est intéressant de considérer les contraintes règlementaires qui peuvent avoir une
incidence sur le produit d’assurance, la modélisation et, par conséquent, sur la rentabilité
de l’assureur.
Age du conducteur
Il est possible de conduire dès l’âge de 14 ans des cyclomoteurs dont la cylindrée
n’excède pas 50 cm³.
A partir de 16 ans, il est possible de conduire une motocyclette légère d’une cylindrée
maximale de 125 cm³, à condition d’avoir un permis A1.
A partir de 18 ans, le conducteur peut accéder en plus à un deux-roues d'une
puissance n'excédant pas 35 kW (ou 47,6 CV, ce qui correspond à une cylindrée de
750 à 900 cm³), à condition d’avoir un permis A2.
A partir de 20 ans toute cylindrée est accessible, à condition d’avoir un permis
correspondant.
Limites d’indemnisation
Pour les garanties optionnelles, les plafonds de garanties et les franchises sont établis
librement lors de la création du produit par l’assureur. Cependant, l’environnement
concurrentiel joue un rôle non négligeable dans ces considérations.
- 17 -
Possibilité de résilier le contrat d’assurance
Depuis 2015, la loi sur la consommation, dite « loi Hamon », a entériné la possibilité
pour l’assuré de résilier un contrat d’assurance, à tout moment et sans justification,
passé un an de contrat.
Les cotisations d’assurance ne sont pas soumises à la TVA. Elles incluent en revanche
une taxe fiscale, dont le taux légal varie selon la nature des contrats d’assurance. Les
montants des taxes collectées sont reversés au Trésor Public. La cotisation comprend
également des contributions qui servent à financer divers fonds ou organismes de
solidarité nationale auxquels elles sont reversées.
Par exemple, la taxe fiscale pour la garantie responsabilité civile obligatoire s’élève à
33% de la cotisation nette, avec 15 % réattribués à la Sécurité sociale. A ce taux
s’ajoutent 2% de contribution Fonds de garantie des assurances obligatoires de
dommages.
Les autres garanties relatives aux véhicules (dommages, assistance aux véhicules,
pannes mécaniques...) sont soumises à une taxe de 18% à laquelle s’ajoute une
contribution fixe de 5,9€ par contrat à destination du fonds de garantie des victimes des
actes de terrorisme et d’autres infractions (FGTI).
L’article A121-1 du Codes des Assurances prévoit que les contrats d’assurance
garantissant des véhicules terrestres à moteur (sauf exceptions prévues dans l'article R.
311-1) doivent comporter la clause de réduction ou de majoration des primes. Avec ce
système, le conducteur qui ne cause pas d’accident bénéficie d’un bonus : sa prime de
référence diminue. A l'inverse, l’automobiliste responsable d’un accident est pénalisé
d’un malus : sa prime de référence augmente.
Les modalités de calcul du bonus-malus sont prévues par le Code des assurances.
Comme le précise la FFA dans son article [20], bonus et malus sont exprimés par des
coefficients de réduction ou de majoration, compris entre 0,50 et 3,50. L’avis d’échéance
mentionne le montant de la prime de référence qui correspond au tarif de base de la
société d’assurances applicable au véhicule concerné compte tenu de ses caractéristiques
- 18 -
techniques : type de véhicule, zone géographique de circulation ou de garage, usage
socio-professionnel, kilométrage parcouru…
Tout accident dont l’assuré est totalement responsable entraîne une majoration de 25
% du coefficient précédemment appliqué. On obtient le nouveau coefficient en multipliant
le précédent par 1,25.
- 19 -
difficultés pour l’analyse en transverse ainsi que pour la prise de décisions tarifaires et
leur déploiement. Les portefeuilles qui vont être présentés dans la suite de ce document
sont issus de partenariats distincts, lancés sur la période allant de 2012 à 2017.
La structure de chaque portefeuille en détail sera analysée par la suite, afin d’identifier
les impacts des particularités de chaque population des assurés sur la fréquence et les
coûts dont il va falloir tenir compte lors de la modélisation.
Portefeuilles A B C D E F TOTAL
Toutes Générations Survenance 2020
S/P TOTAL 50,3% 21,7% 16,1% 194,9% 75,3% 45,0% 40,8%
S/P < 30K 41,4% 18,2% 14,7% 62,7% 75,3% 35,1% 34,5%
S/P de 30K à 100K 6,6% 3,5% 1,4% 31,8% 0,0% 9,9% 6,3%
S/P > 100K 2,3% 0,0% 0,0% 100,3% 0,0% 0,0% 0,0%
- 20 -
Portefeuille A B C D E F TOTAL
Toutes Générations Survenance 2019
S/P TOTAL 75,9% 47,0% 30,7% 76,7% 237,4% 98,1% 95,5%
S/P < 30K 47,9% 44,3% 30,7% 61,0% 131,2% 72,3% 63,3%
S/P de 30K à 100K 6,8% 2,6% 0,0% 15,7% 11,5% 25,8% 7,1%
S/P > 100K 21,1% 0,0% 0,0% 0,0% 94,7% 0,0% 25,0%
Portefeuille A B C D E F TOTAL
Toutes Générations Survenance 2018
S/P TOTAL 103,8% 150,5% 77,4% 74,6% 174,1% 192,3% 126,9%
S/P < 30K 52,9% 56,0% 52,3% 55,6% 144,9% 69,9% 77,9%
S/P de 30K à 100K 11,3% 9,7% 9,2% 19,1% 21,8% 32,0% 14,8%
S/P > 100K 39,6% 84,8% 15,9% 0,0% 7,4% 90,4% 34,3%
- 21 -
2.3. Présentation des données
Pour chacun des portefeuilles, il existe une base de données de quittances et une base
de sinistres. Les bases quittances contiennent les informations sur les assurés, les
véhicules et les durées de couverture, ainsi que les montants de quittances par garantie.
Les bases de sinistres contiennent les informations sur la date du sinistre, la garantie
concernée et la charge. Les bases sont hétérogènes entre elles quant au nombre et au
format des variables. Nous présenterons ci-après les variables d’intérêt ainsi que les
variables explicatives, la structure des données ainsi que les statistiques descriptives
relatives à ces bases. Les bases contenant un grand nombre de variables, ne seront
présentées que celles qui seront intéressantes pour cette étude.
Il en ressort, que les portefeuilles C, D et F sont assez petits – tous les trois combinés
ils représentent 14% du total des données. Nous pouvons nous attendre à la volatilité
plus importante sur ces portefeuilles. Par exemple, le portefeuille D présente un S/P de
195% en 2020, mais cette performance, du fait de la faible taille de ce portefeuille, est
fortement impactée par quelques sinistres graves. Le portefeuille A, au contraire,
représente 62% des données. Les conclusions de l’étude seront fortement impactées par
le mix des assurés de ce portefeuille.
Tous
CodeGarantie Portefeuille A Portefeuille B Portefeuille C Portefeuille D Portefeuille E Portefeuille F
Portefeuilles
EQUIMOT 0,6% 0,3% 0,6% 1,6% 2,4% 1,0% 1,4%
VLX 16,1% 18,1% 11,0% 8,0% 6,6% 21,3% 8,4%
PJ 2,6% 4,1% 0,1% 1,0% 0,0%
VNEUF24 0,0% 0,0% 0,1%
CATECH 0,3% 0,3% 0,4% 0,0% 0,8% 0,3% 0,3%
PROPIL 8,0% 8,7% 5,7% 7,8% 7,5% 7,6% 6,3%
OBJTR 0,0% 0,2%
DRX 11,6% 7,9% 24,1% 25,0% 13,3% 4,2% 25,1%
VNEUF36 0,0% 0,3%
CATNAT 1,0% 1,1% 0,7% 0,6% 0,4% 1,3% 0,5%
CIR 0,0% 0,0%
VNEUF6 0,0% 0,0%
REMAC 0,0% 0,1%
PFX 0,0% 0,0%
RCX 45,8% 46,7% 44,5% 45,7% 29,5% 47,6% 46,5%
BDG 0,1% 0,1% 1,3%
RFRA 0,0% 0,2%
INC 0,0% 1,0%
ACCESS 0,6% 0,8% 1,2% 0,8%
CASQ 1,5% 1,5% 1,3% 1,1% 6,9% 0,3% 1,2%
VNEUF12 0,1% 0,9% 0,9%
PTX 0,0% 0,0%
DEMFR 0,1% 2,0%
ATTEN 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0%
OPPROPIL 0,5% 0,6% 0,5% 6,8% 1,2% 0,7%
DCX 0,0% 0,2% 0,0% 0,1%
DTA 10,9% 10,4% 10,7% 8,6% 18,4% 13,5% 9,5%
TOTAL 100% 100% 100% 100% 100% 100% 100%
Tous
CodeGarantie Portefeuille A Portefeuille B Portefeuille C Portefeuille D Portefeuille E Portefeuille F
Portefeuilles
TOTAL 100% 62% 14% 7% 4% 11% 3%
Il est à noter que dans le respect de la règlementation RGPD les données utilisées sont
anonymisées et ne contiennent pas d’éléments permettant d’identifier les individus.
- 23 -
2.4. Préparation des données et analyse des variables
explicatives
- A partir des données de quittances par garantie, construction d’une base des
polices par garantie, identifiant l’année d’effet et la durée d’exposition par police.
Une attention particulière a été portée au calcul de l’exposition des polices résiliées
en cours d’année, en s’appuyant sur la date de résiliation,
- Retraitement des variables explicatives, en particulier des dates, pour
homogénéiser leur format et les présenter en nombre d’années (âge du
conducteur, ancienneté du permis et du véhicule),
- Rattachement à chaque base de polices obtenue les données des sinistres
survenus sur les mêmes garanties et la bonne période de couverture, à partir des
données sinistres,
- Rattachement des données de statut urbain de la commune à partir du Zonier.
Pour le véhicule :
Pour le conducteur :
- Coefficient bonus-malus
- Ancienneté du permis
- Age du conducteur
Cet ensemble de variables sera utilisé pour expliquer les différences de rentabilité et
construire les tarifs.
- 24 -
Il est à noter que la totalité des portefeuilles ne dispose pas de l’ensemble des variables.
Aucune des bases ne contient de données concernant les modalités de stationnement
(garage/voie publique/autre) et l’usage du véhicule (privé/professionnel). Nous ne
disposons également pas de données sur le sexe du conducteur. Pour le portefeuille E,
la base de données ne dispose pas de CRM des assurés – une variable obligatoire
règlementairement mais non transmise dans le cadre du reporting des polices souscrites
envoyé par le courtier.
Tout ceci introduit un biais de sélection dans les données utilisées. En effet, nous sommes
conscients que les données dont nous disposons et qui seront utilisées pour notre étude
tarifaire ne sont pas une représentation fiable du marché. Un exemple donné par Rain
et Jacques (2013) [7] illustre cet effet : une compagnie qui a historiquement utilisé une
variable tarifaire de moins que ses concurrents et de ce fait n’était pas compétitive sur
les bonus 50. En l’absence d’une variable, cette compagnie a eu tendance à vendre des
contrats aux plus mauvais risques parmi les bonus 50. Une modélisation tarifaire réalisée
à partir d’une base de données des assurés d’une telle compagnie ne reflètera pas
complétement l’ensemble des comportements possible pour des assurés ayant un bonus
50, mais seulement une partie.
Le tableau 7 fait état de la disponibilité des données des variables pour chacun des
portefeuilles.
Code Postal Souscripteur
CONDUCTEUR PRINCIPAL
CONDUCTEUR PRINCIPAL
CONDUCTEUR PRINCIPAL
CONDUCTEUR PRINCIPAL
VEHICULE CODE POSTAL
VEHICULE GROUPE_SRA
VEHICULE CYLINDREE
VEHICULE CODE_SRA
CRM SOUSCRIPTION
VEHICULE MARQUE
VEHICULE MODELE
Ville Souscripteur
DATE NAISSANCE
CIRCULATION
DATE PERMIS
CRM AUTRE
Portefeuille
Souscrite
Formule
GARAGE
REELLE
A OUI OUI OUI OUI OUI OUI NON OUI OUI OUI OUI OUI OUI OUI OUI OUI
B OUI NON NON NON OUI OUI OUI NON NON NON OUI OUI OUI OUI OUI NON
C OUI NON NON NON OUI OUI OUI NON NON NON OUI OUI OUI OUI OUI NON
D OUI OUI OUI OUI OUI OUI OUI OUI OUI OUI OUI OUI OUI OUI OUI OUI
E NON OUI OUI OUI OUI OUI OUI OUI OUI NON OUI NON NON OUI OUI OUI
F OUI NON NON NON OUI OUI OUI NON NON NON OUI OUI OUI OUI OUI NON
Tableau 7 - Disponibilité des données des variables descriptives par portefeuille
- 25 -
Lorsqu’une seule modalité d’une variable est présente dans la base, les données de cette
variable sont considérées comme absentes dans le tableau 8 mais ne sont pas éliminées.
Plusieurs anomalies et valeurs aberrantes ont été mises en évidence au fil de l’analyse :
Nous avons vérifié la cohérence des dates de permis par rapport à la date de naissance
du conducteur et la cohérence de l’ancienneté de la mise en circulation du véhicule (3%
des observations ont été écartées par suite de ce contrôle). Il est important de
mentionner qu’il y a certainement d’autres incohérences dans les données, non
détectées, liées à la saisie manuelle.
Little et Robin (1987) [13] ont développé une typologie répartissant les données
manquantes en trois catégories distinctes :
- 26 -
de valeurs manquantes, si leur nombre est restreint, peut être ignoré sans entrainer de
biais significatif dans le modèle.
- Eliminer l’observation – une solution qui peut être appliquée lorsque la proportion
des données manquantes est très faible. Dans le cas contraire elle entrainera des
biais dans le modèle
- Remplacement des données manquantes par les valeurs estimées comme
proches. Plusieurs méthodes plus ou moins complexes existent : remplacement
par la moyenne, par la dernière observation. Des méthodes d’intelligence
artificielle peuvent également être utilisées, et notamment la méthode des k plus
proches voisins. Cette méthode consiste à affecter une classe à une nouvelle
donnée à partir d’un ensemble de données labellisées et de sa position par rapport
à ces données labélisées. La nouvelle donnée est affectée à la classe la plus
fréquente parmi les k données les plus proches.
Les approches de remplacement des données ont été critiquées notamment dans
l’article de Schafer et Graham (2002) [15] pour le manque de précision
qu’entraînent ces règles.
- Utilisation des algorithmes spécifiques, pas sensibles aux valeurs manquantes,
pour modélisation tarifaire, par exemple les algorithmes d’arbres de régression,
dont CART.
Afin de déterminer le traitement adapté pour chacun des types de données manquantes
dans l’analyse qui nous concerne, le nombre de valeurs présentes a été comparé au
nombre total des observations dans la base (Tableau 8). Les cellules en surbrillance
rouge mettent en évidence les variables avec moins de 95% de données disponibles. Les
cellules en police rouge montrent les variables ayant une seule modalité et donc de facto
également absentes. Les cases rouges sont des variables absentes (0%).
- 27 -
Poids du Portefeuille dans
CODE_POSTAL_SOUSCRIP
le total des observations
CODE_POSTAL_GARAGE
Nombre d'observations
VILLE_SOUSCRIPTEUR
CRM_SOUSCRIPTION
total du Portefeuille
PUISSANCE_REELLE
GROUPE_SRA
ANC_PERMIS
CRM_AUTRE
CLASSE_SRA
Portefeuille
CYLINDREE
CODE_SRA
ANC_MEC
MARQUE
MODELE
TEUR
AGE
A 393 261 58% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100%
B 101 557 15% 100% 100% 58% 100% 100% 100% 100% 100% 100% 100%
C 45 776 7% 100% 100% 56% 100% 100% 100% 100% 100% 100% 100%
D 35 427 5% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100%
E 82 476 12% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 100% 72% 100% 72%
F 19 375 3% 100% 100% 55% 100% 100% 100% 100% 100% 100% 100%
TOTAL 677 872 100%
Nous utiliserons cette garantie car, en tant que garantie obligatoire, elle est acquise par
l’ensemble des assurés des portefeuilles étudiés. Cela permet d’avoir le maximum
d’observations possible pour confirmer ou infirmer l’intérêt de notre analyse par profil-
type. Si l’apport d’analyse par profil-type à la prédiction est confirmé, il conviendra de
revalider qu’il est aussi important pour les autres garanties, en le vérifiant garantie par
garantie. En cas de résultats positifs, les autres garanties seront modélisées selon les
mêmes principes pour définir le tarif du produit final
- 28 -
Après retraitements des données par exercice de rattachement, cette base comporte les
informations sur 136 676 polices, 225 473,7 années-risques étalées sur les années
d’effet de 2012 à 2020 et 1685 sinistres dont la charge est supérieure à 0.
L’ancienneté de permis est la seule variable de conducteur présente dans tous les
portefeuilles. Elle s’établit entre 15 et 18 ans, sauf pour le portefeuille F qui est plus
- 29 -
jeune, avec la médiane de l’ancienneté de permis légerement supérieure à 10 ans, ce
qui est cohérent avec un CRM médian proche de 100.
3.1. Méthodologie
L’identification des segments est réalisée sur la base des données séparée en deux
parties – d’apprentissage et de validation, selon les modalités décrites dans le chapitre 3.
- 30 -
L’analyse par correspondances multiples (ACM) est une méthode statistique qui est
généralement applicable à de vastes tableaux avec en ligne les individus ou les
observations et en colonnes des modalités des variables nominales et descriptives de ces
individus. Ces diverses modalités s’excluent mutuellement et une modalité est
obligatoirement présente.
Le principe de la méthode ACM consiste en une analyse d’un tableau disjonctif obtenu
en transformant les données en profils lignes (individus) et profils colonnes (modalités),
avec le code 1 pour la modalité observée et 0 pour toute autre modalité. Chaque modalité
individuelle correspond à une colonne (voir Figure 4).
Ancienneté Age Age Age Anc MEC Anc MEC Anc MEC
Age
MEC < 26 ans 27-36 ans 37-48 ans < 2 ans 3-4 ans 6-12 ans
Assuré 1 < 26 ans < 2 ans 1 0 0 1 0 0
Assuré 2 27-36 ans < 2 ans 0 1 0 1 0 0
Assuré 3 < 26 ans 3-4 ans 1 0 0 0 1 0
Assuré 4 37-48 ans 6-12 ans 0 0 1 0 0 1
Ainsi, il est possible de déterminer des proximités entre individus pour en tirer des
enseignements. Par exemple, un profil particulier de l’assuré peut émerger à partir de
divers critères observés.
La procédure est sensiblement la même que pour une analyse factorielle des
correspondances (AFC) dont le principe consiste à comparer le tableau des observations
avec un tableau théorique de totale indépendance. Les écarts entre les deux sont
mesurés avec la distance du χ². Une distinction entre l’AFC et l’ACM est que l’AFC se
fonde sur des fréquences marginales alors que l’ACM est réalisée à partir d’un tableau
disjonctif [21].
1 (𝑥 − 𝑥 )
𝑑 (𝑖, 𝑖 ) = 𝑚
𝑣
µ 𝑛
Avec :
Pour chaque modalité, on observe une distance entre deux individus (soit 1, soit 0
puisque le tableau ne comporte que des 0 et des 1). Cet écart est rapporté au poids de
cette modalité par rapport à l’effectif. Donc, si le poids est élevé, la distance est faible.
Si pour une variable tout le monde bénéficie du « 1 » alors tout le monde est proche.
C’est aussi l’une des limites de la méthode car si presque personne ne présente telle
modalité, alors ceux qui lui sont rattachés se situent à une distance considérable des
autres. Il faut veiller à ce qu’aucune modalité ne soit que très peu représentée car les
distorsions que cette rareté entraîne risquent de masquer des distances plus faibles mais
plus intéressantes car concernant un effectif plus nombreux.
L’ACM met en évidence les profils d’individus semblables quant aux attributs qui
servent à les décrire : 1) deux individus se ressemblent s’ils possèdent les mêmes
modalités 2) la proximité entre modalités des variables différentes s’explique par le fait
que ces modalités concernent globalement les mêmes individus ou des individus
semblables 3) la proximité entre deux modalités d’une même variable s’interprète en
termes de ressemblance entre les groupes d’individus qui les possèdent (par rapport aux
autre variables actives de l’analyse).
Les modalités de faible effectif sont éloignées des autres modalités sur le plan factoriel
– c’est-à-dire, plus le groupe est excentré, plus son effectif est faible (le cas du profil
Expert). Ainsi le nombre de véhicule à cylindrée supérieure à 1000, à droite sur le
graphique, sera plus faible que le nombre de véhicules dans la catégorie de cylindrée
125-600, qui se trouve quasi au croisement des axes.
- 32 -
Rural
Expert
CityDrive
Une étape importante avant de réaliser une ACM consiste à discrétiser les variables en
les découpant en classes homogènes. Le résultat d’analyse est sensible à cette
segmentation. Deux questions principales se posent : en combien de classes découper
et quelles valeurs regrouper au sein d’une classe. Pour déterminer le nombre de classes,
nous avons utilisé une méthode des arbres de régression – Classification ascendante
hiérarchique. Il s’agit d’un algorithme CAH qui propose le nombre des classes à retenir
en construisant la subdivision qui maximiserait la dispersion entre les classes. Les autres
algorithmes de regroupement hiérarchique demandent à l’utilisateur de définir le nombre
de classes souhaité. CAH présente toutes les combinaisons possibles et laisse le choix à
l’utilisateur. L’inconvénient de CAH est qu’il n’est pas adapté à des volumes de données
importants car le temps de calcul augmente sensiblement.
- 33 -
Inertia gain
1) Moins de 27 ans
2) 28 – 36 ans
3) 37-53 ans
4) 54-64 ans
5) Plus de 64 ans
Les variables ancienneté de permis, CRM et cylindrée ont été discrétisées de la même
manière, les classes suivantes ont été retenues :
Ancienneté de permis - Moins de 2 ans, 3-4 ans, 5-7 ans, 8-12 ans, supérieure à 12
ans ;
- 34 -
3.2. Application sur les portefeuilles étudiés
En réalisant une ACM sur l’ensemble des portefeuilles (voir Figure 5), 4 profils-types
des conducteurs se dessinent :
Il est à noter que l’ACM présentée a été réalisée sur la base des données contrats,
c’est-à-dire sans distinction si l’assuré a eu un sinistre ou pas. Les profils obtenus en
faisant une ACM sur la population des assurés ayant eu au moins un sinistre n’auraient
pas d’application lors de la modélisation car c’est bien tous les profils, sinistrés et non
sinistrés, que nous cherchons à tarifer. Une telle analyse peut cependant comporter
des informations intéressantes. Les ACM obtenus sur les données sinistrées sont
présentés dans l’Annexe 3. Il est à noter que l’utilisation uniquement des données
des assurés sinistrées réduit significativement la taille de l’échantillon et par
conséquent la fiabilité de l’analyse. Nous ne poursuivrons donc pas cette voie.
Afin d’obtenir une première validation intuitive du modèle, les profils obtenus ont été
comparés en termes de fréquence et coût écrêté à 30K€ et non revalorisé.
Le Tableau 9 met en évidence, comme attendu, une fréquence des sinistres moins
élevée parmi les conducteurs expérimentés et dans le milieu rural et une fréquence plus
élevée en centre-ville. Quant au coût moyen, il est au contraire moins élevé en centre-
ville, où la vitesse est limitée, et beaucoup plus fort au milieu rural.
- 35 -
Poids dans le Coût moyen, Coût moyen
Profil Fréquence S/P S/P écrêté
portefeuille € écrêté, €
Expert 5% 3 642 3 525 0,8% 21% 20%
CityDrive 12% 2 662 2 373 2,2% 41% 37%
Rural 10% 18 973 4 453 0,6% 72% 17%
Autre 73% 8 349 3 028 1,6% 77% 28%
Tableau 9 - Fréquence et coût moyen des profils identifiés
Nous conservons cependant les profils définis et analysons dans les parties suivantes
l’apport de cette variable à la prédiction.
- 36 -
3.4. Implication sur la construction du tarif
Néanmoins, il convient d’évoquer tout de suite les limitations d’une telle étude - en
splittant notre base d’étude en 4 sous-ensembles, nous divisons notre l’échantillon global
des données par 4, car uniquement les données relatives aux profils analysés seront
utilisées pour la régression. Il en résulte une perte de fiabilité et une plus forte
dépendance des résultats sur les éventuels écarts de notre échantillon de la population
globale que nous essayons d’estimer.
Une autre limitation consiste dans le fait que l’ensemble des critères tarifants
« standard » n’est pas disponible dans notre base de données. Dans les critères standard
sont entendus :
Sinistralité
Profil de l’assuré (date du permis, coefficient bonus-malus, date de
naissance)
Données du deux roue (la puissance, valeur, date de premier
immatriculation)
Usage
Niveau de couverture
Notre liste des variables est limitée. Sont absentes les données d’usage (type de trajet,
zone, mode de stationnement), de valeur de véhicule, de la sinistralité passée. L’apport
de ces variables pourrait changer les résultats.
- 37 -
3.5. Conclusion
Dans cette section, nous avons présenté les données et identifié les profils-type des
assurés qui présentent les caractéristiques distinctes pour le risque responsabilité civile.
Pour définir les profils, une base de données a été construite et cette même base de
données sera utilisée pour tester le modèle de tarification en segmentée et au global.
Les 80% des observations de cette base sont utilisés pour la modélisation et la définition
des profils, les 20% restants pour validation des résultats.
En l’absence des données régulières sur certaines variables des portefeuilles (âge,
CRM, positionnement géographique), une catégorie « Non communiqué » est créée et
nous permettra d’analyser le comportement de ces données et leur impact sur la
modélisation.
Pour définir les profils-type, les données ont été discrétisées et analysées en
appliquant la méthode statistique d’analyse des correspondances multiples (ACM). La
spécificité de la méthode d’ACM, comme de toute méthode non supervisée, est qu’elle
dépend largement de l’interprétation. Le choix de retenir 4 profils-types est motivé par
la simplification et l’interprétabilité de ces profils. En contrepartie, le fait de limiter le
nombre de profils permet de conserver un nombre d’observations suffisamment
important par profil. Chaque ajout d’un profil supplémentaire réduit le nombre
d’observations dans chacune des bases individuelles car toute observation peut être
affectée à un seul profil.
Les résultats qui seront obtenus sur la base des données compilées peuvent également
présenter de nombreux biais inhérents à l’analyse actuarielle sur les bases de données
de tailles limitées. Il reste donc possible que les résultats soient affectés par le mix
particulier des portefeuilles individuels, le poids et le nombre des sinistres graves et/ou
corporels, la concentration géographique (la densité n’est pas la même entre Paris et
Chamonix, qui sont toutes les deux dans la catégorie ville-centre)…
- 38 -
DEUXIEME PARTIE :
- 39 -
Dans ce chapitre, nous poserons d’abord les bases théoriques essentielles de la
tarification en assurance. Ensuite, nous réaliserons plusieurs modélisations séparées afin
de projeter le nombre de sinistres, le coût du sinistre et la prime pure directement, en
appliquant les modèles linéaires généralisés. Ces modélisations seront décrites sur
l’exemple de la garantie responsabilité civile. Nous utiliserons cette garantie car, en tant
que garantie obligatoire, elle est acquise par l’ensemble des assurés des portefeuilles
étudiés. Cela permet d’avoir le maximum d’observations possible pour confirmer ou
infirmer l’intérêt de notre analyse par profil-type. Nous ne nous attarderons pas à réaliser
les mêmes étapes pour les autres garanties à ce stade. Si l’apport d’analyse par profil-
type à la prédiction est confirmé sur la garantie responsabilité civile, une analyse
similaire sera à réaliser pour les autres garanties. En cas de résultats positifs, les autres
garanties seront modélisées selon les mêmes principes pour définir le tarif du produit
final.
Pour chacun des tests, les bases sont divisées en deux, selon la méthodologie qui sera
décrite plus loin : une base d’apprentissage de 80% des données et une base de test
avec les 20% restants.
- 40 -
charges individuelles ne sont pas forcément connues. La prime pure est le résultat du
produit de l’espérance du nombre moyen des sinistres et de leur coût moyen.
La théorie de crédibilité retrouve son application dans le coefficient CRM créé par l’Etat
(Code d’assurance : Articles A121-1 à A121-2) pour récompenser les bons conducteurs
ou, inversement, pour punir les conducteurs les plus malheureux. Il est compris entre
0,50 et 3,50 : plus le coefficient est petit, plus le bonus est grand et meilleur est le tarif
; plus le coefficient est élevé, plus le malus et le tarif d’assurance sont élevés.
Les modèles linéaires généralisés ont été introduits par Nelder and Wedderburn (1972)
[14] et, depuis, leur application a été suffisamment étudiée par la communauté
actuarielle. Pour réaliser la modélisation GLM, une solution s’appuyant sur l’outil Akur8
- 41 -
est utilisée. Cette solution permet une visualisation des données et simplifie l’application
du GLM tout en laissant le choix à l’actuaire quant au paramétrage à utiliser. Le fait
d’automatiser la modélisation permettra de focaliser la recherche sur le côté pratique
d’optimisation de tarifs. L’outil Akur8 permet également de comparer les modèles entre
eux, un avantage non négligeable lors de l’analyse et le choix des paramètres à retenir,
comme on pourra le constater ci-après.
Le modèle GLM permet de relier des variables explicatives à une variable à expliquer
au travers d’une fonction appelée « fonction lien » qui linéarise la relation entre ces deux
types de variables.
Ce modèle permet de dépasser les limites du modèle linéaire dues à ses hypothèses
non réalistes pour l’assurance : normalité de la variable expliquée, constance de sa
variance (homoscédasticité), additivité. En assurance non-vie nous nous intéressons à
des valeurs non négatives, car la fréquence des sinistres et le coût sont des valeurs
nulles ou positives. La distribution de la fréquence et du coût moyen n’a donc pas la
forme en cloche et symétrique de la distribution normale et par conséquent, l’hypothèse
de normalité ne peut donc pas être maintenue. Également, la variance de la variable de
fréquence et/ou de coût au sein des différents segments de la clientèle ne sera pas la
même.
- Une variable à prédire (Y) suivant une certaine loi de distribution de la famille des
exponentielles. Chaque composant de y est indépendant et suit la forme de l’une
des distributions de la famille exponentielle ; la même forme pour chaque
composant, mais avec des paramètres différents
- Des facteurs prédictifs qui se combinent pour produire une prédiction linéaire
η = X.β
- Une fonction de lien servant à linéariser le lien entre la variable de réponse (Y) et
les variables explicatives (X). Cette fonction est du type E(Y) = µ = g-1(η). Il est
à noter que pour les variables explicatives il s’agit des corrélations et non des liens
de causalité. Ce n’est pas parce qu’un conducteur est jeune qu’il représente un
plus grand risque, mais parce qu’il a potentiellement moins d’expérience. Son
risque est donc corrélé à son âge, sans que l’âge en soit la cause.
Les deux fonctions de lien les plus souvent utilisées en tarification sont les suivantes :
- 42 -
Lois Lien Fonction Application
Avec :
Le modèle n’est donc plus additif, comme le cas du modèle linéaire, mais multiplicatif.
Enfin, pour valider le tarif GLM, les paramètres du modèle de la prime pure obtenus
sont testés et analysés à travers les intervalles de confiance.
La prime pure est obtenue en multipliant une prime pure de base par le coefficient
représentant la modalité de l’individu pour chaque variable tarifaire. Pour chaque variable
tarifaire, le coefficient correspondant à la modalité de référence est 1, et pour chaque
modalité différente, le coefficient diffère afin de représenter l’impact sur le risque :
Ancienneté
Age Coefficient Coefficient
du véhicule
25 1,5 0 1,3
30 1,45 2 1,1
35 1,3 4 1
40 1 6 0,8
- 43 -
Ainsi une prime pure d’un conducteur de 25 ans avec un véhicule de 4 ans est égale
à 50x1,5x1 = 75 et une prime d’un conducteur de 30 ans avec le même véhicule est égal
à 50x1,45x1= 65.
Un moyen de limiter les distorsions consiste à estimer une prime pure de chaque
croisement des variables explicatives, mais dans la pratique il est quasi impossible
d’avoir une base de données assez large pour que chaque combinaison des variables soit
suffisamment représentée pour que la loi des grands nombres puisse s’appliquer et que
le calibrage du modèle soit fiable. L’utilisation des profils-types définis dans le premier
chapitre constitue une tentative de réduire ces distorsions.
Dans la pratique, la démarche pour la modélisation GLM est donc la suivante [10] :
5. Interprétation du modèle
Akur8 permet d’automatiser certaines tâches des étapes 3 à 6 tout en gardant la main
sur les choix des variables et les arbitrages souhaités entre les modèles les plus
pertinents parmi les modèles acceptables.
- 44 -
2.2. Utilisation de la validation croisée
Les critères statistiques classiques pour la validation du modèle sont les critères AIC
et BIC.
Il est à noter que la plupart des propriétés avantageuses des estimés du maximum de
vraisemblance, dont l’absence de biais, sont valides dans la limite où la taille de
l’échantillon est suffisamment grande. Néanmoins ce critère de taille de l’échantillon n’est
pas absolu et dépend du modèle et en particulier du nombre de paramètres à estimer.
Le Bayesian Information Criterion (BIC) est plus parcimonieux que le critère AIC
puisqu’il pénalise le nombre de variables présentes dans le modèle.
Avec le développement de la science de données, ces critères cèdent leur place aux
techniques de validation croisée, qui ont un spectre d’application plus large. C’est cette
dernière qui sera utilisée. Issue d’apprentissage supervisé, la validation croisée vise à
réduire le biais introduit par la base de données elle-même. Tout modèle est construit
en optimisant les paramètres afin de correspondre le mieux aux données utilisées. En
prenant ensuite un échantillon de données indépendant, mais issu de la même
population, il peut s’avérer que le modèle ne modélise pas aussi bien le comportement
de cet échantillon indépendant – cet effet est appelé surapprentissage. D’où l’importance
- 45 -
d’avoir des mesures permettant de qualifier le comportement du modèle sur les données
non utilisées lors de l’apprentissage.
La valeur standard du paramètre k est de 10, cette valeur ayant démontré de fournir
un meilleur équilibre entre le temps de calcul et le biais de l’estimateur de la performance
du modèle [21]. Cette valeur sera retenue pour nos tests.
Validation du
K-Fold Modèle 1 K-Fold Modèle 2 K-Fold Modèle 3 K-Fold Modèle 4
modèle
Validation Test
Pour appliquer cette méthode, nous affectons à chaque observation de notre base un
numéro aléatoire de 1 à 10 qui permettra de distinguer les données en deux sous-
ensembles – numéros de 1 à 8 pour le jeu d’entrainement et les numéros 9 et 10 pour
le jeu de validation.
Pour modélisation de la fréquence, les modèles possibles ont été comparés en utilisant
les critères de R2 ajusté et de coefficient de Gini (voir la section Critères de validation
- 46 -
d’un modèle pour l’explication des critères). Chacun des points sur la figure 8 représente
un modèle. Il n’y a pas de gain significatif entre les modèles à partir de 8 variables. Nous
choisissons donc le modèle parmi ceux à 8 variables dont les coefficients R2 ajusté et
Gini sont les plus importants. La significativité statistique est automatiquement contrôlée
par Akur8, l’ensemble des modèles proposés pour considération répond aux critères de
validité statistique.
Compte tenu de la faible présence de sinistres corporels dans notre base de données,
les sinistres sont modélisés sans distinction entre matériels et corporels.
Une fois le nombre de variable défini, nous allons nous attarder sur les variables qui
ont été retenues. La figure 9 présente ainsi les variables retenues et leur impact sur la
tarification, exprimé en spread de coefficients. L’ancienneté du permis ressort de loin
comme le critère le plus diversifiant, suivi du statut urbain de commune. La variable du
profil a été retenue mais son impact tarifaire est très léger.
- 47 -
Figure 9 - Impact tarifant des variables retenues pour la fréquence
La métrique du spread est utilisée pour évaluer l’impact tarifaire de chacune des
variables. Le spread est calculé selon la formule suivante :
Le spread à 95/5 est calculé selon la même formule mais en excluant les coefficients
des 5% de l’échantillon aux coefficients plus bas et plus élevés.
L’impact de chaque variable tarifaire sur le tarif peut ensuite être analysé afin de
s’assurer de la cohérence de la modélisation. Les coefficients des données observés de
la variable ancienneté du permis (ligne violette dans la figure 10) sont très volatiles. Les
coefficients retenus pour le modèle (ligne verte) ont été lissés, réduits pour les jeunes
conducteurs et maintenus stables pour les conducteurs à partir de 40 ans. Ces
modifications visent à pallier le manque de données sur certains segments qui
engendrent une volatilité accrue et intégrer un avis métier. Par exemple, nous savons
que le nombre d’observations pour les conducteurs ayant un permis de plus de 40 ans
est très faible et que les fluctuations observées n’ont pas d’explications en dehors d’un
manque de données.
- 48 -
Figure 10 - Analyse du spread du coefficient Ancienneté du permis
- 49 -
Figure 11 - Spread et exposition de la variable Statut urbain de la commune
- 50 -
Quant aux profils-type proposés dans le premier chapitre, leur impact tarifant,
présenté dans la figure 13, ne semble pas suffisamment important pour justifier la
complexité d’analyse diversifiée. Nous ne poursuivrons donc pas cette piste pour la
modélisation de la fréquence des sinistres. Cette variable est fortement corrélée aux
autres variables du modèle, ce qui crée du bruit dans la modélisation. Le remplacement
des variables qu’elle résume ne semble pas avoir un effet escompté.
La modélisation du coût moyen GLM est réalisée sur les sinistres dits « attritionnels »,
autrement dit, normaux et récurrents. Cette nomination est donnée pour les distinguer
des sinistres graves, qui ne pourront pas être modélisés aussi facilement, du fait de leur
nature plus rare et donc leur faible présence dans la base de données. Il est donc
communément accepté, lorsque l’assureur ne dispose pas d’études plus fiables, de
repartir la charge des sinistres graves sur l’ensemble des assurés, sur la base des
prédictions du ratio de S/P budgété dans le business plan.
- 51 -
démontrent plusieurs seuils possibles. Notre objectif est donc de nous assurer que le
seuil retenu par l’assureur reste cohérent par rapport à nos données et ne pénalise pas
la modélisation.
Pour les populations à queues de distribution lourdes, c’est-à-dire avec une probabilité
plus importante que celle de la loi normale d’avoir des sinistres extrêmes, l’approche
graphique de Hill est utilisée. Avant de pouvoir l’appliquer, il convient de vérifier si le
comportement de la distribution de la charge des sinistres supérieurs à un seuil
ressemble graphiquement à une distribution à queue lourde.
- 52 -
Le graphique de Hill présenté dans la Figure 15 permet d’identifier les zones possibles
pour le seuil. Pour réaliser ce graphique les montants des sinistres doivent être triés du
plus grand au plus petit. Le seuil possible se situe sur la plus grande valeur possible de
la zone de graphique où le paramètre α se stabilise. La première zone stable se trouve
vers α=0,9 et la statistique d’ordre 40-50 (difficilement lisible entre la statistique d’ordre
15 et 268 indiqués sur la Figure 15). Cette zone stable correspond à un seuil entre 20 000
et 30 000 maximum.
Pour valider les analyses graphiques, les sinistres ont été classés par tranche de charges
(Tableau 13). La zone optimale qui permettra de capter les sinistres de fréquence, à
partir de 95% en nombre, se trouve sur les tranches de 10 000 à 30 000.
- 53 -
Il est à noter que, pour des raisons pratiques, un assureur choisit un seul seuil
d’écrêtage pour l’ensemble de ses garanties. Ainsi, nous conservons un seuil d’écrêtage
à 30 000€ pour le risque RC moto. Les analyses qui viennent d’être présentées
démontrent que ce seuil reste acceptable, même s’il se situe en haut de la fourchette.
Pour l’inflation pour la partie dommage matériel, il est possible d’utiliser l’indice INSEE
d’entretien et réparation de véhicules particuliers (Identifiant 001764110). L’évolution
de cet indice sur les années 2012-2021, présentée dans la figure 16, démontre une
hausse supérieure à 20% et nous confirme la nécessité de revalorisation des coûts de
sinistres matériels préalable à la modélisation.
115
110
105
100
95
90
- 54 -
Il est à noter que plusieurs conventions entre les assureurs existent sur le marché
français dans l’objectif d’accélérer l’indemnisation des victimes et faciliter la gestion des
recours. Ces conventions prévoient des montants forfaitaires ou des barèmes
d’indemnisations. Notons les deux plus applicables - la convention d’Indemnisation et de
Recours Corporel Automobile (IRCA) et la convention d'indemnisation et de recours entre
sociétés d'assurance (IRSA). La modélisation des coûts d’un assureur reflètera
l’application ou pas de ces éventuelles conventions. Lorsqu’une des compagnies
d’assurance impliquées dans le sinistre n’entrent pas en conventions concernées,
l’indemnisation se fait en droit commun. Nous nous positionnons dans le cas d’une
compagne adhérente à l’IRCA mais pas à l’IRSA. Cette particularité se reflètera dans
l’estimation des coûts de sinistres dossier dossier de notre base de données et, par
conséquent, sur les résultats de modélisation qui ne seront applicables que pour une
compagnie qui appliquera le même schéma de conventions.
Le rapport d’un groupe de travail dirigé par M. Jean-Pierre Dintilhac a élaboré une
nomenclature commune des préjudices corporels. Les postes indemnisables en sont
(DINTILHAC, 2005) :
Préjudices patrimoniaux
- 55 -
- Dépenses de santé futures (D.S.F.)
- Frais de logement adapté (F.L.A.)
- Frais de véhicule adapté (F.V.A.)
- Assistance par tierce personne (A.T.P.) assistance dont a besoin la victime dans
la vie courante
- Pertes de gains professionnels futurs (P.G.P.F.) perte de revenus liée à l’état de
santé de la victime
- Incidence professionnelle (I.P.)
- Préjudice scolaire, universitaire ou de formation (P.S.U.)
Préjudices extrapatrimoniaux
Une partie seulement des coûts liés aux sinistres corporels, aménagements ou dépenses
de santé par exemple, peut être indexée sur l’inflation ou indices spécifiques. Les autres
fiques. Ainsi, certains coûts de sinistres corporels encore ouverts à la date d’analyse se
En présence d’une base de sinistres suffisamment large et fiable, il aurait été possible
de calculer des triangles de coût moyens attritionnels corporels et constater l'évolution
d'une année sur l'autre. Dans notre cas, nous nous contentons d’utiliser un taux 3%,
issu d’un benchmark auprès des autres assureurs, sur les produits similaires, obtenu
auprès de l’équipe de tarification. En France il est d’usage de considérer que la partie
matérielle représente 66% de la prime pure.
Avant de réaliser la modélisation, nous avons éliminé les sinistres avec une charge
négative pour le calcul de la charge moyenne (167 sinistres). Une charge négative
apparaît lorsque la somme de recours obtenus et/ou à obtenir pour un sinistre donné est
supérieure à l’indemnisation versée et/ou provisionnée pour ce même sinistre. Les
causes d’apparition d’une charge négative peuvent être multiples – par exemple, un
reliquat de recours obtenu en attente de reversement à un assuré ou une saisie erronée
d’un montant de recours ou de l’indemnisation.
Pour la modélisation du coût moyen, nous avons utilisé la loi Gamma, couramment
utilisée par le métier dans cet objectif. La loi log-normale a également été testée mais
aucun modèle n’a abouti à un coefficient de la prédictivité R2 supérieur à 0%.
L’application du GLM Gamma s’est relevée moins impactante pour le calcul du coût
moyen que pour le calcul de la fréquence. L’apport de l’information des 4 variables à la
prédictivité du coût moyen n’explique pas plus de 3,5% de variance. La figure 17
démontre que l’ajout des variables supplémentaires a même un impact négatif sur la
- 57 -
prédictivité du modèle (R2 négatifs pour certains modèles à 10 variables). Nous retenons
donc le modèle à 4 variables pour analyse plus détaillé.
Les variables retenues et leur impact tarifant sont présentés dans la figure 18.
L’impact de la cylindrée ressort en plus important, avec le spread des coefficients jusqu’à
65%. Notons qu’aucune variable en lien avec la géographie n’a été retenue (statut
commune, profil-type..). L’ajout de la variable code INSEE engendre une baisse de
prédictivité du modèle, exprimé en R2 ajusté, de 3,29% à 3,07%.
- 58 -
A cause de la faible volumétrie des sinistres de la base, l’exposition à différentes
cylindrées n’est pas uniforme, ce qui explique une forte volatilité des coefficients
observés (Figure 19). Néanmoins, nous avons obtenu des résultats cohérents avec des
coefficients qui augmentent avec la hausse de la cylindrée.
Il est à noter que pour la même raison (faible volumétrie des sinistres dans la base),
nous avons pris la décision de ne pas distinguer les sinistres corporels des sinistres
matériels dans le modèle proposé. La volumétrie des sinistres corporels étant encore
moindre.
La prime pure obtenue en application des deux modèles exposés ci-dessus (fréquence
x coût) sera comparée avec une prime pure issue de la modélisation en utilisant la
distribution Tweedie.
- 59 -
2.5. Modélisation de la prime pure (Tweedie)
Pour d’autres valeurs de ρ non remarquables, les distributions sont toujours définies
mais ne peuvent pas être écrites dans une forme finie. Quand 1 < ρ < 2, les distributions
sont continues pour Y supérieur à zéro, avec une quantité positive pour Y = 0. Pour ρ >
2, les distributions sont continues pour Y supérieur à zéro. Le choix de ρ peut se faire
simplement en analysant les résidus. La variable dépendante doit être numérique, avec
des données supérieures ou égale à zéro. La valeur fixe du paramètre de la distribution
Tweedie peut être n’importe quelle valeur supérieure à 1 et inférieure à 2.
La figure 20, présente une sélection des modèles de prédiction de la prime pure sur
la base de la distribution Tweedie à paramètre ρ =1,5. Le modèle le plus prédictif
comporte 11 variables initialement (12 avec l’enrichissement par code INSEE).
- 60 -
Figure 20 - Performance des modèles Tweedie
Les variables retenues sont significativement les mêmes que celles obtenues lors de
la modélisation par fréquence et coût moyen (voir Figure 21). Uniquement la variable
Tranche d’Age de conducteur est ajoutée. Notons également que la variable Profil a un
impact tarifant.
- 61 -
Le résultat de la modélisation de l’impact tarifaire de la variable Ancienneté de permis
présente des incohérences, les zones 18-26 ans d’ancienneté de permis et 36-42
ancienneté de permis se relèvent moins chères que les zones à 28-34 ans. Il sera donc
nécessaire de lisser les coefficients dans le cas où le modèle Tweedie sera retenu.
Les deux modèles sont obtenus - un modèle classique fréquence x coût moyen et un
modèle de prime pure obtenue directement en appliquant la distribution Tweedie. Se
pose la question des critères du choix entre les deux. Plusieurs critères entrent en jeu,
d’ordre statistique ou technique, qui correspondent à des méthodes de validation
théoriques, mais également les critères opérationnels, comme logique actuarielle ou les
contraintes du marché.
- 62 -
également la corrélation entre les valeurs prédites et les valeurs observées. Le R2 est
proportionnel à la variance de la variable de réponse. A pourcentage d’erreur égal dans
les prédictions, une base de tests avec une variance plus faible aura un R2 plus faible. Le
coefficient R2 ajusté pénalise la métrique R2 pour un nombre croissant des variables
prédictives dans le modèle.
L’indice Gini est une métrique qui permet de quantifier la performance du modèle pour
segmenter les observations. Un modèle à un coefficient Gini plus élevé permettra le tri
des risques plus fin et donc une tarification au plus près du risque.
Nous nous focaliserons sur les statistiques obtenues pour le test. Les deux modèles,
fréquence Poisson et prime pure Tweedie ont des indices Gini très proches, de l’ordre de
47%. Les coefficients obtenus par les deux modèles résulteront en des inégalités fortes
entre les assurés. Les assurés les moins risqués auront un tarif très bas, alors que les
assurés plus risqués auront un tarif beaucoup plus élevé. Notons que le modèle de prime
pure Tweedie présente une qualité de prédiction (R2) légèrement plus importante mais
également une volatilité plus importante.
Il est donc impossible de faire le choix entre ces modèles sur la base seule des
statistiques présentées. Une analyse des coefficients produits par rapport aux critères
de logique actuarielle, au niveau de mutualisation attendue et au niveau des primes
observées sur le marché reste déterminante. La simplicité d’implémentation
opérationnelle peut, dans certains cas, également entrer en ligne de compte.
- 63 -
Tweedie Pure Premium Poisson Frequency Gamma Average
Cost
- 64 -
Fréquence modèle Global Expert CityDrive Rural Profil Autre
2.8. Conclusion
- 65 -
données géographiques se sont avérés concluants. Le zoning a un impact positif sur la
performance du modèle de la fréquence.
Maintenant que le modèle de tarification optimisé est défini, se pose la question des
critères de prise de décision pour l’assureur pour procéder au changement de méthode,
les conséquences d’une telle décision et les autres options disponibles.
- 66 -
TROISIEME PARTIE :
METHODES ALTERNATIVES DU
REDRESSEMENT DU PORTEFEUILLE
- 67 -
Comme précisé dans le chapitre précédent, le modèle GLM est sensible aux
paramètres et aux données utilisées. Ainsi, le changement d’un de ces deux éléments
donne lieu, sans surprise, à un changement de la tarification. L’assureur doit-il la changer
à chaque fois qu’il réalise une nouvelle étude actuarielle ?
Plusieurs contraintes métier l’en empêchent, tout en sachant que les décisions
tarifaires ont un vrai impact stratégique sur la vie de l’assureur de niche. Entrer en guerre
de prix avec les leaders du marché n’est pas une option. L’objectif est donc d’augmenter
la rentabilité tout en gardant ou augmentant le chiffre d’affaires.
Rappelons que le prix du risque n’est pas le seul élément déterminant la prime
commerciale. La figure 23 montre ses autres composantes, notamment les charges fixes
et variables ainsi que la marge attendue par l’assureur.
- 68 -
Taxes
Marge attendue
Coût de réassurance Chargement de
Frais généraux
Commissions gestion
Coût des
sinistres
Prime commerciale
Le classement entre les coûts fixes et les coûts variables dépend du business modèle
de l’assureur. Dans un modèle de ventes directes et de gestion de sinistres internalisée
la majorité des coûts de l’assureur seront des coûts fixes. Analysons les trois principales
catégories des dépenses d’un assureur avec la gestion externalisée :
Commissions :
Frais Généraux :
Coût de réassurance :
La réassurance est l’assurance des assureurs pour faire face notamment aux sinistres
graves. A l’équivalent de l’assurance, la partie qui cède le risque, appelée cédante, va
payer une prime d’assurance, appelée dans ce cas une prime de réassurance, pour
couvrir une partie ou l’intégralité des risques qu’elle porte. La réassurance permet aux
- 69 -
assureurs d’accepter des risques pour lesquels, sans appel à la réassurance, ils n’auraient
pas suffisamment de capitaux propres. La nature du risque RC, en particulier des
dommages corporels d’un montant illimité, rend l’appel à la réassurance indispensable
et représente un coût pour l’assureur. Les principales formes de la réassurance sont
rappelées en Annexe 4.
Les sujets d’optimisation des chargements de gestion sont multiples et mériteraient une
discussion à part entière. Pour notre étude, il est important de comprendre que le niveau
de tarification retenu doit tenir compte des hypothèses de ces chargements qui sont
considérées comme fixes.
Afin d’évoluer et projeter la performance d’un portefeuille, deux ratios sont utilisés en
assurances : sinistres sur primes (S/P) et ratio combiné. Le ratio combiné désigne le
rapport entre les coûts totaux (dont le coût des sinistres et de gestion) et les primes.
Lors de la validation des modèles tarifaires, l’actuaire doit confronter ses résultats à
un ratio S/P cible, au-dessus duquel la commercialisation du produit ne sera pas rentable
pour la société, compte tenu des charges évoquées précédemment.
Il est également nécessaire de confronter les résultats de l’étude aux autres travaux
menés par les actuaires de l’assureur tels que le calcul du résultat technique, les analyses
des hypothèses de provisionnement, les analyses des résultats des populations couvertes
pour le renouvellement, la cohérence du S/P obtenu avec le niveau de rentabilité vu par
les souscripteurs.
Le prix commercial est fondé sur l’ensemble des éléments ci-avant mais également
contraint par la réglementation et le prix du marché. Dans un monde idéal pour un
- 70 -
assureur, ces contraintes pourraient être accompagnées des informations sur la
sensitivité du client au prix et la valeur estimée de l’apport de ce client en portefeuille.
Ainsi, l’assureur aurait pu proposer à chaque prospect intéressant le maximum du prix
que le prospect pourrait accepter. Une telle approche risque de ne pas être appréciée
par le régulateur, mais le mécanisme du marché fera le nécessaire d’un point de vue
éthique.
(𝜇 − 𝜇 ) /𝜇
𝐸= −
(𝑃1 − 𝑃0)/𝑃0
Avec :
- 71 -
Afin de définir le niveau optimal de tarification, l’assureur doit commencer par définir
une fonction de bénéfice, dont les composantes principales sont les suivantes :
Le maximum de la profitabilité est atteint si l’ensemble des polices se trouve sur la courbe
des primes optimisées (Guven et McPhail, 2013). Cette ligne correspond à la frontière
d’efficience par rapport au maintien de la demande et de la rentabilité attendue par un
assureur. En suivant sa montée, la rentabilité diminue alors que la demande augmente,
mais chaque point représente le niveau de rentabilité optimal. La Figure 24 présente un
exemple d’une société dont la position n’est pas optimale. Cette société a plusieurs
moyens d’augmenter sa rentabilité : 1) augmenter la demande en gardant le S/P au
même niveau, 2) diminuer le S/P à demande stable ou 3) une combinaison des deux.
- 72 -
Figure 24 - Frontière d'efficience d'un portefeuille optimisé
- Agir sur la grille de tarification en optimisant les facteurs des variables tarifantes.
Facilement implémentée avec GLM, cette méthode ne permettra pas pour autant
d’identifier les lacunes de tarification sur des segments où le potentiel de
croissance n’est pas atteint. Autrement dit, l’assureur aurait pu augmenter son
résultat net en baissant le prix sur certains segments et en attirant ainsi des
assurés supplémentaires.
- Optimiser les prix sans tenir compte de la tarification actuelle, en déterminant un
niveau de prime optimal pour chaque assuré dans le portefeuille et déterminant
ensuite la grille tarifaire en appliquant l’ingénierie inverse. Cette méthode
permettra à l’assureur de se positionner sur la frontière d’efficience, mais elle est
beaucoup plus consommatrice de temps.
- Une affaire nouvelle dont le prix optimal sera davantage impacté par les prix de
la concurrence et l’image de la marque, mais aussi par le caractère immédiat de
la décision tarifaire, et
- Un renouvellement où l’assureur proposera le prix qui sera fonction de sa stratégie
de maintenir les segments des assurés profitables, de l’historique et de la valeur
attendus de l’assuré individuel en question dans le futur (par exemple à travers la
- 73 -
vente d’autres produits) mais également davantage de temps pour tenir compte
de toutes les variables.
Une analyse des scénarii agrégés des deux modèles d’optimisation permettrait de
définir les mesures cibles et de vérifier que l’impact estimé soit positif. Nous avons
simulé deux scénarii possibles, un avec une hausse tarifaire et un sans hausse, pour
estimer l’impact sur le bénéfice (Tableau 16). Afin de maintenir la confidentialité, les
montants affichés ne correspondent pas aux portefeuilles réels.
Dans l’exemple présenté l’assureur a effectivement intérêt à augmenter les primes car
l’impact sur le bénéfice est positif. Cependant, le résultat est très sensible aux
hypothèses de taux de transformation, de taux de renouvellement et du prix
commercial appliqué.
Une analyse de sensibilité par paramètre est présentée dans le tableau 17. Dans le
cas étudié, nous avons testé l’impact d’une hausse de prix moins forte que dans le
scenario central de 10% (de 3% à 7%) et une sensibilité des taux de transformation et
de renouvellement moins importants que les scénarii de base de -10% et -5%. Il en
ressort de cette analyse que le résultat du portefeuille est plus sensible au taux de
- 74 -
renouvellement qu’au taux de transformation. Dans ce cas de figure, l’assureur doit se
focaliser sur l’étude des mécanismes de modélisation du taux de renouvellement.
- 75 -
- L’assureur ne peut pas changer le produit seul (contexte de partenariats avec des
courtiers, qui sont impactés commercialement par les décisions aussi bien
tarifaires mais aussi relatives aux produits)
- Dans la pratique, la démarche peut s’étaler sur plusieurs années.
- Impact sur le mix : lorsque l’assureur change le tarif, sa compétitivité sur chaque
client évolue, ce qui a un impact sur la structure entière du portefeuille qui se
trouve déformée. En particulier, une erreur de tarification qui impliquerait un tarif
moins élevé que le marché sur les profils à risque élevé risque de générer l’effet
d’antisélection, en attirant ce type de profils vers l’assureur.
- L’effet d’ajustements ponctuels est difficilement différentié de l’évolution naturelle
de la sinistralité.
- Certaines contraintes règlementaires peuvent limiter l’utilisation de tel ou tel
modèle de tarification. Par exemple, il est interdit en Europe de tarifier en fonction
du sexe (Gender Directive du 21 décembre 2012). Il y a des pays où il est interdit
de proposer un prix plus faible en affaire nouvelle au détriment des assurés à des
profils similaires en renouvellement.
La première approche consiste à mieux sélectionner les assurés à travers les critères
de souscription, observables ou non par l’assuré.
- 76 -
Dans le cas des critères de souscriptions non observables, l’assureur qui souhaite
limiter son exposition à un segment de population en particulier, proposera aux autres
segments un tarif significativement plus élevé que celui proposé sur le marché, de
façon à dissuader l’achat.
Un autre levier, bien que limité, consiste à la réduction des garanties proposées, ou la
baisse des plafonds de garanties. Ces changements sont généralement mal perçus par
les assurés et, par conséquent, peuvent avoir un impact négatif sur le taux de
renouvellement. Dans un contexte de co-construction de produit entre l’assureur et le
distributeur, ce levier est assez limité.
L’action inverse, de proposer des options profitables, peut s’avérer plus productive.
La franchise est la somme qui reste à charge de l’assuré dans le cas de la survenance
d’un sinistre. Elle peut être appliquée lorsque l’assuré est responsable. En cas de co-
responsabilité (RC 50%), le montant de franchise est divisé par deux.
- 77 -
autre personne. L’objectif est de dissuader l’assuré de prendre des risques
supplémentaires en prêtant son véhicule à un conducteur dont les critères sont
inconnus de l’assureur. Il est également possible d’exclure totalement la possibilité
de prêt du véhicule à une autre personne.
- La franchise « jeune conducteur » correspond à une variation de la franchise
« prêt de volant » lorsque le conducteur principal prête son véhicule à un
conducteur moins expérimenté (notamment moins de 3 ans de permis) alors que
le conducteur principal bénéficie de CRM plus avantageux (notamment coefficient
50).
Le montant de franchise est librement établi par l’assureur. Ce moyen peut être utilisé
jusqu’à une certaine limite car de plus en plus d’assurés y prêtent attention et la franchise
fait désormais partie des critères de comparaison des produits. L’assureur ne devrait pas
s’éloigner de l’offre de la concurrence au risque de provoquer une mauvaise image de
marque.
Un autre moyen d’agir sur la rentabilité concerne l’alignement des intérêts entre
l’assuré et l’assureur. L’apparition récente des applications de suivi de conduite
connectées permet aux assureurs de favoriser la conduite prudente en proposant un
tarif moins élevé aux bons conducteurs. Le mécanisme est le suivant : l’application
analyse le comportement du conducteur sur la route – la vitesse, l’accélération et le
freinage, la vitesse des manœuvres pendant un certain temps. Passé un délai
d’observation, le tarif du conducteur est ajusté en fonction des données de conduite
obtenues. Une conduite prudente est gratifiée par une remise, une conduite moins
prudente ne donne pas lieu au changement du tarif.
- 78 -
d’innovation. La tarification de ce type de produit présente un intérêt car il s’agit de
trouver un équilibre entre forfait fixe et la partie variable du tarif.
- 79 -
CONCLUSION
Nous avons exploré l’introduction des profils-type dans le modèle de tarification afin
d’obtenir une meilleure adéquation de la tarification au risque. L’étude a été réalisée sur
les données de six courtiers français et la garantie responsabilité civile. Il s’est avéré que
l’impact de la variable profil-type n’apporte pas d’amélioration significative et n’a donc
pas d’intérêt compte tenu de la complexité supplémentaire ajoutée à la modélisation.
Les profils obtenus initialement se sont relevés trop restrictifs pour permettre une
tarification (de 8 à 15% de la population totale par profil). En revanche, ces profils
montrent des écarts significatifs de fréquence et coût moyen. L’assouplissement des
critères d’affectation au profil type engendre davantage de bruit dans la modélisation et
diminue la significativité des résultats. Une validation du résultat sur une base de
données plus large et donc en application de critères plus stricts apporterait
probablement des résultats plus probants.
En revanche, nous avons démontré l’apport important des données géographiques sur
la performance du modèle, notamment sur la modélisation de la fréquence.
Nous avons ensuite cherché à déterminer les critères pour justifier la décision d’un
assureur de changer de modèle de tarification et dresser la liste des impacts potentiels.
Plusieurs composantes du prix commercial ont été considérées fixes, comme le prix
de la réassurance et les frais généraux. L’analyse des moyens de leur optimisation
constitue un objet d’étude à part entière mais reste en dehors du sujet de ce mémoire.
Enfin, nous avons dressé une liste des leviers alternatifs d’amélioration de la rentabilité
d’un portefeuille. L’impact de chacun de ces leviers peut constituer un objet d’étude utile
et intéressant.
- 81 -
BIBLIOGRAPHIE
Ouvrages
Mémoires
Publications
[9] H. BUHLMANN & A. GISLER (2005). A Course in Credibility Theory and its
Applications. Springer.
- 82 -
[10] A. CHARPENTIER (2010). Statistique de l’assurance. 3rd cycle. Université de
Rennes 1 et Université de Montré.
[11] J.-P. DINTILHAC (2005). Rapport du groupe de travail chargé d’élaborer une
nomenclature des préjudices corporels.
[12] R. LITTLE and D. RUBIN (1987). Statistical analysis with missing data. New York:
John Wiley & Sons.
[13] J. A. NELDER and R. W. M. WEDDERBURN (1972). Generalized linear models.
Journal of the Royal Statistical Society, 135, 370–384.al, pp.133..
[14] J.L SCHAFER and J.W GRAHAM (2002). Missing Data: Our view of the state of the
art. Psychological Methods.
[15] C. SCARROTT and A. MACDONALD (2012). A review of extreme value threshold
estimation and uncertainty quantification. REVSTAT – Statistical Journal Volume 10,
Number 1, March 2012, 33–60.
Cours
Sites internet
[17] Institut National de la statistique et des études économiques (2021) Indice des
prix à la consommation.
[18] Fédération Française de l’Assurance (2020) Assurances de biens et de
responsabilité : données clés par année 2019.
[19] Fédération Française de l’Assurance (2021) L’assurance des motos, scooters et
autres deux-roues à moteur.
[20] Fédération Française de l’Assurance (2021) Assurance auto, moto : le bonus-
malus.
[21] Jason BROWNLEE, Python Machine Learning (2020) How to Configure k-Fold
Cross-Validation
Autres
- 83 -
ABREVIATIONS
Garanties :
ACCESS - Accessoires
ATTEN - Attentat
CASQ - Casque
CIR - Circuit
INC - Incendies
PJ – Protection juridique
VLX - Vol
- 84 -
LISTE DES TABLEAUX
Tableau 1 – Statistiques FFA : Fréquence et coût moyen des sinistres par garantie
(Véhicules de 3ème catégorie) ..................................................................... - 16 -
Tableau 2 - Rentabilité dossier/dossier - Exercice de survenance 2020 ............ - 20 -
Tableau 3 - Rentabilité dossier/dossier - Exercice de survenance 2019 ............ - 21 -
Tableau 4 - Rentabilité dossier/dossier - Exercice de survenance 2018 ............ - 21 -
Tableau 5 - Présence et poids relatif des garanties par portefeuille ................. - 23 -
Tableau 6 - Poids relatif des portefeuilles étudiés, tout exercice confondu ........ - 23 -
Tableau 7 - Disponibilité des données des variables descriptives par portefeuille- 25 -
Tableau 8 – Disponibilité des données par variable ...................................... - 28 -
Tableau 9 - Fréquence et coût moyen des profils identifiés ............................ - 36 -
Tableau 10 - Fréquence et coût moyen des profils (critères assouplis) ............ - 36 -
Tableau 11 - Fonctions de lien usuelles ...................................................... - 43 -
Tableau 12 - Calcul de la prime pure en utilisant des coefficients ................... - 43 -
Tableau 13 - Répartition des sinistres par tranche de charge ......................... - 53 -
Tableau 14 - Tests statistiques des modèles au global .................................. - 64 -
Tableau 15 - Tests statistiques des modèles Fréquence par Profil-type ............ - 65 -
Tableau 16 - Exemple d'analyse de scenarii de hausse tarifaire ...................... - 74 -
Tableau 17 - Sensibilité du résultat aux hypothèses ..................................... - 75 -
Tableau 18 - Assurance automobile - Principaux ratios comptables ................. - 88 -
Tableau 19 - Application d'un contrat de réassurance en excédent de plein ...... - 96 -
Tableau 20 - Calcul de cession en excédent de plein et en excédent de sinistre - 97 -
- 85 -
LISTE DES FIGURES
- 86 -
ANNEXES
- 87 -
Annexe 1 : Les projections techniques affichées sont-elles
cohérentes par rapport au marché ?
- 88 -
Annexe 2 : Répartition par profil-type choisie est-elle
similaire et cohérente pour chacun des portefeuilles ?
- 89 -
- 90 -
- 91 -
Annexe 3 : Analyse ACM sur les polices sinistrées
- 92 -
- 93 -
- 94 -
Annexe 4 : Principales formes de la réassurance
La réassurance proportionnelle
Il s’agit des contrats en quote-part (quota share) et excédent de plein (surplus share).
L’excédent de plein est une forme plus sophistiquée où la cédante transfère uniquement
les risques dont les montants de garantie dépassent le niveau établi appelé plein de
rétention. Pour chaque risque, le réassureur perçoit une prime correspondant à la
proportion du dépassement. Le même taux est utilisé pour le partage des sinistres. Cette
structure de partage permet à l’assureur de garder tous les petits risques et céder
uniquement les risques qui dépassent son appétit. Du fait de cette possibilité du choix
des risques par l’assureur, le contrat en excédent de plein peut théoriquement engendrer
l’antisélection vis-à-vis du réassureur. L’incertitude dans le déroulement, l’exposition et
le moment de règlement des sinistres corporels font en sorte que cette forme de
réassurance est très rarement utilisée pour ses risques. La lourdeur des calculs est
également un frein à son utilisation.
- 95 -
Risque Valeur totale Rétention par Cession Pourcentage de prime et de
du risque la cédante sinistres cédé
1 80 000 80 000 0 0%
2 120 000 100 000 20 000 20 000/120 000 = 16,7%
3 500 000 100 000 400 000 400 000/500 000 = 80%
4 700 000 100 000 400 000 400 000/700 000 = 57%
Tableau 19 - Application d'un contrat de réassurance en excédent de plein
Dans la pratique, le plan de réassurance est souvent composé de plusieurs tranches qui
se complètent.
Cette forme permet à la cédante, moyennant une prime annuelle unique, de transférer
au réassureur le risque d’un ou plusieurs sinistres dépassant un certain seuil par sinistre
ou en cumulé. Ce type de réassurance est souvent utilisé en assurance moto et engendre
des frais importants.
Il s’agit des contrats en excédent de sinistres (excess) et cumul de rétention (stop loss).
800
600 200
Montant à charge du
400 réassureur, en K
400
Montant à charge de
200
l'assureur, en K
100
0
Montant du sinistre
- 96 -
Le tableau 20 présente la différence dans le calcul du montant de cession entre un
contrat en excédent de plein et un contrat en excédent de sinistre. Il est à noter que la
rétention dans le contrat en excédent de plein intervient uniquement lors de la définition
de la proportion de cession, et c’est cette dernière qui est utilisée lors du calcul du
montant de sinistre cédé.
450 000 450 000 x 80% = 360 000 450 000 – 100 000 = 350 000
Le contrat en cumul de rétention, quant à lui, permet de limiter la charge annuelle totale
de l’assureur, souvent exprimée sous forme d’un ratio S/P maximum. Dans le cas d’une
priorité de réassurance à un niveau de S/P à 100% et un ratio de S/P réalisé à 104%, le
réassureur prendra en charge le montant de sinistres à la hauteur de 4% de primes de
l’année d’affectation.
- 97 -