Combler l’écart : construire des tables de mortalité au moyen de la science des données

Par Mayur Shah, FICA

Pour les sociétés d’assurance et de réassurance, les tables de mortalité sont à la base de la tarification et de l’évaluation des produits. Pour établir ces tables, les actuaires ont toujours eu recours à des méthodes traditionnelles en se basant sur des points de données tels que le sexe, le statut tabagique, l’âge et la durée.

Toutefois, l’avancée des techniques de la science des données offre une occasion importante de réimaginer la façon de concevoir ces tables.

Construire des tables de mortalité

Depuis toujours, les actuaires construisent les tables de mortalité en ayant recours à un processus appelé graduation, lequel fait appel à des techniques statistiques afin de lisser les taux de mortalité observés de manière à éliminer les fluctuations et à créer un modèle plus régulier. L’augmentation au fil du temps de la puissance de calcul nous permet maintenant d’utiliser différentes techniques pour produire des tables de mortalité.

On pourrait parler de techniques statistiques « plus récentes », mais certaines de ces méthodes remontent avant la graduation actuarielle traditionnelle. On peut les considérer comme plus modernes dans leur applicabilité à l’actuariat. Ces techniques sont les suivantes :

les modèles linéaires généralisés (MLG);
les réseaux de neurones;
les modèles additifs généralisés;
les méthodes arborescentes.

Le MLG est généralement le plus simple à comprendre, mais il s’agit de variations sur le même principe : utiliser un bloc de données et adapter un modèle permettant d’établir des prédictions.

Le rôle des scientifiques des données en actuariat

Les scientifiques des données peuvent contribuer au travail actuariel grâce à l’application de leur expertise à ces méthodes avancées. Leurs compétences en matière de traitement des données, de création de modèles et de visualisation sont très utiles aux fins de la modernisation des tables de mortalité. Il importe cependant qu’ils travaillent en étroite collaboration avec des actuaires parce que le processus nécessite un examen minutieux des hypothèses, de la possibilité de surajustement et de l’interprétabilité du modèle.

Connaître ses données

Dans tout exercice de modélisation, le plus gros du travail consiste à bien comprendre les données.

Il importe de prendre en considération la pertinence des données, car les taux de mortalité peuvent varier considérablement au fil du temps en raison de facteurs tels que les progrès de la médecine, les changements de mode de vie et les critères de tarification.

Voici un aperçu de l’évolution de la tarification et de la collecte de données au Canada :

Avant 1980 : On offrait surtout l’assurance vie entière. Le seul critère de distinction en matière de prime était le sexe.
Début des années 1980 : On a intégré le critère du statut tabagique, mais il était déclaré par l’assuré.
Milieu des années 1980 : On a intégré les analyses sanguines en raison de l’épidémie de SIDA. Un sous-produit appelé cotinine permettait aux assureurs de vérifier le tabagisme.
Début des années 1990 : Introduction d’un prélèvement de liquide buccal pour les valeurs nominales inférieures afin de détecter le VIH, la cotinine et la cocaïne, et d’un test sanguin dans le cas des valeurs nominales plus élevées.
Fin des années 1990 : Introduction des classes préférentielles. Collecte de points de données supplémentaires grâce à l’analyse des fluides (par exemple les lipides), permettant aux tarificateurs d’obtenir davantage de renseignements.
Début des années 2000 : Les entreprises commencent à effectuer des analyses coûts-avantages concernant la collecte de fluides et certaines d’entre elles commencent à la retirer pour les assurés plus jeunes et les montants moins élevés.
Après 2015 : La tarification accélérée, qui accélère la délivrance des polices, gagne en popularité. Avec l’avènement de la pandémie de COVID-19, la tarification accélérée est devenue une nécessité vu la fermeture des laboratoires et l’interdiction des visites. Les compagnies ont augmenté le recours aux modèles prédictifs et aux tests aléatoires pour compenser l’incidence négative de la suppression des analyses de fluides sur la mortalité.

Élaboration d’un modèle

Nous avons entendu les termes à la mode entourant l’apprentissage machine et l’analytique prédictive, mais voulions concevoir une solution concrète. L’équipe canadienne de la tarification actuarielle de la PartnerRe a travaillé de concert avec des scientifiques des données pour concevoir un cadre permettant de créer un autre genre de table de mortalité.

Nous avons commencé par les données issues de la table de mortalité intersociétés de l’Institut canadien des actuaires (ICA). Cet ensemble de données complet englobe la plupart des contrats d’assurance vie individuelle souscrits au Canada depuis un siècle.

La modélisation a posé quelques problèmes, lesquels ont été relevés par les scientifiques des données :

Groupement des données : Les données ne sont pas vraiment comparables point par point, mais sont groupées à un niveau suffisamment fin pour permettre la modélisation.
Données rares : Pour des âges et des durées plus élevés, les données sont restreintes.
Valeurs extrêmes : Vaste fourchette de montants de règlement (de zéro à plusieurs millions) et proportion élevée de dossiers sans demande de règlement.
Rapports relatifs aux classes préférentielles : On a relevé des incohérences entre les compagnies.

La première étape a consisté à résumer les données et à examiner l’applicabilité. Cet exercice a révélé quelques bizarreries :

Pour un âge atteint donné, les durées supérieures à 40 ans semblaient présenter un taux de mortalité plus faible que les durées précédant immédiatement 40 ans. Cela s’explique peut-être, mais de prime abord, cela n’avait pas de sens.
Une quantité étonnante de données pour des polices émises à des non-juvéniles avec un statut de fumeur combiné au cours des dernières années de l’étude. Selon notre connaissance du marché, cela ne devrait pas être le cas. L’ICA a fait enquête et trouvé une erreur dans les données d’origine, laquelle a ensuite été corrigée.

Le jugement actuariel a également été nécessaire pour comprendre que certaines données, telles que les renouvellements et les conversions, ne devraient pas être comprises dans l’ensemble de données, car elles sont prises en compte séparément lors de l’établissement d’une hypothèse de mortalité.

Au bout du compte, nous avons limité les données selon la durée et l’âge atteint afin de garantir l’applicabilité au marché actuel et parce que les données plus anciennes peuvent être volatiles. Il a fallu recourir à l’expertise pour assurer l’extrapolation du modèle à des âges plus avancés.

L’une des plus grandes leçons tirées de cet exercice tient au fait que les concepteurs de modèles devraient travailler de concert avec les utilisateurs finaux et que pour tenir le projet sur la bonne voie, il faut des échanges constants.

Construire un modèle linéaire généralisé

Nous sommes partis du principe selon lequel notre objectif consistait à obtenir une formule de MLG que l’on pourrait utiliser avec le Système de modélisation actuarielle AXIS^TM, qui est largement utilisé dans le secteur pour modéliser les flux de trésorerie et les réserves. Cela a guidé notre conception de la sélection du modèle et des variables.

Sélection du modèle et démarche

Après notre premier examen des données, nous avons réfléchi à notre choix du modèle à titre de MLG. Nous avons envisagé diverses options, dont les modèles binominal, Poisson, binominal négatif et autres.

Il fallait notamment déterminer s’il convenait de modéliser les taux de mortalité selon le nombre de sinistres ou le montant des sinistres. La norme du secteur en Amérique du Nord est d’utiliser le montant des sinistres. En discutant, les équipes d’actuariat et de la science des données ont confirmé la vision selon laquelle il convenait de modéliser les taux de mortalité en fonction du montant étant donné qu’ils constituent le moteur économique du secteur et que le modèle est en mesure de gérer les différences entre le nombre et le montant.

Des outils en science des données permettent également de sélectionner les variables qu’il convient d’utiliser. Nous avons « noté » les variables possibles afin de confirmer l’importance des variables traditionnelles, c.-à-d. l’âge, la durée, le sexe et le statut tabagique, et les avons élargies pour y inclure des variables telles que la tranche de somme assurée, le type d’assurance et l’année de l’étude.

De plus, certaines variables interagissent les unes avec les autres (ce qui signifie qu’il existe des dépendances entre variables). Nous avons recensé les interactions les plus importantes et les avons incluses dans le modèle. Les techniques traditionnelles de construction des tables de mortalité ne tiennent pas compte de ces interactions et présument effectivement que les variables sont indépendantes.

Gérer des périodes sélectes et les interactions entre variables

Une autre observation intéressante concerne la période sélecte. La période sélecte a toujours été fixée à 15 ou 20 durées pour tous les âges à l’émission et le passage de la période sélecte à la mortalité ultime se traduit par un « saut » de taux. Notre analyse a montré que l’effet sélect pourrait être de plus longue durée et peut varier selon l’âge à l’émission. Cela a été pris en compte dans le MLG, dans lequel la durée a été transformée en une asymptote qui s’approche progressivement d’un maximum (le taux ultime).

Résultats

Grâce à ce processus, nous avons été en mesure d’élaborer une formule de MLG pouvant être intégrée dans AXIS^TM en tant que tableau de formule.

Avantages et considérations

Le recours au MLG est une nouvelle façon d’aborder les tables de mortalité dans le cadre de la modélisation. On note plusieurs avantages, dont les suivants :

Prise en considération d’un plus grand nombre de facteurs : Les modèles prédictifs peuvent comprendre un plus large éventail de facteurs ayant une incidence sur la mortalité.
Interaction utile : Tient compte de l’interaction entre les variables.
Efficacité : Bon nombre de tables peuvent être remplacées par une seule formule.
Souplesse : La transition entre la période sélecte et la période ultime peut être plus fluide.
Intemporalité : La construction de tables de mortalité au moyen de la graduation peut prendre énormément de temps. Les modèles prédictifs peuvent être actualisés au moyen de nouvelles données, ce qui garantit le maintien de leur pertinence.

D’autres facteurs, toutefois, doivent être pris en compte :

Limites des logiciels : Contraintes des logiciels de modélisation, tant en ce qui concerne les variables que les fonctionnalités.
Complexité : On ne peut « voir » une table à deux dimensions; les MLG nécessitent compréhension et formation.
Crédibilité des données : Des dérogations sont nécessaires à des âges atteints plus avancés lorsque les données ne sont pas crédibles (mais c’est aussi le cas avec les méthodes traditionnelles).
Coordination : La réussite et la coordination entre les équipes (direction, tarification, évaluation, actuaire désigné, auditeurs externes, évaluateurs pairs, etc.) nécessitent une adhésion interne et externe.

Conclusion

L’intégration des techniques de la science des données – et la collaboration étroite avec des scientifiques des données –, comme le démontre la construction des tables de mortalité, peut bonifier grandement les compétences propres aux actuaires. Cet exemple illustre comment l’intégration de méthodes statistiques modernes à l’expertise actuarielle traditionnelle peut favoriser la précision et la souplesse accrues des modèles. La réussite d’un tel projet nécessite également une collaboration constante entre les personnes et les équipes qui y prennent part, ainsi qu’une adhésion à tous les échelons de l’organisation.

Le recours aux modèles prédictifs permet d’améliorer la précision et la souplesse des tables de mortalité, ce qui, au bout du compte, est profitable aux assureurs vie, aux réassureurs et aux autres organisations qui en dépendent.

Mayur Shah est vice-président principal et chef de la tarification à PartnerRe Life & Health Canada.

Les opinions exprimées dans cet article sont uniquement celles de l’auteur. Cet article est publié uniquement à des fins d’information générale, d’éducation et de discussion. Il ne constitue pas un avis juridique ni professionnel et ne correspond pas nécessairement, ni en entier ni en partie, à la position, à l’opinion ou au point de vue de l’Institut canadien des actuaires, de la PartnerRe ou de toute société affiliée.

Science des données

First name:

Last name:

Email:

Preferred language / Langue privilégiée:

Contact category:

Prénom :

Nom :

Courriel :

Langue privilégiée / Preferred language :

Catégorie de contact :

Combler l’écart : construire des tables de mortalité au moyen de la science des données

Construire des tables de mortalité

Le rôle des scientifiques des données en actuariat

Connaître ses données

Élaboration d’un modèle

Construire un modèle linéaire généralisé

Sélection du modèle et démarche

Gérer des périodes sélectes et les interactions entre variables

Résultats

Avantages et considérations

Conclusion

Suivez Nous

Pour nous joindre

Construire des tables de mortalité

Le rôle des scientifiques des données en actuariat

Connaître ses données

Élaboration d’un modèle

Construire un modèle linéaire généralisé

Sélection du modèle et démarche

Gérer des périodes sélectes et les interactions entre variables

Résultats

Avantages et considérations

Conclusion

Articles similaires

Suivez Nous

Pour nous joindre