L’ICA a publié un énoncé de position intitulé Les mégadonnées et la classification des risques : Comprendre les enjeux actuariels et sociaux. Dans cet épisode, Matt Buchalter, FICA et Chris Cooney, FICA partagent la nécessité de cet énoncé, les avantages qu’une plus grande collecte de données peut avoir sur la tarification en assurance et la société, comment la confidentialité des titulaires de polices est essentielle, et comment la collecte de données devrait évoluer au cours des prochaines années. Cet épisode est disponible en anglais seulement.
VOUS N’AVEZ PAS LE TEMPS D’ÉCOUTER CE BALADO? LISEZ LA TRANSCRIPTION.
Fievoli : Bonjour et bienvenue à Voir au-delà du risque, le balado de l’Institut canadien des actuaires. Je suis Chris Fievoli, actuaire, communications et affaires publiques à l’ICA.
L’ICA a publié un énoncé de position intitulé Les mégadonnées et la classification des risques – Comprendre les enjeux actuariels et sociaux. Nous vous invitons à prendre connaissance de ce document, qui est accessible sur le site Web de l’ICA.
Pour mettre en contexte les discussions ayant mené à la rédaction de cet énoncé, nous avons invité deux membres du groupe de travail chargé de sa création, soit Matt Buchalter et Chris Cooney, tous deux membres de l’ICA.
Merci à vous deux d’avoir accepté notre invitation aujourd’hui.
Buchalter : Merci, Chris. C’est un grand plaisir d’être ici.
Cooney : En effet, merci de m’avoir invité.
Fievoli : Commençons par présenter un bref bilan de l’état actuel des mégadonnées, en particulier dans l’univers des assurances IARD, dans lequel vous exercez tous les deux.
Donnez-nous des exemples de données qui sont recueillies maintenant et auxquelles nous n’avions pas accès, disons, il y a 15 ou 20 ans.
Buchalter : Je crois que le meilleur exemple dans le monde des assurances IARD est celui des dispositifs télématiques sur les véhicules, qui ont commencé à s’imposer au Canada il y a environ dix ans.
On recueille ces données soit au moyen d’une application pour téléphone ou d’un dispositif directement connecté au véhicule et qui peut enregistrer toutes sortes de données. Les avantages d’un dispositif télématique pour véhicule se classent en deux catégories. D’abord, ils permettent d’obtenir une meilleure mesure de l’exposition. Évidemment, plus un véhicule parcourt de kilomètres, plus il y a de risques de réclamation. Avant l’arrivée des dispositifs télématiques, le kilométrage total devait être estimé par le client, ce qui entraînait quelques problèmes.
Premièrement, personne ne tient vraiment le compte du kilométrage qu’il parcourt au cours d’une année, et même si c’était le cas, il n’existe pas bien des moyens pour les assureurs de vérifier ces renseignements. Il y a donc un dispositif intégré au véhicule ou une application dans le téléphone qui permet de mesurer, de manière précise, le nombre de kilomètres parcourus dans une année par le véhicule.
De plus, le dispositif télématique intégré au véhicule offre une mesure du risque, lequel s’entend, ici, des mauvaises habitudes de conduite, que ce soit l’accélération rapide, le freinage brusque ou les virages serrés.
Et certains de ces dispositifs permettent de mesurer la fatigue du conducteur de diverses façons. Tous ces éléments permettent à la compagnie d’assurance d’obtenir une évaluation beaucoup plus détaillée des risques associés à une conduite donnée ou à la conduite d’un véhicule donné que ce qui était possible avant l’avènement des dispositifs télématiques.
Cooney : Je travaille dans le domaine des assurances IARD, mais je sais très bien aussi qu’il existe des applications de type Fitbit permettant d’obtenir des renseignements sur la santé. Par exemple, je sais que la Manuvie a conçu le programme Vitalité, qui offre aux clients certaines incitations et récompenses afin de les motiver à adopter de saines habitudes de vie.
En ce qui concerne les mégadonnées, j’ajouterais aussi qu’historiquement, et je suis dans le secteur depuis longtemps, nous aurions procédé à une analyse statistique. En règle générale, nous aurions utilisé des statistiques agrégées. Il suffit de consulter certaines de nos sources de données de l’industrie pour constater que la granularité était restreinte et que nous ne disposions pas de certaines intersections entre, disons, l’âge du conducteur et le nombre d’années écoulées depuis l’obtention du permis; il fallait en quelque sorte procéder à des agrégations indépendantes.
Mais aujourd’hui, nous avons généralement recours à des ensembles de données beaucoup plus vastes contenant une multitude de renseignements supplémentaires. La granularité est accrue, on peut établir le niveau de risque, et il s’agit d’un autre changement qui, à mon avis, transforme vraiment la façon dont les analyses sont effectuées dans notre secteur.
Fievoli : On peut se demander pourquoi nous avons besoin de plus de données. Pourquoi les assureurs ne s’en tiennent-ils pas aux données qu’ils ont toujours recueillies? Pourquoi ce besoin d’avoir plus d’information?
Cooney : Essentiellement, je crois que ce sont l’innovation et la recherche naturelle d’un avantage concurrentiel qui nous motivent. Nous sommes aussi témoins de l’évolution de la société qui nous entoure. Je crois aussi que l’émergence des téléphones intelligents et même cette nouvelle possibilité de recueillir des renseignements télématiques nous poussent, bien entendu, à tenter de trouver des moyens de tirer avantage de ces nouvelles technologies.
Dans le monde de l’assurance-vie, je crois que le recours aux analyses d’ADN est très répandu et que nous serons nombreux à obtenir des renseignements qui nous permettront d’évaluer les risques en matière de santé, outre l’analyse courante concernant nos origines.
Là encore, du point de vue de l’asymétrie des données, lorsque le proposant éventuel en sait plus que l’assureur sur ses risques spécifiques, il s’agit d’un risque qui a toujours été évalué à l’étape de la souscription, et aujourd’hui ce risque est encore plus élevé étant donné la prépondérance de certains de ces nouveaux renseignements.
Buchalter : Les mégadonnées constituent un concept assez nouveau, mais il s’agit là d’une simple évolution naturelle de l’analyse prédictive et de la classification des risques qui se poursuit dans le secteur des assurances IARD depuis plus de 30 ans.
Je suis d’accord avec Chris, nous évoluons dans un marché très concurrentiel. C’est une bonne chose pour les consommateurs, qui peuvent rechercher l’assureur qui leur convient le mieux du point de vue de la couverture et de la tarification. Cela mène aussi à une sorte de « course aux armements » en matière de données et d’analyse. En effet, l’antisélection est un problème réel et courant, et l’assureur dont la classification des risques et la tarification sont les plus précises et les plus sophistiquées sera, je dirais, le gagnant de cette course.
Et personne ne veut perdre à ce jeu d’antisélection parce que les conséquences financières sont très importantes. Les compagnies d’assurance sont donc toutes en recherche constante de nouvelles données, de nouvelles techniques d’analyse afin de pouvoir prédire avec le plus d’exactitude possible les risques que présente quiconque.
Cooney : Excellent point, Matt. De plus, le coût de stockage des données, la vitesse de la puissance de calcul, etc., tout cela a suivi une trajectoire ascendante, bien sûr, et grâce aux nouvelles méthodologies et aux codes sources ouverts, il est possible d’obtenir gratuitement les plus récentes et les meilleures méthodologies statistiques. Je crois que tout ça entre en jeu dans ce que Matthew a appelé la course aux armements et a pour effet de l’accélérer.
Fievoli : Je voudrais prendre quelques minutes pour parler un peu plus de la tarification. Mais d’abord, j’aimerais ouvrir une petite parenthèse pour parler de la confidentialité des données, parce qu’il s’agit là d’un enjeu incontournable lorsqu’il est question de mégadonnées.
Comment l’industrie gère-t-elle les attentes des titulaires de police à cet égard en particulier?
Cooney : En tant que personne travaillant au sein d’une grande organisation canadienne, je peux dire que les politiques et pratiques internes sont très axées sur la protection de la vie privée des clients.
Par exemple, selon nos directives internes il faut soumettre des évaluations de la protection des renseignements personnels avant de procéder à des recherches quant à la corrélation particulière qui existe entre des données et des résultats. De plus, tout notre personnel suit régulièrement une formation sur l’importance de la protection des renseignements personnels et le maintien de la confiance des consommateurs.
Nous accordons une attention particulière à ce que nous définissions dans l’industrie comme étant des renseignements permettant d’identifier une personne, parce que nous comprenons que le plus grand risque dans ce cas est celui posé pour nos clients. Et, bien entendu, la sécurité des renseignements est un autre élément crucial parce que nous ne sommes en mesure de protéger les renseignements personnels partagés par le client que lorsqu’ils se trouvent dans notre écosystème.
Et, bien sûr, s’il y a une possibilité de passage vers le monde extérieur, il y a un grand risque pour nos clients lorsque leurs données sont exposées.
Buchalter : Je voudrais seulement ajouter que les pratiques liées à la protection de la vie privée et à l’éthique en ce qui concerne la collecte de renseignements ne sont en aucun cas des enjeux propres au secteur des assurances.
Il existe toutes sortes de lois et de règlements très rigoureux visant la collecte et l’utilisation des renseignements personnels. La Loi sur la mise en œuvre de la Charte du numérique, adoptée récemment, précise encore davantage les responsabilités à l’égard de la collecte et de l’utilisation des renseignements personnels. Et ces principes visent tous les secteurs d’activités, y compris celui des assurances. Et l’un des principes juridiques de base de l’assurance dit qu’il s’agit d’une transaction exigeant la bonne foi la plus absolue entre l’assuré et l’assureur.
Pour moi, ce principe de bonne foi absolue vise également la collecte et l’usage responsables des données. Je crois que le secteur des assurances adhère aux normes les plus strictes possibles en matière de collecte et d’utilisation éthiques des données, de même que de stockage et d’élimination adéquats des renseignements personnels.
Cooney : Je vais faire un lien avec le terme « usage » que vous avez utilisé, Matthew. Nous examinons très souvent de très près ce que dit la déclaration de consentement. Les fins auxquelles nous utiliserons les renseignements. Encore une fois, le consentement est un élément essentiel de la discussion sur la protection de la vie privée, car si vous avez consenti à l’utilisation des renseignements à une fin particulière, et qu’ensuite la compagnie d’assurance les utilise à d’autres fins, il y a abus de confiance.
Dans le cadre des évaluations de la protection de la vie privée auxquelles je faisais référence, il s’agit d’un élément crucial qui doit être évalué préalablement à l’utilisation des renseignements en question.
Alors, par exemple, lorsque des données d’assurance basées sur l’utilisation sont partagées, nous devons nous assurer que notre analyse vise strictement les pertes et qu’elle ne touche pas d’autres domaines qui ont été divulgués lorsque le client s’est inscrit à ce régime en particulier.
Fievoli : Revenons aux questions concernant la tarification. Je suis particulièrement curieux de savoir ce en quoi les modèles de tarification et d’établissement des prix ont dû être adaptés compte tenu de ce nouveau registre en matière de collecte de données. J’espère donc que vous êtes en mesure de nous parler de nouvelles techniques que vous avez vu appliquer à cet égard.
Buchalter : Je crois que le premier grand changement réside dans le volume considérable de données. Si vous analysez un portefeuille contenant, disons, 100 000 polices, avant l’ère des mégadonnées, cela aurait représenté 100 000 entrées, 100 000 ensembles de caractéristiques de risque, chacun d’entre eux étant lié à l’expérience en matière de sinistres pour cette police au cours d’une période donnée.
Mais maintenant, si je reprends mon exemple de la télématique dans les véhicules, le dispositif enregistre des données toutes les dix minutes, toutes les cinq minutes, chaque minute, toutes les trente secondes. Le nombre d’entrées par police par période et le nombre de champs par entrée augmentent de façon exponentielle. Cela donne lieu à toutes sortes de considérations en ce qui concerne le stockage des données, l’analyse des mégadonnées, l’intelligence artificielle, l’apprentissage machine, soit toutes ces choses qui n’étaient pas vraiment nécessaires avant l’avènement des mégadonnées.
Il y a toujours eu des mégadonnées dans le domaine des assurances. Mais lorsqu’il s’agit de gérer 100 millions d’entrées par rapport à 100 000 entrées, les façons de les traiter ne sont plus les mêmes. Nous avons dû nous adapter à cette réalité pour assurer la tarification.
Cooney : J’ai aussi fait allusion plus tôt à l’évolution des méthodologies de modélisation. Je crois qu’il s’agit également d’un point important. Par exemple, le grand pouvoir prédictif du modèle XGBoost est reconnu dans la communauté statistique.
Il existe de nouvelles méthodologies et techniques d’apprentissage profond qui permettent un accès accru à de nouveaux types de sources d’information, par exemple, des données d’image telles que l’imagerie satellite.
Nous pourrions vouloir, par exemple, évaluer la superficie d’un toit au moyen de données issues d’imagerie satellite. Voilà une question de moins à poser au consommateur qui nous appelle pour assurer sa maison. Il s’agit donc d’un avantage tant pour le consommateur que pour l’assureur.
Nous sommes en mesure d’accéder à de nouvelles sources de renseignements, ce qui nous permet d’offrir une meilleure expérience client. L’autre chose à laquelle je ferai allusion dans une optique d’avenir, c’est que nous sommes évidemment tous préoccupés par l’augmentation de la fréquence des tempêtes et des risques climatiques. Je crois donc qu’il s’agit fort probablement d’un domaine qui connaîtra une révolution dans l’avenir, à savoir l’incidence qu’auront les risques climatiques et certaines de ces tendances à plus long terme sur la viabilité de nos marchés d’assurance du point de vue du potentiel de risque catastrophique.
Fievoli : Je comprends donc que plus nous ajoutons de données aux fins de la classification des risques, plus il peut y avoir de conséquences, disons, inattendues. Peut-être pourriez-vous nous donner quelques exemples, réels ou hypothétiques, de situations auxquelles vous pourriez être confronté lorsqu’il s’agit d’établir une structure tarifaire pour une assurance?
Buchalter : Je crois que les conséquences indésirables inattendues découlent souvent de la non-utilisation de certaines variables de classification des risques en raison d’une loi ou un d’un règlement, qui provient généralement d’une bonne intention au départ.
J’ai un exemple vécu il y a longtemps dans ma carrière. Lorsque je travaillais dans le domaine de la tarification de l’assurance automobile, une des provinces avait décidé que l’âge du conducteur n’était plus un facteur de tarification acceptable.
Les compagnies ont donc commencé à passer d’un modèle de tarification basé sur l’âge du conducteur à un modèle basé sur le nombre d’années écoulé depuis l’obtention du permis, un facteur relié de près à l’âge pour la majorité des conducteurs, qui obtiennent habituellement leur permis vers l’âge de 16, 17 ou 18 ans.
Mais ce n’est pas le cas pour tous les conducteurs. Certaines personnes obtiennent leur permis à un âge beaucoup plus avancé. Cela peut être attribuable à un changement survenu dans la famille ou parce qu’on est déménagé de la ville vers la banlieue où il est nécessaire de conduire. Cela peut aussi être le cas de nouveaux arrivants au Canada qui obtiennent leur permis à un âge plus avancé.
Les conséquences imprévues de ce règlement étaient telles que, par exemple, on pouvait devoir assurer un conducteur de 50 ans titulaire d’un permis depuis deux ans. Or, comme le système de tarification se fondait sur le nombre d’années écoulé depuis l’obtention du permis, cette personne de cinquante ans se voyait imposer des primes équivalentes à celles que devrait payer un jeune conducteur de 18 ans titulaire de son permis depuis deux ans.
Je dirais qu’il y a de sérieuses différences quant au comportement au volant d’un jeune de 18 ans ayant 2 ans d’expérience et celui d’une personne de 50 ans ayant 2 ans d’expérience.
Je suis certain que telle n’était pas l’intention du règlement, mais tout comme l’eau qui s’écoule toujours vers le point le plus bas, lorsqu’il y a des contraintes réglementaires, les compagnies d’assurance et les actuaires chargés de la tarification feront toujours preuve de créativité pour trouver des moyens d’innover en matière de tarification tout en respectant les directives réglementaires.
Voilà un exemple de ce qui s’est produit dans ce cas. La leçon qu’on peut en tirer, c’est que lorsqu’on adopte une réglementation trop normative en ce qui concerne les éléments de données qui peuvent ou qui ne peuvent pas être utilisés, il y a un risque élevé de conséquences imprévues dans lesquelles, en tant que chargé de la réglementation ou législateur, vous pouvez vous attendre à un ensemble de résultats et obtenir quelque chose de très différent.
Cooney : Je me souviens que notre comité [de la classification des risques] a discuté en long et en large de l’intersection entre ce que j’appellerai l’économie de marché et l’équité sociale, et nous avons constaté qu’il fallait atteindre un équilibre. Certains commentaires formulés indiquaient que les actuaires ne peuvent pas ignorer les problèmes sociaux potentiels.
C’est ce que nous avons entendu dans de nombreux commentaires au sujet de notre article et nous sommes entièrement d’accord : nous avons une responsabilité envers le bien public. Nous constations aussi qu’il existe un défi tout aussi important sur le plan économique, en ce que les actuaires sont des défenseurs de la résilience du système du transfert de risques.
Je ne sais pas s’il s’agit d’une responsabilité vraiment bien connue des actuaires, mais c’est quelque chose qui nous est revenu. En effet, comme Matthew y a fait allusion, lorsque l’on crée cette discontinuité sur le marché, les forces économiques – et je me souviens que la Facility Association n’a pas utilisé le facteur du nombre d’années écoulé depuis l’obtention du permis lorsque le facteur de l’âge a été éliminé, ils ont fini par avoir tous les jeunes conducteurs sur le marché. Ce sont donc des forces très réelles qui entrent en jeu.
Voici un autre exemple que je voudrais mentionner. On a beaucoup parlé du coût plus élevé des taux d’assurance automobile à Brampton, mais il y a eu très peu d’études sur les facteurs sous-jacents.
Par exemple, la région de Brampton (Ontario) compte beaucoup de routes à six voies où les véhicules peuvent rouler à grande vitesse. C’est une collectivité qui a été construite pour faciliter les déplacements domicile-travail et je sais, pour avoir vécu à proximité de la région de Brampton, qu’il est beaucoup plus difficile de tourner à gauche lorsqu’il y a trois voies de circulation en sens inverse que lorsqu’il y en a une seule.
Ce sont les types de faits qui sont rarement pris en compte. Je crois que le recours à des analyses plus granulaires, par exemple, les endroits où surviennent les collisions; la nature de la gravité d’un accident serait utile. Par exemple, enregistre-t-on des collisions plus graves sur les routes à six voies là où les vitesses sont plus élevées?
Je crois qu’il s’agit là d’un moyen de mettre davantage l’accent sur le problème et, en fait, de contribuer à résoudre certains problèmes sous-jacents auxquels sont attribuables les coûts plus élevés. Je me plais à dire que nos modèles permettent de repérer les problèmes. Ce que nous en faisons est une étape cruciale qui fait appel à de nombreuses parties pour les résoudre de manière constructive.
Fievoli : Concluons en portant un regard vers l’avenir. Comment entrevoyez-vous l’évolution de la collecte de données au cours des prochaines années? Croyez-vous que nous allons commencer à recueillir davantage de données, différents types de données ou croyez-vous plutôt qu’à un certain moment, nous atteindrons une limite naturelle à laquelle nous aurons fait tout ce que nous pouvions dans le cadre de nos modèles de tarification actuels?
Buchalter : Les mégadonnées et l’analyse prédictive n’ont rien de statique. Ces domaines évoluent et s’améliorent constamment, non seulement dans le domaine des assurances, mais dans tous les secteurs, que ce soit les sports, les suggestions de films ou encore le magasinage. Et je dirais que nous n’y faisons pas exception. Qui sait ce que l’avenir nous réserve? Mais j’aurais du mal à croire que les améliorations ne se poursuivront pas en matière de collecte de données et de technologie analytique.
Je crois que la seule limite naturelle serait un avenir imaginaire déterministe et prévisible dans lequel plus rien ne serait aléatoire. Il serait intéressant d’avoir une discussion philosophique quant à la possibilité d’un tel monde, mais je crois que dans un proche avenir, cela relèverait de la science-fiction. Je ne crois donc pas que nous serons confrontés de sitôt à une limite naturelle en matière d’analyse prédictive, que ce soit dans le domaine des assurances, de la classification des risques ou dans quelque autre domaine que ce soit.
Cooney : J’ai participé au congrès actuariel [act22], dans le cadre duquel j’ai présenté un segment concernant les facteurs ESG [environnementaux, sociaux et de gouvernance] en mettant vraiment l’accent sur l’intersection entre le bien social et certaines de ces questions.
Je crois que la seule chose que j’aimerais souligner, encore une fois, c’est que notre marché et les questions sociales sont voués à se heurter. Je crois qu’à mesure que nous atteindrons des niveaux de détail plus granulaires, les possibilités de collision continueront d’augmenter.
Et je soulèverais de nouveau l’exemple de la tarification régionale en assurance automobile. Si, par exemple, la tarification de l’assurance automobile tenait compte du code postal, je crois qu’il s’agit d’un domaine où, encore une fois, les forces du marché s’exerceront. Mais il y a aussi des enjeux sociaux avec lesquels nous devons composer en réponse à cela, et comme je le mentionnais dans mon exposé, nous devons, une fois encore, aborder ces questions en collaboration. L’organisme de réglementation doit y jouer un rôle.
Il existe aussi au sein des organisations des protocoles en matière de partialité et d’équité qui nous obligent à aborder ces questions et à nous interroger. Ce qu’il ne faut surtout pas faire, c’est d’ignorer la situation. Et comme je l’ai mentionné dans mon exposé, la communauté actuarielle a, selon moi, un rôle important à jouer pour ce qui est d’aider à comprendre les endroits où ces enjeux vont se heurter et de contribuer à la sensibilisation quant aux façons de résoudre la situation de manière constructive.
Nous ne sommes pas toujours en mesure de produire les solutions de manière autonome parce que, comme je l’ai mentionné, la solution nécessite parfois l’intervention d’un responsable de la réglementation. Un mécanisme de mise en commun ou de partage pourrait contribuer à résoudre certains enjeux qui vont être regroupés. Mais il ne faut surtout pas faire fi de la situation.
Fievoli : Beaucoup de questions intéressantes. Je vous remercie tous les deux d’avoir pris part à notre balado aujourd’hui pour en parler avec nous.
Cooney : Merci, Chris.
Buchalter : Merci, Chris.
Fievoli : Encore une fois, vous pouvez consulter l’énoncé relatif aux mégadonnées et à la classification des risques sur le site Web de l’ICA. Nous avons aussi publié plus de 100 épisodes de notre balado depuis trois ans. Nous vous invitions à vous y abonner. Vous pouvez le faire sur n’importe quelle plateforme sur laquelle vous accédez à ce contenu. Nous aimerions aussi vous entendre. Si vous avez des suggestions ou des idées d’épisodes, vous pouvez les transmettre à balados@cia-ica.ca.
Nous sommes toujours à la recherche de contenu pour notre blogue Voir au-delà du risque. S’il y a des idées dont vous aimeriez nous faire part, vous pouvez nous joindre à l’adresse voiraudeladurisque@cia-ica.ca.
À la prochaine. Je m’appelle Chris Fievoli et je vous remercie d’avoir écouté notre balado Voir au-delà du risque.
Cette transcription a été révisée par souci de clarté.