L’interprétation correcte des données est un défi de taille auquel sont confrontées toutes les organisations. Dans un environnement toujours plus dynamique, qui exige la prise de décisions opportunes et pertinentes, l’analyse des données est devenue un outil de plus en plus important. Dans le contexte de la crise de la COVID-19 en particulier, l’utilisation des technologies analytiques a permis aux institutions de mieux évaluer l’impact sanitaire et social de la pandémie et d’améliorer les processus décisionnels.
L’analyse des données peut être définie comme l’examen d’un ensemble de données dans le but d’en tirer des conclusions afin de soutenir la prise de décisions, ou simplement pour mieux comprendre des questions particulières.
L’analyse des données comprend ainsi un ensemble de techniques utilisées pour établir des conclusions et des recommandations à partir de données. Les différentes techniques d’analyse des données se répartissent en quatre grandes catégories en fonction des informations qu’elles permettent d’obtenir: descriptives, diagnostiques, prédictives et prescriptives.
Analytique descriptive: ce type d’analyse est généralement effectué à partir d’un ensemble de données volumineux qui, à première vue, n’est pas très informatif. Des techniques de nettoyage, de classement, de traitement et de visualisation sont appliquées afin d’illustrer les développements au sein des organisations sous une forme accessible. L’analytique descriptive produit une analyse des résultats d’événements ou de phénomènes particuliers et permet d’identifier ce qui s’est passé. Les résultats indiquent simplement si quelque chose va bien ou non, sans expliquer pourquoi.
Analytique de diagnostic: elle fournit des informations détaillées sur une question spécifique et identifie la raison d’un événement ou d’un phénomène particulier. Les données historiques peuvent être comparées à d’autres données pour répondre à la question de savoir pourquoi quelque chose s’est produit.
Des informations détaillées sont nécessaires pour effectuer ce type d’analyse. Dans le cas contraire, la collecte de données requises pour chaque question spécifique peut s’avérer inefficace et fastidieuse.
Analytique prédictive: ce type d’analyse s’appuie sur l’application de modèles et techniques mathématiques et statistiques aux données historiques détenues par l’organisation. L’analytique prédictive ne permet pas de déterminer avec une certitude absolue ce qui va se passer puisqu’elle est basée sur des niveaux de probabilité, mais elle montre ce qui pourrait potentiellement se produire. Elle s’appuie sur les résultats de l’analytique descriptive et de diagnostic pour identifier les groupes et les valeurs anormales, qui sont utilisés comme base pour les modèles prédictifs. Ces modèles, appliqués à une grande quantité de données, permettent de prévoir ce qui est susceptible de se produire avec un degré donné de probabilité.
L’analytique prédictive est une forme avancée d’analyse de données qui apporte de nombreux avantages, comme l’utilisation de l’apprentissage automatique. Cependant, il est important de ne pas perdre de vue le fait qu’une prévision n’est qu’une estimation. Puisqu’elle est basée sur une analyse de la corrélation entre les variables et de la façon dont elles pourraient se développer, son exactitude dépend dans une large mesure de la qualité des données sous-jacentes.
Analytique prescriptive: ce type d’analyse implique la collecte de données, la recommandation d’actions et la prévision de leur impact, afin de faciliter et d’automatiser la prise de décisions en identifiant la meilleure décision à partir d’un ensemble d’options.
Elle vise à répondre à des questions comme: «Que pouvons-nous faire pour empêcher que cela se produise?» ou «Que pouvons-nous faire pour que cela se produise?». Elle permet de définir les mesures à prendre pour prévenir un problème futur ou pour tirer le meilleur parti d’une tendance.
Ce type d’analyse nécessite non seulement des données historiques internes, mais aussi des informations externes, en raison de la nature des algorithmes mathématiques sous-jacents.
Graphique 1: Les différents types d’analyses de données
Le graphique 1 présente les différentes catégories d’analyses de données, leur valeur ajoutée et leur complexité en termes de mise en œuvre.
L’utilisation de ces techniques est particulièrement importante dans le domaine de la sécurité sociale, car elles permettent aux institutions de tirer le meilleur parti du volume de plus en plus important de données disponibles, d’une part pour détecter et expliquer des événements inhabituels et d’autre part pour construire des modèles prédictifs permettant d’anticiper les nouveaux développements.
Ces analyses ont de nombreuses applications. Un nombre croissant d’institutions utilisent les technologies analytiques dans divers domaines, comme la prévention de la fraude, l’analyse des performances des processus, l’évaluation et l’ajustement des programmes sociaux, la mise en œuvre de mesures de prévention, le développement proactif de la politique sociale et les services de soins de santé.
L’Association internationale de la sécurité sociale (AISS) a élaboré des lignes directrices en matière de technologies de l’information et de la communication qui comprennent des directives sur l’application des technologies d’analyse de données. Plus précisément, il existe quatre lignes directrices, une pour chaque catégorie d’analyse de données décrite ci-dessus (lignes directrices 54 à 57), ainsi que des lignes directrices distinctes sur le big data (ligne directrice 58) et sur l’apprentissage automatique et son utilisation pour soutenir le processus décisionnel (ligne directrice 59).
Expériences en matière d’application des techniques analytiques pour lutter contre la pandémie
Des exemples de bonnes pratiques dans ce domaine ont été présentés lors du Prix AISS 2020 des bonnes pratiques pour les Amériques, ainsi que lors de webinaires et d’autres activités de l’AISS. Ces exemples illustrent bien le fait que les techniques analytiques suscitent actuellement beaucoup d’intérêt et qu’elles sont de plus en plus utilisées par les institutions de sécurité sociale. Dans le contexte de la crise sanitaire liée à la pandémie de COVID-19, ces techniques se sont avérées être un outil précieux, particulièrement pertinent dans le domaine des services de soins de santé.
Costa Rica
La Caisse d’assurance sociale de Costa Rica (Caja Costarricense de Seguro Social, CCSS) a appliqué des techniques analytiques afin d’assurer le suivi de la pandémie de COVID-19 au sein de la population et celui de la prise en charge correspondante dans les établissements de santé de la CCSS. Pendant la crise sanitaire, la nécessité de disposer en temps opportun d’informations exactes à des fins de suivi et pour soutenir la prise de décisions en vue de gérer la pandémie était évidente.
Il a donc été décidé qu’une source unique d’information devrait être mise en place, en s’appuyant sur les informations fiables et adaptables dont dispose la CCSS en matière de santé afin d’effectuer une analyse de traçabilité des patients atteints de la COVID-19. À cette fin, il était nécessaire de consolider les données provenant des établissements de santé et de s’appuyer sur les données de référence de l’institution.
L’application qui en résulte met également l’accent sur l’utilisation d’outils informatiques décisionnels pour gérer les informations statistiques et ainsi permettre de fournir en temps voulu des données relatives aux soins de santé liés à la COVID-19. L’objectif est de favoriser la prise de décisions fondée sur les données, en particulier sur un plan stratégique. Cela requiert un accès plus facile à l’information statistique ainsi que l’utilisation d’outils d’analyse des données.
Dans l’ensemble, l’application des technologies analytiques a effectivement aidé la CCSS à prendre des décisions fondées sur les données. Elle a été en mesure de quantifier l’impact sur les services et d’adapter la prestation des services en conséquence. Parallèlement, cette application a soutenu la transition numérique propre à l’institution, notamment par l’adoption de technologies d’analyse de données.
L’approche de la CCSS est basée sur l’analytique descriptive et de diagnostic.
Mexique
Grâce à cette approche de gouvernance des données, l’IMSS peut fournir des informations précieuses à ses principaux membres. Cela facilite la prise de décisions tant au niveau de la direction qu’au niveau opérationnel. Les informations géographiques et statistiques dont dispose l’institution lui permettent de gérer les niveaux des stocks, les incapacités des bénéficiaires causées par des problèmes de santé liés à la COVID-19 et les données relatives aux entreprises en ce qui concerne la conformité aux variables de retour au travail. À travers cette approche, l’IMSS cherche à traiter des questions telles que les doublons au niveau des efforts déployés, les occasions manquées de fournir des informations précieuses, ainsi que la normalisation, la traçabilité, l’intégrité et la qualité médiocres des données. Ces aspects sont typiques des données provenant d’institutions qui fournissent différents services et détiennent d’importants volumes d’informations dans divers répertoires de données non reliés.
L’approche de l’IMSS en matière de gouvernance des données repose sur trois piliers: un changement culturel chez les individus, des processus améliorés grâce à une vision plus globale et le développement technologique, avec la mise en œuvre d’un lac de données dans le cadre d’une solution intégrée. Une fois ces bases en place, des outils analytiques peuvent ensuite être déployés pour effectuer l’analyse des données. Celle-ci fournit des informations utiles de qualité et permet d’identifier les tendances et les valeurs anormales. Elle facilite l’harmonisation nécessaire à un échange transparent et sûr d’informations avec d’autres institutions.
Encore une fois, dans le même contexte, l’exploitation de données massives sur la base d’un lac de données permet de visualiser et de gérer l’évolution de la pandémie en appliquant des variables telles que le nombre de cas, le taux d’occupation des hôpitaux, l’état de santé des patients et le nombre de décès par région, le sexe, l’âge, l’unité médicale, etc.
L’approche de l’IMSS est basée sur l’analytique descriptive et de diagnostic.
Pérou
L’approche d’EsSalud – Institut d’assurance sociale de santé (EsSalud – Seguro Social de Salud) du Pérou a consisté en la création d’une unité de veille et d’analyse des données, dont l’objectif est de fournir en temps opportun des informations complètes de qualité, en s’appuyant sur l’analyse des données pour étayer les décisions stratégiques institutionnelles. La création de cette unité vise à favoriser une gestion moderne et efficace de l’institution dans l’intérêt des bénéficiaires, en fournissant en temps opportun des informations pertinentes et de qualité aux cadres dirigeants afin de soutenir les prises de décisions.
Un autre aspect de cette approche consiste à élaborer des applications et d’autres stratégies innovantes, d’une part pour communiquer avec les cadres dirigeants, d’autre part pour optimiser la conservation des dossiers et favoriser l’intégration des données de l’institution. L’une des applications fondamentales est la carte de densité (Mapa de calor), qui montre l’évolution de la pandémie au Pérou en représentant graphiquement «l’itinéraire du virus» à mesure qu’il se propage, les zones à prévalence élevée, etc.
La mise à disposition d’informations pertinentes, actualisées quotidiennement, permet d’analyser les rendez-vous différés, de suivre les visites à domicile, d’envoyer des alertes concernant les hospitalisations prolongées et de surveiller la disponibilité de lits dans les hôpitaux.
Il convient de souligner que l’objectif d’EsSalud est non seulement de générer des informations à usage interne, mais aussi de coopérer avec d’autres organismes publics en partageant les résultats obtenus. Des informations du Registre national d’identification (Registro Nacional de Identificación) et de l’état civil (Estado civil) ont notamment été utilisées.
L’approche d’EsSalud est basée sur l’analytique descriptive et de diagnostic.
Résultats obtenus
Ces institutions ont obtenu des résultats positifs grâce à l’application de technologies analytiques. Elles ont été en mesure de mettre en place des mécanismes spécifiques pour surmonter les défis liés à la pandémie et ont également développé leur capacité à appliquer ces technologies dans d’autres contextes. Le tableau 1 présente les résultats.
Pays | Résultats obtenus pour les systèmes de soins de santé |
---|---|
Costa Rica - CCSS | Renforcement des processus décisionnels. |
Production d’informations permettant de planifier les services post-COVID-19. L’impact sur les services a pu être mesuré, et la proportion des prestations réalisées est la suivante:
|
|
Mexique - IMSS | Mise en œuvre d’une plateforme de données unique pour la COVID-19 utilisant les technologies de lac de données et de données massives. La plateforme a reçu 86 422 visites de 445 utilisateurs. |
Les informations sont partagées avec le ministère de la Santé (chargé de la coordination des politiques en matière de pandémie) et d’autres institutions. | |
Peru - EsSalud | Des rapports quotidiens de suivi de la pandémie ont été fournis et comprenaient les informations suivantes:
|
Mise en œuvre d’applications telles que la carte de densité (Mapa de calor), et diffusion de cartes et d’infographies facilitant l’interprétation de l’information. Mise en place d’un tableau de bord fournissant des alertes sur les séjours prolongés et la disponibilité des lits dans les hôpitaux, accessible en ligne avec des informations actualisées en temps réel. |
|
Les informations sont partagées avec au moins douze gouvernements locaux et deux ministères. |
Le potentiel et les limites de l’analytique prédictive
L’Organisation panaméricaine de la santé (OPS) souligne l’importance de l’analytique prédictive dans la lutte contre la COVID-19, car elle permet de prévoir l’évolution de la pandémie avec un degré acceptable d’incertitude. Sur la base de ces informations, les institutions peuvent anticiper la demande approximative en services médicaux de courte durée, déterminer les délais de levée partielle ou totale des mesures de confinement et même prévoir les nouveaux besoins pouvant survenir (OPS, 2021).
Par ailleurs, l’OPS relève également que les modèles de prévision ont certaines limites lorsqu’ils sont appliqués à un contexte tel que celui de la pandémie, puisqu’ils comprennent une certaine incertitude inhérente qui affecte leur performance et qui peut être difficile à quantifier. L’introduction de délais et l’hétérogénéité des données analysées peuvent notamment conduire à une plus grande incertitude. Il est essentiel de réaliser une «analyse de sensibilité» pour mieux appréhender l’incertitude. Cette technique est utilisée pour évaluer l’impact qu’une variable dépendante particulière, sous un ensemble donné d’hypothèses, pourrait avoir sur le résultat global. L’incertitude peut être réduite en augmentant la taille de l’échantillon et en améliorant la qualité des données utilisées dans le modèle. Le volume et la qualité des données sont par conséquent essentiels pour ces techniques analytiques (OPS, 2021).
Facteurs de réussite
Toutes les expériences décrites soulignent l’importance de divers facteurs lors de l’application de techniques analytiques dans le contexte de la COVID-19.
Un premier facteur est celui de l’équipe, un élément essentiel de la stratégie de mise en œuvre des techniques analytiques. Il faut donc créer des équipes multidisciplinaires avec des rôles clairement définis. Il est toujours important que les comités comprennent des membres spécialisés dans différents domaines car cela permet d’étendre les définitions au besoin.
Au sein d’EsSalud, une unité d’analyse composée d’une équipe multidisciplinaire a été créée. Cette unité dispose d’un plan stratégique souple lui permettant d’élaborer et d’ajouter des innovations à la stratégie d’analyse de l’institution. Au Mexique, l’IMSS a mis en place une équipe conjointe pour le travail en collaboration. Des rôles spécifiques ont été définis dans les domaines de l’analyse, de la qualité des données, de l’architecture et de la propriété fonctionnelle des données. Un comité exécutif pour les données a été créé.
L’appui des cadres dirigeants est également essentiel à ce type d’initiative, notamment pour assurer la viabilité de la mise en œuvre. En effet, les initiatives d’analyse des données impliquent généralement différentes institutions, rassemblant des données et des processus provenant de plusieurs domaines d’intérêt. Elles peuvent également exiger la conclusion d’accords avec d’autres organisations. L’IMSS au Mexique et le CCSS au Costa Rica ont pu compter sur l’engagement et le soutien de leurs cadres dirigeants, ce qui a été l’une des clés de la réussite des deux initiatives.
La flexibilité des modèles mis en œuvre peut aussi être considérée comme un facteur crucial. Ces modèles doivent évoluer pour refléter le changement des réalités. Il est également important que les modèles soient spécifiques et non généraux, car la performance des prévisions s’en trouve améliorée. Dans le cas d’EsSalud, la polyvalence du modèle de carte de densité a permis de l’adapter au besoin croissant d’informations découlant de l’urgence sanitaire.
Un autre facteur capital est la qualité des données, qui constitue le principal fondement de toute initiative d’analyse des données. La prise de décisions fondée sur les données nécessite des données fiables, sans quoi la performance de l’analyse et la validité des conclusions sont limitées. La meilleure façon de garantir la qualité des données est de prendre des mesures afin de s’assurer que des données de bonne qualité sont utilisées dès le départ, et d’éviter ainsi de devoir nettoyer les données ultérieurement.
Le CCSS au Costa Rica et EsSalud au Pérou ont développé une culture de prise de décisions fondée sur les données. Des mesures ont été prises pour compenser tout manque d’expérience ou de connaissance de cette approche, étant donné qu’il était entendu que la qualité des données et l’interprétation correcte des informations sont essentielles pour s’assurer que les bonnes décisions sont prises.
Conclusion
Les techniques traditionnelles d’analyse des données permettent la création automatique de rapports et de tableaux de bord qui offrent une vue rétrospective de l’organisation, afin de répondre à des questions comme «Que s’est-il passé?» et «Pourquoi cette situation s’est-elle produite?». Par ailleurs, en plus de soutenir la prise de décisions en fournissant une analyse descriptive des données, les techniques avancées d’apprentissage automatique, telle que l’analytique prédictive et prescriptive, peuvent fournir une perspective prospective d’une organisation qui soutient la prise de décisions tout en optimisant les processus opérationnels et en augmentant la productivité.
L’importance de l’analyse des données s’est accrue au cours des dernières années, comme le montrent le nombre de bonnes pratiques décrites dans le présent document ainsi que les diverses présentations en ligne sur le sujet. Les outils d’analyse des données jouent un rôle de plus en plus central dans les organisations. L’analyse des données ne doit pas être considérée de façon isolée, mais plutôt dans le contexte des processus opérationnels et décisionnels, et en lien avec la gestion et la qualité des données sous-jacentes pour garantir que l’interprétation des données est fondée.
Il est également utile de souligner la capacité institutionnelle des organisations qui avaient déjà des projets d’analyse de données en cours, celle-ci leur ayant permis de recentrer leurs efforts dans le contexte de l’urgence sanitaire.
En résumé, face à la crise sanitaire liée à la COVID-19, un certain nombre d’institutions de sécurité sociale ont consolidé ou commencé à développer des solutions de ce type.
Références
AISS. 2019a. Lignes directrices de l’AISS en matière de technologies de l’information et de la communication (Édition revue et augmentée). Genève, Association internationale de la sécurité sociale.
AISS. 2019b. Lignes directrices de l’AISS en matière de qualité des services (Édition révisée). Genève, Association internationale de la sécurité sociale.
Caisse d'assurance sociale de Costa Rica. 2019. Solutions automatisées de l’intelligence analytique pour la santé: appui à la gestion de la pandémie de la COVID-19 au Costa Rica (Bonnes pratiques en sécurité sociale). Genève, Association internationale de la sécurité sociale.
Commission technique des technologies de l’information et de la communication. 2019. Appliquer les technologies émergentes dans le domaine de la sécurité sociale. Genève, Association internationale de la sécurité sociale.
EsSalud - Institut d'assurance sociale de santé. 2020. Alerte sur la progression de la COVID-19: la carte de densité de l’Unité de veille et d’analyse des données (Bonnes pratiques en sécurité sociale). Genève, Association internationale de la sécurité sociale.
Institut mexicain d'assurance sociale. 2020. Stratégie analytique de l’Institut mexicain d’assurance sociale: l’importance des données dans la lutte contre la pandémie de COVID-19 (Bonnes pratiques en sécurité sociale). Genève, Association internationale de la sécurité sociale.
OPS. 2021. Why predictive modeling is critical in the fight against COVID-19 (COVID-19 Factsheets). Washington, DC, Organisation panaméricaine de la santé. Également disponible en espagnol.