Die korrekte Interpretation von Daten stellt eine große Herausforderung für alle Organisationen dar. In einer Welt, in der alles immer schneller gehen muss und in der unverzügliche und angemessene Entscheidungen verlangt werden, ist die Datenanalyse zu einem immer wichtigeren Instrument geworden. Insbesondere im Kontext von COVID-19 ermöglichte der Einsatz von Analysetechnologien den Institutionen, die gesundheitlichen und sozialen Auswirkungen der Pandemie besser einzuschätzen und die Entscheidungsfindung zu verbessern.
Datenanalyse lässt sich definieren als die Wissenschaft von der Prüfung eines Datensatzes mit dem Ziel, daraus Schlussfolgerungen zu ziehen, um die Entscheidungsfindung zu unterstützen oder ganz einfach das Verständnis eines bestimmten Problems zu vertiefen.
Dementsprechend verwendet die Daten
Deskriptive Datenanalyse: Diese Art von Analyse wird gewöhnlich an einem großen Datensatz durchgeführt, der auf den ersten Blick nicht sehr informativ erscheint. Techniken zur Bereinigung, Sortierung, Verarbeitung und Darstellung erlauben es, Entwicklungen in Organisationen in einem übersichtlichen Format zu verdeutlichen. Die deskriptive Datenanalyse untersucht die Ergebnisse eines bestimmten Ereignisses oder Phänomens und zeigt auf, was geschehen ist. Die Outputs geben Aufschluss darüber, ob etwas gut läuft, ohne jedoch die Gründe dafür zu erklären.
Diagnostische Analyse: Sie bietet ausführliche Informationen über ein bestimmtes Problem und ermittelt die Ursache für ein bestimmtes Ereignis oder Phänomen. Historische Daten können mit anderen Daten verglichen werden, um die Frage zu beantworten, warum etwas eingetreten ist.
Die Durchführung dieser Art von Analyse erfordert ausführliche Informationen, da sich die Datenerhebung sonst für jedes einzelne Problem als ineffizient und zeitaufwendig erweisen kann.
Prädiktive Analyse: Diese Art der Analyse wendet mathematische und statistische Modellbildung und Techniken auf historische Daten der jeweiligen Organisation an. Die prädiktive Analyse kann nicht mit absoluter Sicherheit ermitteln, was in Zukunft geschehen wird, denn sie beruht auf Wahrscheinlichkeitsgraden. Sie zeigt jedoch auf, was man erwarten kann. Sie stützt sich auf die Outputs der deskriptiven und der diagnostischen Analyse, um Gruppen und Abweichungen zu ermitteln, die als Grundlage für die prädiktiven Analysemodelle dienen. Diese Modelle können bei Anwendung auf eine große Menge von Daten eine Prognose dessen ergeben, was mit einem bestimmten Grad der Wahrscheinlichkeit geschehen könnte.
Die prädiktive Analyse ist eine fortgeschrittene Art der Datenanalyse, die viele Vorteile bietet, darunter die Verwendung maschinellen Lernens. Allerdings darf dabei nicht vergessen werden, dass eine Prognose nur eine Schätzung ist. Da sie auf einer Analyse der Korrelation zwischen Variablen und deren möglicher Entwicklung basiert, hängt ihre Genauigkeit weitgehend von der Qualität der zugrundeliegenden Daten ab.
Präskriptive Datenanalyse: Diese Art der Analyse umfasst die Sammlung von Daten, die Empfehlung von Maßnahmen und die Vorhersage der Auswirkungen, die diese haben werden. So soll die Entscheidungsfindung erleichtert und automatisiert werden, indem aus einer Reihe von Möglichkeiten die beste Entscheidung ausgewählt wird.
Die präskriptive Datenanalyse will Fragen beantworten wie „Was kann ich tun, um zu verhindern, dass dies geschieht?“ oder „Was kann ich tun, damit dies geschieht?“. Sie schlägt Maßnahmen vor, um ein künftiges Problem zu vermeiden oder um einen Trend optimal zu nutzen.
Für diese Art von Analyse benötigt man aufgrund der Beschaffenheit der verwendeten mathematischen Algorithmen nicht nur interne historische Daten, sondern auch externe Informationen.
Schaubild 1: Verschiedene Arten von Datenanalyse
Schaubild 1 fasst die Kategorien, ihren Mehrwert und ihre Komplexität bei der Umsetzung zusammen.
Der Einsatz dieser Techniken ist im Bereich der sozialen Sicherheit besonders wichtig, denn sie ermöglichen es Institutionen, die ständig wachsende große Menge an verfügbaren Daten optimal zu nutzen, um ungewöhnliche Ereignisse aufzudecken und zu erklären und prädiktive Modelle zu entwerfen, die bei der Vorwegnahme neuer Entwicklungen helfen können.
Für diese Art von Analyse gibt es viele Einsatzmöglichkeiten. Immer mehr Institutionen verwenden Analysetechnologien in einer Reihe von Bereichen. Dazu gehören: Vorbeugung von Betrug, Prozessleistungsanalyse, Bewertung und Anpassung von Sozialprogrammen, Umsetzung von vorbeugenden Maßnahmen, proaktive Entwicklung von Sozialpolitik und Gesundheitsdienstleistungen.
Die Internationale Vereinigung für Soziale Sicherheit(IVSS) hat Leitlinien über Informations- und Kommunikationstechnologie entwickelt, die Orientierungshilfen für den Einsatz von Datenanalysetechnologien bieten. Es gibt insbesondere vier Leitlinien, eine für jede der oben erwähnten Kategorien der Datenanalyse (Leitlinien 54 bis 57), sowie je eine eigene Leitlinie über Big Data (Leitlinie 58) und maschinelles Lernen zur Unterstützung der Entscheidungsfindung (Leitlinie 59).
Erfahrungen beim Einsatz von Analysetechniken zur Bekämpfung der Pandemie
Beispiele guter Praxis in diesem Bereich wurden für den IVSS-Wettbewerb um den Preis für gute Praxis für Amerika 2020 und anlässlich von Webinaren und anderen IVSS-Tätigkeiten vorgestellt. Aus diesen Beispielen geht eindeutig hervor, dass der Einsatz von Analysetechniken ein Bereich von aktuellem Interesse ist und sie immer häufiger von Institutionen der sozialen Sicherheit verwendet werden. Während der Coronavirus-Krise erwiesen sich diese Techniken als wertvolle Instrumente insbesondere für die Anwendung im Bereich der Gesundheitsdienstleistungen.
Costa Rica
Die Sozialversicherungskasse von Costa Rica (Caja Costarricense de Seguro Social – CCSS) verwendete Analysetechniken, um die Ausbreitung von COVID-19 in der Bevölkerung zu verfolgen und die von den Gesundheitseinrichtungen der Kasse bereitgestellten Leistungen zu überwachen. In der Krisenzeit bestand ein klarer Bedarf an schnell verfügbaren und genauen Informationen für die Nachverfolgung der Entwicklungen und als Unterstützung für Entscheidungen zur Bewältigung der Pandemie.
Aus diesem Grund wurde beschlossen, eine einheitliche Informationsquelle zu entwickeln und sich dabei auf die der Sozialversicherungskasse verfügbaren soliden und anpassungsfähigen Gesundheitsinformationen zu stützen, um eine Nachverfolgbarkeitsanalyse von COVID-19-Patienten durchzuführen. Hierzu war es nötig, die Daten von Gesundheitseinrichtungen zu konsolidieren und sich auf die Stammdaten der CCSS zu stützen.
Die daraus resultierende Anwendung legt überdies einen strategischen Schwerpunkt auf den Einsatz von Business Intelligence Tools, um die statistischen Informationen zu verwalten und die schnelle Bereitstellung von COVID-19-Daten über die Gesundheitsversorgung zu ermöglichen. Ziel ist es, die datengestützte Entscheidungsfindung insbesondere auf strategischer Ebene zu unterstützen. Dies erfordert leichteren Zugang zu statistischen Informationen und den Einsatz von Datenanalyse-Tools.
Insgesamt erwies sich die Verwendung von Analysetechnologien für die Sozialversicherungskasse als hilfreich bei der datengestützten Entscheidungsfindung. Sie war in der Lage, die Auswirkungen auf die Dienstleistungen zu quantifizieren und deren Bereitstellung entsprechend anzupassen. Zugleich unterstützte die Anwendung die Digitalisierung innerhalb der Institution, insbesondere durch den Einsatz von Datenanalysetechnologien.
Der Ansatz der Sozialversicherungskasse von Costa Rica beruht auf der deskriptiven und der diagnostischen Datenanalyse.
Mexiko
In Mexiko hat sich die Sozialversicherungsanstalt Mexikos (Instituto Mexicano de Seguridad Social – IMSS) der Problematik der Datenanalyse mit der Einführung einer Data-Governance-Strategie angenähert, insbesondere angesichts der Bedeutung von Daten in der COVID-19-Pandemie.
Dank dieses Data-Governance-Ansatzes kann die IMSS für ihre wichtigsten Einrichtungen wertvolle Informationen bereitstellen. Dies erleichtert die Entscheidungsfindung auf Verwaltungs- und Betriebsebene. Die der Sozialversicherungsanstalt zur Verfügung stehenden geografischen und statistischen Informationen ermöglichen es ihr, die Vorratsmengen, die Krankmeldungen von Versicherten infolge von COVID-19-bedingten Leiden und unternehmensbezogene Daten für die Einhaltung von Faktoren in Verbindung mit der Rückkehr an die Arbeit zu verwalten. Mit diesem Ansatz strebt die IMSS die Bewältigung unterschiedlicher Probleme an, darunter die Verdoppelung der Anstrengungen, versäumte Gelegenheiten für die Weitergabe wertvoller Informationen sowie die geringe Standardisierung, Nachverfolgbarkeit, Integrität und Qualität von Daten. Solche Merkmale sind typisch für Daten von Institutionen, die eine Vielfalt von Dienstleistungen erbringen und in einer Anzahl nicht verbundener Datenbestände große Mengen von Informationen halten.
Die Data Governance der IMSS stützt sich auf drei Säulen: eine veränderte Einstellung der einzelnen Personen, verbesserte Prozesse dank einer ganzheitlicheren Sichtweise und technologische Entwicklungen, wobei im Rahmen einer integrierten Lösung ein sogenannter Data Lake (wörtlich übersetzt „Datensee“) umgesetzt wird. Auf dieser Grundlage lassen sich dann Analyse-Tools einführen, um Datenanalysen durchzuführen. Die Datenanalyse stellt nützliche, hochwertige Informationen zur Verfügung und erlaubt die Erkennung von Fehlentwicklungen und abweichenden Werten. Sie erleichtert die nötige Vereinheitlichung für einen transparenten und sicheren Informationsaustausch mit anderen Institutionen.
Im gleichen Kontext ermöglicht die Beherrschung von Big Data auf Basis eines Data Lake, die Entwicklung der Pandemie darzustellen und zu steuern, indem Variablen wie die Anzahl der Infizierten, die Krankenhausbelegung, Patientenergebnisse und Todesfälle nach Region, Geschlecht, Alter, medizinischer Einrichtung usw. verwendet werden.
Der Ansatz der Sozialversicherungsanstalt Mexikos beruht auf der deskriptiven und der diagnostischen Datenanalyse.
Peru
Der Ansatz von Perus EsSalud – Sozialversicherung für Gesundheit (EsSalud – Seguro Social de Salud) bestand darin, eine Einheit für Datenüberwachung und Analyse einzurichten, deren Ziel es ist, durch die Datenanalyse umfassende und zeitnahe Informationen von hoher Qualität bereitzustellen, um strategische Entscheidungen der Institution zu unterstützen. Die Schaffung dieser Einheit soll die moderne effiziente Verwaltung im Interesse der Versicherten fördern, indem Führungskräfte bei der Entscheidungsfindung mit zeitnahen, relevanten und hochwertigen Informationen unterstützt werden.
Ein weiterer Aspekt dieses Ansatzes ist die Entwicklung von Anwendungen und anderen innovativen Strategien zur Kommunikation mit der Führungsebene sowie die Förderung und Überwachung von Aufzeichnungen besserer Qualität und die Integration von institutionellen Informationen. Eine der zentralen Anwendungen ist dabei die Überwachungskarte (Mapa de calor), die die Entwicklung der Pandemie in Peru aufzeigt, indem sie die Verbreitungswege des Virus, Hochinzidenzgebiete usw. abbildet.
Aufgrund der Bereitstellung relevanter Informationen, die täglich aktualisiert werden, können aufgeschobene Termine analysiert, Hausbesuche nachverfolgt, Warnmeldungen über erhöhte Einweisungszahlen versendet und die Verfügbarkeit von Krankenhausbetten überwacht werden.
EsSalud ist bestrebt, nicht nur Informationen für den internen Gebrauch zu generieren, sondern auch solche für die Zusammenarbeit mit anderen öffentlichen Einrichtungen, mit denen die erzielten Ergebnisse geteilt werden. Insbesondere wurden Informationen aus dem nationalen Melde- und Zivilstandsregister (Registro Nacional de Identificación y Estado Civil) verwendet.
Der Ansatz von EsSalud beruht auf der deskriptiven und der diagnostischen Datenanalyse.
Erzielte Ergebnisse
Die genannten Institutionen haben dank des Einsatzes von Analysetechnologien positive Ergebnisse erzielt. Sie konnten spezifische Mechanismen umsetzen, um auf Herausforderungen durch die Pandemie einzugehen, und sie haben ihre Fähigkeit verbessert, solche Technologien in anderen Kontexten einzusetzen. Tabelle 1 fasst die Ergebnisse zusammen.
Land | Ergebnisse für die Gesundheitsversorgung |
---|---|
Costa Rica - CCSS | Stärkung der Entscheidungsfindungsprozesse |
Generierung von Informationen, die helfen, Dienstleistungen für die Zeit nach COVID-19 zu planen. Die Auswirkungen auf die bestehenden Dienstleistungen konnten gemessen werden, mit folgenden Umsetzungsraten:
|
|
Mexiko - IMSS | Einführung einer einheitlichen Datenplattform für COVID-19 unter Verwendung von Data-Lake- und Big-Data-Technologien. Die Plattform wurde insgesamt von 445 Benutzern 86 422 Mal besucht. |
Informationen werden mit dem Gesundheitsministerium (das die Pandemiemaßnahmen koordiniert) und anderen Institutionen geteilt. | |
Peru - EsSalud | Tägliche Pandemieüberwachungsberichte wurden bereitgestellt, die Folgendes nachverfolgen:
|
Einführung von Anwendungen wie die Überwachungskarte (Mapa de calor), sowie Karten und Infografiken, die bei der Interpretation der Informationen helfen. Einrichtung einer Übersichtstafel, die Alarmmeldungen bei verlängerten Aufenthalten und verfügbaren Krankenhausbetten vorsieht und online mit in Echtzeit aktualisierten Informationen zugänglich ist. |
|
Die Informationen werden mit mindestens 12 Lokalverwaltungen und zwei Ministerien geteilt. |
Potenzial und Grenzen der prädiktiven Datenanalyse
Die Panamerikanische Gesundheitsorganisation (Pan American Health Organization, PAHO) betont die Wichtigkeit von prädiktiver Analyse im Kampf gegen COVID-19, denn diese erlaubt es, die Entwicklung der Pandemie mit einem akzeptablen Grad an Unsicherheit abzuschätzen. Ausgehend von solchen Informationen können Institutionen die ungefähre Nachfrage nach akutmedizinischen Dienstleistungen abschätzen, den Zeitrahmen für die teilweise oder vollständige Aufhebung von Maßnahmen (z. B. Lockdowns) festlegen und sogar neue Bedürfnisse erkennen, die entstehen könnten (PAHO, 2021).
Zugleich weist die PAHO darauf hin, dass Prognosemodelle Grenzen haben, wenn sie auf einen Kontext wie die Pandemie angewendet werden, denn in den Modellen besteht eine gewisse Unsicherheit, die ihre Leistungsfähigkeit beeinflusst und die schwer zu quantifizieren ist. Insbesondere die Einführung von Zeithorizonten und die Heterogenität der zu analysierenden Daten können diese Unsicherheit verstärken. Für ein besseres Verständnis der Unsicherheit ist die Durchführung einer Sensitivitätsanalyse unabdingbar. Diese Technik wird verwendet, um die Auswirkungen zu bewerten, die eine bestimmte abhängige Variable unter gewissen Annahmen auf das Gesamtergebnis haben könnte. Die Unsicherheit lässt sich durch die Vergrößerung des Datensatzes und durch die Verbesserung der Qualität der in dem Modell verwendeten Daten verringern. Dies bedeutet, dass die Menge und die Qualität der Daten entscheidend für diese Analysetechniken sind (PAHO, 2021).
Kritische Faktoren
Die beschriebenen Erfahrungen deuten alle auf verschiedene kritische Faktoren hin, wenn im Kontext von COVID-19 Analysetechniken eingesetzt werden.
Ein erster kritischer Faktor ist das Team, das ein entscheidender Teil der Strategie für die Umsetzung der Analysetechniken ist. Aus diesem Grund sollte das Ziel sein, multidisziplinäre Teams mit klar definierten Rollen zu bilden. Es ist immer wichtig, dass Mitglieder aus verschiedenen Bereichen mitwirken, denn so können die Definitionen nötigenfalls ausgeweitet werden.
Bei EsSalud wurde eine besondere Analyseeinheit gebildet, die ein multidisziplinäres Team umfasst. Diese Einheit hat einen flexiblen strategischen Plan, der ihr erlaubt, neue Innovationen zu entwickeln und der Analysestrategie der Institution hinzuzufügen. Die IMSS stellte in Mexiko ein gemeinsames Team für die Zusammenarbeit zusammen. Spezifische Rollen wurden in den Bereichen Analyse, Datenqualität, Architektur und funktionelles Dateneigentum festgelegt. Ein Leitungsausschuss für Daten wurde geschaffen.
Unterstützung durch die Führungsebene ist für diese Art von Initiative ebenfalls unabdingbar, insbesondere, um die Durchführbarkeit der Umsetzung zu gewährleisten. Dies liegt daran, dass Datenanalyseinitiativen gewöhnlich ganze Institutionen durchdringen und Daten und Prozesse aus mehr als einem Interessenbereich zusammenführen. Sie können auch Vereinbarungen mit anderen Organisationen erfordern. Sowohl die IMSS in Mexiko als auch die CCSS in Costa Rica konnten auf das Engagement und die Unterstützung ihrer Führungsebene zählen, was für den Erfolg beider Initiativen ausschlaggebend war.
Die Flexibilität der umgesetzten Modelle kann ebenfalls als kritischer Faktor gelten. Die Modelle müssen weiterentwickelt werden, um sich verändernde Realitäten zu berücksichtigen. Wichtig ist auch, dass die Modelle spezifisch und nicht allgemein sind, denn so wird die Vorhersagefähigkeit besser. Bei EsSalud ließ sich die Überwachungskarte aufgrund ihrer hohen Modellanpassungsfähigkeit an den wachsenden Bedarf an Informationen infolge des Gesundheitsnotstands anpassen.
Ein weiterer kritischer Faktor ist die Datenqualität, die das Fundament für jede Initiative der Datenanalyse bildet. Datengestützte Entscheidungsfindung erfordert verlässliche Daten, denn sonst sind die Reichweite der Analyse und die Gültigkeit der Schlussfolgerungen begrenzt. Am besten lässt sich die Datenqualität gewährleisten, wenn durch gezielte Maßnahmen sichergestellt wird, dass von Anfang an Daten guter Qualität erfasst werden, sodass später keine Datenbereinigung mehr nötig ist.
Sowohl die CCSS in Costa Rica als auch EsSalud in Peru entwickelten eine Kultur der datengestützten Entscheidungsfindung. Es wurden Maßnahmen getroffen, um fehlende Erfahrung oder Vertrautheit mit diesem Ansatz auszugleichen, denn man war sich darüber bewusst, dass die Datenqualität und die korrekte Interpretation von Informationen unabdingbar sind, um sicherzustellen, dass die richtigen Entscheidungen getroffen werden.
Schlussbetrachtung
Traditionelle Datenanalysetechniken ermöglichen eine automatische Berichterstattung und die Erstellung von Kontrolltafeln, die eine Rückschau auf die Organisation erlauben. Damit können Fragen wie „Was ist geschehen?“ und „Warum ist diese Situation entstanden?“ beantwortet werden. Neben der Unterstützung bei der Entscheidungsfindung durch die Bereitstellung einer deskriptiven Datenanalyse können jedoch fortschrittliche Techniken des maschinellen Lernens wie die prädiktive und die präskriptive Datenanalyse einer Organisation eine zukunftsorientierte Perspektive eröffnen. Dadurch wird nicht nur die Entscheidungsfindung unterstützt sondern zugleich die Produktivität erhöht und es werden die Geschäftsabläufe optimiert.
Die Bedeutung der Datenanalyse ist in den letzten Jahren gewachsen. Die Zahl der beschriebenen Beispiele für gute Praxis sowie die verschiedenen Webinarpräsentationen zum gleichen Thema belegen dies. Dementsprechend kommt Datenanalyse-Tools eine immer zentralere Rolle in Organisationen zu. Die Datenanalyse sollte nicht isoliert betrachtet werden, sondern vielmehr im Kontext der Geschäftsabläufe und der Entscheidungsfindung, sowie der Verwaltung und Qualität der zugrundeliegenden Daten, um sicherzustellen, dass die Interpretation der Daten auf gesicherter Grundlage erfolgt.
Auch auf die institutionelle Kapazität jener Organisationen soll hingewiesen werden, die bereits vor der Pandemie Datenanalyseprojekte umsetzten, denn diese ermöglichten ihnen, ihre Bestrebungen im Kontext des Gesundheitsnotstands neu auszurichten.
Abschließend kann festgehalten werden, dass eine Reihe von Institutionen der sozialen Sicherheit während der Corona-Pandemie die Gelegenheit genutzt hat, um diese Art von Lösungen zu festigen oder neu zu entwickeln.
Referenzen
EsSalud - Sozialversicherung für Gesundheit. 2020. Überwachung der Ausbreitung von COVID-19: die Überwachungskarte der Einheit für Datenüberwachung und -analyse (Gute Praxis in der sozialen Sicherheit). Genf, Internationale Vereinigung für Soziale Sicherheit.
Fachausschuss für Informations- und Kommunikationstechnologie. 2019. Einsatz neuer Technologien in der sozialen Sicherheit. Genf, Internationale Vereinigung für Soziale Sicherheit.
IVSS. 2019a. Leitlinien der IVSS über Informations- und Kommunikationstechnologie (Erweiterte Ausgabe). Genf, Internationale Vereinigung für Soziale Sicherheit.
IVSS. 2019b. Leitlinien der IVSS zur Dienstleistungsqualität (Erweiterte Auflage). Genf, Internationale Vereinigung für Soziale Sicherheit.
PAHO. 2021. Why predictive modeling is critical in the fight against COVID-19 (COVID-19 Factsheets). Washington, DC, Panamerikanische Gesundheitsorganisation. Auch erhältlich auf Spanisch.
Sozialversicherungsanstalt Mexikos. 2020. IMSS-Analytik: die Bedeutung von Daten bei der Bekämpfung der COVID-19-Pandemie (Gute Praxis in der sozialen Sicherheit). Genf, Internationale Vereinigung für Soziale Sicherheit.
Sozialversicherungskasse von Costa Rica. 2019. Automatisierte Datenanalysen im Gesundheitsbereich: Unterstützung für die Bewältigung der COVID-19-Pandemie in Costa Rica (Gute Praxis in der sozialen Sicherheit). Genf, Internationale Vereinigung für Soziale Sicherheit.