Daten sind ein wichtiges Instrument für politische Entscheidungsträger, um auf Veränderungen in einer Gesellschaft und die Herausforderungen zu reagieren, mit denen die Menschen im Alltag konfrontiert sind. Aus diesem Grund hat STATEC, das Nationale Institut für Statistik und Wirtschaftswissenschaften in Luxemburg, ein internes Data Science Lab gemeinsam mit dem Interdisciplinary Centre for Security, Reliability and Trust (SnT) der Universität Luxemburg eingerichtet. Das Data Science Lab wird sich auf die Entwicklung und Implementierung von KI-Tools konzentrieren, die die Mission von STATEC in Luxemburg unterstützen.
Durch künstliche Intelligenz (KI) und maschinelles Lernen (ML) sind nationale Statistikbüros weltweit in der Lage, ihre Leistung und Fähigkeiten zu maximieren. So können Statistik-Teams, die riesigen Mengen an granularen Informationen verarbeiten und analysieren, die uns in Zeiten von Big Data zur Verfügung stehen. Dies ermöglicht eine effizientere Erstellung offizieller Statistiken, was die Einführung von KI/ML für die Verarbeitung von Big Data zu einer Priorität für Statistikinstitute auf der ganzen Welt macht. Luxemburg ist Teil davon, und STATEC hat die Integration von KI und ML zu einem wichtigen Element ihrer Innovationsagenda gemacht.
SnT wird die Teams von STATEC unterstützen, wenn sie über ihre grundlegende KI-Einrichtung hinausgehen und ihre Fähigkeiten durch das Data Science Lab erweitern. Das Projekt besteht aus drei Elementen:
1. Skalierung und Aufrechterhaltung der KI-Aktivitäten von STATEC
Die Einrichtung eines ML-Systems im Vergleich zu einem herkömmlichen Softwareprojekt lässt sich am besten mit dem Unterschied zwischen der Erziehung eines Kindes und dem Bau eines Hauses vergleichen. KI-Systeme benötigen wie Kinder Daten, um zu lernen und sich weiterzuentwickeln, während traditionelle Software nach etablierten „Regeln“ oder „Bauplänen“ gebaut wird. Aufgrund dieser grundlegenden Unterschiede reichen dieselben Technologien und Prozesse, die die Erstellung und Wartung von Software effektiv unterstützen, nicht aus, um ML-Systeme zu entwickeln. SnT wird die IT-Teams von STATEC bei der Untersuchung der sogenannten „MLOps“-Technologien unterstützen, die es STATEC ermöglichen werden, die Entwicklung und Einführung von KI-Systemen im gesamten Unternehmen zu skalieren.
2. Untersuchung innovativer Anwendungsfälle
KI kann als Instrument für eine Vielzahl von Anwendungsfällen verwendet werden. Daher bestimmen der Kontext und die Bedürfnisse jeder Organisation die Richtung der Innovation. Im Falle von STATEC ist ein potenzielles Beispiel die Kodierung von Text nach statistischen Klassifizierungen. Dieser Prozess wird derzeit manuell durchgeführt, könnte aber mit Natural Language Processing automatisiert werden. Ein weiterer Anwendungsfall wäre die Verwendung von KI/ML-Methoden für Imputationen mit statistischen Daten.
3. Entwicklung und Implementierung eines Instruments zur Automatisierung der statistischen Verarbeitung
Ein häufiger Nachteil vieler KI-Lösungen ist der „Black-Box“-Effekt, bei dem Informationen eingegeben werden und dann eine Ausgabeantwort oder Antwort gegeben wird, ohne die Möglichkeit zu verstehen, warum diese Antwort gegeben wurde. Dies ist besonders problematisch, wenn es um statistische Analysen geht, bei denen Transparenz entscheidend ist. Daher beabsichtigt das Team von SnT für das dritte Element des Projekts, diese Black Box zu „aufzubrechen“, damit Statistik-Teams verstehen können, wie die Datenverarbeitung durchgeführt wurde.
„Wir begleiten sie während ihrer gesamten KI-Reise und helfen ihnen, die vielen Herausforderungen zu lösen, denen sie jetzt und in Zukunft gegenüberstehen werden“, sagt Prof. Yves Le Traon, Direktor von SnT. „Letztendlich besteht das Ziel darin, Statistik- und IT-Teams dabei zu helfen, mit den richtigen Methoden zu arbeiten und ihr spezialisiertes Wissen so effektiv wie möglich zusammenzubringen. Somit kann STATEC eine qualitativ hochwertige Wartung und Entwicklung ihrer KI-Lösungen gewährleisten. Es gibt so viele Möglichkeiten, wie KI-Technologie STATEC helfen kann, und wir freuen uns darauf, diese gemeinsam zu erkunden.“
„Die Einführung solider KI-Tools in unsere Datenverarbeitungsmethodik wird es unseren Statistikern ermöglichen, effizienter zu arbeiten und ihr Fachwissen für statistische Analysen freisetzen“, sagt Dr. Serge Allegrezza, Generaldirektor von STATEC. „Das Ergebnis werden aussagefähigere Daten sein, mit welchen Luxemburger Entscheidungsträger arbeiten können, und effizientere Prozesse für die Bürgerinnen und Bürger, die uns ihre Zeit für unsere Datenerfassung zur Verfügung stellen.“