Dateninfrastruktur für vertrauenswürdige KI-Anwendungen in Wirtschaft und Verwaltung
Die KI-Datenplattform der KI-Allianz Baden-Württemberg ist eine offene, modular aufgebaute Infrastruktur, die den Zugang zu KI-Assets erleichtert. Als KI-Assets werden sowohl KI-Modelle als auch qualitativ hochwertige Datensätze verstanden.
Sie richtet sich an Unternehmen, Start-ups, öffentliche Institutionen und Forschungseinrichtungen und verfolgt das Ziel, die Entwicklung innovativer, vertrauenswürdiger KI-Anwendungen zu beschleunigen. Dafür setzt sie auf Open-Source-Komponenten, „Compliance by Design“-Ansätze sowohl für rechtliche als auch ethische Fragen sowie den Anschluss an leistungsfähige Hochleistungsrechner (HPC). Ergänzend werden Software-Werkzeuge bereitgestellt, die Daten für KI-Anwendungen qualitätssichern, d.h. automatisiert prüfen, bereinigen und für KI nutzbar machen (AI-ready data).
Ausgangspunkt
Ausgangspunkt ist die Beobachtung, dass viele Organisationen zwar prinzipiell über Daten verfügen, diese aber für KI-Anwendungen kaum nutzbar sind.
Typische Probleme sind fehlerhafte, unvollständige oder unzureichend annotierte Daten, fehlende Standards für Formate und Qualität sowie mangelnde Recherchemöglichkeiten für bestehende KI-Assets. Hinzu kommt, dass insbesondere kleine und mittlere Unternehmen selten über spezialisierte Data-Science-Teams verfügen und die manuelle Datenaufbereitung sehr ressourcenintensiv ist. Gleichzeitig hemmen Sicherheitsbedenken und die Sorge um Datensouveränität die Bereitschaft, sensible Daten zu teilen.
Ergebnis als Open Source-Release
Das Ziel der KI-Datenplattformentwicklung ist es, die Vision eines KI-Ökosystems durch eine geeignete Dateninfrastruktur greifbar zu machen. Im Dezember 2025 wurden zentrale Module der KI-Datenplattform als Open Source-Release veröffentlicht, vgl. https://ki-allianz.de/opensource-veroeffentlichung-2025/ und https://github.com/KI-Allianz/ .
Die Ergebnisse zahlen auf die folgenden drei Ebenen (levels) einer Dateninfrastruktur ein mit entsprechenden Fragen und Szenarien:
Level 1: KI-Asset Angebote: „Ich habe wertvolle KI-Assets (Daten oder KI-Modelle) mit Business-Potenzial. Wie kann ich sie sichtbar machen / verwerten?“
Level 2: KI-Asset Kataloge:
(1) „Ich benötige für meine KI-Anwendung Daten von anderen.“
(2) „Ich möchte bestehende KI-Modelle wiederverwenden.“ „Wie finde ich diese?“
Level 3: KI-Wissensplattform: „Gibt es Fördermöglichkeiten für meine Fragestellung?, „Welche KI-Experten/innen kann ich in meiner Region ansprechen
Insbesondere für die Levels 1 und 2 läuft aktuell ein Testbetrieb eines KI-Asset Katalogs unter https://ki-daten.hlrs.de . Dieser setzt auf verschiedene Level 1-KI-Asset Angebote der Projektpartner auf und „erntet“ deren Metadaten (harvesting).
Sektorspezifische Datengrundlagen
Die KI-Datenplattform setzt auf sektorspezifische Datenräume, um einen standardisierten, sicheren und souveränen Datenaustausch innerhalb von Branchen wie Produktion, Gesundheit, Smart City und Mobilität zu ermöglichen. Gemeinsame Regeln, Schnittstellen und Metadatenstandards schaffen dabei Vertrauen und Interoperabilität.
In der industriellen Produktion wird ein einheitlicher Zugang zu Produktionsdaten geschaffen, unter anderem durch die Anbindung von Datenquellen über die Asset Administration Shell (AAS) und Initiativen wie Manufacturing-X.
Im Gesundheitsbereich werden föderierte, vertrauensvolle Dateninfrastrukturen genutzt, um Gesundheitsdaten sicher bereitzustellen und perspektivisch mit anderen Domänen zu verknüpfen, wobei rechtliche und ethische Anforderungen zentral sind.
Im Smart-City-Kontext werden kommunale Daten gemeinsam mit dem Daten:Raum:Freiburg erschlossen, verknüpft und als Blaupause für ein kommunales KI-Ökosystem weiterentwickelt.
Im Bereich Mobilität entstehen datenbasierte Dienste, etwa durch synthetische und rechtskonforme Datensätze, Prognosemodelle und Datengenerierung, unterstützt durch ein Partnernetzwerk aus dem Raum Karlsruhe zur Förderung effizienter, sicherer und nachhaltiger Mobilität.
Sektorübergreifender Mehrwert
Ein anschauliches Beispiel für den Mehrwert der Zusammenführung sektorspezifischer Daten ist das Szenario „Intelligente Besucherprognosen im Tourismus“. Um vorhersagen zu können, wann sich wie viele Menschen an bestimmten Hotspots aufhalten, müssen Daten aus unterschiedlichen Quellen zusammengeführt werden: Veranstaltungsdaten, Mobilitätsdaten, Wetterprognosen. Ein Tourismus-Datenraum bietet dafür den Rahmen, diese Informationen sicher zu kombinieren und mit KI auszuwerten. So können Besucherspitzen prognostiziert und gesteuert werden, etwa durch Echtzeitempfehlungen, optimierte Verkehrslenkung oder angepasste Infrastrukturplanung. Davon profitieren Gäste, kommunale Verwaltungen und lokale Anbieter gleichermaßen.
Querschnittliche Themen
Zudem adressiert die KI-Datenplattform wichtige Querschnittsthemen wie Datenqualität, Ethik und Recht sowie Benutzerfreundlichkeit.
Zur Sicherstellung der Datenqualität werden Dienste bereitgestellt, die Datensätze automatisiert prüfen, bereinigen, strukturieren und annotieren, sodass aus heterogenen Rohdaten qualitätsgesicherte, KI-taugliche Datenbestände entstehen.
Im Bereich Ethik und Recht verfolgt die Plattform einen „Ethik by Design“-Ansatz mit transparenten Prozessen, nachvollziehbaren Entscheidungen und fairer Datenverarbeitung. Rechtliche Anforderungen wie DSGVO, Digital-Governance-Gesetz (DGA) und KI-Verordnung werden in die Architektur integriert. Der Landesbeauftragte für den Datenschutz und die Informationsfreiheit Baden-Württemberg war in die Konzeption eingebunden; zudem wurde ein entsprechendes Whitepaper veröffentlicht (DOI: 10.6094/UNIFR/276339).
Ein weiterer Schwerpunkt ist die Benutzerfreundlichkeit: Durch intuitive Oberflächen, klare Anleitungen und kontextbasierte Hilfen wird die Nutzung auch für Anwender ohne tiefgehende KI- oder Datenexpertise ermöglicht und ein breiter Zugang zu KI-Assets geschaffen.
Strategische Initiative & Anwenderforum
Strategisch verfolgt das Teilvorhaben der KI-Allianz Baden-Württemberg das Ziel, eine landesweite Plattform zu etablieren, die den Datenaustausch erleichtert und einen Markt für KI-Assets (Daten und Modelle) schafft. Dadurch sollen Innovationen in verschiedenen Sektoren des Wirtschafts- und Wissenschaftsstandorts Baden-Württemberg gezielt gefördert und Synergien zwischen Wirtschaft, öffentlichen Institutionen und Forschung maximiert werden.
Insgesamt versteht sich die KI-Datenplattform als offenes, gemeinschaftlich entwickeltes Ökosystem, das technische Infrastruktur, rechtliche und ethische Leitplanken, Datenqualitätswerkzeuge und Hochleistungsrechenressourcen zusammenführt. Sie adressiert zugleich die praktischen Herausforderungen der Datenaufbereitung, die Notwendigkeit sicherer Datenräume und den Anspruch, KI in Baden-Württemberg verantwortungsvoll und breit nutzbar zu machen.
Mit dem Testbetrieb startet der Einstieg in den operativen Betrieb gemäß einem Public-Private-Modell. Organisationen können sich bereits jetzt als Early Adopter im Anwenderforum beteiligen. Sie erhalten Zugang zu Entwicklungen und Testphasen, können Funktionen, Standards und Prioritäten mitgestalten, werden auf der Plattform sichtbar und profitieren vom direkten Austausch mit führenden KI-Akteuren aus Wirtschaft, Forschung und Verwaltung.
Partner
Ansprechpartner
Dr.-Ing. Thomas Usländer, Fraunhofer IOSB, Business Developer KI-Engineering
Gefördert durch
Die KI-Allianz Baden-Württemberg eG und die verbundenen Projekte sind eine Initiative, die darauf abzielt, die Entwicklung und Anwendung von Künstlicher Intelligenz (KI) zu fördern. Die Maßnahmen sollen dazu beitragen, Baden-Württemberg zu einem Hotspot der KI-Entwicklung und -Anwendung zu machen, bestehende Initiativen zu verbinden und die digitale Transformation überregional vernetzt voranzutreiben.
