Gesellschaft Deutscher Chemiker

Fair‐Kolumne

"No Data, no AI Party"

Nachrichten aus der Chemie, November 2025, Seite 15, DOI, PDF. Login für Volltextzugriff.

Von Wiley-VCH zur Verfügung gestellt

Dieser etwas launige Satz stammt aus einem Vortrag von Paul Czodrowsky, Professor in Mainz, bei den Chemistry Data Days 2023. Künstliche Intelligenzen (KI) müssen trainiert werden, und dazu brauchen sie Daten. Doch wo sind solche Daten zu finden? Beispielsweise in Forschungsdatenrepositorien, also Plattformen, auf denen Daten hochgeladen werden, um sie zu veröffentlichen. Die Repositorien archivieren die Daten meist redundant an mehreren Orten und mit unterschiedlicher Speichertechnik, damit sich auf die Daten sicher zugreifen lässt, ohne dass sich diese ändern.

Damit Forschende und vor allem KI Daten wiederfinden können, benötigen die Repositorien – neben den Daten selbst, beispielsweise Messdaten – auch Metadaten. Metadaten enthalten den Kontext der Forschungsdaten und geben Auskunft über ihre Entstehung, genutzte Methoden oder Geräteeinstellungen, um Daten auch künftig noch richtig zu interpretieren. Beim Nutzen der Daten für das KI-Training gilt: garbage in = garbage out. Denn mit fehlenden oder schlechten Metadaten sind Forschungsdaten nutzlos.

Deswegen helfen elektronische Laborjournale (ELN) dabei, Daten fair in einem Repositorium zu speichern: Gute ELNs erfas

Bildung + Gesellschaft

Überprüfung Ihres Anmeldestatus ...

Wenn Sie ein registrierter Benutzer sind, zeigen wir in Kürze den vollständigen Artikel.