Synthetische Daten in der KI-Entwicklung

Lernen Sie wie Künstliche Intelligenz ohne große Datenmengen trainiert werden kann.

Verstehen Sie Methoden zur Generierung synthetischer Datensätze für das Training von KI-Modellen. Bewerten Sie Vorteile hinsichtlich Datenschutz, Skalierbarkeit und Modellrobustheit. Setzen Sie synthetische Daten gezielt zur Verbesserung von Trainingsprozessen ein.

Webinar oder Workshop

Länge: 10 Stunden
Datum: nach Bedarf
Kostenfrei

Das Training von Künstlichen Intelligenz-Algorithmen benötigt in der Regel große und diverse Datenmengen. Diese Datenmengen sind häufig schwer auffindbar, kostspielig zu beschaffen oder schlichtweg nicht existent. Synthetische Daten sind eine Möglichkeit. Zusätzlich weisen reale Daten häufig Bias-Probleme auf, oder sind aus Datenschutzgründen nicht direkt für das Training anwendbar.

In diesem Kurs werden sie praxisnah lernen, wie synthetische Daten in der KI-Entwicklung eingesetzt werden können, um Datenknappheit, Datenschutzanforderungen und Bias-Probleme zu adressieren.
Zu Beginn werden grundlegende Begriffe geklärt: Was sind synthetische Daten, wie unterscheiden sie sich von Anonymisierung und Maskierung und welche Typen (tabellarisch, Text, Bild, Zeitreihen) gibt es?
Anschließend werden typische Anwendungsszenarien aus der Produkt- und Forschungspraxis vorgestellt, etwa für Prototyping, Testdaten, Training von ML-Modellen oder den Datenaustausch mit Partnern.
Ein Schwerpunkt liegt auf verschiedenen Generierungsmethoden, von regel- und simulationsbasierten Verfahren bis hin zu KI-basierten Ansätzen wie GANs, Variational Autoencoders und Diffusionsmodellen (auf konzeptioneller Ebene).

Die Teilnehmenden werden lernen, welche Qualitätskriterien für synthetische Datensätze relevant sein werden und wie sich Datenqualität, Nutzbarkeit und Datenschutz gegeneinander abwägen lassen werden.
In Hands-on-Übungen werden die Teilnehmenden einfache Open-Source- oder Cloud-Tools einsetzen, um selbst kleine synthetische Datensätze zu erzeugen, Parameter zu verändern und Auswirkungen auf die resultierenden Daten zu beobachten.

Typische Anwendungsfälle und Grenzen synthetischer Daten in der KI-Entwicklung benennen.

Grundlegende Generierungsansätze konzeptionell verstehen und einordnen.

Einfache synthetische Datensätze mit geeigneten Tools erzeugen und Parameter sinnvoll wählen.

Grundlegende Qualitäts- und Datenschutzkriterien für synthetische Daten anwenden.

Kontakt

Tristan Kley
Projektleiter Academy
E-Mail

Voraussetzungen

Die Teilnahme an ZaKI.D Academy Kursen ist kostenfrei, eine Anmeldung ist jedoch erforderlich. Wir behalten uns vor Kurse abzusagen, wenn sich nicht ausreichend viele Teilnehmer anmelden.

Um an erfolgreich in diesem Kurs zu sein, benötigen Lerner fundierte theoretische Kenntnisse und erste praktische Erfahrung im Gebiet des Maschinellen Lernens, insbesondere zu Neuronalen Netzen. Es sollte grundlegendes Wissen zu gängigen Architekturen, Trainings- und Evaluationsprozessen und üblichen Datenstrukturen vorhanden sein. Diese Kompetenzen können in unserem Kurs „Einstieg Maschinelles Lernen“ und „Künstliche Neurale Netze“ erworben werden.

Nächste Termine

    • Datum: Nach Abstimmung
    • Uhrzeit: Nach Abstimmung
    • Ort: TBD
    • Kostenfrei

    Sobald genügend Teilnehmer durch eine Anmeldung ihr Interesse angekündigt haben, werden wir mit den Teilnehmern einen passenden Termin abstimmen.