Header
 
Login
 

Privatsphäre-Einstellungen

Wir verwenden Cookies auf unserer Website. Einige von ihnen sind unerlässlich, während andere uns helfen, diese Website und Ihre Erfahrungen zu verbessern.

Notwendig Statistik Marketing
Auswahl bestätigen
Weitere Einstellungen

Hier finden Sie eine Übersicht aller verwendeten Cookies. Sie können ganzen Kategorien Ihre Zustimmung geben oder weitere Informationen anzeigen und bestimmte Cookies auswählen.

Alle auswählen
Auswahl bestätigen
Notwendig Cookies
Wesentliche Cookies ermöglichen grundlegende Funktionen und sind für die ordnungsgemäße Funktion der Website erforderlich.
Statistik Cookies
Statistik-Cookies sammeln anonym Informationen. Diese Informationen helfen uns zu verstehen, wie unsere Besucher unsere Website nutzen.
Marketing Cookies
Marketing-Cookies werden von Werbekunden oder Publishern von Drittanbietern verwendet, um personalisierte Anzeigen zu schalten. Sie tun dies, indem sie Besucher über Websites hinweg verfolgen
Zurück
    Merken
    Abbildung 1: Ein Flussdiagramm des Anfangsabschnitts eines typischen KI-Projekts (J = Ja; N = Nein) – adaptiert von [11] (Quelle aller Abbildungen: die Autoren).

    Generierung synthetischer Batch-Daten durch künstliche Intelligenz

    Originale

    EinleitungMethodenErgebnisseDiskussionSchlussfolgerung
    Keywords: Design of Experiments |  Data Science |  Künstliche Intelligenz |  Synthetische Daten |  Synthetische Batches |  Bioprozess 

    Abstract

    Generation of synthetic batch data through artificial intelligence

    In this paper, a flexible approach to generating synthetic data batches, comprised of multivariate time-series synthetic datasets, is presented. One of the most overlooked influential factors of modern Artificial Intelligence (AI) approaches is an ample and high-quality database. Quite often, ample, and high-quality data is only available to a limited extend. Synthetically generated data can close this gap. Unlike dummy data, in-silico created synthetic data gives unprecedented levels of realism. As per definition, dummy data is mock data generated at random as a substitute for real data in testing environments. In contrast to the simple generation of random substitute data, this effort presents the creation of synthetic data for in-silico generation of additional batches, considering the characteristics of the underlying process and measured real data. Both aspects for synthetic data generation, quality, and quantity of data, are lined out and verified. Inherent to the synthetic data is its ability to not only generate realistic synthetic batch data but also to generate batches with a controlled spread in data if required, broadening the field of potential use cases. As planned, the synthetically generated data curves differ from each other randomly within the space spanned by the real data set. Achieving high-quality synthetic datasets while providing limited real-world datasets is a strong door opener for AI-based algorithms. Synthetically generated data significantly contributes to rooting and accelerating the use of AI in pharma by working as a privacy-secure drop-in replacement for real data. Synthetic data is exempt from privacy regulations and overcomes data re-identification risks.

    David Hubmayr1, Nilanjan Banerjee2, Joeri van Wijngaarden3, Toni Manzano3 · 1CSL Behring AG, Bern Schweiz 2 · Fakultät für Informatik und Elektrotechnik. Universität Maryland, Baltimore County Baltimore Maryland USA 3 · Aizon Inc., Barcelona Spanien

    Korrespondenz:

    DI David Hubmayr, Wankdorfstr. 10, 3014 Bern (Schweiz), E-Mail: david.hubmayr@cslbehring.com

    Zusammenfassung

    In diesem Beitrag wird ein flexibler Ansatz zur Erzeugung synthetischer Batch-Daten, die sich aus multivariaten Zeitreihen zusammensetzen, vorgestellt. Einer der am meisten übersehenen Einflussfaktoren in Bezug auf Künstliche Intelligenz (KI) ist eine umfassende und qualitativ hochwertige Datenbasis.