Generative kontradiktorische Netzwerke: Die kreative Seite des maschinellen Lernens
Unglaubliche Fortschritte in der künstlichen Intelligenz (KI) schaffen immer intelligentere Maschinen. Da sich Maschinen unabhängig von den empfangenen Daten verbessern können, schaffen sie neue Möglichkeiten, um immer komplexere Aufgaben zu erledigen.
Eine vielversprechende Lösung, die in einigen Bereichen bereits unglaubliche Ergebnisse liefert, sind die sogenannten antagonistischen generativen Netzwerke oder Generative Adversarial Networks (GAN), die hauptsächlich zur Erzeugung von Bildern verwendet werden , aber auch die automatische Erstellung von Texten ermöglichen. Was sind generative kontradiktorische Netzwerke wirklich? Wie arbeiten Sie? Und wie können wir sie gewinnbringend einsetzen?
- Was ist ein generatives kontradiktorisches Netzwerk?
- Wie funktionieren generative kontradiktorische Netzwerke?
- Welche Herausforderungen muss das System bewältigen?
- Ein ausgewogener Wettbewerb
- Objekte richtig verstehen
- Wofür werden GANs verwendet?
- Videovorhersage
- Textbasierte Bilderzeugung
- Erzeugung komplexer Objekte
- Verbesserung der Bilddetails
- Entwicklung neuer Produkte
- Produkttextgenerierung
Was ist ein generatives kontradiktorisches Netzwerk?
Bevor wir uns damit befassen, was Generative Adversarial Networks für uns tun können, wollen wir uns ansehen, was sie wirklich sind.
Es ist ein maschinelles Lernsystem ( maschinelles Lernen ) entwickelt im Jahr 2014 von einem Team unter der Leitung von Ian Goodfellow. Der Zweck eines generativen gegnerischen Netzwerks besteht darin, Ihre eigenen Entwürfe auf der Grundlage einer Reihe realer Daten zu erstellen. Das Ergebnis ist so täuschend real, dass es unmöglich ist zu wissen, dass das Bild nicht von einer menschlichen Hand stammt. Um diese Ergebnisse zu erzielen, werden zwei konkurrierende neuronale Netze verwendet.
Die Aufgabe des generierenden Netzwerks besteht darin, eine Fälschung zu erstellen. Das Netzwerk speist sich aus Daten, beispielsweise Fotos von zufälligen Personen, und erstellt aus den empfangenen Informationen ein eigenes Foto. Dazu muss das Netzwerk zunächst die gemeinsamen Merkmale aller angezeigten Fotos kennenlernen. Auf diese Weise ist das neue Bild keine Nachahmung der Originaldaten, sondern eine völlig neue, aber ähnliche Arbeit. In unserem Beispiel wäre es ein Foto einer Person (die es nicht gibt).
Die Basisdaten und die von ihr erzeugten Informationen werden zusammen an das zweite Netzwerk geliefert. Die Aufgabe des diskriminierenden Netzwerks besteht darin, zu entscheiden, ob die empfangenen Daten wahr oder falsch sind. Das Bild wird nicht nur als falsch deklariert, wenn es zu stark von den Basisdaten abweicht, sondern auch, wenn es eine zu perfekte Nachahmung ist. Wenn sich das generierende Netzwerk darauf beschränkt, einen Durchschnitt der Daten zu extrahieren und daraus eine neue Arbeit zu erstellen, sieht das Ergebnis künstlich aus. Auf diese Weise filtert das diskriminierende Netzwerk auch unnatürlich aussehende Daten heraus.
Beide Netzwerke konkurrieren miteinander . Wenn das unterscheidende Netzwerk die gefälschten Daten erkennt, gibt es sie zurück. In diesem Fall ist das Generatorraster noch nicht gut genug und deshalb müssen Sie weiter lernen. Das diskriminierende Netzwerk lernt jedoch wiederum. Da sich beide neuronalen Netze gegenseitig trainieren, sind sie mit Deep-Learning-Systemen verbunden. Das generierende Netzwerk versucht, Datensätze zu erstellen, die so authentisch aussehen, dass sie den Diskriminator täuschen. Dies versucht seinerseits, die realen Beispiele mit einer solchen Genauigkeit zu analysieren und zu verstehen, dass die falschen Daten keine Chance haben, als real identifiziert zu werden.
Wie funktionieren generative kontradiktorische Netzwerke?
Wie jede künstliche Intelligenz müssen antagonistische generative Netzwerke trainiert werden, um ihre Funktion korrekt zu erfüllen. Diese Modalität des maschinellen Lernens oder maschinellen Lernens erfolgt in sechs Schritten:
- Definition des Problems : In einem ersten Schritt muss ein Problem definiert werden, das das System lösen muss. Zu diesem Zweck müssen Entwickler echte Daten sammeln, die das System verwenden kann.
- Architektur : Unterschiedliche Probleme erfordern unterschiedliche Netzwerktypen. Daher sollte das Generative Adversarial Network mit der geeigneten Architektur für die entsprechende Anwendung gesucht werden.
- Erstes Training des diskriminierenden Netzwerks : In diesem Schritt beginnt das eigentliche Training. Das erzeugende Netzwerk stoppt und das diskriminierende Netzwerk analysiert nur echte Daten, um zu lernen, sie zu verstehen.
- Erstes Training des generierenden Netzwerks : Das diskriminierende Netzwerk stoppt und das generierende Netzwerk beginnt wiederum, falsche Daten zu generieren.
- Zweites Training des Unterscheidungsnetzwerks : In diesem Schritt wird das Unterscheidungsnetzwerk mit den neuen gefälschten Daten vom Generator gespeist und muss entscheiden, welche Daten als wahr und welche als falsch angesehen werden.
- Zweites Training des Erzeugungsnetzwerks : Das Erzeugungsnetzwerk verbessert sich mit dem Ergebnis des zweiten Trainings des Unterscheidungsnetzwerks noch mehr. Hier lernt das generierende Netzwerk die Schwächen des Diskriminators kennen und versucht, diese auszunutzen, wodurch falsche Datensätze generiert werden, die noch realer erscheinen.
Dank dieser Interaktion bleiben beide Netzwerke in ständiger Entwicklung und werden so besser und effizienter . Das generierende Netzwerk lernt, immer realistischere Datensätze zu entwickeln. Das diskriminierende Netzwerk lernt, selbst die realistischsten Datensätze als falsch zu identifizieren.
Um Ihre Privatsphäre zu schützen, wird das Video nach dem Klicken hochgeladen.
Welche Herausforderungen muss das System bewältigen?
Wie bei fast allen Technologien sind die Entwickler von Generative Adversarial Networks Sie stehen vor einer Reihe von Herausforderungen, die angegangen werden müssen, um einen reibungslosen Ablauf des Trainings zu gewährleisten.
Ein ausgewogener Wettbewerb
Wie bereits erläutert, basieren generative kontradiktorische Netzwerke auf der Konkurrenz zwischen zwei neuronalen Netzen . Dies kann jedoch nur funktionieren, wenn beide Netzwerke gleich stark und effizient sind. Wenn eines der beiden Netzwerke stärker als das andere ist, funktioniert das System nicht. Wenn beispielsweise das erzeugende Netzwerk überlegen ist, kann der Diskriminator die gefälschten Daten nicht unterscheiden. Im umgekehrten Fall markiert das Unterscheidungsnetzwerk alle Daten des Generators als falsch. In beiden Fällen kann kein Netzwerk lernen.
Objekte richtig verstehen
Generative gegnerische Netzwerke haben häufig Probleme , Objekte richtig zu erkennen und zu verstehen . Dies ist besonders bei Bildern ausgeprägt. Ein echtes Foto könnte beispielsweise zwei Katzen mit jeweils zwei Augen zeigen. Wenn der Generator die Struktur und Position der Bildelemente nicht vollständig versteht, kann er eine Katze mit vier Augen erzeugen. Perspektiven können auch für diese Netzwerke problematisch sein, die möglicherweise nicht verstehen, dass zwei Bilder dasselbe Objekt aus unterschiedlichen Blickwinkeln darstellen.
Wofür werden GANs verwendet?
Generative Adversarial Networks erhielten auch außerhalb des IT-Bereichs besondere Aufmerksamkeit, nachdem das Künstlerkollektiv Obvious die Technik zur Erstellung eines Kunstwerks verwendet hatte. Dieses Gemälde wurde für 432.500 USD versteigert. Generative Adversarial Networks Sie können auch erstaunliche Dinge jenseits der Kunst tun.
Videovorhersage
Generative Adversarial Networks können die Frames eines Videos verwenden, um vorherzusagen, wie es fortgesetzt wird, und es somit unabhängig über die eigentliche Aufzeichnung hinaus erweitern. Alle Elemente des Videos sind enthalten, zum Beispiel Bewegungen und Aktionen, aber auch Hintergrundänderungen wie Regen oder Nebel.
Textbasierte Bilderzeugung
Aus einer Beschreibung können generative gegnerische Netzwerke Bilder generieren . Sie können beispielsweise ein eigenständiges Storyboard entwickeln, das auf einem Skript basiert.
Erzeugung komplexer Objekte
GANs ermöglichen es, selbst die einfachsten Skizzen in kürzester Zeit in komplexe dreidimensionale Objekte umzuwandeln . Mit einem generativen gegnerischen Netzwerk kann beispielsweise eine sehr grobe Zeichnung eines Baumes in ein Objekt von großer Komplexität und voller Details umgewandelt werden, z. B. zitternde Blätter oder eine im Wind schwankende Krone.
Verbesserung der Bilddetails
GANs können einem Bild mit niedriger Auflösung oder Pixeln neue Details hinzufügen , indem sie Informationen aus ähnlichen Bildern verwenden, um fehlende Informationen hinzuzufügen.
Entwicklung neuer Produkte
Einige Unternehmen experimentieren mit generativen kontradiktorischen Netzwerken in der Produktentwicklungsphase, um damit völlig neue Produktreihen und Designs zu erstellen .
Produkttextgenerierung
Generative Adversarial Networks verfügen auch über Copywriting- Funktionen und werden bereits zum Generieren von Produkttexten verwendet, die bei Kaufentscheidungen der Kunden eine immer wichtigere Rolle spielen. In diesen Netzwerken können Sie diese Beschreibungen nicht nur schnell erstellen, sondern auch analysieren, welche Produkttexte in der Vergangenheit am erfolgreichsten waren, und daraus neue Texte generieren.
In all diesen Bereichen werden die Generative Adversarial Networks bereits erfolgreich eingesetzt. Unternehmen und Entwickler arbeiten ständig an neuen Anwendungen, daher wird erwartet, dass diese antagonistischen generativen Netzwerke mittelfristig in vielen Bereichen unseres Lebens und unserer Arbeit sehr präsent sind.