Die neuronalen Netze von DeepNude und ihre Auswirkungen
DeepNude hat wichtige ethische Fragen zur Nutzung von KI aufgeworfen.
Was ist DeepNude und warum wird heute noch darüber gesprochen?
DeepNude ist ein KI-Programm, das wegen seiner Fähigkeit, modifizierte Versionen von Fotos bekleideter Personen zu erstellen, die Subjekte so erscheinen lässt, als wären sie nackt, für Diskussionen gesorgt hat. Die Software wurde von einem russischen Programmierer entwickelt, der unter dem Pseudonym Alberto bekannt ist. Die Idee entstand, laut eigenen Angaben, als technisches Experiment, inspiriert von den berühmten „Röntgenbrillen“ aus den Werbeanzeigen der 60er und 70er Jahre. Allerdings wurde DeepNude kurz nach seiner Veröffentlichung aufgrund der Kritik an der nicht einvernehmlichen Verwendung von Bildern und den ethischen Risiken, die mit dieser Art von KI verbunden sind, zurückgezogen.
Welche KI-Technologien machen DeepNude möglich?
Im Kern von DeepNude stehen zwei Schlüsselkonzepte des maschinellen Lernens: GANs (Generative Adversarial Networks) und die Pix2pix-Technologie. GANs sind eine Art von neuronalen Netzwerken, die aus zwei Modellen bestehen, die zusammenarbeiten: einem Generator, der Bilder erstellt; und einem Diskriminator, der bewertet, ob das generierte Bild realistisch aussieht oder nicht. Im Laufe der Zeit wird der Generator immer besser darin, realistische Bilder zu produzieren, während der Diskriminator besser darin wird, Fehler zu erkennen. Es ist ein Spiel zu zweit, das das Netzwerk dazu bringt, zu lernen, glaubwürdige Bilder zu erstellen. Pix2pix hingegen ist eine Technologie zur Bild-zu-Bild-Übersetzung, das heißt, sie wandelt ein Bild in ein anderes visuelles Format um – zum Beispiel von „Bild mit Kleidung“ zu „Bild ohne Kleidung“ im Fall von DeepNude.
Wie wurde der Algorithmus von DeepNude trainiert?
Der Algorithmus wurde mit über 10.000 Fotos von nackten Frauen trainiert, die aus dem Internet gesammelt wurden. Dieses Dataset ermöglichte es dem System, zu „lernen“, wie die verschiedenen Teile des weiblichen Körpers – Haut, Formen, Proportionen und Farben – unter verschiedenen Lichtbedingungen und in unterschiedlichen Posen aussehen. Dank dieser Informationen hat das neuronale Netzwerk gelernt, die von Kleidung bedeckten Bereiche zu erkennen und sie digital zu rekonstruieren, indem es sich vorstellt, was darunter wäre, basierend auf den gelernten Modellen. Es ist wichtig zu betonen, dass DeepNude fast ausschließlich mit Bildern von Frauen funktioniert, da das Trainingsdataset fast ausschließlich aus weiblichen Fotos bestand. Wenn man versucht, den Algorithmus mit männlichen Bildern zu verwenden, sind die Ergebnisse verzerrt und wenig realistisch.
Was macht das neuronale Netzwerk genau, wenn es ein Foto erhält?
Wenn ein Benutzer ein Foto einer bekleideten Person hochlädt, führt das neuronale Netzwerk eine Reihe automatischer Schritte aus: 1. Erkennung der Körperkonturen. Der Algorithmus identifiziert die Körperform und die von der Kleidung bedeckten Bereiche. 2. Segmentierung des Bildes. Es unterteilt das Foto in Bereiche: Kleidung, Haut, Hintergrund und Details. 3. Künstliche Rekonstruktion. Basierend auf den während des Trainings gelernten Daten generiert das Netzwerk neue Pixel, die Haut und anatomische Details darstellen, die mit der ursprünglichen Pose und Beleuchtung übereinstimmen. 4. Finale Komposition. Die neuen Pixel „ersetzen“ digital die Kleidung und erzeugen die Illusion eines nackten Körpers, ohne jemals ein echtes Foto des Subjekts zu zeigen. DeepNude verwendet GANs:
Was bedeutet das in einfachen Worten?
GANs funktionieren wie ein Spiel zwischen zwei künstlichen Intelligenzen. Eine (der Generator) erstellt falsche Bilder, während die andere (der Diskriminator) versucht zu verstehen, ob sie echt oder falsch sind. Zu Beginn produziert der Generator grobe Bilder, die voller Fehler sind. Aber mit Tausenden von Iterationen lernt er, die Realität immer besser zu imitieren. Diese Art des Lernens ist es, was DeepNude ermöglicht, konsistente und visuell realistische Bilder zu erstellen, auch wenn sie völlig künstlich sind. GANs werden heute in vielen anderen Bereichen eingesetzt: von der Restaurierung alter Fotos über die Erstellung virtueller Charaktere in Videospielen bis hin zu Fotofiltern in sozialen Netzwerken.
Was bedeutet es, dass DeepNude die Technologie „pix2pix“ verwendet?
Pix2pix ist eine Art von KI-Modell, das ein Foto in eine andere visuelle Version desselben Bildes umwandelt. Zum Beispiel: Es kann eine Skizze in ein realistisches Gesicht umwandeln; oder eine Straßenkarte in ein Satellitenbild. Im Fall von DeepNude wird pix2pix verwendet, um von „Bild mit Kleidung“ zu „Bild ohne Kleidung“ zu wechseln, wobei die Logik befolgt wird, die während des Trainings gelernt wurde. Es handelt sich nicht um eine einfache „Überlagerung“ von grafischen Ebenen: Das Modell generiert neue Pixel basierend auf den Statistiken der Daten, die es studiert hat.
Warum wurde DeepNude zurückgezogen?
Nach der ursprünglichen Veröffentlichung im Jahr 2019 wurde DeepNude von seinem eigenen Schöpfer zurückgezogen. Die Kritiken waren sofort und stark: Die App konnte verwendet werden, um nicht einvernehmliche Bilder zu erstellen, was die Privatsphäre und Würde der Menschen verletzte. Das Risiko bestand darin, dass jeder das Foto einer bekleideten Frau hochladen und in wenigen Sekunden eine manipulierte Version erhalten konnte. Der Schöpfer von DeepNude erklärte, dass er die böswillige Nutzung, die davon gemacht werden würde, nicht vorhergesehen hatte, und entfernte das Projekt mit der Begründung, dass „die Welt nicht bereit für eine solche Technologie war“.
Was sind die ethischen und sozialen Auswirkungen von Technologien wie DeepNude?
DeepNude hat grundlegende ethische Fragen über das Verhältnis zwischen künstlicher Intelligenz, Privatsphäre und Zustimmung aufgeworfen. Dieselben Techniken, die zur Erstellung manipulierten Bilder verwendet werden, werden heute in positiven Kontexten eingesetzt, wie in der Medizin, im Kino oder in der digitalen Restaurierung. Ohne Regeln und Kontrolle können sie jedoch zu Werkzeugen des Missbrauchs werden. Dies hat Regierungen, Unternehmen und Forscher dazu veranlasst, über KI-Ethische Fragen zu sprechen und mehr Verantwortung bei der Entwicklung und Nutzung generativer neuronaler Netzwerke zu fordern.
Werden Technologien wie DeepNude heute noch verwendet?
Obwohl DeepNude entfernt wurde, wird die zugrunde liegende Technologie – GANs und Pix2pix-Modelle – weiterhin weit verbreitet eingesetzt. Es gibt Hunderte von Projekten für generative KI, die ähnliche Prinzipien für legale und kreative Zwecke nutzen: beschädigte Fotos regenerieren, realistische Avatare erstellen oder Gesichter aus teilweise Bildern rekonstruieren. Gleichzeitig sind illegale Versionen und Klone der Originalsoftware entstanden, die im Dark Web oder über private Kanäle operieren, oft mit schädlichen Absichten.
Ist es möglich, Techniken wie die von DeepNude ethisch zu verwenden?
Ja, aber mit klaren Grenzen und Regeln. Dieselben neuronalen Netzwerke, die DeepNude verwendet hat, um Bilder zu generieren, können verwendet werden, um fehlende Gesichter in alten Gemälden zu rekonstruieren, Landschaften nachzubilden oder 3D-Objekte zu modellieren. Das Problem ist nicht die Technologie an sich, sondern die Art und Weise, wie sie verwendet wird. Viele Unternehmen im Bereich der künstlichen Intelligenz implementieren jetzt Kontrollsysteme, um unbefugte Manipulationen von Bildern realer Personen zu verhindern.
Wie werden generative neuronale Netzwerke heute verantwortungsbewusst trainiert?
Heute versuchen Entwickler, ethische Datasets zu verwenden, die aus künstlich generierten Bildern oder aus Inhalten bestehen, die unter offenen Lizenzen veröffentlicht wurden. Darüber hinaus werden Systeme zur Filterung sensibler Inhalte und zur Nachverfolgbarkeit der Modelle eingeführt, um zu wissen, wie und mit welchen Daten sie trainiert wurden. Diese Transparenz ist entscheidend, um zu verhindern, dass sich Fälle wie DeepNude wiederholen, und um das Vertrauen der Öffentlichkeit in künstliche Intelligenz aufrechtzuerhalten.