Puls, das GAN schlägt wieder zu: von unscharfen Pixeln bis zu HD-Fotos

13. Juni 2020

Technologie

Pulse GAN, ein neuronales Netzwerk, das mit einem revolutionären Ansatz für Bilder die Detailgenauigkeit unscharfer Pixel um das 64-fache steigern kann.

Forscher der Duke University haben ein KI-Tool entwickelt, das verschwommene, nicht erkennbare Bilder von Gesichtern von Menschen in überzeugende computergenerierte Porträts mit feineren Details als je zuvor umwandeln kann.

Methoden vor Pulse GAN könnten ein pixeliges Bild bis zum Achtfachen seiner ursprünglichen Auflösung detaillieren. Aber Dukes Team hat eine Möglichkeit gefunden, eine Handvoll Pixel aufzunehmen und realistisch aussehende Gesichter mit bis zu 64-facher Auflösung zu erstellen. Dabei wurden Funktionen wie feine Linien, Wimpern und Falten "vorgestellt", die nicht im ersten Bild enthalten waren. .

Es wurden noch nie Bilder mit dieser Auflösung erstellt
Cynthia Rudin, Informatiker, Duke University

Es ist kein Identikit

Das Pulse GAN-System kann nicht zur Identifizierung von Personen verwendet werden, sagen die Forscher: Ein verschwommenes und nicht erkennbares Foto von einer Überwachungskamera wird nicht in ein kristallklares Bild einer realen Person verwandelt. Es ist vielmehr in der Lage, neue Gesichter zu erzeugen, die nicht existieren, aber plausibel real erscheinen.

Dieselbe Technik könnte theoretisch Fotos von fast allem mit niedriger Auflösung aufnehmen und scharfe, lebensechte Bilder erstellen, mit Anwendungen, die von Medizin und Mikroskopie bis hin zu Astronomie und Satellitenbildern reichen, sagte der Co-Autor. Sachit Menon, doppelte Spezialisierung in Mathematik und Informatik.

Die Forscher werden ihre Methode vorstellen, genannt IMPULS GAN, von morgen bis zum 19. Juni auf der CVPR-Konferenz (Computer Vision and Pattern Recognition) 2020.

Puls-GAN, von unscharfen Pixeln bis zu HD-Fotos — Ein Beispiel für ein rekonstruiertes Foto

Herkömmliche Ansätze beginnen damit, ein Bild mit niedriger Auflösung mit verschwommenen Pixeln aufzunehmen und zu "erraten", welche zusätzlichen Pixel benötigt werden, indem versucht wird, sie im Durchschnitt mit den entsprechenden Pixeln in hochauflösenden Bildern abzugleichen, die der Computer zuvor gesehen hat. Infolge dieser Mittelung können strukturierte Bereiche in Haar und Haut, die möglicherweise nicht perfekt von Pixel zu Pixel ausgerichtet sind, verschwommen und undeutlich erscheinen.

Das Duke-Team hat einen anderen Ansatz gewählt

Anstatt ein Bild mit niedriger Auflösung aufzunehmen und langsam neue Details hinzuzufügen, sucht das System nach Beispielen für AI-generierte hochauflösende Gesichter (Jetzt werde ich sehr gut darin) und suchen nach solchen, die dem Eingabebild so ähnlich wie möglich aussehen, wenn sie auf dieselbe Größe reduziert werden.

Das Team verwendete ein maschinelles Lernwerkzeug namens GAN oder "gegnerisches generatives Netzwerk". Ich habe gründlicher darüber gesprochen in diesem Artikel und andere auf dieser Seite. GANs sind neuronale Netze, die auf demselben Fotodatensatz trainiert werden. Ein Netzwerk enthält menschliche Gesichter, die durch künstliche Intelligenz erstellt wurden und die Gesichter nachahmen, auf denen es trainiert wurde, während das andere dieses Ergebnis aufnimmt und entscheidet, ob es zwingend genug ist, um mit einem echten Foto verwechselt zu werden. Das erste Netzwerk wird mit der Erfahrung immer besser, bis das zweite nicht mehr unterscheidet. Mit anderen Worten, sie konkurrieren miteinander und verbessern sich durch den Wettbewerb.

PULSE ist in der Lage, realistisch aussehende Bilder aus verrauschten und qualitativ schlechten Eingaben zu erstellen. Aus einem einzelnen verschwommenen Bild eines Gesichts kann eine unbegrenzte Anzahl realistischer Möglichkeiten hervorgehen, von denen jede auf subtile Weise anders aussieht.

Selbst bei pixeligen Fotos, bei denen Augen und Mund kaum erkennbar sind, „tut unser Algorithmus etwas dagegen. Etwas, das traditionelle Ansätze nicht können. “ Wort des Mitautors Alex Damjan, Mathematiker bei Duke.

Pulse GAN, die "Fantasie" an der Macht

Das System kann ein verschwommenes Pixelbild oder ein 16 × 16-Pixel-Bild in Sekunden in ein 1024 × 1024-Pixel-Bild konvertieren und dabei mehr als eine Million Pixel hinzufügen, ähnlich wie bei der HD-Auflösung. Details wie Poren, Falten und Haarsträhnen, die auf Fotos mit niedriger Auflösung nicht wahrnehmbar sind, werden in computergenerierten Versionen klar und deutlich.

Die Forscher baten 40 Personen, 1.440 Bilder zu bewerten, die mit PULSE GAN und fünf weiteren Skalierungsmethoden erstellt wurden. Ihr Urteil? Eine Zahl auf einer Skala von eins bis fünf. und Pulse GAN hat das Beste von allem getan. Was mehr ist, erzielte er fast gleichwertig mit hochwertigen Fotos von echten Menschen.

Überzeugen Sie sich selbst von den Ergebnissen https://pulse.cs.duke.edu/.

Gianluca Riccio, Kreativdirektorin von Melancia adv, Texterin und Journalistin. Es ist Teil des italienischen Instituts für Zukunft, der World Future Society und H+. Seit 2006 leitet er Futuroprossimo.it, die italienische Ressource für Zukunftsforschung.

Um über Forschungen, Entdeckungen und Erfindungen zu berichten, Kontaktieren Sie die Redaktion! Folgen Sie Futuro Prossimo auf WhatsApp: exklusive Neuigkeiten und Updates (kostenlos).

FP über Fatto Quotidiano
Alberto Robiati und Gianluca Riccio führen die Leser durch Zukunftsszenarien: die Chancen, Risiken und Möglichkeiten, die wir haben, um ein mögliches Morgen zu schaffen.

Zum gleichen Thema:

Das Letzte

Puls, das GAN schlägt wieder zu: von unscharfen Pixeln bis zu HD-Fotos

Technologie

Teilen

Forscher der Duke University haben ein KI-Tool entwickelt, das verschwommene, nicht erkennbare Bilder von Gesichtern von Menschen in überzeugende computergenerierte Porträts mit feineren Details als je zuvor umwandeln kann.

Es ist kein Identikit

Das Duke-Team hat einen anderen Ansatz gewählt

Pulse GAN, die "Fantasie" an der Macht

Orwell Supermarkt: Einkaufen mit Gesichtserkennung muss neu gedacht werden

VASA-1, die KI von Microsoft, erstellt aus nur einem Foto superrealistische Charaktere

Amodei, Anthropic: „KI wird bald in der Lage sein, sich autonom zu replizieren und zu überleben“

Overtourism: Ist der Eintrittspreis für Venedig die Zukunft der Kunststädte?

Batterierecycling 2.0, der Grabstein zum Thema „Elektroauto ja oder nein?“

Synthetisch, aber lebendig: Zellen, die die Grenze zwischen künstlich und biologisch herausfordern

Deutschland, vor einem Jahr haben wir uns von der Atomkraft verabschiedet: Warum sie nicht zurückkehren werden

Herculaneum enthüllt Platons Geheimnisse: Sein Ende wird rekonstruiert