Das Ende der Stock-Fotografie?

Einleitung

Das "Brain" Team vom Tech-Giganten Google hat etwas faszinierendes geschaffen. Das neue "Text-zu-Bild-Diffusionsmodell mit einem beispiellosen Grad an Fotorealismus und einem tiefen Sprachverständnis", ist atemberaubend und erschreckend zugleich. In erster Linie eröffnet es unzählige Möglichkeiten für Digitalunternehmer:innen. Wie kann man sich das neue "Imagen", eine KI-Bildsynthese, vorstellen?
Copyright: Imagen. https://imagen.research.google/

📂 Inhalt

Jeder kennt die Situation: Die Chefin steht vor der Tür und fragt wie weit Sie mit dem Beitrag sind. Es fehlen noch Stockbilder! Aber woher nehmen wenn nicht stehlen? Anbieter gibt es zu mindestens genug: AdobeStock, Pixabay, Unsplash, Istockfoto, Shutterstock, Pexels, GettyImages und und und… Nun wäre es nicht schön wenn man einfach seinen Fotowunsch aufschreiben könnte und sofort das exakt passende Foto erhalten würde? Klingt ja fast wie Magie!

Wie wäre es zum Beispiel mit: „Einem süßen Corgi, der in einem Sushi-Haus lebt?“

Huch das funktioniert ja echt gut! Und sieht dazu noch fotorealistisch aus. Aber wie funktioniert das Ganze und kann ich es schon verwenden?

Was ist „Imagen“ vom Google-Brains Team?

Imagen ist ein KI-Bildgenerator, der auf einem Text-zu-Bild-Diffusionsmodell basiert. Einfach gesagt verwendet die KI ihr tiefes Sprachverständnis, um aus Text fotorealistische Bilder zu generieren. Dabei wird ein T5 XXL-Encoder zum übersetzen von Textbausteinen verwendet [Google-AI-Blog,2020].

Die Erklärung der exakten Funktionsweise ist aktuell noch nicht im Detail möglich. Experten vermuten allerdings, dass Google eine klare Positionierung gegenüber seinen Mitbewerbern, wie zum Beispiel „DALL-E 2“ von open.ai wagt.

Kann ich Imagen schon verwenden?

Imagen ist aktuell nicht öffentlich – weder die Anwendung noch der Code. Das bedeutet, dass wir uns noch etwas gedulden müssen. Vergleichbare Anwendungen gibt es allerdings schon.

Der Grund dafür ist einfach. Das KI-System zur Fotogenerierung funktioniert zwar, jedoch ist die Angst vor einer illegalen Nutzung des Tools hoch. Wie im Research Paper der Cornell University nachzulesen, wurde das bekannte Datenset LAION-400M verwendet, um nicht gewünschte Inhalte herauszufiltern.

Der Konkurrent open.ai hat bereits eine Warteliste angelegt, um das Tool nutzen zu können. Bei Google’s Imagen müssen wir uns voraussichtlich noch etwas gedulden, bevor der KI-Foto-Spaß losgehen kann.

Fazit: Großes Potential für Online-Unternehmer:innen!

Wir finden, Imagen und andere KI-Bildgeneratoren bieten ein immenses Potential für alle, die ihr Internet-Business automatisieren wollen. Online-Händler:innen könnten zum Beispiel Produktbilder ganz nach ihren Vorlieben innerhalb Sekunden erzeugen und somit teure und zeitaufwendige Fotosessions von ihren monatlichen Ausgaben streichen. Auch für Webdesigner würden zum Beispiel teure Abos für Stock-Foto-Datenbanken entfallen. Aber nicht nur diese Beispiele könnten von den KI-Generatoren profitieren. Die Anwendungsbeispiele sind fast unzählbar! Es ist Definitiv eine Entwicklung, die man weiter verfolgen sollte. Hoffentlich steht dieses Tool bald der Internet-Community zur Verfügung!

Weitere Quellennachweise für technisch Interessierte:

Beitrag von heise.online →

AI-Blog von Google →

Offizielle Imagen Research Site →

Der KI-Generator von Open AI →

Author picture

Wir berichten fast täglich über IT-News, die uns und unsere Kund:innen besonders interessieren.

Alle Beiträge