moredread
Diskussionsleiter
Profil anzeigen
Private Nachricht
Link kopieren
Lesezeichen setzen
dabei seit 2008
Profil anzeigen
Private Nachricht
Link kopieren
Lesezeichen setzen
KI - Bilder erzeugen durch Textbeschreibungen
15.08.2021 um 21:53Hi,
ich wollte einmal das Thema der Gemäldegeneratoren ansprechen, und zwar spezifisch solche, die man per Text dazu anweisen kann, etwas zu tun, also mithilfe gesprochener Wörter (und damit mal wieder mit GPT3; also dem Motor von @ArtInt). Da das Thema aber sehr populär ist, dürften wir solche Generatoren bald in allen möglichen Kontexten benutzen (bspw. als Clipart Generator, Emoticon Generator, Kunstgenerator oder zum erzeugen von Schmuddelbildchen).
Ich wollte in diesem Thread das Thema ein wenig im Fokus behalten, insbesondere, was möglich ist. Weniger mit einem Fokus auf die dahinterstehende Technik als mit den Bildern, die erzeugt werden können. Da gewissermaßen die offizielle KI des Herstellers ist nicht frei verfügbar (auch nicht in einer geschlossenen Beta o.ä.) ist, muss man sich aktuell mit Nachbauten zufrieden geben, die von Studenten o.ä. finanziert werden. Da ein Teil des Codes der offiziellen KI (DALL-E von OpenAI) verfügbar ist, aber eben nicht das trainierte Modell, muss die KI trainiert werden. Diese Updates erfolgen ständig, so das die KI nach und nach besser wird. Die Updates kommen alle ein oder zwei Wochen zum tragen, so weit ich das bis jetzt verfolgt habe.
Gewissermaßen meine vorletze Erfahrung war, das es sich um eine Art moderne-Kunst-Generator handelte. Man hatte meistens eine Idee, worum es in den Bildern ging, aber sie bildeten niemals auch nur im entferntesten die Realität ab. Jetzt, etwa zwei Wochen später, hat sich die KI signifikant verbessert. Einfach Dinge kann sie jetzt sehr gut darstellen. So zum Beispiel zeichnet die KI Wolken:
Original anzeigen (1,2 MB)
Das nächste Bild ist der Ozean:
Original anzeigen (1,2 MB)
Und das hier zeigt ein Kliff; etwas, das für die KI offenbar etwas schwerer ist:
Original anzeigen (1,2 MB)
Also offensichtlich können einfache Landschaften dargestellt werden. Jetzt mischen wir mal Kliff und Ozean:
Original anzeigen (1,0 MB)
Als nächstes packen wir ein bisschen Wetter oben drauf:
Original anzeigen (1,2 MB)
Da fehlt noch ein bisschen was. Vielleicht Wellen?
Original anzeigen (1,1 MB)
Immer noch nicht dräuend genug. Vielleicht noch ein paar Wolken?
Original anzeigen (1,2 MB)
Ah, ich habe es: Es ist ja noch Tag. Mal sehen, wie das ganze in der Nacht aussieht.
Original anzeigen (1,0 MB)
Ich denke, da ist noch Platz nach oben. Ich weiß ja, woran die KI scheitert (bspw. Menschen oder Dingen wie Maschinen) oder schwächelt (sie kennt den Kölner Dom, aber nur auf Deutsch o_O ). Ich bin gepannt, wie es ist, der KI dabei zuzusehen, wie sie malt und besser und besser wird. Wer weiß; irgendwann kann sie auch das hier gut umsetzen:
Original anzeigen (1,6 MB)
Wer probieren möchte, kann das hier tun https://huggingface.co/spaces/flax-community/dalle-mini (daher stammen die Screenshots) oder hier https://huggingface.co/spaces/abidlabs/dalle-mini . Wenn ihr gute Bilder erzeugt, immer her damit! :) Und wenn ihr Links auf andere Generatoren kennt, die aus Text Bilder erzeugen (keine Photoshop-Online Tools, Randomness-Tools, Mandelbrot-Generatoren oder Single-Use-Case-Generatoren wie www.thispersondoesnotexist.com - bitte nur Text-Bild-Generatoren!)
ich wollte einmal das Thema der Gemäldegeneratoren ansprechen, und zwar spezifisch solche, die man per Text dazu anweisen kann, etwas zu tun, also mithilfe gesprochener Wörter (und damit mal wieder mit GPT3; also dem Motor von @ArtInt). Da das Thema aber sehr populär ist, dürften wir solche Generatoren bald in allen möglichen Kontexten benutzen (bspw. als Clipart Generator, Emoticon Generator, Kunstgenerator oder zum erzeugen von Schmuddelbildchen).
Ich wollte in diesem Thread das Thema ein wenig im Fokus behalten, insbesondere, was möglich ist. Weniger mit einem Fokus auf die dahinterstehende Technik als mit den Bildern, die erzeugt werden können. Da gewissermaßen die offizielle KI des Herstellers ist nicht frei verfügbar (auch nicht in einer geschlossenen Beta o.ä.) ist, muss man sich aktuell mit Nachbauten zufrieden geben, die von Studenten o.ä. finanziert werden. Da ein Teil des Codes der offiziellen KI (DALL-E von OpenAI) verfügbar ist, aber eben nicht das trainierte Modell, muss die KI trainiert werden. Diese Updates erfolgen ständig, so das die KI nach und nach besser wird. Die Updates kommen alle ein oder zwei Wochen zum tragen, so weit ich das bis jetzt verfolgt habe.
Gewissermaßen meine vorletze Erfahrung war, das es sich um eine Art moderne-Kunst-Generator handelte. Man hatte meistens eine Idee, worum es in den Bildern ging, aber sie bildeten niemals auch nur im entferntesten die Realität ab. Jetzt, etwa zwei Wochen später, hat sich die KI signifikant verbessert. Einfach Dinge kann sie jetzt sehr gut darstellen. So zum Beispiel zeichnet die KI Wolken:
Original anzeigen (1,2 MB)
Das nächste Bild ist der Ozean:
Original anzeigen (1,2 MB)
Und das hier zeigt ein Kliff; etwas, das für die KI offenbar etwas schwerer ist:
Original anzeigen (1,2 MB)
Also offensichtlich können einfache Landschaften dargestellt werden. Jetzt mischen wir mal Kliff und Ozean:
Original anzeigen (1,0 MB)
Als nächstes packen wir ein bisschen Wetter oben drauf:
Original anzeigen (1,2 MB)
Da fehlt noch ein bisschen was. Vielleicht Wellen?
Original anzeigen (1,1 MB)
Immer noch nicht dräuend genug. Vielleicht noch ein paar Wolken?
Original anzeigen (1,2 MB)
Ah, ich habe es: Es ist ja noch Tag. Mal sehen, wie das ganze in der Nacht aussieht.
Original anzeigen (1,0 MB)
Ich denke, da ist noch Platz nach oben. Ich weiß ja, woran die KI scheitert (bspw. Menschen oder Dingen wie Maschinen) oder schwächelt (sie kennt den Kölner Dom, aber nur auf Deutsch o_O ). Ich bin gepannt, wie es ist, der KI dabei zuzusehen, wie sie malt und besser und besser wird. Wer weiß; irgendwann kann sie auch das hier gut umsetzen:
Original anzeigen (1,6 MB)
Wer probieren möchte, kann das hier tun https://huggingface.co/spaces/flax-community/dalle-mini (daher stammen die Screenshots) oder hier https://huggingface.co/spaces/abidlabs/dalle-mini . Wenn ihr gute Bilder erzeugt, immer her damit! :) Und wenn ihr Links auf andere Generatoren kennt, die aus Text Bilder erzeugen (keine Photoshop-Online Tools, Randomness-Tools, Mandelbrot-Generatoren oder Single-Use-Case-Generatoren wie www.thispersondoesnotexist.com - bitte nur Text-Bild-Generatoren!)