Ich habe wieder eine ganze Reihe neuer KIs aufgetan.
Da wäre einmal die KI, die dieses verwirrende Bild generiert hat. Offensichtlich mangelt es der KI an Erfahrung; aber die damit erstellten Bilder wirken faszinierend:
Die Rede ist hier von:
https://deepai.org/machine-learning-model/text2imgIch habe zusätzlich noch eine andere KI gefunden. Mir ist noch nicht ganz klar, wie sie funktioniert; irgendwie wird VQGAN und CLIP benutzt. Das man mit VQGAN ein Bild generieren kann ist nichts neues, mir ist nur nicht ganz klar, wie das mithilfe von Clip funktioniert. Clip wird dazu benutzt, Objekte auf Bildern zu erkennen und einen entsprechenden Text auszugeben.
Im Gegensatz zu den anderen KIs setzt die aber einiges voraus. Man gibt einen Text ein und es wird ein Bild generiert - aber um das zu erreichen, muss man die KI erstmal zum laufen bringen. Damit man auf die Seite kommt, wird ein aktives Google Konto benötigt:
https://colab.research.google.com/drive/1go6YwMFe5MX6XM9tv-cnQiSTU50N9EeT#scrollTo=g7EDme5RYCrtEs dauert sehr lange, bis ein Bild generiert wird (eine Stunde ist nichts; außer vielleicht, ihr habt eine Nvidia Grafikkarte, die mit 30 beginnt; meine beginnt mit 10 und es dauert, dauert, dauert). Daher habe ich noch kein Demobild. Einfach mal die Google Bildersuche bemühen ("VQGAN clip" ist der Suchbegriff). Oder mal auf Reddit schauen:
https://www.reddit.com/r/deepdream/search/?q=VQGAN%2BCLIP&restrict_sr=1Zusätzlich kann diese KI auch Videos erstellen. Geht alles schneller, als gedacht.