@Atrox Hab deinen Prompt mal in ChatGPT eingegeben. Habs zwei mal versucht, in jeweils neuen Fenstern.

Original anzeigen (0,2 MB)Ich würde fast sagen, das du nur Glück hattest.
Ich wähnte mich auch schon, nahe an der Lösung zu sein. Aber ohne die genauen Metadaten und den korrekten Seed, könnte ich das Bild nicht mehr nachstellen.
Atrox schrieb:Ich ziehe in Betracht die Rotwein-Challenge in einen meiner Kurse mit aufzunehmen. Ist eine schöne Übung dazu, wie man bei den LLMs manchmal um die Ecke denken muss, um das gewünschte Ergebnis zu erhalten.
Ja, Bildgenerierung ist ein schönes Anschauungsbeispiel. Aber dein Fazit musst du wohl ändern. Ich denke, das ich die richtige Erklärung gefunden hab, weshalb man kein Bild eines vollen Weinglases erstellen kann (nicht unter Zuhilfenahme einer LoRA). Der Schlüssel liegt nicht so sehr in der Text-Beschreibung begründet sondern vielmehr im Rauschen des Bildes. Ein Bild wird in mehreren Staps erstellt. Wenn das Bild schon in der ersten Phase ein Katze darstellt, kann daraus kein Hund mehr werden. Das passiert beim Glas Wein ebenso. Die Datenlage (das Grundrauschen) muss so eng mit dem Bild eines nicht bis zum Rand gefüllten Glas verknüpft sein, das die Beschreibung fast schon egal wird. Wenn schon das erste Rauschen ein defacto Weinglas mit Wein zeigt, dann wird es immer zu diesem Weinglas, welches nicht vollständig gefüllt ist.
Hier mal ein Video, indem dieses Rauschen zu sehen ist:

How to View Ksampler Preview Images in ComfyUI | Easy Guide
Externer Inhalt
Durch das Abspielen werden Daten an Youtube übermittelt und ggf. Cookies gesetzt.