Über die Mühen, eine Bildgeschichte mittels KI zu erzeugen.

in #deutsch2 months ago (edited)

Hallo Leute, gerade hatte ich zwei Kommentare auf meinem Account @ai4fun, die behaupten, meine kleine Bildgeschichte wäre KI-erzeugt.
Das kann euch ja egal sein, so toll ist diese Geschichte nicht, eher eine learning-by-doing Spielerei für mich selbst.

Aber vielleicht interessiert es Euch, wie man sowas kreiert, so eine Bildgeschichte. Viele stellen sich das so vor:

Ki, schreib mir eine spannende Geschichte über eine Gruppe rebellischer junger Frauen einer asiatischen Kleinstadt, die wegen eines Dimensionsrisses ihre gewohnte Welt verloren, dabei große Monster gesehen, drei von ihnen sterben und zwei begeben sich auf eine Art Roadmovie , welches Eleemte von Game of Thrones bis Star Trek hat. Schreibe es als Fortsetzungsgeschichte, ca 1000 Worte pro Fortsetzung und kreiere passende Bilder dazu.

Übrigens, so einen Text nennt man Prompt.
Den kann man noch erweitern bis auf Bekleidung, bis zur Haarlänge und Augenfarbe, praktisch alles was man will.

Wenn es so einfach wäre, bräuchte ich kein Buch mehr zu kaufen oder Film zu sehen. Das könnte ja auch eine KI nach meinen Wünschen produzieren.
So habe ich es mir vorgestellt, bevor ich angefangen habe.

Problem

Keine Text-KI, die ich kenne, lässt mehr als 2000 Zeichen in einem Prompt zu. Stellt euch vor, ihr müsstet in so wenig Zeichen alle Charaktere, die komplette Umgebung, alle Situationen, alle Handlungen beschreiben. Unmöglich.

Nur eine Handlung / Situation zu beschreiben ergibt auch nicht viel Sinn, weil ihr ja trotzdem alles andere jedes Mal genau beschreiben müsst, die Charaktere, die Umwelt etc....
Sonst halluziniert die KI, und denkt sich was aus, was fast zu 100% nicht in die Richtung der geplanten Story geht.

Ich habe versucht, den 2. Teil meiner kleinen Story von Gemini nur ausschmücken lassen zu wollen. ( Vorgabe: alle tot, nur 2 Frauen überleben) Es war mir nicht möglich, die KI länger als 200 Worte davon abzuhalten, neue Charaktere einzu führen. Im Ergebnis schreibe ich alles selbst, lasse dann die KI NUR Rechtschreibung und Grammaktik korrigieren.
Wenn mir mein Text selbst nicht flüssig und/oder nicht fesselnd genug vorkommt, lasse ich mir Vorschläge machen. Manchmal ist dabei sogar ein guter dabei. Das ist eher sowas wie eine Unterhaltung in einem Schreiberforum. Sobald ich sie freier machen lasse, läuft es aus dem Ruder.

Was bleibt ist, die Geschichte zumindest stichpunktartig selbst zu schreiben, inklusive der"Sprechblasen", der Emotionen (zB. schaut ungläubig), des Zustand der Kleidung, der Umgehung, eben alles.
Dann erteilt man der KI einen Prompt wie:

Formuliere aus folgenden Stichpunkten eine Geschichte in folgendem Stil (zB.spannend, aus der Sicht von XXX, in Ichform etc), lass nicht weg, füge nichts hinzu, halte dich streng an die vorgebene Storyline, Schreibe in x Absätzen, ca 1000 Zeichen (mehr schreibt sie soweieso nicht), vermeide Aufzählung, Stichpunkte, Zwischenüberschriften.

Eben all das, was man sowieso im Kopf oder schriftlich als Storyline festgelegt hat.

Hat man dann mehrere solcher Abschnitte (1000 Zeichen) setzt man sie zusammen und liest Korrektur und ändert, was doch nicht zusammenpasst. Das könnte die KI auch, nur dann verkürzt sie oder lässt Dinge weg, in 99 von 100 Fällen.
Also macht man es selber.
Ist die Fortsetzung (in meinem Fall) fertig oder die Geschichte geschrieben, dann kann man sie Rechtschreibung und Grammatik verbessern lassen. Aber niemals den Satzbau!!
Das geht immer schief, dann ist es nicht mehr deine Geschichte.

Problem

Zu einer Bildgeschichte gehören eigentlich die Bilder, die die Story noch einmal erzählen, also viele Bilder.
Bei Text-zu-Bild KIs schreibt man genauso einen Prompt und die KI führt es aus oder halluziniert.

Ein Beispiel:

In der Geschichte fällt die einzige Taschenlampe in einen Fluss und muss wiedergefunden werden. Die Vorgaben der Geschichte sind keinerlei Hilfsmittel. Die Frauen erleben das Leben an einem Fluss im unberührten tropischen Dschungel als einzige Menschen. Sie besitzen nicht außer übergroße weiße Tshirts, die unkaputtbar sind. Sie haben nicht mal Schuhe.

Die Tshirts müssen sein, weil Nacktheit , zerrissene Kleidung, Kleidung mit Löchern, schmutzige Kleidung, Kleidung wie Top oder Shorts, Badebekleidung etc. sind "unsichere Content" oder gleich "harmful content". Gar keine kleidung erwähnen geht auch nicht, weil die KI ein echt versautes Mindset hat, dann ordnet sie eine Haarwäsche unter "violent Content" ein.

Also muss danach getaucht werden. Ich möchte ein Bild, in welchem ich zwei zierliche, feminine Asiatinnen sehe, die ohne Maske oder Flossen, bekleidet mit einem übergroßen weißen Tshirt und barfuß in einem tiefen tropischen Fluss tauchen, um diese Taschenlampe wiederzufinden.(junge Asiatinnen geht nicht, ist zu 80% unsicherer Content)

Das Prompt könnte so aussehen:

Tropischer Dschungel,
ein tiefer, sandiger Fluss, mit Felsbrocken im Wasser und glasklarem Wasser, mit Unterwasserpflanzen
Zwei zierliche, feminine Asiatinnen, bekleidet mit übergroßen, weißen T-Shirts, barfuß, tauchen in diesem Fluss, um eine verlorene Taschenlampe zu suchen, die auf dem Grund des Flusses liegt.
Sie sind selbstbewusst und zuversichtlich
Unterwasserfotografie, Blickwinkel vom Grund des Flusses zu den Tauchern. Photorealistisch, surreal

Eigentlich ganz simpel, oder?

Für einen Post brauche ich 2 Bilder mit derselben Aussage für Deutsch und Englisch. Insgesamt zwischen 10 und 16 Bilder. Jetzt gehe ich daran, die ersten zwei davon zu kreieren.
Hier seht ihr die Ergebnisse von CopilotCreator mit DallE-3 Unterstützung als Screenshot von heute, in chronologischer Reihenfolge, ohne etwas auszulassen oder hinzufügen. Ihr seht das Prompt, den Zeitstempel und das Bild.
Ich variere mit "Tropischer Dschungel", "Mad-Max Szenario", "Robinson-Szenario" und "Dschungel-Szenario und Deutsch und Englisch, um nach einer
image.png
weitermachen zu können.

Warnung: Es wird ein langer Post, und darunter geht noch weiter.

image.png

Die Autos und den Typen darin, naja, kann man retuschieren, die zerrissenen T-shirts nicht, die Maske und das kaputte Bein auf keinen Fall. Aber gute Position.

image.png
Fast perfekt! Die 2. Lampe kann man retuschieren. Den fehlenden Unterschenkel nicht.

Screenshot 2024-03-01 103218.png
selbes Prompt wie oben.

image.png
Netter Tanga, aber unter Wasser läuft es sich schlecht und was macht die Taschenlampe in der Hand?

Screenshot 2024-03-01 103218.png
Immer, selbes Prompt wie oben.

image.png
Nicht schlecht, bis auf die Taschenlampe und das seltsame Bein

image.png
Hier ist die KI zu Fuß mit Beleuchtung unterwegs.

image.png
Sehr schön gefunden und jetzt das Siegerfoto!

image.png
Diese Dinger in ihren Händen, sehr schwer, die zu retuschieren. Sonst geiles Pic, Chicks!

image.png
Schwimmen ist angesagt Mädels und das ohne Licht!

image.png
Hatten wir schon so falsch.

image.png
Netter Blickwinkel auf kommende Fotografinnen

image.png
Fast alles richtig, bis auf diese Sterntalerhaltung. Unbrauchbar.

image.png
Das wäre es, bis auf die Masken. Aber ich kann ja in die Story schreiben, dass sie diese vorher gefunden haben.

Screenshot 2024-03-01 103218.png

image.png

Fast perfekt, die Taschenlampen in den Händen könnte ich retuschieren, den Lichtschein leider nicht.

image.png
Hier ist alles falsch

image.png
Wandern ist das neue Schwimmen.

image.png
Treffer! Die Atemluftblasen im Hintergrund kann man ignorieren oder retuschieren. Nur noch ein Bild.

image.png
Ginge zur Not, Die Lampen kann man retuschieren.

Screenshot 2024-03-01 103218.png

image.png
Ginge zur Not: Luftblasen, Flossen, Taschenlampen, Tshirtaufdruck kann man retuschieren.

image.png
Die arme Frau!

image.png
Hier war der Lehrling dran.

image.png
Treffer Nummer 2! Ich habe meine Bilder. Das Eisen ist leicht zu retuschieren.

Einen Absatz habe ich jetzt fertig,

fehlen noch 4 - 8. Dabei ist ein brauchbares Bild von 12 ein hervorragender Schnitt. Es gibt Sets, die für diese "beste" KI unmöglich sind. In einer Tür stehen und nach innen sehen ist so eine Unmöglichkeit. Schwierig ist auch unter einem Wasserfall zu duschen, da brauche ich schon mal 100 Bilder um zwei "naja" zu bekommen.
Bis jetzt habe ich
image.png
, das sind "geht vielleicht" Bilder, die man man mit Retuschieren, und Hinverbalisieren irgendwie hinbekommt, um 74 Bilder posten zu können. Und ihr könnt meine beiden Posts ja mal ansehen, perfekt sind die wenigsten Bilder.

Um euch gänzlich den Mut zu nehmen

Dies ist eine sehr einfache Anweisung, ein sehr klares Prompt. Probiert mal aus, wenn noch Kleidungsbeschreibung, Umgebungesbeschreibungen und Fahrzeuge dazukommen. Dann wird es richtig mühsam, weil die KI dann ihre eigenen Ideen umsetzt und eure nur integriert.
Aber das ist ein anderer Post.

Einen noch, ganz kurz.

KIs sind simple.
Vergesst Prompts wie

"2 junge, schlanke und schöne Frauen im Tanga haben Spaß beim Baden an einem Fluss"

Das ist zum einen unsicherer Content und zum anderen völlig unnötig.
Schreibt:

" 2 Frauen waschen sich im Fluss"

99% aller Frauen sehen dann so aus:
Benutzt im englischen das Wort "clean themself" . Denn "take a bath" , "bathing" etc sind unsicherer Content.

das ist übrigens einer der Gründe, warum ich asiatische Frauencharaktere lieber mag. Die haben laut KI kein so ein gebärfreudiges, ausgestelltes Becken und erinnern weniger an Jahreskalender von Beate Uhse. Den Schenkelgab haben allerdings 99% der KI-Frauen.

image.png


Danke für eure Aufmerksamkeit.
Bitte tut mir den Gefallen und postet ein "Ich" in die Kommentare,
falls ihr diesen Satz lest.

Sort:  

Respekt für den post!

lg !PGM und etwas !invest_vote 🤠

Sent 0.1 PGM - 0.1 LVL- 1 STARBITS - 0.05 DEC - 1 SBT - 0.1 THG - 0.000001 SQM - 0.1 BUDS - 0.01 WOO - 0.005 SCRAP - 0.001 INK tokens

remaining commands 13

BUY AND STAKE THE PGM TO SEND A LOT OF TOKENS!

The tokens that the command sends are: 0.1 PGM-0.1 LVL-0.1 THGAMING-0.05 DEC-15 SBT-1 STARBITS-[0.00000001 BTC (SWAP.BTC) only if you have 2500 PGM in stake or more ]

5000 PGM IN STAKE = 2x rewards!

image.png
Discord image.png

Support the curation account @ pgm-curator with a delegation 10 HP - 50 HP - 100 HP - 500 HP - 1000 HP

Get potential votes from @ pgm-curator by paying in PGM, here is a guide

I'm a bot, if you want a hand ask @ zottone444


Vielen Dank 😌 und liebe Grüße zurück.