Mit Midjourney auf den Spuren von Moby Dick

Was wäre, wenn nicht Ishmael der einzige Überlebende des Untergangs der Pequod in Herman Melvilles legendärem Roman Moby Dick gewesen wäre? Stattdessen hätten nur die Speicherkarten der Kameras einiger Crewmitglieder die Katastrophe überstanden. Mit ihnen hielten sie die Reise aus ihrer Perspektive fest. Durch die Objektive von Starbuck, Stubb, Queequeg und Pip erlebst du den Alltag an Bord, atemlosen Momente auf See und die Vielfalt des Ozeans.

Mithilfe von Midjourney habe ich die Crew des Walfangschiffs Pequod in die heutige Zeit versetzt und sie mit Kameras zur Dokumentation ihrer Reise ausgestattet.

Der erste Offizier Starbuck verkörpert die Vernunft und Moral an Bord. Er widerspricht häufig dem von Rache getriebenen Kapitän Ahab und sieht dessen Besessenheit als irrational und gefährlich an. Ausgestattet mit einer DJI Drohne und einer Sony Alpha A7 III widmet sich Starbuck leidenschaftlich der dokumentarischen Naturfotografie, er fotografiert Delphine und Albatrasse, die das Schiff besuchen. Als rationaler Denker behält er mit der Drohne stets den Überblick über die Reise der Pequod. Sein erstes Bild zeigt das Schiff im winterlichen Hafen von Nantucket, wo auch Ishmael anheuert.

Der zweite Offizier Stubb bringt mit seiner entspannten und humorvollen Art Ausgleich in die angespannte Stimmung an Bord. Bei der Crew ist er sehr beliebt. Während Starbuck das Geschehen um das Schiff festhält, dokumentiert Stubb mit seiner Hasselblad X1D alleine den Alltag an Bord. Stubb porträtiert die Matrosen bei ihren Deckarbeiten oder bei ihren Pausen und inszeniert gerne Objekte wie Harpunen in einem editorialen, fotojournalistischen Stil.

Der polynesische Harpunier Queequeg, ein enger Freund des Erzählers Ishmael, sticht durch seine mutige, exotische und mysteriöse Ausstrahlung hervor. Ausgerüstet mit einer GoPro Actioncam und einer Arri Alexa begleitet er die Walfänger mitten im Geschehen in ihren kleinen Booten, filmt aus nächster Nähe den Einsatz der Harpunen und schaut mit seiner GoPro auf das Leben unter die Wasseroberflächen.

Der junge, afroamerikanische Schiffsjunge Pip gilt als niedrigstes Mitglied der Bordhierarchie. Für ihn ist die Pequod auch ein großer Abenteuerspielplatz. Mit einer Kodak-Kamera macht er am liebsten Selfies und dokumentiert aus einer unbeschwert-kindlichen Sicht das aufregende Leben an Bord.

Herman Melvilles Roman “Moby Dick” gehört zu meinen absoluten Lieblingsbüchern.1Zitierte Stellen stammen aus der Neuübersetzung von Matthias Jendis (Hanser Verlag) Was mich besonders fasziniert, sind die unglaublich lebendig wirkenden Naturbeschreibungen, die der Autor aus eigenen Erfahrungen als Walfänger schöpft.

Meilen um Meilen wogte er um uns her, sodass es war, als segelten wir durch grenzenlose Felder reifen, goldenen Weizens.

Moby Dick (Kapitel 58)

Wenn Melville das Schiff durch “unermessliche Wiesen von Krill” segeln lässt und schreibt: “Meilen um Meilen wogte er um uns her, sodass es war, als segelten wir durch grenzenlose Felder reifen, goldenen Weizens” (Kapitel 58), dann vermittelt er dem Leser ein bildgewaltiges Erlebnis der Weite und Lebendigkeit des Ozeans. Solche Schilderungen sucht man in Verfilmungen vergeblich. Dabei beschreiben sie eine mit Leben gefüllte Natur, die wir heute nicht mehr kennen. Die Ozeane sind längst überfischt, es gibt mehr Plastik als Fische darin. Heute würde man den Ozean mit anderen Augen sehen, als zu Melvilles Zeiten. Obwohl er selbst die Schönheit beschreibt, sieht Melville grundsätzlich etwas abgrundtief Böses in den Weltmeeren: “Die See ist aber nicht nur der Erbfeind des Menschen, des Fremden in ihrem Reiche, sondern auch der teuflische Feind ihrer eigenen Brut. (…) Schnaubend und schäumend wie ein zügelloses Schlachtross, das seinen Reiter abgeworfen, überrennt der herrenlose Ozean den Erdball” (Kapitel 58). Mellvilles Erzählungen stecken von an Details, die man heute anderes erzählen würde.

Rund drei Jahre war die Pequod auf den Weltmeeren unterwegs. So aufregend die Waljagd und die Umsegelung des Kaps der Guten Hoffnung auch waren, der Alltag auf einem Segelschiff war nicht immer abenteuerlich. Geduld gehörte zum Leben an Deck dazu. Doch was machten die Seeleute, wenn kein Wind wehte? Für eine fesselnde Erzählung mögen diese Momente uninteressant sein, für Fotos jedoch nicht. Sie bieten die Möglichkeit, das Leben und die Menschen an Deck einzufangen.

Inspiriert von Herman Melvilles bildgewaltigen Naturbeschreibungen in “Moby Dick” hatte ich die Idee, mithilfe von Midjourney die verloren gegangene Schönheit der Ozeane wieder auferstehen zu lassen. Zugegeben ich bin noch ein ziemlicher Anfänger im Prompten. Ich hätte nicht gedacht, dass einige einfache Befehle, so schwierig sind. Mir gelang es zum Beispiel nicht, das Meer in einem kräftigen Orange-Ton wie die von Melville beschriebenen “unermesslichen Wiesen von Krill” darzustellen. Vielleicht fehlt Midjourney eine Referenz für ein farbiges Meer?! Insgesamt wirkt die Bilderserie konsistent, allerdings nicht beim näheren Betrachten: Die Schiffe und Boote sehen (wenn man genau hinschaut) in jedem Bild anders aus. Das lässt sich auch kaum ändern. Und viele Dinge an Deck kommen echten Segler:innen vermutlich lächerlich sinnlos vor.

Es braucht eine genaue Beschreibung für gute Ergebnisse. Besonders gut kann Midjourney Perspektiven, Lichtverhältnisse oder Kameraeinstellungen umsetzen.

Auch was die Darstellung historischer Szenen betrifft, ist es ganz schön Arbeit, Szenen ohne moderne Kleidung und sonstigen Gegenständen zu kreieren. Perplexity und ChatGPT haben mir dabei assistiert, passende Prompts zu formulieren, in “virtuellen Museen” zu recherchieren und passende Beschreibungen in “Moby Dick” zu finden. Ein hilfreicher Trick: Um gleiche Charaktere über mehrere Bilder hinweg beizubehalten, lassen sich in Midjourney bis zu sechs Gesichter als Referenz setzen (–cref). Dies funktioniert nicht nur mit Menschen, sondern auch mit Objekten, wie beispielsweise einer Harpune. Aus einer gezeichneten Harpune macht Midjourney ein fotorealistisches Bild – was für eine Chance für Historiker:innen! 

ChatGPT und Perplexity haben mir bei der Recherche geholfen.

Die Frage steht im Raum: Sind Bild-KIs wie Midjourney eine Konkurrenz für Fotograf:innen und Grafiker:innen oder muss man die Technik viel mehr als neue kreative Ausdrucksform einordnen? Fest steht, dass KI-Systeme auf echte Bilddaten zum Training angewiesen sind. Denn werden sie ausschließlich mit ihren eigenen generierten Werken gefüttert, entsteht laut Studien mit der Zeit ein zunehmend bizarres Abbild der Realität.2The Curse of Recursion: Training on Generated Data Makes Models Forget (Studie)

Bedenklich stimmt auch, dass KI-Ergebnisse besonders gut werden, wenn man Namen von Künstler:innen wie Wes Anderson oder Ridley Scott als Referenz verwendet. Meiner Meinung nach sollten Kreative dann eine Art Dividende erhalten (ähnlich wie bei Liedaufrufen bei Spotify), wenn ihr Name und Stil derart für kommerzielle Systeme genutzt wird. Es ist auch fragwürdig, dass KI-Systeme aktuell noch viele Vorurteile verstärken und zu bestimmten Stereotypen tendieren – in meinem Fall waren es oft muskelöse, schöne Menschen, die einer Parfümwerbung entsprungen schienen. Künstliche Intelligenz bleibt also ein Werkzeug mit Schattenseiten, das kritisch und ethisch reflektiert werden muss.

Es braucht unzählige Versuche, bis man aus Motiven auffällige Fehler entfernt hat. Matrosen, zum Beispiel, trugen oft modere Kleidung wie gelbe Regenmäntel oder Midjourney setzt die Personen (wie hier) neben das Schiff statt in das Schiff.

Ansonsten denke ich, “KI-Fotografie” könnte zukünftig durchaus einen Platz als eigenständiges Erzählmedium neben Fotos, Filmen, Videospielen oder Theater einnehmen – so wie dieses Beispiel gezeigt hat: Überzeugende Bilder entstehen nicht auf Knopfdruck, sondern erfordern eingehende Recherchen, sei es zur Biologie (Welche Haifischarten gibt es im Pazifik?), zur Geschichte oder zu historischen Kontexten (Was trugen Seeleute im 19. Jahrhundert?).

Ich stelle mir selbst die Frage, wieweit das mein eigenes Werk ist. Schließlich habe ich die KI nicht nur für Recherchen und zur Bildgenerierung genutzt, sondern auch zum Feinschliff und Redigieren des Textes. Ist das nicht alles ein KI-Werk? Ich denke aber, das ist es, auch wenn die KI mir erheblich geholfen hat. Die kreative Ursprungsidee stammte von mir, ich wählte die Szenen aus und korrigiere die Fehler der KI. Vieles hätte ohne KI einfach viel länger gedauert. Zudem besteht die technische und kreative Entwicklungsgeschichte der Menschheit aus Zufällen, Inspirationen und Remixen. Das macht das Urheberrecht auch so kompliziert – und teils fragwürdig. 

Welchen Schluss kann man ziehen? Ich denke, wir brauchen dringend Regeln im Umgang mit Bild-KIs. Vor allem, um Urheber:innen faire Entlohnung für ihre Beiträge zu gewährleisten. Probleme wie Rassismus oder Stereotypen in KI-Ausgaben müssen offen diskutiert werden.

Gleichermaßen benötigen wir aber mehr inspirierende Beispiele und Leuchtturmprojekte, die das Potenzial bildgenerierender KIs in unterschiedlichen Bereichen aufzeigen. Sie können Literatur oder Museen viel interaktiver und zugänglicher machen. Mit KI wäre es gar kein Problem, sich mit fiktiven Menschen wie den Matrosen der Pequod zu unterhalten oder anhand alter Zeichnungen, Tiere, Pflanzen oder Gegenstände fotorealistisch darzustellen.

Wird Geschichte dank KI zu einem immersiven Abenteuer? So viel mehr scheint möglich. Packen wir es an, die faszinierenden Möglichkeiten kreativ zu entdecken!

Fußnoten

  • 1
    Zitierte Stellen stammen aus der Neuübersetzung von Matthias Jendis (Hanser Verlag)
  • 2
    The Curse of Recursion: Training on Generated Data Makes Models Forget (Studie)

Ich liebe den Duft von warmen Wäldern, die Ränder der Ozeane und digitalen Kulturen. Hier teile ich meine Gedanken und experimentiere mit Ideen. Begleite mich auf meinem Spaziergang – von Banalem bis Tiefgründigem.