Gemini 2.5 Flash-Bilder: So erzielen Sie optimale Ergebnisse mit Eingabeaufforderungen

👤 Philipp Schmid, Logan Kilpatrick, Alisa Fortin
📅 August 28, 2025
📊 fortgeschritten
⭐ Empfohlen
#gemini #image-generation #prompting #ai-tutorial

So erzielen Sie optimale Ergebnisse bei der Gemini 2.5 Flash-Bildgenerierung

  1. AUG. 2025

Philipp Schmid Entwickler Relations Engineer

Logan Kilpatrick Group Product Manager

Alisa Fortin Product Manager

Gemini 2.5 Flash Image Banner

Gemini 2.5 Flash Image ist unser neuestes, schnellstes und effizientestes nativ multimodales Modell. Das Besondere an Gemini 2.5 Flash ist seine native multimodale Architektur. Es wurde von Grund auf neu trainiert, um Text und Bilder in einem einzigen, einheitlichen Schritt zu verarbeiten. Dies ermöglicht leistungsstarke Funktionen, die über die einfache Bilderzeugung hinausgehen, wie z. B. konversationelles Bearbeiten, Multi-Bild-Komposition und logisches Schlussfolgern über Bildinhalte.

Hier sind die wichtigsten Funktionen:

  • Text-zu-Bild: Generieren Sie hochwertige Bilder aus einfachen oder komplexen Textbeschreibungen.

  • Bild + Text-zu-Bild (Bearbeitung): Geben Sie ein Bild an und verwenden Sie Textprompts, um Elemente hinzuzufügen, zu entfernen oder zu ändern, den Stil zu ändern oder Farben anzupassen.

  • Mehrere Bilder zu einem Bild (Komposition & Stilübertragung): Verwenden Sie mehrere Eingabebilder, um eine neue Szene zu komponieren oder den Stil von einem Bild auf ein anderes zu übertragen.

  • Iterative Verfeinerung: Führen Sie eine Konversation, um Ihr Bild über mehrere Durchläufe hinweg schrittweise zu verfeinern und kleine Anpassungen vorzunehmen.

  • Texterkennung: Generieren Sie Bilder, die klaren und gut platzierten Text enthalten, ideal für Logos, Diagramme und Poster.

Diese Anleitung zeigt Ihnen, wie Sie Prompts schreiben und Anweisungen geben, um bessere Ergebnisse mit Gemini 2.5 Flash zu erzielen. Alles beginnt mit einem grundlegenden Prinzip:

Beschreiben Sie die Szene, listen Sie nicht nur Keywords auf. Die Kernstärke des Modells ist sein tiefes Sprachverständnis. Ein erzählender, beschreibender Absatz erzeugt fast immer ein besseres, kohärenteres Bild als eine einfache Liste von unverbundenen Wörtern. Sie können diese mit Code aus der offiziellen Dokumentation ausprobieren oder direkt in Google AI Studio mit der Erstellung beginnen.

Bilder aus Text erstellen

Die gebräuchlichste Methode zum Generieren eines Bildes ist die Beschreibung dessen, was Sie sehen möchten.

1. Fotorealistische Szenen

Denken Sie bei realistischen Bildern wie ein Fotograf. Das Erwähnen von Kamerawinkeln, Objektivtypen, Beleuchtung und feinen Details führt das Modell zu einem fotorealistischen Ergebnis.

Vorlage:

Ein fotorealistisches [Aufnahmeart] von [Motiv], [Handlung oder Ausdruck], in [Umgebung] angesiedelt. Die Szene wird durch [Beleuchtungsbeschreibung] beleuchtet und erzeugt eine [Stimmung] Atmosphäre. Aufgenommen mit einem [Kamera-/Objektivdetails], wobei [wichtige Texturen und Details] hervorgehoben werden. Das Bild sollte im Format [Seitenverhältnis] vorliegen.

Beispiel-Prompt:

Ein fotorealistisches Nahaufnahmeporträt eines älteren japanischen Keramikers mit tiefen, sonnengegerbten Falten und einem warmen, wissenden Lächeln. Er begutachtet sorgfältig eine frisch glasierte Teeschale. Die Kulisse ist seine rustikale, sonnenverwöhnte Werkstatt. Die Szene wird von weichem, goldenem Licht beleuchtet, das durch ein Fenster fällt und die feine Textur des Tons hervorhebt. Aufgenommen mit einem 85-mm-Porträtobjektiv, was zu einem weichen, unscharfen Hintergrund (Bokeh) führt. Die Gesamtstimmung ist ruhig und meisterhaft. Vertikale Porträtausrichtung.

Beispielausgabe:

photorealistic close-up portrait of an elderly Japanese ceramicist

Ein fotorealistisches Nahaufnahmeporträt eines älteren japanischen Keramikers…

2. Stilisierte Illustrationen & Sticker

Um Sticker, Icons oder Assets für Ihre Projekte zu erstellen, seien Sie explizit in Bezug auf den Stil und denken Sie daran, einen weißen Hintergrund anzufordern, wenn Sie einen benötigen.

Vorlage:

Ein [Stil]-Sticker von einem [Motiv], mit [Schlüsselmerkmalen] und einer [Farbpalette]. Das Design sollte [Linienführung] und [Schattierungsstil] haben. Der Hintergrund muss weiß sein.

Beispiel-Prompt:

Ein Kawaii-Sticker eines glücklichen Roten Pandas, der einen winzigen Bambushut trägt. Er knabbert an einem grünen Bambusblatt. Das Design zeichnet sich durch kräftige, klare Umrisse, einfache Cel-Shading und eine leuchtende Farbpalette aus. Der Hintergrund muss weiß sein.

Beispielausgabe:

kawaii-style sticker of a happy red panda

Ein Kawaii-Sticker eines glücklichen Roten Pandas…

3. Präziser Text in Bildern

Gemini 2.5 Flash Image kann Text in Bildern rendern. Seien Sie klar über den genauen Text, den Sie wünschen, beschreiben Sie den Schriftstil und legen Sie das Gesamtdesign fest.

Vorlage:

Erstellen Sie einen [Bildtyp] für [Marke/Konzept] mit dem Text “[zu rendernder Text]” in einer [Schriftstil]. Das Design sollte [Stilbeschreibung] mit einem [Farbschema] sein.

Beispiel-Prompt:

Erstellen Sie ein modernes, minimalistisches Logo für ein Café namens “The Daily Grind”. Der Text sollte in einer klaren, fetten, serifenlosen Schriftart sein. Das Design sollte ein einfaches, stilisiertes Symbol einer Kaffeebohne enthalten, das nahtlos in den Text integriert ist. Das Farbschema ist schwarz und weiß.

Beispielausgabe:

modern, minimalist logo for a coffee shop

Erstellen Sie ein modernes, minimalistisches Logo für ein Café namens “The Daily Grind”…

4. Produkt-Mockups & Werbefotografie

Erstellen Sie saubere, professionelle Produktfotos für E-Commerce, Werbung oder Branding.

Vorlage:

Ein hochauflösendes, studiobeleuchtetes Produktfoto einer [Produktbeschreibung] auf einer [Hintergrundoberfläche/Beschreibung]. Die Beleuchtung ist ein [Beleuchtungseinstellung, z. B. Drei-Punkt-Softbox-Setup], um [Beleuchtungszweck] zu erreichen. Der Kamerawinkel ist ein [Winkeltyp], um [spezifische Funktion] zu präsentieren. Ultrarealistisch, mit scharfer Fokussierung auf [Schlüsseldetail]. [Seitenverhältnis].

Beispiel-Prompt:

Ein hochauflösendes, studiobeleuchtetes Produktfoto einer minimalistischen Kaffeetasse aus Keramik in mattem Schwarz, präsentiert auf einer polierten Betonoberfläche. Die Beleuchtung ist ein Drei-Punkt-Softbox-Setup, das weiche, diffuse Highlights erzeugt und harte Schatten eliminiert. Der Kamerawinkel ist eine leicht erhöhte 45-Grad-Aufnahme, um die klaren Linien hervorzuheben. Ultrarealistisch, mit scharfem Fokus auf dem Dampf, der aus dem Kaffee aufsteigt. Quadratisches Bild.

Beispielausgabe:

minimalist ceramic coffee mug

Ein hochauflösendes, studiobeleuchtetes Produktfoto einer minimalistischen Kaffeetasse aus Keramik…

5. Minimalistisches Design & Negativraum

Erstellen Sie Hintergründe für Websites, Präsentationen oder Marketingmaterialien, auf die Sie Text überlagern möchten.

Vorlage:

Eine minimalistische Komposition mit einem einzelnen [Motiv], das sich in der [unten rechts/oben links/etc.] des Rahmens befindet. Der Hintergrund ist eine riesige, leere [Farbe]-Leinwand, die einen erheblichen Negativraum schafft. Weiche, subtile Beleuchtung. [Seitenverhältnis].

Beispiel-Prompt:

Eine minimalistische Komposition mit einem einzelnen, zarten roten Ahornblatt, das sich unten rechts im Rahmen befindet. Der Hintergrund ist eine riesige, leere, cremefarbene Leinwand, die einen erheblichen Negativraum für Text schafft. Weiche, diffuse Beleuchtung von oben links. Quadratisches Bild.

Beispielausgabe:

red maple leaf

Eine minimalistische Komposition mit einem einzelnen, zarten roten Ahornblatt…

6. Sequentielle Kunst (Comic-Panel / Storyboard)

Erstellen Sie überzeugende visuelle Erzählungen, Panel für Panel, ideal für die Entwicklung von Storyboards, Comicstrips oder jeder Form von sequenzieller Kunst, indem Sie sich auf klare Szenenbeschreibungen konzentrieren.

Vorlage:

Ein einzelnes Comic-Panel im Stil von [Kunststil]. Im Vordergrund, [Charakterbeschreibung und Aktion]. Im Hintergrund, [Umgebungsdetails]. Das Panel hat eine [Dialog-/Bildunterschriftenfeld] mit dem Text “[Text]”. Die Beleuchtung erzeugt eine [Stimmung]-Stimmung. [Seitenverhältnis].

Beispiel-Prompt:

Ein einzelnes Comic-Panel im Stil einer düsteren, Noir-Kunst mit kontrastreichen Schwarz-Weiß-Tinten. Im Vordergrund steht ein Detektiv im Trenchcoat unter einer flackernden Straßenlaterne, Regen durchnässt seine Schultern. Im Hintergrund spiegelt sich das Neonschild einer trostlosen Bar in einer Pfütze. Ein Bildunterschriftenfeld oben lautet “Die Stadt war ein schwieriger Ort, um Geheimnisse zu bewahren”. Die Beleuchtung ist hart und erzeugt eine dramatische, düstere Stimmung. Querformat.

Beispielausgabe:

comic book panel

Ein einzelnes Comic-Panel im Stil einer düsteren, Noir-Kunst…

Bilder mit Text bearbeiten

Hier zeigt sich die Multimodalität von Gemini 2.5 Flash Image wirklich. Sie können ein oder mehrere Bilder zusammen mit Ihren Textprompts zum Bearbeiten, Komponieren und Übertragen von Stilen bereitstellen.

1. Bildbearbeitung: Hinzufügen & Entfernen von Elementen

Geben Sie ein Bild an und beschreiben Sie einfach die gewünschte Änderung. Das Modell analysiert den Stil, die Beleuchtung und die Perspektive des Originalbildes, um die Bearbeitung natürlich aussehen zu lassen und die Charakterkonsistenz über eine Reihe von Bildern hinweg zu erhalten.

Vorlage:

Verwenden Sie das bereitgestellte Bild von [Motiv], bitte [hinzufügen/entfernen/modifizieren] [Element] zu/von der Szene. Stellen Sie sicher, dass die Änderung [Beschreibung, wie die Änderung integriert werden soll] ist.

Beispiel-Prompt:

Verwenden Sie das bereitgestellte Bild meiner Katze, bitte fügen Sie einen kleinen, gestrickten Zaubererhut auf ihren Kopf hinzu. Lassen Sie es so aussehen, als ob sie bequem sitzt und das weiche Licht des Fotos passt.

Beispiel Eingabe & Ausgabe:

Cat_Gemini2.5-Prompt

2. Inpainting: Bearbeiten eines bestimmten Bereichs

Sie können Gemini 2.5 Flash Image im Gespräch mitteilen, nur einen Teil eines Bildes zu bearbeiten, während der Rest vollständig unberührt bleibt.

Vorlage:

Verwenden Sie das bereitgestellte Bild, ändern Sie nur das [spezifische Element] zu [neues Element/Beschreibung]. Behalten Sie alles andere im Bild genau so bei, wobei der ursprüngliche Stil, die Beleuchtung und die Komposition erhalten bleiben.

Beispiel-Prompt:

Verwenden Sie das bereitgestellte Bild eines Wohnzimmers, ändern Sie nur das blaue Sofa in ein Vintage-Sofa aus braunem Leder. Behalten Sie den Rest des Raumes, einschließlich der Kissen auf dem Sofa und der Beleuchtung, unverändert bei.

Beispiel Eingabe & Ausgabe:

Livingroom_Gemini2.5-Prompt

3. Stilübertragung

Geben Sie ein Foto an und bitten Sie das Modell, seinen Inhalt im spezifischen Stil oder der Kunstbewegung nachzubilden.

Vorlage:

Transformieren Sie das bereitgestellte Foto von [Motiv] in den künstlerischen Stil von [Künstler/Kunststil]. Bewahren Sie die ursprüngliche Komposition, aber rendern Sie sie mit [Beschreibung der stilistischen Elemente].

Beispiel-Prompt:

Transformieren Sie das bereitgestellte Foto einer modernen Stadtstraße bei Nacht in den künstlerischen Stil von Vincent van Goghs “Sternennacht”. Bewahren Sie die ursprüngliche Komposition von Gebäuden und Autos, aber rendern Sie alle Elemente mit wirbelnden, pastosen Pinselstrichen und einer dramatischen Palette aus tiefen Blautönen und leuchtenden Gelbtönen.

Beispiel Eingabe & Ausgabe:

City_Gemini2.5-Prompt

4. Erweiterte Komposition: Kombinieren mehrerer Bilder

Geben Sie mehrere Bilder als Kontext an, um eine brandneue, zusammengesetzte Szene zu erstellen. Dies ist perfekt für Produkt-Mockups oder kreative Collagen.

Vorlage:

Erstellen Sie ein neues Bild, indem Sie die Elemente aus den bereitgestellten Bildern kombinieren. Nehmen Sie das [Element aus Bild 1] und platzieren Sie es mit/auf dem [Element aus Bild 2]. Das endgültige Bild sollte eine [Beschreibung der endgültigen Szene] sein.

Beispiel-Prompt:

Erstellen Sie ein professionelles E-Commerce-Modefoto. Nehmen Sie das blaue Blumenkleid aus dem ersten Bild und lassen Sie die Frau aus dem zweiten Bild es tragen. Generieren Sie eine realistische Ganzkörperaufnahme der Frau, die das Kleid trägt, wobei die Beleuchtung und die Schatten an eine Umgebung im Freien angepasst werden.

Beispiel Eingabe & Ausgabe:

Model_Gemini2.5-Prompt

Best Practices

Hier sind weitere Tipps für die Arbeit mit der Bilderzeugung:

  • Seien Sie hyperspezifisch: Je mehr Details Sie angeben, desto mehr Kontrolle haben Sie. Anstatt “Fantasy-Rüstung”, beschreiben Sie sie: “aufwendig gearbeitete Elfen-Plattenrüstung, mit Silberblattmustern graviert, mit hohem Kragen und Schulterplatten in Form von Falkenflügeln.”

  • Beheben Sie Inkonsistenzen bei Charakteren: Wenn Sie feststellen, dass die Merkmale eines Charakters nach vielen iterativen Bearbeitungen zu driften beginnen, können Sie ein neues Gespräch mit einer detaillierten Beschreibung beginnen, um die Konsistenz zu erhalten.

  • Geben Sie Kontext und Absicht an: Erklären Sie den Zweck des Bildes. Beispielsweise wird “Erstellen Sie ein Logo für eine hochwertige, minimalistische Hautpflegemarke” bessere Ergebnisse liefern als nur “Erstellen Sie ein Logo”.

  • Iterieren und verfeinern: Erwarten Sie kein perfektes Bild beim ersten Versuch. Nutzen Sie die konversationelle Natur des Modells, um kleine Änderungen vorzunehmen. Fügen Sie Prompts wie “Das ist großartig, aber können Sie die Beleuchtung etwas wärmer machen?” oder “Behalten Sie alles gleich, aber ändern Sie den Ausdruck des Charakters in einen ernsteren” hinzu.

  • Verwenden Sie “semantische negative Prompts”: Anstatt “keine Autos” zu sagen, beschreiben Sie die gewünschte Szene positiv: “eine leere, verlassene Straße ohne Anzeichen von Verkehr”.

  • Seitenverhältnisse: Bei der Bearbeitung behält Gemini 2.5 Flash Image im Allgemeinen das Seitenverhältnis des Eingabebildes bei. Wenn dies nicht der Fall ist, geben Sie dies explizit in Ihrem Prompt an: "Aktualisieren Sie das Eingabebild... Ändern Sie das Eingabe-Seitenverhältnis nicht." Wenn Sie mehrere Bilder mit unterschiedlichen Seitenverhältnissen hochladen, übernimmt das Modell das Seitenverhältnis des letzten bereitgestellten Bildes. Wenn Sie ein bestimmtes Seitenverhältnis für ein neues Bild benötigen und die Aufforderung es nicht erzeugt, ist es am besten, ein Referenzbild mit den richtigen Abmessungen als Teil Ihrer Aufforderung bereitzustellen.

  • Steuern Sie die Kamera: Verwenden Sie fotografische und filmische Sprache, um die Komposition zu steuern. Begriffe wie Weitwinkelaufnahme, Makroaufnahme, Tiefperspektive, 85mm-Porträtobjektiv und Dutch Angle geben Ihnen präzise Kontrolle über das endgültige Bild.

Einschränkungen

Während wir unsere Modelle weiterentwickeln und verbessern, glauben wir daran, transparent über Bereiche zu sein, in denen Verbesserungen erforderlich sind.

Obwohl Gemini 2.5 Flash Image ein leistungsstarkes und vielseitiges Werkzeug ist, kann das Erreichen der Perfektion beim ersten Versuch mit sehr nuancierten Anforderungen einige Iterationen erfordern. Sie werden möglicherweise feststellen, dass das Generieren komplexer Typografie oder das Beibehalten der absoluten Konsistenz von Charaktermerkmalen über mehrere Bilder hinweg manchmal eine Verfeinerung durch Folge-Prompts erfordert.

Wir arbeiten aktiv daran, diese Bereiche zu verbessern und schätzen Ihre Kreativität, während wir gemeinsam die nächste Generation von Bildwerkzeugen entwickeln.

Was kommt