MCP Image: MCP server pro generování a editaci obrázků přes Gemini a OpenAI

Vytvořeno: 11.04.2026 | Aktualizováno: 10.05.2026 19:03

MCP Image je MCP server pro generování a editaci obrázků přes Gemini nebo OpenAI pro MCP klienty jako Claude Code, Cursor nebo Codex. Podle README automaticky rozšiřuje stručné prompty, volí rozumné výchozí parametry a nabízí více úrovní kvality bez nutnosti ručně řešit každý detail. Ve výchozím stavu používá Gemini / Nano Banana, ale přes proměnnou prostředí umí běžet i proti OpenAI gpt-image-2.

Pokud jde konkrétně o praktické zprovoznění jiného obrázkového MCP serveru v OpenCode, navazuje na to Gemini MCP v OpenCode.

  • Automaticky optimalizuje prompt přes Subject–Context–Style framework.
  • Nabízí tři quality presety: fast, balanced a quality.
  • Umí generování i editaci existujících obrázků přes inputImagePath.
  • Podporuje různé poměry stran, vyšší rozlišení a více výstupních formátů.
  • Podle README umí i volitelné režimy jako character consistency, world knowledge nebo Google Search grounding; Google Search grounding je ale použitelný jen u Gemini provideru.

Podle README je potřeba:

  • Node.js 22 nebo novější
  • Gemini API klíč z Google AI Studio pro Gemini provider
  • OpenAI API klíč pro OpenAI provider
  • u OpenAI také org verification pro použití gpt-image-2
  • MCP klient, který umí připojit externí server

README ukazuje konfiguraci pro Claude Code, Cursor a Codex. Pro Claude Code vypadá základní přidání serveru takto:

claude mcp add mcp-image --scope user \
  --env GEMINI_API_KEY=your-api-key \
  --env IMAGE_OUTPUT_DIR=/absolute/path/to/images \
  -- npx -y mcp-image

Důležité je nepřidávat API klíč do verzované konfigurace nebo do repozitáře. Výstupní adresář IMAGE_OUTPUT_DIR má být absolutní cesta. Pokud není nastavený, README uvádí výchozí ./output v aktuálním pracovním adresáři.

  • IMAGE_PROVIDER=gemini – výchozí provider; používá Nano Banana 2 / Pro přes GEMINI_API_KEY
  • IMAGE_PROVIDER=openai – OpenAI provider; používá gpt-image-2 přes OPENAI_API_KEY
  • GEMINI_API_KEYAPI klíč pro Gemini
  • OPENAI_API_KEYAPI klíč pro OpenAI
  • IMAGE_OUTPUT_DIR – absolutní cesta pro ukládání vygenerovaných obrázků
  • IMAGE_QUALITY – výchozí preset kvality (fast, balanced, quality)
  • SKIP_PROMPT_ENHANCEMENT=true – vypnutí automatického rozšíření promptu

Provider se volí při startu serveru přes IMAGE_PROVIDER. Jeden běžící server-instance tedy používá právě jeden provider a nejde ho přepínat per-request.

Pokud je potřeba používat Nano Banana i OpenAI, je vhodné přidat do konfigurace MCP klienta dvě samostatné instance pod různými jmény, například mcp-image-nano a mcp-image-gpt. Každá instance má vlastní IMAGE_PROVIDER a vlastní API klíč. Tool se v obou případech jmenuje generate_image, ale v MCP klientovi se rozliší podle názvu serveru nebo session prefixu.

  • fast – nejrychlejší režim pro iterace a drafty
  • balanced – kompromis mezi rychlostí a kvalitou
  • quality – nejvyšší kvalita za cenu pomalejšího běhu a vyšší ceny

Podle README se pro fast a balanced používá Nano Banana 2 a pro quality Nano Banana Pro. U OpenAI provideru se quality presety mapují na hodnoty podporované OpenAI: fastlow, balancedmedium, qualityhigh.

U OpenAI se také aspectRatio mapuje na nejbližší podporovanou velikost. Google Search grounding přes useGoogleSearch OpenAI provider nepodporuje.

Pro editaci nebo práci s referenčním obrázkem se používá parametr inputImagePath. Nepředává se base64 ani URL, ale absolutní cesta k souboru na disku:

{
  "inputImagePath": "/absolute/path/to/reference.png"
}

Server si soubor přečte sám a interně ho převede na base64 pro Gemini nebo OpenAI API. Přes MCP protokol tedy jde jen krátký string s cestou k souboru, ne velký base64 blob v JSON-RPC.

Omezení referenčních obrázků:

  • Podporovaný je jeden vstupní obrázek na jedno volání.
  • blendImages je jen hint pro model, nepřidává druhý soubor.
  • Cesta musí být absolutní.
  • Soubor musí existovat a musí být ve formátu PNG, JPEG nebo WebP.
  • Maximální velikost je 10 MB.
  • URL není podporovaná; obrázek z URL je potřeba nejdřív stáhnout do souboru a až potom předat lokální cestu.
  • Bezpečnostní kontroly zakazují .. a null byte; symlinky se resolvují přes realpath.

Příklad stažení referenčního obrázku z URL před voláním toolu:

curl -L "https://example.com/reference.png" -o /tmp/reference.png

Potom se do toolu předá /tmp/reference.png jako inputImagePath.

  • Automatická optimalizace promptu dává smysl hlavně tehdy, když se zadávají krátké nebo neurčité prompty.
  • Pokud je potřeba mít prompt plně pod kontrolou, lze enhancement vypnout přes SKIP_PROMPT_ENHANCEMENT=true.
  • Pro editaci obrázku se používá inputImagePath a README vyžaduje absolutní cestu k souboru.
  • README uvádí podporu formátů PNG, JPEG a WebP do 10 MB.
  • Vyšší rozlišení a vyšší preset kvality zvyšují čas generování i cenu volání API.
  • Pokud se má používat Gemini i OpenAI, je potřeba spustit dvě oddělené instance serveru.

Tento server dává smysl hlavně tehdy, když MCP klient sám neumí nativní generování obrázků a je potřeba přidat externí server s jednoduchým ovládáním. Repozitář zároveň nabízí i samostatný skill pro psaní promptů; ten je podle README vhodný spíš pro nástroje, které už generování obrázků mají vestavěné.

Tento článek je obecný přehled MCP serveru mcp-image. Pokud jde o konkrétní praktické zprovoznění obrázkového MCP serveru v OpenCode přes ultimate-gemini-mcp, navazuje na to Gemini MCP v OpenCode.

  • ai/mcp/servery/mcp-image.txt
  • Poslední úprava: 10.05.2026 19:03
  • autor: Petr Nosek