Obsah

MCP Image: MCP server pro generování a editaci obrázků přes Gemini a OpenAI

Vytvořeno: 11.04.2026 | Aktualizováno: 10.05.2026 19:03

MCP Image je MCP server pro generování a editaci obrázků přes Gemini nebo OpenAI pro MCP klienty jako Claude Code, Cursor nebo Codex. Podle README automaticky rozšiřuje stručné prompty, volí rozumné výchozí parametry a nabízí více úrovní kvality bez nutnosti ručně řešit každý detail. Ve výchozím stavu používá Gemini / Nano Banana, ale přes proměnnou prostředí umí běžet i proti OpenAI gpt-image-2.

Pokud jde konkrétně o praktické zprovoznění jiného obrázkového MCP serveru v OpenCode, navazuje na to Gemini MCP v OpenCode.

Co server umí

Předpoklady

Podle README je potřeba:

Základní konfigurace

README ukazuje konfiguraci pro Claude Code, Cursor a Codex. Pro Claude Code vypadá základní přidání serveru takto:

claude mcp add mcp-image --scope user \
  --env GEMINI_API_KEY=your-api-key \
  --env IMAGE_OUTPUT_DIR=/absolute/path/to/images \
  -- npx -y mcp-image

Důležité je nepřidávat API klíč do verzované konfigurace nebo do repozitáře. Výstupní adresář IMAGE_OUTPUT_DIR má být absolutní cesta. Pokud není nastavený, README uvádí výchozí ./output v aktuálním pracovním adresáři.

Důležité proměnné prostředí

Více providerů současně

Provider se volí při startu serveru přes IMAGE_PROVIDER. Jeden běžící server-instance tedy používá právě jeden provider a nejde ho přepínat per-request.

Pokud je potřeba používat Nano Banana i OpenAI, je vhodné přidat do konfigurace MCP klienta dvě samostatné instance pod různými jmény, například mcp-image-nano a mcp-image-gpt. Každá instance má vlastní IMAGE_PROVIDER a vlastní API klíč. Tool se v obou případech jmenuje generate_image, ale v MCP klientovi se rozliší podle názvu serveru nebo session prefixu.

Quality presety

Podle README se pro fast a balanced používá Nano Banana 2 a pro quality Nano Banana Pro. U OpenAI provideru se quality presety mapují na hodnoty podporované OpenAI: fastlow, balancedmedium, qualityhigh.

U OpenAI se také aspectRatio mapuje na nejbližší podporovanou velikost. Google Search grounding přes useGoogleSearch OpenAI provider nepodporuje.

Referenční obrázky

Pro editaci nebo práci s referenčním obrázkem se používá parametr inputImagePath. Nepředává se base64 ani URL, ale absolutní cesta k souboru na disku:

{
  "inputImagePath": "/absolute/path/to/reference.png"
}

Server si soubor přečte sám a interně ho převede na base64 pro Gemini nebo OpenAI API. Přes MCP protokol tedy jde jen krátký string s cestou k souboru, ne velký base64 blob v JSON-RPC.

Omezení referenčních obrázků:

Příklad stažení referenčního obrázku z URL před voláním toolu:

curl -L "https://example.com/reference.png" -o /tmp/reference.png

Potom se do toolu předá /tmp/reference.png jako inputImagePath.

Praktické poznámky

Kdy to dává smysl

Tento server dává smysl hlavně tehdy, když MCP klient sám neumí nativní generování obrázků a je potřeba přidat externí server s jednoduchým ovládáním. Repozitář zároveň nabízí i samostatný skill pro psaní promptů; ten je podle README vhodný spíš pro nástroje, které už generování obrázků mají vestavěné.

Související článek k OpenCode

Tento článek je obecný přehled MCP serveru mcp-image. Pokud jde o konkrétní praktické zprovoznění obrázkového MCP serveru v OpenCode přes ultimate-gemini-mcp, navazuje na to Gemini MCP v OpenCode.

Zdroje