MCP Image: MCP server pro generování a editaci obrázků přes Gemini a OpenAI
Vytvořeno: 11.04.2026 | Aktualizováno: 10.05.2026 19:03
MCP Image je MCP server pro generování a editaci obrázků přes Gemini nebo OpenAI pro MCP klienty jako Claude Code, Cursor nebo Codex. Podle README automaticky rozšiřuje stručné prompty, volí rozumné výchozí parametry a nabízí více úrovní kvality bez nutnosti ručně řešit každý detail. Ve výchozím stavu používá Gemini / Nano Banana, ale přes proměnnou prostředí umí běžet i proti OpenAI gpt-image-2.
Pokud jde konkrétně o praktické zprovoznění jiného obrázkového MCP serveru v OpenCode, navazuje na to Gemini MCP v OpenCode.
Co server umí
- Automaticky optimalizuje prompt přes Subject–Context–Style framework.
- Nabízí tři quality presety:
fast,balancedaquality. - Umí generování i editaci existujících obrázků přes
inputImagePath. - Podporuje různé poměry stran, vyšší rozlišení a více výstupních formátů.
- Podle README umí i volitelné režimy jako character consistency, world knowledge nebo Google Search grounding; Google Search grounding je ale použitelný jen u Gemini provideru.
Předpoklady
Podle README je potřeba:
- Node.js 22 nebo novější
- Gemini API klíč z Google AI Studio pro Gemini provider
- OpenAI API klíč pro OpenAI provider
- u OpenAI také org verification pro použití
gpt-image-2 - MCP klient, který umí připojit externí server
Základní konfigurace
README ukazuje konfiguraci pro Claude Code, Cursor a Codex. Pro Claude Code vypadá základní přidání serveru takto:
claude mcp add mcp-image --scope user \ --env GEMINI_API_KEY=your-api-key \ --env IMAGE_OUTPUT_DIR=/absolute/path/to/images \ -- npx -y mcp-image
Důležité je nepřidávat API klíč do verzované konfigurace nebo do repozitáře. Výstupní adresář IMAGE_OUTPUT_DIR má být absolutní cesta. Pokud není nastavený, README uvádí výchozí ./output v aktuálním pracovním adresáři.
Důležité proměnné prostředí
IMAGE_PROVIDER=gemini– výchozí provider; používá Nano Banana 2 / Pro přesGEMINI_API_KEYIMAGE_PROVIDER=openai– OpenAI provider; používágpt-image-2přesOPENAI_API_KEYGEMINI_API_KEY– API klíč pro GeminiOPENAI_API_KEY– API klíč pro OpenAIIMAGE_OUTPUT_DIR– absolutní cesta pro ukládání vygenerovaných obrázkůIMAGE_QUALITY– výchozí preset kvality (fast,balanced,quality)SKIP_PROMPT_ENHANCEMENT=true– vypnutí automatického rozšíření promptu
Více providerů současně
Provider se volí při startu serveru přes IMAGE_PROVIDER. Jeden běžící server-instance tedy používá právě jeden provider a nejde ho přepínat per-request.
Pokud je potřeba používat Nano Banana i OpenAI, je vhodné přidat do konfigurace MCP klienta dvě samostatné instance pod různými jmény, například mcp-image-nano a mcp-image-gpt. Každá instance má vlastní IMAGE_PROVIDER a vlastní API klíč. Tool se v obou případech jmenuje generate_image, ale v MCP klientovi se rozliší podle názvu serveru nebo session prefixu.
Quality presety
fast– nejrychlejší režim pro iterace a draftybalanced– kompromis mezi rychlostí a kvalitouquality– nejvyšší kvalita za cenu pomalejšího běhu a vyšší ceny
Podle README se pro fast a balanced používá Nano Banana 2 a pro quality Nano Banana Pro. U OpenAI provideru se quality presety mapují na hodnoty podporované OpenAI: fast → low, balanced → medium, quality → high.
U OpenAI se také aspectRatio mapuje na nejbližší podporovanou velikost. Google Search grounding přes useGoogleSearch OpenAI provider nepodporuje.
Referenční obrázky
Pro editaci nebo práci s referenčním obrázkem se používá parametr inputImagePath. Nepředává se base64 ani URL, ale absolutní cesta k souboru na disku:
{
"inputImagePath": "/absolute/path/to/reference.png"
}
Server si soubor přečte sám a interně ho převede na base64 pro Gemini nebo OpenAI API. Přes MCP protokol tedy jde jen krátký string s cestou k souboru, ne velký base64 blob v JSON-RPC.
Omezení referenčních obrázků:
- Podporovaný je jeden vstupní obrázek na jedno volání.
blendImagesje jen hint pro model, nepřidává druhý soubor.- Cesta musí být absolutní.
- Soubor musí existovat a musí být ve formátu PNG, JPEG nebo WebP.
- Maximální velikost je 10 MB.
- URL není podporovaná; obrázek z URL je potřeba nejdřív stáhnout do souboru a až potom předat lokální cestu.
- Bezpečnostní kontroly zakazují
..a null byte; symlinky se resolvují přesrealpath.
Příklad stažení referenčního obrázku z URL před voláním toolu:
curl -L "https://example.com/reference.png" -o /tmp/reference.png
Potom se do toolu předá /tmp/reference.png jako inputImagePath.
Praktické poznámky
- Automatická optimalizace promptu dává smysl hlavně tehdy, když se zadávají krátké nebo neurčité prompty.
- Pokud je potřeba mít prompt plně pod kontrolou, lze enhancement vypnout přes
SKIP_PROMPT_ENHANCEMENT=true. - Pro editaci obrázku se používá
inputImagePatha README vyžaduje absolutní cestu k souboru. - README uvádí podporu formátů PNG, JPEG a WebP do 10 MB.
- Vyšší rozlišení a vyšší preset kvality zvyšují čas generování i cenu volání API.
- Pokud se má používat Gemini i OpenAI, je potřeba spustit dvě oddělené instance serveru.
Kdy to dává smysl
Tento server dává smysl hlavně tehdy, když MCP klient sám neumí nativní generování obrázků a je potřeba přidat externí server s jednoduchým ovládáním. Repozitář zároveň nabízí i samostatný skill pro psaní promptů; ten je podle README vhodný spíš pro nástroje, které už generování obrázků mají vestavěné.
Související článek k OpenCode
Tento článek je obecný přehled MCP serveru mcp-image. Pokud jde o konkrétní praktické zprovoznění obrázkového MCP serveru v OpenCode přes ultimate-gemini-mcp, navazuje na to Gemini MCP v OpenCode.