====== MCP Image: MCP server pro generování a editaci obrázků přes Gemini a OpenAI ======
//Vytvořeno: **11.04.2026** | Aktualizováno: **~~LASTMOD~~**//
[[https://github.com/shinpr/mcp-image|MCP Image]] je MCP server pro generování a editaci obrázků přes Gemini nebo OpenAI pro MCP klienty jako Claude Code, Cursor nebo Codex. Podle README automaticky rozšiřuje stručné prompty, volí rozumné výchozí parametry a nabízí více úrovní kvality bez nutnosti ručně řešit každý detail. Ve výchozím stavu používá Gemini / Nano Banana, ale přes proměnnou prostředí umí běžet i proti OpenAI ''gpt-image-2''.
Pokud jde konkrétně o praktické zprovoznění jiného obrázkového MCP serveru v OpenCode, navazuje na to [[ai:mcp:servery:gemini-mcp|Gemini MCP v OpenCode]].
===== Co server umí =====
* Automaticky optimalizuje prompt přes Subject–Context–Style framework.
* Nabízí tři quality presety: ''fast'', ''balanced'' a ''quality''.
* Umí generování i editaci existujících obrázků přes ''inputImagePath''.
* Podporuje různé poměry stran, vyšší rozlišení a více výstupních formátů.
* Podle README umí i volitelné režimy jako character consistency, world knowledge nebo Google Search grounding; Google Search grounding je ale použitelný jen u Gemini provideru.
===== Předpoklady =====
Podle README je potřeba:
* Node.js 22 nebo novější
* Gemini API klíč z [[https://aistudio.google.com/apikey|Google AI Studio]] pro Gemini provider
* OpenAI API klíč pro OpenAI provider
* u OpenAI také org verification pro použití ''gpt-image-2''
* MCP klient, který umí připojit externí server
===== Základní konfigurace =====
README ukazuje konfiguraci pro Claude Code, Cursor a Codex. Pro Claude Code vypadá základní přidání serveru takto:
claude mcp add mcp-image --scope user \
--env GEMINI_API_KEY=your-api-key \
--env IMAGE_OUTPUT_DIR=/absolute/path/to/images \
-- npx -y mcp-image
Důležité je nepřidávat API klíč do verzované konfigurace nebo do repozitáře. Výstupní adresář ''IMAGE_OUTPUT_DIR'' má být absolutní cesta. Pokud není nastavený, README uvádí výchozí ''./output'' v aktuálním pracovním adresáři.
==== Důležité proměnné prostředí ====
* ''IMAGE_PROVIDER=gemini'' – výchozí provider; používá Nano Banana 2 / Pro přes ''GEMINI_API_KEY''
* ''IMAGE_PROVIDER=openai'' – OpenAI provider; používá ''gpt-image-2'' přes ''OPENAI_API_KEY''
* ''GEMINI_API_KEY'' – API klíč pro Gemini
* ''OPENAI_API_KEY'' – API klíč pro OpenAI
* ''IMAGE_OUTPUT_DIR'' – absolutní cesta pro ukládání vygenerovaných obrázků
* ''IMAGE_QUALITY'' – výchozí preset kvality (''fast'', ''balanced'', ''quality'')
* ''SKIP_PROMPT_ENHANCEMENT=true'' – vypnutí automatického rozšíření promptu
==== Více providerů současně ====
Provider se volí při startu serveru přes ''IMAGE_PROVIDER''. Jeden běžící server-instance tedy používá právě jeden provider a nejde ho přepínat per-request.
Pokud je potřeba používat Nano Banana i OpenAI, je vhodné přidat do konfigurace MCP klienta dvě samostatné instance pod různými jmény, například ''mcp-image-nano'' a ''mcp-image-gpt''. Každá instance má vlastní ''IMAGE_PROVIDER'' a vlastní API klíč. Tool se v obou případech jmenuje ''generate_image'', ale v MCP klientovi se rozliší podle názvu serveru nebo session prefixu.
===== Quality presety =====
* ''fast'' – nejrychlejší režim pro iterace a drafty
* ''balanced'' – kompromis mezi rychlostí a kvalitou
* ''quality'' – nejvyšší kvalita za cenu pomalejšího běhu a vyšší ceny
Podle README se pro ''fast'' a ''balanced'' používá Nano Banana 2 a pro ''quality'' Nano Banana Pro. U OpenAI provideru se quality presety mapují na hodnoty podporované OpenAI: ''fast'' → ''low'', ''balanced'' → ''medium'', ''quality'' → ''high''.
U OpenAI se také ''aspectRatio'' mapuje na nejbližší podporovanou velikost. Google Search grounding přes ''useGoogleSearch'' OpenAI provider nepodporuje.
===== Referenční obrázky =====
Pro editaci nebo práci s referenčním obrázkem se používá parametr ''inputImagePath''. Nepředává se base64 ani URL, ale absolutní cesta k souboru na disku:
{
"inputImagePath": "/absolute/path/to/reference.png"
}
Server si soubor přečte sám a interně ho převede na base64 pro Gemini nebo OpenAI API. Přes MCP protokol tedy jde jen krátký string s cestou k souboru, ne velký base64 blob v JSON-RPC.
Omezení referenčních obrázků:
* Podporovaný je jeden vstupní obrázek na jedno volání.
* ''blendImages'' je jen hint pro model, nepřidává druhý soubor.
* Cesta musí být absolutní.
* Soubor musí existovat a musí být ve formátu PNG, JPEG nebo WebP.
* Maximální velikost je 10 MB.
* URL není podporovaná; obrázek z URL je potřeba nejdřív stáhnout do souboru a až potom předat lokální cestu.
* Bezpečnostní kontroly zakazují ''..'' a null byte; symlinky se resolvují přes ''realpath''.
Příklad stažení referenčního obrázku z URL před voláním toolu:
curl -L "https://example.com/reference.png" -o /tmp/reference.png
Potom se do toolu předá ''/tmp/reference.png'' jako ''inputImagePath''.
===== Praktické poznámky =====
* Automatická optimalizace promptu dává smysl hlavně tehdy, když se zadávají krátké nebo neurčité prompty.
* Pokud je potřeba mít prompt plně pod kontrolou, lze enhancement vypnout přes ''SKIP_PROMPT_ENHANCEMENT=true''.
* Pro editaci obrázku se používá ''inputImagePath'' a README vyžaduje absolutní cestu k souboru.
* README uvádí podporu formátů PNG, JPEG a WebP do 10 MB.
* Vyšší rozlišení a vyšší preset kvality zvyšují čas generování i cenu volání API.
* Pokud se má používat Gemini i OpenAI, je potřeba spustit dvě oddělené instance serveru.
===== Kdy to dává smysl =====
Tento server dává smysl hlavně tehdy, když MCP klient sám neumí nativní generování obrázků a je potřeba přidat externí server s jednoduchým ovládáním. Repozitář zároveň nabízí i samostatný skill pro psaní promptů; ten je podle README vhodný spíš pro nástroje, které už generování obrázků mají vestavěné.
===== Související článek k OpenCode =====
Tento článek je obecný přehled MCP serveru ''mcp-image''. Pokud jde o konkrétní praktické zprovoznění obrázkového MCP serveru v OpenCode přes ''ultimate-gemini-mcp'', navazuje na to [[ai:mcp:servery:gemini-mcp|Gemini MCP v OpenCode]].
===== Zdroje =====
* [[https://github.com/shinpr/mcp-image|MCP Image na GitHubu]]
* [[https://aistudio.google.com/apikey|Google AI Studio – Gemini API klíč]]