Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
ai:mcp:servery:mcp-image [03.05.2026 04:05] – Aktualizace odkazu po přesunu Gemini MCP Petr Nosekai:mcp:servery:mcp-image [10.05.2026 19:03] (aktuální) – [MCP Image: MCP server pro generování a editaci obrázků přes Gemini a OpenAI] Petr Nosek
Řádek 1: Řádek 1:
-====== MCP Image: MCP server pro generování a editaci obrázků přes Gemini ======+====== MCP Image: MCP server pro generování a editaci obrázků přes Gemini a OpenAI ======
  
-[[https://github.com/shinpr/mcp-image|MCP Image]] je MCP server pro generování a editaci obrázků přes Gemini pro MCP klienty jako Claude Code, Cursor nebo Codex. Podle README automaticky rozšiřuje stručné prompty, volí rozumné výchozí parametry a nabízí více úrovní kvality bez nutnosti ručně řešit každý detail.+//Vytvořeno: **11.04.2026** | Aktualizováno: **~~LASTMOD~~**// 
 + 
 +[[https://github.com/shinpr/mcp-image|MCP Image]] je MCP server pro generování a editaci obrázků přes Gemini nebo OpenAI pro MCP klienty jako Claude Code, Cursor nebo Codex. Podle README automaticky rozšiřuje stručné prompty, volí rozumné výchozí parametry a nabízí více úrovní kvality bez nutnosti ručně řešit každý detail. Ve výchozím stavu používá Gemini / Nano Banana, ale přes proměnnou prostředí umí běžet i proti OpenAI ''gpt-image-2''.
  
 Pokud jde konkrétně o praktické zprovoznění jiného obrázkového MCP serveru v OpenCode, navazuje na to [[ai:mcp:servery:gemini-mcp|Gemini MCP v OpenCode]]. Pokud jde konkrétně o praktické zprovoznění jiného obrázkového MCP serveru v OpenCode, navazuje na to [[ai:mcp:servery:gemini-mcp|Gemini MCP v OpenCode]].
Řádek 11: Řádek 13:
   * Umí generování i editaci existujících obrázků přes ''inputImagePath''.   * Umí generování i editaci existujících obrázků přes ''inputImagePath''.
   * Podporuje různé poměry stran, vyšší rozlišení a více výstupních formátů.   * Podporuje různé poměry stran, vyšší rozlišení a více výstupních formátů.
-  * Podle README umí i volitelné režimy jako character consistency, world knowledge nebo Google Search grounding.+  * Podle README umí i volitelné režimy jako character consistency, world knowledge nebo Google Search grounding; Google Search grounding je ale použitelný jen u Gemini provideru.
  
 ===== Předpoklady ===== ===== Předpoklady =====
Řádek 18: Řádek 20:
  
   * Node.js 22 nebo novější   * Node.js 22 nebo novější
-  * Gemini API klíč z [[https://aistudio.google.com/apikey|Google AI Studio]]+  * Gemini API klíč z [[https://aistudio.google.com/apikey|Google AI Studio]] pro Gemini provider 
 +  * OpenAI API klíč pro OpenAI provider 
 +  * u OpenAI také org verification pro použití ''gpt-image-2''
   * MCP klient, který umí připojit externí server   * MCP klient, který umí připojit externí server
  
Řádek 36: Řádek 40:
 ==== Důležité proměnné prostředí ==== ==== Důležité proměnné prostředí ====
  
 +  * ''IMAGE_PROVIDER=gemini'' – výchozí provider; používá Nano Banana 2 / Pro přes ''GEMINI_API_KEY''
 +  * ''IMAGE_PROVIDER=openai'' – OpenAI provider; používá ''gpt-image-2'' přes ''OPENAI_API_KEY''
   * ''GEMINI_API_KEY'' – API klíč pro Gemini   * ''GEMINI_API_KEY'' – API klíč pro Gemini
 +  * ''OPENAI_API_KEY'' – API klíč pro OpenAI
   * ''IMAGE_OUTPUT_DIR'' – absolutní cesta pro ukládání vygenerovaných obrázků   * ''IMAGE_OUTPUT_DIR'' – absolutní cesta pro ukládání vygenerovaných obrázků
   * ''IMAGE_QUALITY'' – výchozí preset kvality (''fast'', ''balanced'', ''quality'')   * ''IMAGE_QUALITY'' – výchozí preset kvality (''fast'', ''balanced'', ''quality'')
   * ''SKIP_PROMPT_ENHANCEMENT=true'' – vypnutí automatického rozšíření promptu   * ''SKIP_PROMPT_ENHANCEMENT=true'' – vypnutí automatického rozšíření promptu
 +
 +==== Více providerů současně ====
 +
 +Provider se volí při startu serveru přes ''IMAGE_PROVIDER''. Jeden běžící server-instance tedy používá právě jeden provider a nejde ho přepínat per-request.
 +
 +Pokud je potřeba používat Nano Banana i OpenAI, je vhodné přidat do konfigurace MCP klienta dvě samostatné instance pod různými jmény, například ''mcp-image-nano'' a ''mcp-image-gpt''. Každá instance má vlastní ''IMAGE_PROVIDER'' a vlastní API klíč. Tool se v obou případech jmenuje ''generate_image'', ale v MCP klientovi se rozliší podle názvu serveru nebo session prefixu.
  
 ===== Quality presety ===== ===== Quality presety =====
Řádek 47: Řádek 60:
   * ''quality'' – nejvyšší kvalita za cenu pomalejšího běhu a vyšší ceny   * ''quality'' – nejvyšší kvalita za cenu pomalejšího běhu a vyšší ceny
  
-Podle README se pro ''fast'' a ''balanced'' používá Nano Banana 2 a pro ''quality'' Nano Banana Pro.+Podle README se pro ''fast'' a ''balanced'' používá Nano Banana 2 a pro ''quality'' Nano Banana Pro. U OpenAI provideru se quality presety mapují na hodnoty podporované OpenAI: ''fast'' → ''low'', ''balanced'' → ''medium'', ''quality'' → ''high''
 + 
 +U OpenAI se také ''aspectRatio'' mapuje na nejbližší podporovanou velikost. Google Search grounding přes ''useGoogleSearch'' OpenAI provider nepodporuje. 
 + 
 +===== Referenční obrázky ===== 
 + 
 +Pro editaci nebo práci s referenčním obrázkem se používá parametr ''inputImagePath''. Nepředává se base64 ani URL, ale absolutní cesta k souboru na disku: 
 + 
 +<code json> 
 +
 +  "inputImagePath": "/absolute/path/to/reference.png" 
 +
 +</code> 
 + 
 +Server si soubor přečte sám a interně ho převede na base64 pro Gemini nebo OpenAI API. Přes MCP protokol tedy jde jen krátký string s cestou k souboru, ne velký base64 blob v JSON-RPC. 
 + 
 +Omezení referenčních obrázků: 
 + 
 +  * Podporovaný je jeden vstupní obrázek na jedno volání. 
 +  * ''blendImages'' je jen hint pro model, nepřidává druhý soubor. 
 +  * Cesta musí být absolutní. 
 +  * Soubor musí existovat a musí být ve formátu PNG, JPEG nebo WebP. 
 +  * Maximální velikost je 10 MB. 
 +  * URL není podporovaná; obrázek z URL je potřeba nejdřív stáhnout do souboru a až potom předat lokální cestu. 
 +  * Bezpečnostní kontroly zakazují ''..'' a null byte; symlinky se resolvují přes ''realpath''
 + 
 +Příklad stažení referenčního obrázku z URL před voláním toolu: 
 + 
 +<code bash> 
 +curl -L "https://example.com/reference.png" -o /tmp/reference.png 
 +</code> 
 + 
 +Potom se do toolu předá ''/tmp/reference.png'' jako ''inputImagePath''.
  
 ===== Praktické poznámky ===== ===== Praktické poznámky =====
Řádek 56: Řádek 101:
   * README uvádí podporu formátů PNG, JPEG a WebP do 10 MB.   * README uvádí podporu formátů PNG, JPEG a WebP do 10 MB.
   * Vyšší rozlišení a vyšší preset kvality zvyšují čas generování i cenu volání API.   * Vyšší rozlišení a vyšší preset kvality zvyšují čas generování i cenu volání API.
 +  * Pokud se má používat Gemini i OpenAI, je potřeba spustit dvě oddělené instance serveru.
  
 ===== Kdy to dává smysl ===== ===== Kdy to dává smysl =====
  • ai/mcp/servery/mcp-image.1777773903.txt.gz
  • Poslední úprava: 03.05.2026 04:05
  • autor: Petr Nosek