Open WebUI: RAG, pluginy a integrace poskytovatelů (praktická orientace)
Úvod
Open WebUI používám jako webové rozhraní pro práci s LLM (chat, modely, nastavení) a pro napojení dalších funkcí přes RAG, pluginy a integrace poskytovatelů. V praxi mi slouží jako centrální UI, ve kterém kombinuji modely a rozšíření bez toho, abych přepisoval vlastní aplikaci.
Kdy co použít (RAG vs pluginy vs integrace poskytovatelů)
Když si ujasňuji, jakou cestou něco řešit, držím se těchto pravidel:
- RAG používám, když potřebuji, aby model odpovídal z mých dokumentů (firemní know-how, návody, interní wiki) a šlo mi primárně o vyhledání relevantních pasáží a jejich citování/zužitkování.
- Pluginy / funkce (filters, functions, pipelines) používám, když chci upravit chování UI nebo požadavků na model (např. přepínač „reasoning“, transformace promptu, filtrování nebo přidání volitelných parametrů do requestu).
- Integrace poskytovatelů (Gemini / Anthropic / OpenRouter) používám, když chci přidat nové endpointy/modely a spravovat je jako zdroje v Open WebUI (typicky API klíče, dostupné modely, specifické parametry).
RAG (návody)
RAG beru jako „dokumenty → vyhledání → kontext v promptu“. Konkrétní postup konfigurace neodvozuji z poznámek, takže se držím oficiálního návodu.
Tenhle odkaz používám jako hlavní dokumentaci k nastavení a používání RAG v Open WebUI (co to je, jak to zapnout a jak s tím pracovat v UI).
Pluginy: přepínač reasoning (reasoning toggle)
U „reasoning“ jsem narazil na praktickou potřebu: chci mít v UI jednoduché zaškrtávací políčko, které přepne chování modelu / requestu bez toho, abych pokaždé ručně upravoval prompt. Pro tohle existuje hotový community příspěvek a alternativně i ukázkový filter v developer toolkit repozitáři.
Tenhle příspěvek z Open WebUI Community používám jako referenci k tomu, jak přidat do Open WebUI přepínač (checkbox) pro „reasoning effort“ / reasoning režim.
Tenhle konkrétní soubor mi slouží jako čitelný příklad implementace „reason toggle“ filtru, když potřebuji pochopit, co se reálně posílá a kde to v plugin architektuře sedí.
Poznámka k praxi: u pluginů si hlídám, jestli jde o UI/UX přepínač (komfort) nebo o změnu request parametrů (dopad na cenu/latenci/chování), protože „reasoning“ často mění spotřebu tokenů a výsledný styl odpovědí.
Integrace poskytovatelů
Google Gemini (včetně zmínky Nano Banana)
Gemini řeším jako integraci poskytovatele a současně jako pipeline/skript, který napojuje širší kus Google API. V poznámkách mám explicitně zmíněno, že to zahrnuje i obrázkové modely jako Nano Banana, takže to beru jako „víc než jen text chat“.
Tenhle soubor používám jako zdroj pravdy k tomu, jak je Gemini pipeline v Open WebUI reálně napojená (včetně toho, že sahá i na obrazové modely typu Nano Banana).
Tenhle community post používám jako „UI-orientovanou“ referenci k integraci Gemini v Open WebUI (co přidat a kde to v Open WebUI typicky najdu).
Claude / Anthropic (claude.ai)
Claude řeším přes integraci v Open WebUI, která je publikovaná v Open WebUI Community. V poznámkách je to označené jako integrace pro claude.ai, takže zachovávám pojmenování a držím se toho, co je v community postu.
Tenhle odkaz používám jako výchozí dokument k integraci Anthropic/Claude (claude.ai) do Open WebUI.
OpenRouter
OpenRouter používám, když chci jednotné API přes více modelů a poskytovatelů a nechci řešit každý backend zvlášť. V poznámkách mám jednak komunitní integraci a jednak doplněk, který má zobrazovat „reasoning tokeny“ v OpenRouteru.
Tenhle community post používám jako referenci k základní integraci OpenRouteru v Open WebUI.
Tenhle repozitář používám jako doplněk/referenci, když potřebuji v Open WebUI vidět nebo řešit zobrazení „reasoning tokenů“ pro OpenRouter.
Tipy a troubleshooting (rychlá reference)
Držím se jen toho, co plyne z poznámek, bez domýšlení konkrétních klikacích kroků:
- Když řeším „reasoning“, ověřuji si, jestli je to zapnuté přes plugin přepínač (reasoning toggle) nebo jestli to má řešit integrace poskytovatele; nejrychlejší orientace pro mě bývá přes Open WebUI Community odkazy výše.
- Když řeším OpenRouter a „reasoning tokeny“, beru jako první krok ověření přes repozitář ``openwebui-openrouter-reasoning-tokens``, protože právě ten je v poznámkách explicitně uvedený jako řešení zobrazení reasoning tokenů.
- Když potřebuji Gemini „rozšířeně“ (včetně obrazových modelů jako Nano Banana), sahám primárně po implementaci v ``google_gemini.py``, protože tam očekávám nejvíc detailů k tomu, co integrace skutečně podporuje.
Zdroje
Dokumentace RAG v Open WebUI (návod a koncepty).
Open WebUI Community post k „OpenAI Reasoning Effort“ a přepínači reasoning v UI.
Ukázkový filter pro reasoning toggle (implementační reference).
Gemini pipeline (včetně podpory pro obrazové modely jako Nano Banana).
Open WebUI Community post pro integraci Google Gemini.
Open WebUI Community post pro integraci Anthropic / Claude (claude.ai).
Open WebUI Community post pro integraci OpenRouter.
Repozitář pro zobrazení/řešení reasoning tokenů u OpenRouteru v Open WebUI.