Obsah

Open WebUI: RAG, pluginy a integrace poskytovatelů (praktická orientace)

Úvod

Open WebUI používám jako webové rozhraní pro práci s LLM (chat, modely, nastavení) a pro napojení dalších funkcí přes RAG, pluginy a integrace poskytovatelů. V praxi mi slouží jako centrální UI, ve kterém kombinuji modely a rozšíření bez toho, abych přepisoval vlastní aplikaci.

Kdy co použít (RAG vs pluginy vs integrace poskytovatelů)

Když si ujasňuji, jakou cestou něco řešit, držím se těchto pravidel:

RAG (návody)

RAG beru jako „dokumenty → vyhledání → kontext v promptu“. Konkrétní postup konfigurace neodvozuji z poznámek, takže se držím oficiálního návodu.

Tenhle odkaz používám jako hlavní dokumentaci k nastavení a používání RAG v Open WebUI (co to je, jak to zapnout a jak s tím pracovat v UI).

Pluginy: přepínač reasoning (reasoning toggle)

U „reasoning“ jsem narazil na praktickou potřebu: chci mít v UI jednoduché zaškrtávací políčko, které přepne chování modelu / requestu bez toho, abych pokaždé ručně upravoval prompt. Pro tohle existuje hotový community příspěvek a alternativně i ukázkový filter v developer toolkit repozitáři.

Tenhle příspěvek z Open WebUI Community používám jako referenci k tomu, jak přidat do Open WebUI přepínač (checkbox) pro „reasoning effort“ / reasoning režim.

Tenhle konkrétní soubor mi slouží jako čitelný příklad implementace „reason toggle“ filtru, když potřebuji pochopit, co se reálně posílá a kde to v plugin architektuře sedí.

Poznámka k praxi: u pluginů si hlídám, jestli jde o UI/UX přepínač (komfort) nebo o změnu request parametrů (dopad na cenu/latenci/chování), protože „reasoning“ často mění spotřebu tokenů a výsledný styl odpovědí.

Integrace poskytovatelů

Google Gemini (včetně zmínky Nano Banana)

Gemini řeším jako integraci poskytovatele a současně jako pipeline/skript, který napojuje širší kus Google API. V poznámkách mám explicitně zmíněno, že to zahrnuje i obrázkové modely jako Nano Banana, takže to beru jako „víc než jen text chat“.

Tenhle soubor používám jako zdroj pravdy k tomu, jak je Gemini pipeline v Open WebUI reálně napojená (včetně toho, že sahá i na obrazové modely typu Nano Banana).

Tenhle community post používám jako „UI-orientovanou“ referenci k integraci Gemini v Open WebUI (co přidat a kde to v Open WebUI typicky najdu).

Claude / Anthropic (claude.ai)

Claude řeším přes integraci v Open WebUI, která je publikovaná v Open WebUI Community. V poznámkách je to označené jako integrace pro claude.ai, takže zachovávám pojmenování a držím se toho, co je v community postu.

Tenhle odkaz používám jako výchozí dokument k integraci Anthropic/Claude (claude.ai) do Open WebUI.

OpenRouter

OpenRouter používám, když chci jednotné API přes více modelů a poskytovatelů a nechci řešit každý backend zvlášť. V poznámkách mám jednak komunitní integraci a jednak doplněk, který má zobrazovat „reasoning tokeny“ v OpenRouteru.

Tenhle community post používám jako referenci k základní integraci OpenRouteru v Open WebUI.

Tenhle repozitář používám jako doplněk/referenci, když potřebuji v Open WebUI vidět nebo řešit zobrazení „reasoning tokenů“ pro OpenRouter.

Tipy a troubleshooting (rychlá reference)

Držím se jen toho, co plyne z poznámek, bez domýšlení konkrétních klikacích kroků:

Zdroje

Dokumentace RAG v Open WebUI (návod a koncepty).

Open WebUI Community post k „OpenAI Reasoning Effort“ a přepínači reasoning v UI.

Ukázkový filter pro reasoning toggle (implementační reference).

Gemini pipeline (včetně podpory pro obrazové modely jako Nano Banana).

Open WebUI Community post pro integraci Google Gemini.

Open WebUI Community post pro integraci Anthropic / Claude (claude.ai).

Open WebUI Community post pro integraci OpenRouter.

Repozitář pro zobrazení/řešení reasoning tokenů u OpenRouteru v Open WebUI.