OpenWhispr
OpenWhispr je open-source desktopová aplikace pro převod řeči na text, diktování do libovolné aplikace, přepis schůzek a práci s poznámkami. Projekt cílí na privacy-first použití a umožňuje běh jak s lokálními speech-to-text modely, tak s cloudovými službami.
Co projekt umí
Podle README repozitáře OpenWhispr kombinuje několik funkcí do jedné desktopové aplikace:
- diktování textu přes globální klávesovou zkratku do libovolné aplikace
- přepis schůzek
- AI asistenta napojeného na různé modely
- správu poznámek
- veřejné API a MCP integraci
Projekt je dostupný pro macOS, Windows i Linux.
Lokální i cloudové modely
Jedna z hlavních vlastností OpenWhispru je možnost volby mezi lokálním a cloudovým zpracováním. V README je jako lokální varianta uvedený například Whisper a NVIDIA Parakeet. Pokud běží zpracování lokálně, audio nemusí opustit zařízení.
To je praktické hlavně tam, kde je důležitá kontrola nad soukromím, nižší závislost na externí službě nebo možnost provozu bez trvalého připojení ke cloudu.
Hlavní funkce
Diktování
OpenWhispr umí převést mluvené slovo na text a vložit ho do aktuálně otevřené aplikace. Model použití je jednoduchý: stisk klávesové zkratky, nadiktování textu a automatické vložení na pozici kurzoru.
AI agent
Projekt uvádí i AI asistenta, který může být napojený na modely jako GPT-5, Claude, Gemini, Groq nebo lokální modely. Nejde tedy jen o čistý speech-to-text, ale i o další zpracování textu nebo hlasového vstupu.
Přepis schůzek
README zmiňuje automatickou detekci schůzek v aplikacích jako Zoom, Teams a FaceTime. Součástí je i diarizace mluvčích a rozpoznávání hlasových fingerprintů.
Poznámky a vyhledávání
OpenWhispr obsahuje i vrstvu pro práci s poznámkami. Podle dokumentace projektu má umět organizaci do složek, vyhledávání a další AI akce nad obsahem.
API a MCP
Projekt má veřejné API a podporu MCP. To je zajímavé hlavně pro automatizaci, napojení na další nástroje a integraci s AI asistenty. Přehled API a MCP integrace je v oficiální dokumentaci: API overview a MCP server setup.
Rychlý start pro vývoj
README uvádí tento základní postup pro lokální spuštění vývojové verze:
git clone https://github.com/OpenWhispr/openwhispr.git cd openwhispr npm install npm run dev
Pro vývoj je podle README potřeba Node.js 24 nebo novější.
Technický základ
V repozitáři jsou jako hlavní technologie uvedené například:
- React 19
- TypeScript
- Tailwind CSS v4
- Electron 41
- better-sqlite3
- whisper.cpp
- sherpa-onnx
- shadcn/ui
Z toho je vidět, že jde o desktopovou aplikaci postavenou nad Electronem s webovým frontendem a napojením na lokální AI komponenty.
Kdy to dává smysl
OpenWhispr dává smysl hlavně v situacích, kdy je potřeba:
- rychlé diktování textu do různých aplikací
- lokální speech-to-text bez posílání audia do cloudu
- přepis online schůzek
- propojení poznámek, přepisů a AI workflow v jednom nástroji
- otevřené řešení, které je možné upravovat nebo integrovat přes API