QMD
QMD je lokální search engine pro markdownové dokumenty, poznámky, meeting notes a knowledge base. Podle README kombinuje BM25 fulltext, vektorové vyhledávání a LLM re-ranking, přitom běží on-device nad lokálními soubory. Dobře zapadá například jako doplněk k patternu LLM Wiki, kde může sloužit jako vyhledávací vrstva nad rostoucí wiki.
Co to je
QMD není samotná knowledge base ani agent memory platforma. Je to nástroj pro indexaci a prohledávání dokumentů, které už někde máš – typicky markdown, dokumentaci, zápisky nebo interní wiki. Hlavní hodnota je v tom, že nad těmito soubory umí dělat jak rychlé keyword search, tak i sémantické hledání a následný re-ranking výsledků.
README ho popisuje jako „Query Markup Documents“ a cílí hlavně na agentic workflows, kde agent potřebuje rychle:
- najít relevantní soubory
- získat jejich cestu nebo docid
- stáhnout konkrétní dokument
- omezit hledání jen na vybranou kolekci
Jak funguje
Podle dokumentace používá QMD hybridní pipeline:
- BM25 / FTS5 pro klasické fulltextové hledání
- vector search pro sémantickou podobnost
- query expansion pro rozšíření dotazu
- LLM re-ranking pro přesnější finální pořadí výsledků
V README je architektura popsaná jako kombinace více retrieval kroků, které se spojují přes RRF (Reciprocal Rank Fusion) a následně se přerovnají pomocí lokálního rerankeru. Prakticky je důležité hlavně to, že nejde jen o jednoduché grepování souborů.
Co umí
QMD umí pracovat jak přes CLI, tak přes MCP server. V praxi nabízí hlavně:
- správu kolekcí nad adresáři se soubory
- indexaci markdownu a dalších textových zdrojů
- ukládání kontextu k adresářům a cestám
- vyhledávání v režimech
search,vsearchaquery - načítání jednoho nebo více dokumentů přes
getamulti-get - JSON nebo file-oriented výstup vhodný pro agenty
- MCP server pro přímé napojení do LLM klientů
Pro větší bázi je důležité i to, že QMD nevrací jen seznam výsledků, ale umí dodat i snippet, skóre, docid a kontext. Agent tak může udělat dvoukrokový workflow: nejdřív hledat, potom stáhnout konkrétní dokumenty.
Lokální běh a modely
QMD běží lokálně a podle README využívá node-llama-cpp a GGUF modely pro embeddingy, reranking a query expansion. To je důležitý rozdíl oproti cloudovým službám – obsah dokumentů nemusí odcházet mimo lokální stroj.
README uvádí tři hlavní lokální modelové role:
- embedding model
- reranker
- model pro query expansion
Výhodou je soukromí a přímý běh nad lokálními soubory. Nevýhodou jsou vyšší nároky na lokální prostředí a nutnost počítat s tím, že pokročilejší kvalita retrievalu něco stojí i výpočetně.
K čemu je to dobré
QMD dává smysl hlavně v těchto situacích:
- máš větší markdownovou knowledge base
- agent nad ní potřebuje opakovaně hledat
- nechceš pokaždé ručně procházet index nebo adresáře
- chceš lokální, souborově orientovaný search bez nutnosti stavět vlastní retrieval stack
- potřebuješ rychle připojit vyhledávání do Claude Code, MCP klienta nebo jiného agentního workflow
Typický use-case je právě větší osobní nebo týmová wiki, kde samotná struktura souborů a ruční index přestávají stačit, ale pořád chceš zůstat u lokálního markdownového workflow.
Jak se liší od LLM Wiki
Tady je dobré rozlišit pattern a nástroj.
LLM Wiki je způsob práce s knowledge base. Řeší, jak se zdroje průběžně kompilují do wiki, jak vznikají syntézy, jak se udržují vztahy mezi stránkami a jak se dělá linting.
QMD oproti tomu řeší hlavně retrieval nad již existujícími soubory. Jinými slovy:
- LLM Wiki = pattern pro průběžně udržovanou znalostní vrstvu
- QMD = search vrstva nad markdownem a dokumenty
Nejsou to konkurenti. QMD může být praktický stavební blok uvnitř workflow LLM Wiki.
Základní použití
README uvádí například tento rychlý start:
# instalace npm install -g @tobilu/qmd # přidání kolekce qmd collection add ~/notes --name notes # vytvoření embeddingů qmd embed # fulltext search qmd search "project timeline" # semantické vyhledávání qmd vsearch "how to deploy" # hybridní query qmd query "quarterly planning process"
Pokud se má QMD používat přímo z agenta, dává smysl i MCP server:
qmd mcp
README uvádí také HTTP variantu MCP serveru pro sdílený běh bez opakovaného načítání modelů.
Na co dát pozor
- QMD není náhrada za kvalitní strukturu knowledge base
- výsledky budou jen tak dobré, jak dobré jsou indexované dokumenty a kontext
- lokální modely zvyšují nároky na runtime prostředí
- hybridní retrieval je užitečný, ale pořád neřeší sám o sobě syntézu, konsolidaci a údržbu wiki
Jinými slovy: QMD dobře řeší hledání, ale neřeší za tebe znalostní architekturu.
Kdy ho zvažovat
QMD má smysl zvažovat ve chvíli, kdy už máš větší množství markdownu a agent nad ním dělá opakované dotazy. Pokud máš jen malou sadu souborů, může stačit obyčejný filesystem a jednoduché fulltextové nástroje. Jakmile ale knowledge base roste, QMD dává smysl jako hotová lokální retrieval vrstva.