QMD je lokální search engine pro markdownové dokumenty, poznámky, meeting notes a knowledge base. Podle README kombinuje BM25 fulltext, vektorové vyhledávání a LLM re-ranking, přitom běží on-device nad lokálními soubory. Dobře zapadá například jako doplněk k patternu LLM Wiki, kde může sloužit jako vyhledávací vrstva nad rostoucí wiki.
QMD není samotná knowledge base ani agent memory platforma. Je to nástroj pro indexaci a prohledávání dokumentů, které už někde máš – typicky markdown, dokumentaci, zápisky nebo interní wiki. Hlavní hodnota je v tom, že nad těmito soubory umí dělat jak rychlé keyword search, tak i sémantické hledání a následný re-ranking výsledků.
README ho popisuje jako „Query Markup Documents“ a cílí hlavně na agentic workflows, kde agent potřebuje rychle:
Podle dokumentace používá QMD hybridní pipeline:
V README je architektura popsaná jako kombinace více retrieval kroků, které se spojují přes RRF (Reciprocal Rank Fusion) a následně se přerovnají pomocí lokálního rerankeru. Prakticky je důležité hlavně to, že nejde jen o jednoduché grepování souborů.
QMD umí pracovat jak přes CLI, tak přes MCP server. V praxi nabízí hlavně:
search, vsearch a queryget a multi-getPro větší bázi je důležité i to, že QMD nevrací jen seznam výsledků, ale umí dodat i snippet, skóre, docid a kontext. Agent tak může udělat dvoukrokový workflow: nejdřív hledat, potom stáhnout konkrétní dokumenty.
QMD běží lokálně a podle README využívá node-llama-cpp a GGUF modely pro embeddingy, reranking a query expansion. To je důležitý rozdíl oproti cloudovým službám – obsah dokumentů nemusí odcházet mimo lokální stroj.
README uvádí tři hlavní lokální modelové role:
Výhodou je soukromí a přímý běh nad lokálními soubory. Nevýhodou jsou vyšší nároky na lokální prostředí a nutnost počítat s tím, že pokročilejší kvalita retrievalu něco stojí i výpočetně.
QMD dává smysl hlavně v těchto situacích:
Typický use-case je právě větší osobní nebo týmová wiki, kde samotná struktura souborů a ruční index přestávají stačit, ale pořád chceš zůstat u lokálního markdownového workflow.
Tady je dobré rozlišit pattern a nástroj.
LLM Wiki je způsob práce s knowledge base. Řeší, jak se zdroje průběžně kompilují do wiki, jak vznikají syntézy, jak se udržují vztahy mezi stránkami a jak se dělá linting.
QMD oproti tomu řeší hlavně retrieval nad již existujícími soubory. Jinými slovy:
Nejsou to konkurenti. QMD může být praktický stavební blok uvnitř workflow LLM Wiki.
README uvádí například tento rychlý start:
# instalace npm install -g @tobilu/qmd # přidání kolekce qmd collection add ~/notes --name notes # vytvoření embeddingů qmd embed # fulltext search qmd search "project timeline" # semantické vyhledávání qmd vsearch "how to deploy" # hybridní query qmd query "quarterly planning process"
Pokud se má QMD používat přímo z agenta, dává smysl i MCP server:
qmd mcp
README uvádí také HTTP variantu MCP serveru pro sdílený běh bez opakovaného načítání modelů.
Jinými slovy: QMD dobře řeší hledání, ale neřeší za tebe znalostní architekturu.
QMD má smysl zvažovat ve chvíli, kdy už máš větší množství markdownu a agent nad ním dělá opakované dotazy. Pokud máš jen malou sadu souborů, může stačit obyčejný filesystem a jednoduché fulltextové nástroje. Jakmile ale knowledge base roste, QMD dává smysl jako hotová lokální retrieval vrstva.