Obsah

QMD

QMD je lokální search engine pro markdownové dokumenty, poznámky, meeting notes a knowledge base. Podle README kombinuje BM25 fulltext, vektorové vyhledávání a LLM re-ranking, přitom běží on-device nad lokálními soubory. Dobře zapadá například jako doplněk k patternu LLM Wiki, kde může sloužit jako vyhledávací vrstva nad rostoucí wiki.

Co to je

QMD není samotná knowledge base ani agent memory platforma. Je to nástroj pro indexaci a prohledávání dokumentů, které už někde máš – typicky markdown, dokumentaci, zápisky nebo interní wiki. Hlavní hodnota je v tom, že nad těmito soubory umí dělat jak rychlé keyword search, tak i sémantické hledání a následný re-ranking výsledků.

README ho popisuje jako „Query Markup Documents“ a cílí hlavně na agentic workflows, kde agent potřebuje rychle:

Jak funguje

Podle dokumentace používá QMD hybridní pipeline:

V README je architektura popsaná jako kombinace více retrieval kroků, které se spojují přes RRF (Reciprocal Rank Fusion) a následně se přerovnají pomocí lokálního rerankeru. Prakticky je důležité hlavně to, že nejde jen o jednoduché grepování souborů.

Co umí

QMD umí pracovat jak přes CLI, tak přes MCP server. V praxi nabízí hlavně:

Pro větší bázi je důležité i to, že QMD nevrací jen seznam výsledků, ale umí dodat i snippet, skóre, docid a kontext. Agent tak může udělat dvoukrokový workflow: nejdřív hledat, potom stáhnout konkrétní dokumenty.

Lokální běh a modely

QMD běží lokálně a podle README využívá node-llama-cpp a GGUF modely pro embeddingy, reranking a query expansion. To je důležitý rozdíl oproti cloudovým službám – obsah dokumentů nemusí odcházet mimo lokální stroj.

README uvádí tři hlavní lokální modelové role:

Výhodou je soukromí a přímý běh nad lokálními soubory. Nevýhodou jsou vyšší nároky na lokální prostředí a nutnost počítat s tím, že pokročilejší kvalita retrievalu něco stojí i výpočetně.

K čemu je to dobré

QMD dává smysl hlavně v těchto situacích:

Typický use-case je právě větší osobní nebo týmová wiki, kde samotná struktura souborů a ruční index přestávají stačit, ale pořád chceš zůstat u lokálního markdownového workflow.

Jak se liší od LLM Wiki

Tady je dobré rozlišit pattern a nástroj.

LLM Wiki je způsob práce s knowledge base. Řeší, jak se zdroje průběžně kompilují do wiki, jak vznikají syntézy, jak se udržují vztahy mezi stránkami a jak se dělá linting.

QMD oproti tomu řeší hlavně retrieval nad již existujícími soubory. Jinými slovy:

Nejsou to konkurenti. QMD může být praktický stavební blok uvnitř workflow LLM Wiki.

Základní použití

README uvádí například tento rychlý start:

# instalace
npm install -g @tobilu/qmd
 
# přidání kolekce
qmd collection add ~/notes --name notes
 
# vytvoření embeddingů
qmd embed
 
# fulltext search
qmd search "project timeline"
 
# semantické vyhledávání
qmd vsearch "how to deploy"
 
# hybridní query
qmd query "quarterly planning process"

Pokud se má QMD používat přímo z agenta, dává smysl i MCP server:

qmd mcp

README uvádí také HTTP variantu MCP serveru pro sdílený běh bez opakovaného načítání modelů.

Na co dát pozor

Jinými slovy: QMD dobře řeší hledání, ale neřeší za tebe znalostní architekturu.

Kdy ho zvažovat

QMD má smysl zvažovat ve chvíli, kdy už máš větší množství markdownu a agent nad ním dělá opakované dotazy. Pokud máš jen malou sadu souborů, může stačit obyčejný filesystem a jednoduché fulltextové nástroje. Jakmile ale knowledge base roste, QMD dává smysl jako hotová lokální retrieval vrstva.

Zdroje