Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Následující verze | Předchozí verze | ||
| ai:zapisy-a-workflow:inspirace-a-strategie:karpathy-llm-wiki-prubezne-budovana-znalostni-baze [11.04.2026 00:42] – Nový článek o patternu LLM Wiki Petr Nosek | ai:zapisy-a-workflow:inspirace-a-strategie:karpathy-llm-wiki-prubezne-budovana-znalostni-baze [13.04.2026 10:22] (aktuální) – Doplnění praktické video ukázky setupu a workflow k LLM Wiki Petr Nosek | ||
|---|---|---|---|
| Řádek 1: | Řádek 1: | ||
| ====== Karpathyho LLM Wiki – průběžně budovaná znalostní báze ====== | ====== Karpathyho LLM Wiki – průběžně budovaná znalostní báze ====== | ||
| - | [[https:// | + | [[https:// |
| + | |||
| + | ===== Nejčastější omyl ===== | ||
| + | |||
| + | Nejdůležitější je neplést si LLM Wiki s generickým „second brain“ úložištěm na všechno. Smyslem není jen nahromadit co nejvíc souborů, ale průběžně z nich stavět provázanou znalostní vrstvu pro konkrétní doménu nebo projekt. | ||
| + | |||
| + | * '' | ||
| + | * samotné přidání celé složky souborů ještě neznamená, že se znalost „zkompilovala" | ||
| + | * '' | ||
| + | * existující wiki nebo dokumentace může být jen dalším zdrojem v '' | ||
| + | * v praxi dává největší smysl držet jednu wiki pro jeden jasně vymezený okruh témat; jinak místo kumulace znalosti roste šum | ||
| + | |||
| + | Jinými slovy: dokumentace k nástroji nebo odkaz na zajímavý článek se může stát vstupem, ale hodnotu získá až ve chvíli, kdy ho LLM zapracuje do existujících stránek a propojí s ostatními znalostmi v dané doméně. | ||
| ===== O co jde ===== | ===== O co jde ===== | ||
| Řádek 8: | Řádek 20: | ||
| Výsledkem není jen odpověď na konkrétní dotaz, ale průběžně rostoucí znalostní vrstva. Nový zdroj neznamená pouze nový embedding nebo další soubor v indexu, ale i úpravu již existujících stránek, doplnění souvislostí a případné označení konfliktů s tím, co wiki tvrdila dřív. | Výsledkem není jen odpověď na konkrétní dotaz, ale průběžně rostoucí znalostní vrstva. Nový zdroj neznamená pouze nový embedding nebo další soubor v indexu, ale i úpravu již existujících stránek, doplnění souvislostí a případné označení konfliktů s tím, co wiki tvrdila dřív. | ||
| + | |||
| + | Když Karpathy píše, že znalost je **zkompilovaná předem**, nemyslí tím indexaci souborů pro pozdější retrieval. Myslí tím, že po ingestu už jsou relevantní wiki stránky přepsané a připravené k použití, takže se syntéza nemusí skládat znovu při každém dalším dotazu. | ||
| ===== Tři vrstvy ===== | ===== Tři vrstvy ===== | ||
| Řádek 44: | Řádek 58: | ||
| Jeden nový zdroj tak může změnit více stránek najednou. To je hlavní rozdíl oproti klasickému retrievalu nad plochým archivem souborů. | Jeden nový zdroj tak může změnit více stránek najednou. To je hlavní rozdíl oproti klasickému retrievalu nad plochým archivem souborů. | ||
| + | |||
| + | Karpathy v gistu zároveň píše, že osobně preferuje ingest po jednom zdroji a zůstává u něj v loopu. To dobře ukazuje, že pointa není bezhlavý hromadný import všeho, ale průběžné kurátorství: | ||
| ==== Query ==== | ==== Query ==== | ||
| Dotazy se už nevedou primárně proti raw dokumentům, | Dotazy se už nevedou primárně proti raw dokumentům, | ||
| + | |||
| + | Praktický důsledek je jednoduchý: | ||
| ==== Lint ==== | ==== Lint ==== | ||
| Řádek 95: | Řádek 113: | ||
| * bez verzování a lintingu se báze časem zhorší | * bez verzování a lintingu se báze časem zhorší | ||
| * je potřeba jasně oddělit raw zdroje, interní pracovní vrstvu a případně publikované výstupy | * je potřeba jasně oddělit raw zdroje, interní pracovní vrstvu a případně publikované výstupy | ||
| + | * pokud se do jedné wiki míchají nesouvisející domény, rychle se zhorší struktura i kvalita syntézy | ||
| Právě proto dává smysl wiki verzovat v gitu a průběžně kontrolovat diffy. U větší knowledge base se hodí i samostatná vyhledávací vrstva. | Právě proto dává smysl wiki verzovat v gitu a průběžně kontrolovat diffy. U větší knowledge base se hodí i samostatná vyhledávací vrstva. | ||
| + | |||
| + | ===== Praktická ukázka setupu ===== | ||
| + | |||
| + | [[https:// | ||
| + | |||
| + | {{youtube> | ||
| + | |||
| + | Ve videu je užitečné hlavně to, že abstraktní tři vrstvy převádí do konkrétního setupu: | ||
| + | |||
| + | * v rootu vaultu jsou '' | ||
| + | * pravidla pro agenta jsou v '' | ||
| + | * ingest se spouští jednoduchým promptem typu '' | ||
| + | * po přidání dalšího zdroje agent nemá jen vytvářet nové stránky, ale i aktualizovat už existující témata a doplnit vazby | ||
| + | * průběžná kontrola kvality se dá spustit promptem '' | ||
| + | |||
| + | Zároveň je dobré to chápat jen jako jednu praktickou podobu, ne jako jediné správné řešení. Video samo ukazuje Obsidian hlavně jako viewer a graph view nad markdown soubory; samotný princip LLM Wiki zůstává stejný i s jiným editorem nebo jiným agentem, pokud umí spolehlivě číst a zapisovat soubory. Soustředí se hlavně na menší osobní setup, ne na větší vyhledávací vrstvu nebo provoz ve větším měřítku. | ||
| ===== Jak do toho zapadá qmd ===== | ===== Jak do toho zapadá qmd ===== | ||
| Řádek 114: | Řádek 149: | ||
| * [[https:// | * [[https:// | ||
| * [[https:// | * [[https:// | ||
| + | * [[https:// | ||
| * [[https:// | * [[https:// | ||
| - | |||