Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Obě strany předchozí revize Předchozí verze Následující verze | Předchozí verze | ||
| ai:modely:llama [18.04.2026 13:08] – Rozšíření stránky o poznatky ze dvou videí zpracovaných přes NotebookLM Petr Nosek | ai:modely:llama [18.04.2026 13:10] (aktuální) – Doplnění inline odkazu na GitHub Ollamy Petr Nosek | ||
|---|---|---|---|
| Řádek 1: | Řádek 1: | ||
| ====== Llama ====== | ====== Llama ====== | ||
| - | [[https:// | + | [[https:// |
| ===== llama.cpp na Raspberry Pi ===== | ===== llama.cpp na Raspberry Pi ===== | ||
| Řádek 11: | Řádek 11: | ||
| Hlavní praktické poznatky z videa: | Hlavní praktické poznatky z videa: | ||
| - | * `llama.cpp` dává smysl tam, kde je potřeba jednoduchý a úsporný runtime bez zbytečné režie. | + | * '' |
| * Kritická je velikost modelu v RAM. Na Raspberry Pi je potřeba počítat s kvantizací a s tím, že větší modely budou narážet na paměť i rychlost. | * Kritická je velikost modelu v RAM. Na Raspberry Pi je potřeba počítat s kvantizací a s tím, že větší modely budou narážet na paměť i rychlost. | ||
| - | * Ve videu se řeší kompilace přes `'' | + | * Ve videu se řeší kompilace přes '' |
| - | * Důležitá je práce se system promptem a s parametry jako `temperature`, velikost kontextu nebo limit generovaných tokenů. | + | * Důležitá je práce se system promptem a s parametry jako '' |
| * Zajímavá je možnost vynutit strukturovaný výstup, například validní JSON nebo jiný formální formát. | * Zajímavá je možnost vynutit strukturovaný výstup, například validní JSON nebo jiný formální formát. | ||
| Řádek 25: | Řádek 25: | ||
| ===== Ollama na Raspberry Pi ===== | ===== Ollama na Raspberry Pi ===== | ||
| - | Druhé video [[https:// | + | Druhé video [[https:// |
| {{youtube> | {{youtube> | ||
| Řádek 39: | Řádek 39: | ||
| Praktické poznatky z videa: | Praktické poznatky z videa: | ||
| - | * `Ollama` je pohodlnější cesta než ruční práce s `llama.cpp`, pokud je cílem model hlavně rychle rozběhat a zkoušet. | + | * '' |
| * Na Raspberry Pi dává smysl zkoušet opravdu malé modely. Ve videu se pracuje s [[https:// | * Na Raspberry Pi dává smysl zkoušet opravdu malé modely. Ve videu se pracuje s [[https:// | ||
| - | * Přepínač | + | * Přepínač '' |
| - | * Pro sledování vytížení je praktické mít vedle otevřené | + | * Pro sledování vytížení je praktické mít vedle otevřené '' |
| * Pro technické dotazy a jednoduché pomocné úkoly může malý lokální model stačit, ale je potřeba počítat s halucinacemi a s horší kvalitou v češtině. | * Pro technické dotazy a jednoduché pomocné úkoly může malý lokální model stačit, ale je potřeba počítat s halucinacemi a s horší kvalitou v češtině. | ||
| Řádek 54: | Řádek 54: | ||
| * není to dobrá cesta pro větší modely nebo pro práci, kde je potřeba vysoká přesnost a rychlost | * není to dobrá cesta pro větší modely nebo pro práci, kde je potřeba vysoká přesnost a rychlost | ||
| - | Pokud je cílem jen rychle lokálně zkusit malý model, je jednodušší začít přes Ollamu. Pokud je cílem pochopit, jak běh modelu funguje pod kapotou, dává větší smysl `llama.cpp`. | + | Pokud je cílem jen rychle lokálně zkusit malý model, je jednodušší začít přes Ollamu. Pokud je cílem pochopit, jak běh modelu funguje pod kapotou, dává větší smysl '' |
| ===== Limity a poznámky ===== | ===== Limity a poznámky ===== | ||