LlamaIndex Cloud a LlamaParse
LlamaIndex je ekosystém nástrojů pro stavbu RAG aplikací a AI agentů nad dokumenty a dalšími datovými zdroji. Odkaz https://cloud.llamaindex.ai/ vede do cloudového rozhraní LlamaIndexu, kde jsou soustředěné služby pro parsování, extrakci a indexaci dokumentů.
Co je co
LlamaIndex Cloud
LlamaIndex Cloud je webové rozhraní a API pro cloudové služby LlamaIndexu. Podle oficiálního webu sdružuje hlavně tři vrstvy práce s dokumenty:
- LlamaParse - převod PDF a dalších dokumentů do podoby vhodné pro AI, typicky markdownu a dalších strukturovaných výstupů
- LlamaExtract - vytěžení konkrétních polí a dat ze souborů podle definovaného schématu
- Index / LlamaCloud Index - příprava dokumentů pro vyhledávání a retrieval v RAG pipeline
Prakticky to znamená, že cloud.llamaindex.ai není jen „nějaký web LlamaIndexu„, ale vstupní bod do jejich cloudového document-processing stacku.
LlamaParse
LlamaParse je konkrétní služba v ekosystému LlamaIndexu zaměřená na zpracování dokumentů. Oficiální popis ji staví jako nástroj pro převod složitých PDF, tabulek, grafů, rukopisu nebo naskenovaných dokumentů do čistého textu a strukturovaných dat pro další AI zpracování.
Smysl to dává hlavně ve chvíli, kdy je potřeba dostat dokumenty do použitelné podoby pro RAG, extrakci dat nebo automatizaci nad firemními soubory.
OCR.z.ai
https://ocr.z.ai/ je samostatná OCR služba mimo ekosystém LlamaIndexu. Landing page ji popisuje jako „Free & accurate OCR powered by GLM-OCR“. Podle hlavního webu z.ai jde o službu z AI ekosystému Z.ai postaveného nad modely GLM.
Původní poznámka, že jde o čínskou AI službu, dává smysl zachovat hlavně z pohledu práce s dokumenty. U OCR služeb je rozumné předem řešit, jaké soubory se do nich posílají a jestli neobsahují citlivá data.
Praktická orientace
cloud.llamaindex.ai= cloudové rozhraní LlamaIndexu pro práci s dokumenty a indexacíwww.llamaindex.ai/llamacloud= produktový popis celé cloudové nabídkywww.llamaindex.ai/llamaparse= detail konkrétní parser/OCR vrstvy pro dokumentyocr.z.ai= samostatná OCR alternativa mimo LlamaIndex