Máte hromadu PDF souborů, které potřebujete převést do čitatelné a strukturované podoby? Nebo pracujete s obrázky, PowerPointy a dalšími dokumenty, které chcete mít v jednotném formátu? Marker je open-source nástroj, který vám s tím pomůže – a dělá to překvapivě dobře.
Marker je konverzní nástroj vyvinutý společností Datalab, který transformuje PDF, obrázky a další dokumenty (PPTX, DOCX, XLSX, HTML, EPUB) do markdownu, JSON, HTML nebo jiných formátů. Jde v podstatě o inteligentní převodník, který nejen stáhne text, ale snaží se zachovat strukturu dokumentu – tabulky, rovnice, seznamy, odsazení a vše ostatní.
Hlavní praktické použití Markeru:
Marker používá ověřenou strategii – kombinuje heuristiku s hlubokým učením. Konkrétně:
Marker se pyšní benchmarky. Oproti konkurenčním cloudovým řešením (jako Llamaparse či Mathpix):
Specificky pro jednotlivé typy dokumentů:
Typ dokumentu | Přesnost |
---|---|
Vědecké články | 96,7 % |
Stránky knih | 97,2 % |
Dopisy | 98,4 % |
Formuláře | 88 % |
pip install marker-pdf
Pokud chcete pracovat s více typy dokumentů než jen PDF:
pip install marker-pdf[full]
Převod jednoho souboru:
marker_single /cesta/k/souboru.pdf
Chcete převést celou složku dokumentů?
marker /cesta/k/slozce
Marker automaticky detekuje dostupné zdroje (GPU, CPU) a optimalizuje práci. Výchozí výstup je markdown, ale můžete specifikovat i JSON, HTML nebo čunky.
Pro vyšší kvalitu můžete zapnout podporu LLM:
marker_single /cesta/k/souboru.pdf --use_llm --gemini_api_key YOUR_KEY
Marker podporuje Gemini, OpenAI, Anthropic (Claude), Ollama a další. Tímto způsobem dosáhne ještě vyšší přesnosti, zvlášť u složitějších dokumentů.
Chcete si vyzkoušet Marker interaktivně?
pip install streamlit streamlit-ace
marker_gui
Otevře se webové rozhraní, kde si můžete hrát s možnostmi.
Máte PDF s vědeckým článkem, který chcete zpracovat pro AI aplikaci:
marker_single research_paper.pdf --output_format json --use_llm
Výstupem bude JSON s hierarchickou strukturou všech prvků – nadpisy, paragrafy, rovnice, tabulky, vše strukturované.
Máte finanční report s tabulkami a chcete vytáhnout jen je:
marker_single financial_report.pdf --converter_cls marker.converters.table.TableConverter --output_format json
Starý dokument ve formě skenů? Marker zapne OCR:
marker_single scanned_document.pdf --force_ocr
Marker je výborný, ale má hranice. Nejsou to selhání, spíše okraje:
Řešením je použít příznak --use_llm a --force_ocr, což řeší většinu těchto problémů.
Marker je dostupný jako open-source (pod GPL licencí s výjimkami pro výzkum a startupy do 2M dolarů financování), ale Datalab nabízí i hostovanou API verzi za cenu. Tato verze je 4× levnější než konkurence a zpracuje stránku PDF přibližně za 15 sekund.
Marker je solidní volba pro všechny, kdo potřebují spolehlivě převádět dokumenty do strukturovaného formátu. Ať už jste vědecký tým zpracovávající články, podnikání s hromadou kontraktů, nebo AI vývojář připravující data – Marker vás nezklame. Kombinuje rychlost, přesnost a rozumnou cenu.
Jestliže vám stačí základní conversion, spusťte si ho lokálně zdarma. Pokud potřebujete maximální přesnost a nemusíte se starat o infrastrukturu, zkuste cloudový API. Buď jak buď, je to nástroj, který si zaslouží pozornost.