Mistral OCR — PDF na Markdown dla LLM
Mistral wypuściło API do OCR, które zamienia PDF-y na Markdown gotowy dla modeli językowych. To ważne dla dostępności dokumentów — wiele organizacji posiada zasoby w PDF-ach niedostępnych dla LLM-ów, systemów RAG i narzędzi wspomagających.
API jest multimodalne: wyciąga tekst, rozpoznaje obrazy, wzory matematyczne i złożone układy stron. Obsługuje języki inne niż angielski, co dla polskiego rynku ma znaczenie. Według Mistral bije Google, Microsoft i OpenAI w trudnych przypadkach — i jest szybsze od modeli ogólnego przeznaczenia, bo wyspecjalizowane wyłącznie w OCR.
Dostępne przez platformę Mistral, AWS, Azure, Google Cloud i jako deployment on-premise dla danych wrażliwych. Integracja z Le Chat już działa.
Warto przeczytać w całości: Mistral's new OCR API turns any PDF document into an AI-ready Markdown file (Romain Dillet)