Equalify Reflow — otwarte narzędzie AI do konwersji PDF na dostępny Markdown
Zamiast tradycyjnej, niezwykle kosztownej i żmudnej remediacji — czyli ręcznego naprawiania tagów wewnątrz skomplikowanych struktur PDF — twórcy projektu Equalify Reflow z University of Illinois Chicago (UIC) proponują zupełnie inne podejście. Ich otwartoźródłowe narzędzie dokonuje semantycznego tłumaczenia dokumentu PDF bezpośrednio na format Markdown, który następnie staje się idealną bazą dla dostępnego kodu HTML.
Sercem systemu jest tzw. AI harness (szkielet instrukcji), który kontroluje i weryfikuje pracę multimodalnych modeli AI. Proces konwersji (nazwany Reflow) przebiega w pięciu krokach: od usunięcia uciążliwych dla czytników ekranu układów dwukolumnowych, przez automatyczne budowanie logicznej hierarchii nagłówków (H1–H6), aż po rekonstruowanie tabel oraz automatyczne generowanie inteligentnych opisów alternatywnych (alt text) dla grafik przez wyspecjalizowanego subagenta AI.
To podejście redefiniuje dostępność cyfrową dokumentów. Przejście z własnościowego, sztywnego formatu PDF na demokratyczny, uniwersalny i semantycznie bogaty format tekstowy (Markdown) pozwala na łatwy eksport do HTML, systemów LMS (np. Canvas) czy WordPressa. Otwiera to drogę do taniej i masowej cyfryzacji setek tysięcy niedostępnych dokumentów w instytucjach publicznych i akademickich.
Warto przeczytać w całości: PDF to Accessible Markdown: Introducing an Open Source AI Tool (Blake Bertuccelli-Booth & Dylan Isaac)