LlamaIndex выпустила LiteParse для парсинга PDF в AI-агентных workflow
LiteParse — TypeScript-библиотека на Node.js без Python-зависимостей. Использует PDF.js и Tesseract.js для локального OCR, сохраняет пространственную структуру документов с отступами и пробелами, генерирует скриншоты для мультимодальных агентов.