Команда Baidu Qianfan выпустила Qianfan-OCR: 4B-параметровую модель для унифицированной обработки документов
Модель объединяет распознавание текста, анализ макета и понимание документов в единую vision-language архитектуру, обеспечивая прямое преобразование изображений в Markdown и поддержку задач вроде извлечения таблиц.