Cohere выпустила Command A Vision: 112B многомодальную модель
Расширение текстовой модели Command A интегрирует SigLIP2-энкодер для обработки документов, диаграмм и таблиц. Лидирует в бенчмарках DocVQA (95.9%) и OCRBench (86.9%), опережая GPT-4.1.
Расширение текстовой модели Command A интегрирует SigLIP2-энкодер для обработки документов, диаграмм и таблиц. Лидирует в бенчмарках DocVQA (95.9%) и OCRBench (86.9%), опережая GPT-4.1.