·1 хв читання · 88 слів·👁 2.5K↗ 56
Топові нейромережі не склали ЗНО Команда українських дослідників розробила ZNOVision — перший мультимодальний тест із ЗН…
Топові нейромережі не склали ЗНО
Команда українських дослідників розробила ZNOVision — перший мультимодальний тест із ЗНО для ШІ-моделей. У ньому зібрані завдання з 13 шкільних предметів, включаючи завдання з картинками та схемами. Тест перевіряє не тільки знання української мови, а й розуміння візуального контексту.
Жодна модель не подолала поріг у 70%. Найкращий результат показав Gemini Pro — 67,5%. GPT-4o — лише 47%.
Особливо погано ШІ справлялися з візуальними питаннями — не розпізнавали український текст на зображеннях, ігнорували одиниці виміру і втрачали частину умов.

