TGArchive
·1 хв читання · 88 слів·👁 2.5K56

Топові нейромережі не склали ЗНО Команда українських дослідників розробила ZNOVision — перший мультимодальний тест із ЗН…

Топові нейромережі не склали ЗНО

Команда українських дослідників розробила ZNOVision — перший мультимодальний тест із ЗНО для ШІ-моделей. У ньому зібрані завдання з 13 шкільних предметів, включаючи завдання з картинками та схемами. Тест перевіряє не тільки знання української мови, а й розуміння візуального контексту.

Жодна модель не подолала поріг у 70%. Найкращий результат показав Gemini Pro — 67,5%. GPT-4o — лише 47%.

Особливо погано ШІ справлялися з візуальними питаннями — не розпізнавали український текст на зображеннях, ігнорували одиниці виміру і втрачали частину умов.

Tokensales | News | WaitingRoom

Відкрити в Telegram
Повернутись до каналу