Исследование WSU: ChatGPT слабо справляется с верификацией научных гипотез
Ученые протестировали 719 гипотез из бизнес-журналов. Поверхностная точность — 80%, но без случайных угадываний — лишь на 60% лучше подбрасывания монеты. На ложных суждениях верность — 16,4%, а в 27% случаев ответы противоречат.