
Доказать хотели, что алгоритм работает лучше человека, но вышло всё абсолютно наоборот. Оказывается, что вообще все модели не готовы к реальным рабочим процессам.
Команда тестировала топов — GPT, Claude и Gemini — на офисных задачах. Ответ убил: каждая четвёртая операция с документами заканчивалась либо потерей данных, либо порчей. Даже новые агенты не справляются, результат был закономерно таким же.
А ещё оказалось, что у всех моделей ИИ случается «внезапная катастрофа». Модель вроде работает идеально, а потом просто берёт и уничтожает огромные куски данных.
По итогу Microsoft попытались эти результаты скрыть, но не получилось. Исследование всплыло в сети.
Ну что, пока ожирение от безделья нам ещё не грозит. Так, что можно расслабиться
Теперь Вы знаете больше