Поддержать нас
Беларусы на войне
  1. После возвращения из Польши задержан бывший сотрудник КГБ — «Вясна»
  2. Самый востребованный в мире беларусский бестселлер перевели на английский язык
  3. На этом заводе в Минске не хватает больше 700 работников — какие кадры нужны и сколько готовы платить
  4. Замдиректора Купаловского театра, похоже, стал бывший сотрудник КГБ
  5. Разворот по доллару: как быстро будет дорожать американская валюта? Прогноз курсов валют
  6. В обменниках возникла «аномальная» ситуация с долларами и евро — и это не преувеличение
  7. Минчанин пошел по просьбе матери поговорить с шумными соседями и был убит двумя братьями. СК раскрыл подробности
  8. Российский блогер-миллионник приезжал в офис Dana Holdings разбираться с долгом клиента. Поймал директора в неподходящий момент
  9. На авторынок Беларуси возобновили поставки популярного бренда — раньше он был в топ-3 по проданным машинам
  10. Помните «непростого» иностранца, который в 2020-м хвалил Лукашенко и говорил, что никто не украдет его дом? Похоже, он «сглазил»
  11. Личный «хутор» по соседству с резиденцией. Что известно о недвижимости политика, которого Лукашенко не хочет отпускать на родину


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.