Компания OpenAI представила инновационную функцию для ChatGPT — «режим агента», который позволяет ИИ не просто отвечать на вопросы, а самостоятельно выполнять задачи от имени пользователя.
Теперь ChatGPT может не только советовать, но и действовать
С помощью новой функции пользователи могут поручить ИИ выполнение таких задач, как:
— «Посмотри мой календарь и кратко проинформируй о предстоящих встречах с клиентами»,
— «Составь план и закажи ингредиенты для японского завтрака на четверых».
Функция пока доступна подписчикам тарифов Pro, Plus и Team активируется через пункт «agent mode» в приложении ChatGPT.
Что умеет агент?
Инструмент объединяет возможности предыдущих сервисов OpenAI — Operator и Deep Research, и позволяет взаимодействовать с такими приложениями, как Gmail и GitHub. Например:
— «Спланируй и закажи продукты на английский завтрак для пятерых»,
— «Проанализируй четырёх конкурентов и создай презентацию».
Результаты и эффективность
На тесте Humanity’s Last Exam агент показал результат 41,6% (pass@1) — почти вдвое выше предыдущих моделей o3 и o4-mini. На одном из самых сложных математических тестов FrontierMath агент достиг результата 27,4%, в то время как предыдущий рекорд составлял всего 6,3%.
Безопасность и этические ограничения
OpenAI утверждает, что безопасность была главным приоритетом при разработке этой функции. Каждый ввод пользователя проходит предварительную проверку, а биологически чувствительные запросы подвергаются дополнительному контролю.
Кроме того, такие действия, как отправка электронных писем, возможны только с разрешения пользователя. Банковские операции и другие высокорисковые действия полностью заблокированы.
Конкуренция в области ИИ усиливается
Этот релиз состоялся на фоне обостряющейся конкуренции в сфере искусственного интеллекта. Google и Apple также разрабатывают собственных интеллектуальных агентов. OpenAI, в свою очередь, делает решающий шаг к превращению ChatGPT в полноценного цифрового помощника, а не просто чат-бота.


