ChatGPT теперь может действовать за вас: OpenAI запустила новый «режим агента»

Компания OpenAI представила инновационную функцию для ChatGPT — «режим агента», который позволяет ИИ не просто отвечать на вопросы, а самостоятельно выполнять задачи от имени пользователя.

Теперь ChatGPT может не только советовать, но и действовать

С помощью новой функции пользователи могут поручить ИИ выполнение таких задач, как:

— «Посмотри мой календарь и кратко проинформируй о предстоящих встречах с клиентами»,

— «Составь план и закажи ингредиенты для японского завтрака на четверых».

Функция пока доступна подписчикам тарифов Pro, Plus и Team активируется через пункт «agent mode» в приложении ChatGPT.

Что умеет агент?

Инструмент объединяет возможности предыдущих сервисов OpenAI — Operator и Deep Research, и позволяет взаимодействовать с такими приложениями, как Gmail и GitHub. Например:

— «Спланируй и закажи продукты на английский завтрак для пятерых»,

— «Проанализируй четырёх конкурентов и создай презентацию».

Результаты и эффективность

На тесте Humanity’s Last Exam агент показал результат 41,6% (pass@1) — почти вдвое выше предыдущих моделей o3 и o4-mini. На одном из самых сложных математических тестов FrontierMath агент достиг результата 27,4%, в то время как предыдущий рекорд составлял всего 6,3%.

Безопасность и этические ограничения

OpenAI утверждает, что безопасность была главным приоритетом при разработке этой функции. Каждый ввод пользователя проходит предварительную проверку, а биологически чувствительные запросы подвергаются дополнительному контролю.

Кроме того, такие действия, как отправка электронных писем, возможны только с разрешения пользователя. Банковские операции и другие высокорисковые действия полностью заблокированы.

Конкуренция в области ИИ усиливается

Этот релиз состоялся на фоне обостряющейся конкуренции в сфере искусственного интеллекта. Google и Apple также разрабатывают собственных интеллектуальных агентов. OpenAI, в свою очередь, делает решающий шаг к превращению ChatGPT в полноценного цифрового помощника, а не просто чат-бота.