Coin Market Solution logo Coin Market Solution logo
Forklog 2026-03-06 11:38:27

OpenAI представила GPT‑5.4 с компьютерным зрением 

Компания OpenAI выпустила GPT-5.4 и GPT-5.4 Pro спустя два дня после релиза версии 5.3 Instant.  GPT-5.4 Thinking and GPT-5.4 Pro are rolling out now in ChatGPT.GPT-5.4 is also now available in the API and Codex.GPT-5.4 brings our advances in reasoning, coding, and agentic workflows into one frontier model. pic.twitter.com/1hy6xXLAmJ— OpenAI (@OpenAI) March 5, 2026 Стандартная версия GPT-5.4 доступна в веб-интерфейсе ChatGPT, через API и в инструменте Codex. Версию GPT-5.4 Thinking открыли для подписчиков Plus, Team и Pro.  Для пользователей тарифа Pro и корпоративных клиентов Enterprise предназначена GPT-5.4 Pro, которая также доступна через API.  Базовая стоимость использования составляет $2,5 за 1 млн входных токенов и $15 за 1 млн выходных. Расценки для версии Pro заметно выше: $30 и $180 за 1 млн токенов соответственно. Производительность в рабочих задачах GPT-5.4 выдает более стабильные и качественные результаты в реальных сценариях применения. В бенчмарке GDPval, оценивающем выполнение задач по 44 профессиям, версия достигла показателя в 83%. Это означает, что модель работает на уровне профильных специалистов или превосходит их. Для сравнения, результат GPT-5.2 составлял 70,9%. Источник: OpenAI.  Особое внимание разработчики уделили работе с таблицами, презентациями и документами. В задачах уровня младшего аналитика инвестбанка GPT‑5.4 набрала 87,3% против 68,4% у GPT‑5.2.  Презентации от новой модели оценщики предпочитали в 68% случаев — за лучшую эстетику, разнообразие и эффективное использование генерации изображений. Источник: OpenAI.  GPT‑5.4 также стала самой точной моделью OpenAI с точки зрения работы с фактами. При тестировании на промптах с заранее известными ошибками: отдельные утверждения оказывались ложными на 33% реже; полные ответы содержали ошибки на 18% реже по сравнению с GPT‑5.2. Компьютерное зрение  Версия первой получила встроенные возможности компьютерного зрения и управления ПК. Модель способна использовать мышь и клавиатуру, ориентируясь на скриншоты, а также писать код для автоматизации через Playwright.  Поведение настраивается под конкретные сценарии с учетом допустимого уровня риска. В бенчмарке OSWorld-Verified (управление рабочим столом) GPT‑5.4 успешно выполнила 75% заданий, обойдя предыдущую версию (47,3%) и человека (72,4%). Прогресс связан с улучшенным визуальным восприятием: в тесте MMMU-Pro (понимание и логика) результат составил 81,2% против 79,5% у GPT-5.2; в OmniDocBench (анализ документов) средний показатель ошибок снизился с 0,140 до 0,109. Программирование  В кодинге модель сравнялась со специализированной GPT‑5.3‑Codex, но работает быстрее.  В Codex появился режим /fast, ускоряющий генерацию в полтора раза без потери качества. По результатам внутренних тестов GPT‑5.4 показала высокие результаты в сложных задачах фронтенд-разработки.  Также представлен экспериментальный навык Playwright (Interactive). Он позволяет модели визуально отлаживать веб- и Electron-приложения, тестируя собственный код прямо в процессе написания. Инструменты  В GPT‑5.4 появилась функция поиска инструментов (Tool Search). Раньше системе приходилось заранее загружать в контекст описания всех доступных плагинов. Это добавляло тысячи лишних токенов к каждому запросу и увеличивало стоимость. Теперь модель получает лишь базовый список и при необходимости самостоятельно находит и подгружает нужные параметры. В тестах на базе MCP Atlas такой подход снизил потребление токенов на 47% без потери точности. Веб-поиск также стал производительнее: в бенчмарке BrowseComp показатели выросли на 17%, а версия Pro достигла рекордных 89,3%. GPT‑5.4 Thinking эффективнее собирает информацию из множества источников, лучше прорабатывает сложные запросы и выдает более структурированные ответы. Управляемость и контекст При работе со сложными запросами GPT‑5.4 Thinking в ChatGPT сначала демонстрирует пользователю план действий. Это позволяет на ходу скорректировать направление, не перезапуская генерацию и не делая лишних уточнений. Функция уже доступна на сайте и в Android-приложении, скоро появится на iOS. Модель также лучше удерживает контекст в длинных диалогах и дольше обдумывает сложные задачи. Это помогает сохранять связность и релевантность ответов даже при работе с большими объемами информации. Напомним, в начале марта пользователи бойкотировали ChatGPT на фоне сделки OpenAI с Пентагоном. 

Read the Disclaimer : All content provided herein our website, hyperlinked sites, associated applications, forums, blogs, social media accounts and other platforms (“Site”) is for your general information only, procured from third party sources. We make no warranties of any kind in relation to our content, including but not limited to accuracy and updatedness. No part of the content that we provide constitutes financial advice, legal advice or any other form of advice meant for your specific reliance for any purpose. Any use or reliance on our content is solely at your own risk and discretion. You should conduct your own research, review, analyse and verify our content before relying on them. Trading is a highly risky activity that can lead to major losses, please therefore consult your financial advisor before making any decision. No content on our Site is meant to be a solicitation or offer.