OpenAI представила модель GPT-5.5 із кодовою назвою «Spud» 23 квітня, позиціонуючи її як найбільш продуктивну систему для самостійного багатокрокового виконання завдань.
Запуск відбувся через тиждень після випуску Anthropic оновленої Claude Opus 4.7, створюючи прямий майданчик для порівняння двох флагманських моделей.
GPT-5.5 орієнтована на автономність агентних рішень і програмування
Модель GPT-5.5 розроблена для планування, виконання, перевірки та ітерацій із використанням зовнішніх інструментів без постійного нагляду з боку користувача. OpenAI характеризує її як «новий клас інтелекту для реального застосування й забезпечення роботи агентів».
Стежте за нами в X, щоб отримувати актуальні новини в реальному часі
«Ми прихильники поетапного розгортання: GPT-5.5 вже є потужною моделлю, однак передбачаємо динамічний прогрес. Ітеративність — базова складова нашої стратегії безпеки; це оптимальний шлях для розвитку стійкості до ризиків у галузі штучного інтелекту», — зазначив Сем Олтмен у дописі.
Вже зараз модель доступна користувачам ChatGPT Plus, Pro, Business та Enterprise. Доступна й розширена версія Pro. Вартість API стартує від $5 за 1 млн вхідних токенів та $30 за 1 млн вихідних токенів із контекстним вікном у 1 млн токенів.
Згідно з власними бенчмарками OpenAI, GPT-5.5 демонструє перевагу над Claude Opus 4.7 у низці агентних тестів. За показником Terminal-Bench 2.0 вона набрала 82,7%, тоді як Opus 4.7 — 69,4%.
На FrontierMath у діапазоні тiрів з 1 по 3 підсумковий результат GPT-5.5 склав 51,7% проти 43,8%. Перші незалежні спроби підтверджують ці тенденції у сфері програмування та знаннєво-аналітичних завдань.
Де Claude Opus 4.7 все ще переважає
За висновками незалежних аналітиків, модель Anthropic зберігає перевагу у написанні наукових текстів, формуванні юридичних і фінансових висновків, а також у точному слідуванні інструкціям.
Opus 4.7 оперує також вищою роздільною здатністю аналізу зображень — до 3,75 мегапікселя, що перевищує можливості попередньої версії утричі.
У задачах, пов’язаних із операційними системами, різниця скорочується. GPT-5.5 отримала 78,7% за OSWorld-Verified, Opus 4.7 — 78,0%.
Моделі змінюються місцями за окремими тестами на навігацію: GPT-5.5 Pro досягла 90,1% проти 79,3% для Opus 4.7.
Динаміка змагання у сфері ШІ у 2026 році
Одна за одною серії релізів фіксують тенденцію до посилення конкуренції. OpenAI презентувала кілька модифікацій GPT-5.x цього року, Anthropic системно вдосконалює Claude.
Gemini 3.1 Pro від Google також претендує на увагу корпоративного сегмента.
Вибір між двома конкурентами значною мірою зумовлений специфікою задач: GPT-5.5 може стати оптимальним рішенням для автоматизації агентних процесів і довгострокового програмування.
Claude Opus 4.7 логічніше застосовувати для завдань, що вимагають підвищеної точності в аналітичній роботі. Відповідність заявлених OpenAI показників дійсності покаже подальший незалежний аудит.
Підпишіться на наш YouTube-канал, щоб переглядати експертні коментарі та аналітику від лідерів ринку





