Anthropic та OpenAI 18 листопада 2025 року перейшли до нового етапу конкуренції; кожна компанія орієнтується на наукові дослідження. Anthropic презентувала Claude Science — робоче AI-середовище для дослідників, в той час як OpenAI анонсувала GeneBench-Pro — новий бенчмарк для комп’ютерної біології.
Запуск у той самий день зміщує фокус AI-гонки з чат-ботів і автоматизованої розробки коду в лабораторну практику. Один учасник випустив інструмент, націлений на оперативне використання у науковій галузі. Другий — створив засіб оцінки поточного рівня розвитку технологій.
Функціонал Claude Science від Anthropic
Claude Science об’єднує уніфікований доступ до баз даних, коду та потужностей обчислювальної інфраструктури в межах одного застосунку. Система інтегрує понад 60 наукових джерел даних з областей геноміки, протеоміки та хемінформатики.
Claude Science є додатком, а не окремою мовною моделлю. Реліз співпав зі збереженням обмежень на експорт Fable 5 і Mythos 5 — найпотужніших моделей Anthropic — відповідно до регуляторних вимог США. Кожен результат у системі підлягає аудиту та містить простежуваність до програмного коду, який його згенерував.
Цей робочий інтерфейс продовжує життєві наукові ініціативи Anthropic, розпочаті у жовтні 2025 року. Під час бета-тестування співробітник Інституту Аллена Жером Лекок скоротив час аналізу рецензій з двох років до лічених місяців.
Anthropic планує профінансувати до 50 проєктів, виділивши до $30 000 кредитів на кожен.
OpenAI GeneBench-Pro — зрушення стандартів
У відповідь на запуск Claude Science компанія OpenAI презентувала GeneBench-Pro. Цей бенчмарк дозволяє оцінити здатність AI-агентів до прийняття рішень, які вимагає справжня біологічна дослідницька діяльність.
GeneBench-Pro включає 129 завдань у сферах геноміки, кількісної біології та трансляційної медицини.
Флагманська модель OpenAI, GPT-5.6 Sol, вирішила 28,7% завдань на найвищому рівні логічних міркувань. У Pro-режимі цей показник підвищився до 31,5%. Реліз попередніх версій GPT-5.6 здійснювався на вимогу регуляторних органів у Вашингтоні.
На першій версії GeneBench GPT-5 показала результат менше 5%, а Opus 4.8 від Anthropic досягла 16% на складнішому тесті.
Дві стратегії — спільна мета
Поточна ситуація демонструє розбіжність підходів до ідентичної цілі: Anthropic створює інструментарій для оперативної лабораторної роботи, OpenAI — критерії для оцінки обґрунтованості AI-розв’язання складних задач на нестабільних даних.
Варто зазначити, обидва запуску відбулися на тлі посилення позицій китайського сегмента AI у наукових дослідженнях. Результати тестування OpenAI свідчать про стриманість очікувань: навіть найпередовіша модель компанії не справляється з більшістю завдань GeneBench-Pro.
Тиск поступає як з боку геополітики, так і з наукової спільноти: експортні обмеження США вже змусили Anthropic розглядати трансфер моделей до інших країн.
Експерти оцінюють, що вирішення кожної задачі GeneBench-Pro у людини-спеціаліста займає 20–40 годин роботи та коштує кілька тисяч доларів. OpenAI стверджує: аналогічний AI-аналіз сьогодні можливий у межах декількох доларів.
Біомедичний геронтолог Обрі де Грей (Aubrey de Grey) вважає: вже зараз AI прибирає ключові вузькі місця наукового пошуку, хоча фундаментальні прориви залишаються питанням часу.
«У дуже близькому майбутньому AI зробить окремі етапи наукових процесів — особливо розробку нових лікарських засобів — більше не основним обмеженням», — переконаний Обрі де Грей, президент і головний науковий співробітник Longevity Escape Velocity Foundation у подкасті BeInCrypto.
Водночас де Грей наголошує: швидкість наукової роботи — лише одна зі змінних, а затвердження нових засобів завжди лишається під впливом регуляторних вимог і суспільного рівня прийняття ризику.
Дослідники прогнозують швидкий перехід
Частина фахівців уже відзначає: перелом відбувається у реальному часі. Докторка Дер’я Унутмаз, професорка імунології, на панелі BeInCrypto заявила, що AI демонструє перевершення її особистого експертного судження.
«Я особисто довіряю AI більше, ніж власним висновкам у своїй галузі за 35 років».
Вона впевнена: такий рівень довіри дуже швидко стане нормою для лікарської практики.
«Це питання етики: невдовзі навіть ігнорування AI у медичній сфері стане неналежною професійною поведінкою».
Оптимістичний тон за даними поки випереджає фактичні результати. Протягом найближчих місяців стане очевидно, чи відбудеться масове впровадження нових цифрових інструментів науковою спільнотою та чи покращаться показники GeneBench-Pro.









