Claude Mythos розкриває 73% експертних кіберзавдань, недоступних ШІ раніше

  • Claude Mythos Preview — перший ШІ, що завершив моделювання корпоративної кібератаки.
  • Воно вирішило 73% експертних завдань з хакінгу, які жоден ШІ не міг пройти до 2025 року.
  • Anthropic оголосила про попередню версію Claude Mythos 7 квітня.

Модель Claude Mythos Preview від Anthropic вперше серед AI-систем повністю завершила імітовану атаку на корпоративну мережу, відповідно до нових оцінок Інституту безпеки штучного інтелекту Великої Британії (AISI).

Результати дослідження, опубліковані через кілька днів після оголошення моделі 7 квітня, сигналізують про досягнення штучним інтелектом кібернетичних можливостей, що вимагають негайної уваги з боку фахівців з інформаційної безпеки в усьому світі.

Що таке Claude Mythos?

Anthropic презентувала модель Claude Mythos Preview 7 квітня, обравши обмежений підхід до доступу. Публічного релізу не відбулося. Доступ до функціоналу отримали лише дослідницькі організації, спеціалізовані на безпеці, для цілеспрямованої оцінки ризиків та підготовки до особливої потужності нової AI-моделі. Деталі для дослідників так і залишаються предметом угод з обмеженим колом партнерів.

«Ця модель показує високий результат у більшості напрямків – проте її виняткова компетентність у сфері комп’ютерної безпеки вартує окремої уваги. Саме тому ми запустили проєкт Glasswing: Claude Mythos Preview використовуватиметься для захисту критично важливого програмного забезпечення, а також для підготовки сектору до нових практик кіберзахисту, які стануть невід’ємною частиною в умовах розвитку кібератак», – зазначено в офіційному повідомленні.

Стежте за новинами в X – повідомлення з’являються в реальному часі

Нова розробка вже привернула увагу як технологічних експертів, так і регуляторів. Згідно з інформацією агентства Reuters з посиланням на обізнані джерела, міністр фінансів США Скотт Бессент спільно з головою Федеральної резервної системи Джеромом Павеллом провели екстрену зустріч з керівниками провідних банків, офіційно попередивши про підвищені кіберризики, пов’язані з цією моделлю штучного інтелекту.

Оцінка роботи Claude Mythos Preview

AI Security Institute (AISI), що підпорядковується Департаменту науки, інновацій та технологій уряду Великої Британії, здійснив комплексну кібероцінку можливостей Claude Mythos Preview компанії Anthropic із залученням ряду спеціалізованих сценаріїв інформаційної безпеки.

Зокрема було проведено тестування за принципом «capture-the-flag» (CTF), у межах якого штучний інтелект мав виявити та використати вразливості в системах для отримання прихованих маркерів. Claude Mythos продемонструвала 73% успішності із завдань експертного рівня – раніше жодна з моделей не досягала такого результату при аналогічних умовах (до квітня 2025 року).

Кібернетичні можливості Claude Mythos
Кібернетичні можливості Claude Mythos. Джерело: AISI

Дослідники також розробили складну модель симуляції атаки під назвою «The Last Ones» (ТLO), що охоплює 32 етапи зламу корпоративної мережі. Для людського фахівця в галузі інформаційної безпеки виконання такої симуляції зайняло б близько 20 годин суцільної роботи.

Claude Mythos Preview зуміла повністю пройти симуляцію у 3 із 10 тестових спроб. У середньому вона долала 22 з 32 кроків атаки. Для порівняння, модель Claude Opus 4.6 – найближчий конкурент – не перевищувала показники 16 кроків у середньому.

«Успішний прохід Mythos Preview на одному випробувальному полігоні демонструє її принаймні базову здатність до автономної атаки на невеликі, слабко захищені та вразливі корпоративні системи за наявності доступу до внутрішньої мережі. Але наші тестові середовища мають суттєві відмінності від реального корпоративного ІТ-простору – і на практиці рівень захисту там часто вищий», – наголошують дослідники.

Згідно з результатами власного тестування red team групи Anthropic, Claude Mythos Preview здатна ідентифікувати й екземплярно використовувати zero-day уразливості у всіх основних операційних системах та браузерах за прямої вказівки користувача.

«Ми сильно обмежені у своїй комунікації результатів. Понад 99% виявлених уразливостей поки що не ліквідовані виробниками, тож відповідально утримуємося від публікації будь-яких технічних деталей», – підкреслює команда Anthropic.

AISI акцентує на базових пріоритетах цифрової безпеки: підтримка регулярного оновлення програмного забезпечення, жорсткі доступи по ролях, максимальне посилення конфігурації, розширене логування подій у мережі.

Підписуйтеся на YouTube, щоб отримувати професійні аналітичні коментарі від галузевих лідерів


Щоб прочитати найсвіжіший аналіз криптовалютного ринку від BeInCrypto, натисніть тут.

Дисклеймер

Відповідно до принципів проєкту Trust Project, ця авторська стаття представляє точку зору автора і не обов'язково відображає погляди BeInCrypto. BeInCrypto залишається прихильником прозорої звітності та дотримання найвищих стандартів журналістики. Читачам рекомендується перевіряти інформацію самостійно і консультуватися з професіоналами, перш ніж приймати рішення на основі цього контенту. Зверніть увагу, що наші Загальні положення та умови, Політика конфіденційності та Дисклеймер були оновлені.