Модель Claude Mythos Preview від Anthropic вперше серед AI-систем повністю завершила імітовану атаку на корпоративну мережу, відповідно до нових оцінок Інституту безпеки штучного інтелекту Великої Британії (AISI).
Результати дослідження, опубліковані через кілька днів після оголошення моделі 7 квітня, сигналізують про досягнення штучним інтелектом кібернетичних можливостей, що вимагають негайної уваги з боку фахівців з інформаційної безпеки в усьому світі.
Що таке Claude Mythos?
Anthropic презентувала модель Claude Mythos Preview 7 квітня, обравши обмежений підхід до доступу. Публічного релізу не відбулося. Доступ до функціоналу отримали лише дослідницькі організації, спеціалізовані на безпеці, для цілеспрямованої оцінки ризиків та підготовки до особливої потужності нової AI-моделі. Деталі для дослідників так і залишаються предметом угод з обмеженим колом партнерів.
«Ця модель показує високий результат у більшості напрямків – проте її виняткова компетентність у сфері комп’ютерної безпеки вартує окремої уваги. Саме тому ми запустили проєкт Glasswing: Claude Mythos Preview використовуватиметься для захисту критично важливого програмного забезпечення, а також для підготовки сектору до нових практик кіберзахисту, які стануть невід’ємною частиною в умовах розвитку кібератак», – зазначено в офіційному повідомленні.
Стежте за новинами в X – повідомлення з’являються в реальному часі
Нова розробка вже привернула увагу як технологічних експертів, так і регуляторів. Згідно з інформацією агентства Reuters з посиланням на обізнані джерела, міністр фінансів США Скотт Бессент спільно з головою Федеральної резервної системи Джеромом Павеллом провели екстрену зустріч з керівниками провідних банків, офіційно попередивши про підвищені кіберризики, пов’язані з цією моделлю штучного інтелекту.
Оцінка роботи Claude Mythos Preview
AI Security Institute (AISI), що підпорядковується Департаменту науки, інновацій та технологій уряду Великої Британії, здійснив комплексну кібероцінку можливостей Claude Mythos Preview компанії Anthropic із залученням ряду спеціалізованих сценаріїв інформаційної безпеки.
Зокрема було проведено тестування за принципом «capture-the-flag» (CTF), у межах якого штучний інтелект мав виявити та використати вразливості в системах для отримання прихованих маркерів. Claude Mythos продемонструвала 73% успішності із завдань експертного рівня – раніше жодна з моделей не досягала такого результату при аналогічних умовах (до квітня 2025 року).
Дослідники також розробили складну модель симуляції атаки під назвою «The Last Ones» (ТLO), що охоплює 32 етапи зламу корпоративної мережі. Для людського фахівця в галузі інформаційної безпеки виконання такої симуляції зайняло б близько 20 годин суцільної роботи.
Claude Mythos Preview зуміла повністю пройти симуляцію у 3 із 10 тестових спроб. У середньому вона долала 22 з 32 кроків атаки. Для порівняння, модель Claude Opus 4.6 – найближчий конкурент – не перевищувала показники 16 кроків у середньому.
«Успішний прохід Mythos Preview на одному випробувальному полігоні демонструє її принаймні базову здатність до автономної атаки на невеликі, слабко захищені та вразливі корпоративні системи за наявності доступу до внутрішньої мережі. Але наші тестові середовища мають суттєві відмінності від реального корпоративного ІТ-простору – і на практиці рівень захисту там часто вищий», – наголошують дослідники.
Згідно з результатами власного тестування red team групи Anthropic, Claude Mythos Preview здатна ідентифікувати й екземплярно використовувати zero-day уразливості у всіх основних операційних системах та браузерах за прямої вказівки користувача.
«Ми сильно обмежені у своїй комунікації результатів. Понад 99% виявлених уразливостей поки що не ліквідовані виробниками, тож відповідально утримуємося від публікації будь-яких технічних деталей», – підкреслює команда Anthropic.
AISI акцентує на базових пріоритетах цифрової безпеки: підтримка регулярного оновлення програмного забезпечення, жорсткі доступи по ролях, максимальне посилення конфігурації, розширене логування подій у мережі.
Підписуйтеся на YouTube, щоб отримувати професійні аналітичні коментарі від галузевих лідерів





