Mythos AI від Anthropic зламаний у перший день, поки Білий дім готує запуск

  • Група в Discord отримала доступ до закритого Mythos AI від Anthropic у день запуску.
  • Вони вгадали URL моделі, використовуючи дані з витоку Mercor.
  • Білий дім тепер планує надати федеральним агентствам доступ до Mythos.

Невелика група неавторизованих користувачів отримала доступ до попередньої версії Claude Mythos від Anthropic у той самий день, коли компанія повідомила про контрольований запуск, згідно з інформацією Bloomberg.

Ця подія актуалізує питання щодо спроможності Anthropic забезпечити ізоляцію моделі, яку було визнано надто небезпечною для широкого оприлюднення.

Яким чином приватна група Discord отримала доступ до Mythos

Учасники закритого Discord-каналу, орієнтованого на пошук невипущених моделей штучного інтелекту, змогли на основі припущення визначити адресу кінцевої точки Mythos.

«Anthropic заявила, що Mythos — занадто небезпечний для релізу. А потім четверо випадкових осіб із Discord отримали доступ у перший же день, просто здогадавшись адресу…», — написав Josh Kale, популярний користувач X.

Їм вдалося реконструювати принципи найменування Anthropic, використовуючи дані, що містилися у матеріалах інциденту безпеки Mercor тритижневої давності, зазначає Bloomberg із посиланням на інформоване джерело.

Один із членів групи також мав чинні права для оцінювання — у зв’язку з контрактною співпрацею з підрядником Anthropic. Комбінація легітимних облікових даних і коректно визначеної кінцевої адреси забезпечила групі стійкий доступ до інструменту.

З повідомлень випливає, що користувачі експлуатують Mythos на регулярній основі з моменту отримання доступу. Разом з тим, вони свідомо уникають сценаріїв, пов’язаних із кібербезпекою, використовуючи модель переважно для рутинних завдань, наприклад, створення простих вебсайтів.

Anthropic підтвердила проведення внутрішнього розслідування інциденту. За даними компанії, наразі відсутні ознаки того, що несанкціонований доступ виходив за межі підрядного середовища.

Anthropic раніше зазначала, що Mythos здатен ідентифікувати та експлуатувати zero-day уразливості у всіх основних операційних системах і веб-браузерах.

У рамках ініціативи Project Glasswing компанія обмежила доступ близько 40 уповноваженим організаціям, серед яких Apple, Amazon та Cisco, виключно для цілей оборонного тестування безпеки.

Адміністрація Білого дому просуває доступ для цивільних державних органів, попри заборону Пентагону

Інцидент трапився на тлі ініціативи Білого дому щодо розширення доступу до Mythos для цивільних федеральних органів США. 15 квітня Управління з питань бюджету й адміністрації розіслало керівникам відомств деталі про модифіковану версію моделі з підвищеним рівнем захисту.

Це є відходом від позиції початку поточного року, коли Пентагон визнав Anthropic чинником «ризику для ланцюга постачання» після відмови компанії зняти захисні бар’єри на вимогу військових.

«Ми не дозволимо ЖОДНІЙ компанії визначати для нас правила ухвалення операційних рішень», — написав речник Міністерства оборони Sean Parnell у X.

Пізніше федеральний суд призупинив широкомасштабну заборону у відповідь на позовну заяву Anthropic.

17 квітня генеральний директор Anthropic Даріо Амодеї провів робочу зустріч із представниками Білого дому, яку обидві сторони назвали «продуктивною».

Водночас, за даними Axios, Агенція національної безпеки вже використовувала Mythos для виявлення уразливостей, попри наявність офіційного чорного списку Пентагону.


Щоб прочитати найсвіжіший аналіз криптовалютного ринку від BeInCrypto, натисніть тут.

Дисклеймер

Відповідно до принципів проєкту Trust Project, ця авторська стаття представляє точку зору автора і не обов'язково відображає погляди BeInCrypto. BeInCrypto залишається прихильником прозорої звітності та дотримання найвищих стандартів журналістики. Читачам рекомендується перевіряти інформацію самостійно і консультуватися з професіоналами, перш ніж приймати рішення на основі цього контенту. Зверніть увагу, що наші Загальні положення та умови, Політика конфіденційності та Дисклеймер були оновлені.