Штучний інтелект Google за лічені хвилини піддався хакерській атаці і розкрив надзвичайно небезпечні дані

Також на запит, сформульований як провокація, ШІ підготувала презентацію під назвою "Excused Stupid Gemini 3", фактично висміюючи власні обмеження.
 |  Автор: Соколенко Вікторія
Штучний інтелект Google за лічені хвилини піддався хакерській атаці і розкрив надзвичайно небезпечні дані
Ілюстративне зображення / Getty Images

Експерти з Південної Кореї зуміли всього за кілька хвилин зламати захисні механізми Gemini 3 Pro, просунутої мультимодальної ШІ-системи Google, повністю вивівши з ладу вбудовані етичні фільтри. Про це повідомляє Android Authority.

Під час перевірки, організованої стартапом Aim Intelligence, модель практично миттєво видала детальні рекомендації щодо створення вірусу натуральної віспи, згенерувала програмний код, придатний для вироблення зарину, і описала процес виготовлення кустарної вибухівки — інформацію, яку система в нормальних умовах зобов'язана блокувати.

У Aim Intelligence підкреслили, що корінь проблеми криється не в окремих формулюваннях запитів, а в пристрої сучасних моделей: їх можливості розвиваються швидше, ніж системи захисту, які повинні їх контролювати. Прийоми маскування, хитрі конструкції промтів і приховані інструкції підривають ефективність існуючих бар'єрів.

Ситуація, в якій навіть заявлена Google "найрозумніша" модель так просто виводиться з-під контролю, вказує на терміновість перегляду підходів до безпеки: посилення протоколів, коригування принципів роботи і, можливо, скорочення ряду доступних функцій.

Нагадаємо, раніше ми писали про те, що ютубер змусив робота з ChatGPT вистрілити в себе.

Підпишись на наш Telegram-канал, якщо хочеш першим дізнаватися головні новини.



Не пропусти інші цікаві статті, підпишись:
Ми в соціальних мережах