Home » Google выпускает план защиты от угроз ИИ

Google выпускает план защиты от угроз ИИ

По мере того, как все больше организаций переходят к внедрению генеративных ИИ, Google хочет, чтобы мы все больше беспокоились о безопасности. С этой целью в четверг технический гигант выпустил свою платформу Secure AI Framework (SAIF), которая должна стать своего рода дорожной картой безопасности, хотя на данный момент она несколько тонко набросана.

Но если вы представляете себе, что это схема предотвращения своего рода экзистенциальная опасность ИИ, о которой всегда говорит Илон Маскдумайте меньше и более непосредственно.

Вот краткое изложение шести «основных элементов» фреймворка:

  • Элементы 1 и 2 касаются расширения существующей структуры безопасности организации, в первую очередь, для включения угроз ИИ.

  • Элемент 3 касается интеграции ИИ в вашу защиту от угроз ИИ, что довольно тревожно напоминает гонку ядерных вооружений, независимо от того, было ли это намеренно или нет.

  • Элемент 4 касается преимуществ безопасности единообразия в ваших «структурах управления», связанных с ИИ.

  • Элементы 5 и 6 касаются постоянной проверки, оценки и тестирования ваших приложений ИИ, чтобы убедиться, что они могут противостоять атакам и не подвергают вас ненужному риску.

Похоже, что на данный момент Google в основном просто хочет, чтобы организации привносили элементарные идеи кибербезопасности в ИИ. Как заявил глава информационной безопасности Google Cloud Фил Венейблс сказал Аксиос(откроется в новой вкладке)«Даже когда люди ищут более продвинутые подходы, они должны помнить, что у вас также должны быть правильные основы».

Но уже есть некоторые новые и уникальные проблемы безопасности, возникающие здесь и сейчас с генеративными приложениями ИИ, такими как ЧатGPT.

Например, исследователи безопасности определили один потенциальный риск: «быстрые инъекции», причудливая форма эксплуатации ИИ, при которой вредоносная команда, направленная на ничего не подозревающий плагин чат-бота ИИ, поджидает в каком-то блоке текста. Когда ИИ сканирует быструю инъекцию, он меняет характер команды, отдаваемой ИИ. Это как спрятать в тексте зловещее заклинание контроля над разумом. Телесуфлер Рона Бургунди(откроется в новой вкладке). Странно, да?

Read more:  Google Camera 8.8 настраивает панель масштабирования на Pixel 7/Pro

Быстрые инъекции — это лишь один из новых типов угроз, которые, по словам Google, он надеется помочь обуздать. Другие включают:

  • «Кража модели», возможный способ заставить модель перевода раскрыть свои секреты.

  • «Отравление данными», при котором злоумышленник саботирует процесс обучения с намеренно ошибочными данными.

  • Создание подсказок, которые могут извлекать потенциально конфиденциальный или конфиденциальный дословный текст, который изначально использовался для обучения модели.

Google Сообщение блога(откроется в новой вкладке) о SAIF говорится, что эта структура принимается, ну, в общем, Google. Что касается того, что означает выпуск «фреймворка» для всего мира, то он может ни к чему не привести, но его также можно принять в качестве стандарта. Например, Национальный институт стандартов и технологий (NIST) правительства США в 2014 году выпустил более общую концепцию кибербезопасности. Она была направлена ​​на защиту критической инфраструктуры от кибератак, но также имеет большое влияние и признан золотым стандартом(откроется в новой вкладке) в кибербезопасности большинство опрошенных ИТ-специалистов по этому поводу.

Google, однако, не является правительством США, что ставит под сомнение, насколько авторитетной будет его структура в глазах конкурентов Google в области искусственного интеллекта, таких как OpenAI. Но в области безопасности похоже, что Google пытается лидировать в сфере ИИ. вместо гонок играть в догонялки. Возможно, возвращение части влияния, утраченного на ранних этапах гонки ИИ, и есть то, для чего на самом деле предназначен выпуск SAIF.

2023-06-08 22:08:00


1686280504
#Google #выпускает #план #защиты #от #угроз #ИИ

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.