Home » Ученые АГУ разработали специальный микрофон для проверки человеческой речи

Ученые АГУ разработали специальный микрофон для проверки человеческой речи

Дипфейки стали серьезной общественной проблемой с появлением видео- и аудиоконтента, созданного искусственным интеллектом или ИИ.

Дипфейк — убедительная имитация, стирающая грань между фантазией и реальностью. Они могут вызвать затруднения при определении, например, того, действительно ли политик сделал тревожное заявление или же они были саботированы теми, кто пытался вмешаться в выборы.

«До недавнего времени звук записанного голоса повсеместно воспринимался как подлинно человеческий», — говорит Висар Бериша, профессор электротехники Инженерной школы имени Айры А. Фултона при Университете штата Аризона, работающий по совместительству в Университетском колледже здравоохранения. Решения. «Не было никаких оснований сомневаться в его подлинности. С появлением технологии клонирования голоса это доверие разрушается, и новой нормой станет скептицизм, а не доверие».

Поскольку дипфейки могут разрушить репутацию и подорвать доверие к учреждениям, Федеральная торговая комиссия США (FTC) провела конкурс FTC Voice Cloning Challenge, чтобы разработать креативные междисциплинарные методы борьбы с дипфейковым звуком, созданным искусственным интеллектом, за часть призовых в размере 35 000 долларов США.

Одним из победителей конкурса является OriginStory, проект, в котором используется новый тип микрофона, который сначала проверяет, что человек-говорящий произносит записанную речь, а затем помечает эту речь водяным знаком как подлинно человеческую. Водяной знак может быть показан слушателям, устанавливая цепочку доверия от записи до извлечения.

В разработке OriginStory активно участвует ASU; Проект был разработан с использованием ресурсов университета и запатентован Skysong Innovations, эксклюзивной компанией ASU по управлению интеллектуальной собственностью.

Бериша возглавляет группу разработчиков, в которую входят коллеги-преподаватели ASU Дэниел Блисс, профессор электротехники Фултонской школы в Школе электротехники, вычислительной техники и энергетики; и Джули Лисс, заместитель декана Колледжа медицинских решений и профессор речи и слуха.

Read more:  Infinix Note 12i 2022 цена 2 млн Индонезийские спецификации

Биология человека спешит на помощь

Хотя человеческая речь и речь, генерируемая искусственным интеллектом, могут звучать одинаково для нетренированного уха, способы генерации этих сигналов заметно различаются. Дипфейки генерируются алгоритмически с использованием нейронных сетей — разновидности технологии машинного обучения.

С другой стороны, биологический механизм производства речи человека включает в себя промежуточные биосигналы, такие как вибрации голосовых связок и движения артикуляторов, которые являются частями тела, используемыми для формирования речи, такими как губы, язык и полость носа.

OriginStory использует сенсорную технологию, уже присутствующую в разнообразной электронике, для обнаружения этих биосигналов, в то время как микрофон выполняет свою обычную функцию записи речи. Поскольку биосигналы и речь записываются одновременно, OriginStory может подтвердить подлинность записанного человеческого голоса.

Присутствие биосигналов указывает на то, что речь генерируется отчетливо человеческим механизмом производства речи. OriginStory также обеспечивает конфиденциальность записанных данных, поскольку проверяемые биосигналы различимы между человечеством и ИИ, но не между разными людьми.

Полученный звук получает водяной знак, встроенный в файл, подтверждающий его легитимность. Тогда любое будущее обращение к средствам массовой информации может быть гарантировано как подлинно человечное, чтобы обеспечить общественное доверие.

Противодействие угрозам в новую эпоху искусственного интеллекта

Вдохновением для этой идеи послужила новостная история, которую Бериша увидела в 2023 году, о матери, живущей в районе Феникса, которой позвонил мошенник и заявил, что похитил ее дочь.

Однако девочка-подросток была цела и невредима; то, что предположительно было ее голосом по телефону, было клоном ИИ.

«Читать было действительно страшно, и лично это поразило меня, потому что у меня есть дети примерно того же возраста», — говорит Бериша.

Лисс, эксперт в области физиологии речи и речевой акустики, присоединилась к проекту, поскольку она согласна с Беришей в отношении опасностей технологии клонирования голоса с помощью искусственного интеллекта. Она говорит, что разработка защиты от речи, генерируемой искусственным интеллектом, имеет решающее значение для обеспечения мировой безопасности.

Read more:  Аликс Эрл быстро сменила наряд для Недели моды в Нью-Йорке

Этот проект является последним за более чем 10 лет сотрудничества между парой в проектах, выходящих за рамки границ между инженерными и медицинскими приложениями.

«Для воплощения инновационных идей в практические решения решающее значение имеет междисциплинарное сотрудничество», — говорит Лисс. «АГУ ожидает, что его преподаватели будут придумывать и пробовать смелые и инновационные подходы к решению мировых проблем. Здесь это заложено в культуре».

Имея за плечами награду Voice Cloning Challenge, команда OriginStory стремится продолжить совершенствование технологии для возможной коммерциализации. Члены команды будут работать с Дреной Кусари, вице-президентом по продуктам Microsoft, используя ее опыт в разработке технологических продуктов и их выводе на рынок.

По мнению Бериши, FTC, назвав OriginStory одним из победителей, подчеркивает важность потенциального широкого использования технологии в обществе.

«Наш выбор служит дальнейшим подтверждением нашего центрального тезиса: нам нужны новые технологии, чтобы создать цепочку доверия, подтверждающую, что голос является подлинно человеческим с момента его записи до момента, когда его слушают», — говорит он.

2024-05-03 22:48:08


1714777161
#Ученые #АГУ #разработали #специальный #микрофон #для #проверки #человеческой #речи

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.