Home » Распознавание голоса с помощью ИИ: как роботы могут слышать эмоции

Распознавание голоса с помощью ИИ: как роботы могут слышать эмоции

Мюнхен В человеческом голосе можно услышать многое. «Если у вас жар, вы говорите совсем по-другому», — говорит Дагмар Шуллер. Технология ее компании Audeering может использовать искусственный интеллект (ИИ) для распознавания голосовых и эмоциональных выражений говорящих, поддержки сотрудников колл-центра. и даже обнаруживать короновирусные инфекции. Теперь эту технологию также можно использовать, чтобы сделать роботов более чуткими, например, для использования в уходе.

Производитель Hanson Robotics хочет интегрировать автоматизированное распознавание эмоций Audeering в своих сервисных роботов и, таким образом, создать человекоподобных помощников. Хэнсон уже использует датчики для анализа выражения лица собеседника — теперь к нему добавляется голос.

Затем с помощью так называемого социального ИИ роботы должны анализировать эмоции своего партнера и реагировать на них сочувственно. Например, по словам Аудиринга, если робот распознает гнев по голосу, он может реагировать спокойно и успокаивающе. Машины также должны уметь распознавать иронию в будущем.

Болезни можно узнать по голосу

«Благодаря распознаванию эмоций мы на большой шаг приблизились к нашей цели — естественному взаимодействию между людьми и роботами», — говорит основатель Hanson Дэвид Хэнсон. Было важно, чтобы анализ данных проводился «в соответствии с самыми высокими этическими стандартами».

Кроме того, роботы также должны следить за состоянием здоровья ухаживающих за больными. В недавнем исследовании Аудиринг смог показать, что короткие регулярные языковые тесты можно использовать для выявления связанных с болезнью индикаторов рассеянного склероза, синдрома усталости и депрессии.

«Робот не должен заменять медицинский диагноз врача или медсестры», — говорит глава Audeering Шуллер. Однако во времена нехватки квалифицированных рабочих сервисные роботы могут стать полезным дополнением.

Поскольку во многих секторах во всем мире наблюдается нехватка персонала, сегмент сервисных роботов переживает бум. В 2021 году в профессиональном секторе было продано 121 000 машин, т. е., например, без частных пылесосов или косилок, что на 37% больше, чем в предыдущем году.

Read more:  Искусственный интеллект, чат-боты и дополненная реальность возглавляют главные технологические тенденции недели

У отраслевой ассоциации IFR пока нет более свежих данных, но тенденция роста, вероятно, сохранится. Почти 15 000 сервисных роботов использовались в медицинском и сестринском секторе.

Чтобы прорыв увенчался успехом по всем направлениям, общение человека и машины должно быть еще больше упрощено и улучшено. Над этим работают многие представители отрасли. Например, стартап Fruitcore из Констанции разработал операционную систему, которую можно использовать для программирования роботов с использованием повседневного языка..

Аудеринг считается техническим лидером

Например, пользователи автомата могут сказать: «Подъезжай к правому углу столешницы» или «Подними стекло на четыре сантиметра». Раньше для этого требовалось сложное программирование. «Использование робототехники станет доступным, и, прежде всего, оно станет доступным», — говорит глава Fruitcore Йенс Риггер.

Дагмар Шуллер

Основатель Audeering долгое время работает в области анализа голоса.

(Фото: Горьян Гаянин)

С помощью программного обеспечения от Audeering роботы теперь должны не только понимать язык, но и уметь слышать эмоции. Шуллер и руководство Audeering давно работают над этой темой. Она основала Audeering вместе с Бьорном Шуллером, Флорианом Эйбеном, Феликсом Венингером и Мартином Вёльмером из исследовательской группы ИИ более десяти лет назад в Техническом университете Мюнхена.

В то время распознавание речи было уже относительно продвинутым, и следующим логическим шагом был анализ голоса. «Поскольку это междисциплинарная область, в которой играют роль такие темы, как искусственный интеллект, электротехника, фонетика, психология и медицина, поставщиков было немного», — говорит Шуллер. «Мы сохранили и расширили наше лидерство по сей день».

Инсайдер отрасли подтверждает, что Audeering является одним из технологических лидеров. Однако нужно подождать и посмотреть, какую роль в будущем будут играть технологические гиганты. Google, Яблоко и Co., которые также интенсивно занимаются ИИ, а также распознаванием речи и голоса.

Первые заявки на Audeering пришли из маркетинговых исследований. Например, потенциальные клиенты говорят, что они думают о продукте или бренде. При этом платформа анализирует уровень энтузиазма. Около 7000 параметров теперь используются для определения выражений эмоций, а также, например, для документирования прогресса в лечении психических заболеваний.

Audeering обрабатывает данные только на своих серверах

«Это технология, которую можно использовать где угодно. Все, что вам нужно, — это микрофон», — говорит Шуллер. Например, в одном проекте члены экипажа неправительственной организации вели на корабле аудиодневник. Моменты стресса могут быть проанализированы таким образом.

В то время, когда такие страны, как Китай, имеют обширные системы видеонаблюдения и оценки социального поведения, такие технологии сложны. Вы обрабатываете данные только на своих серверах Германия и соответствуют самым высоким стандартам, уверяют основатели.

Будут сохранены только определенные пользователем функции, пользователь остается ответственным за свои личные данные. Согласие говорящего всегда должно быть получено в первую очередь. Кроме того, Шуллер говорит: «То, что говорится с точки зрения содержания, поначалу нас не интересует».

>> Читайте также: Робототехника как главный приоритет – VDMA требует совместного расширения федерального правительства Автоматизация

Многие хотели бы знать настроение клиентов или участников мероприятия. Ивент-агентство Avantgarde разработало технологию, которая с помощью датчиков и использования искусственного интеллекта измеряет, насколько хорошо, например, спикера на конференции или продавца в магазине принимают участники и посетители. Для этой цели используются оптические датчики, но они не генерируют изображение из соображений защиты данных..

По словам основателя Audeering Шуллера, голосовой подход по-прежнему предлагает множество возможностей. Однако применимо следующее: «Мне нужны данные для обучения моделей». В дополнение к Общему регламенту защиты данных существует риск дополнительного чрезмерного регулирования с помощью так называемого Закона ЕС об искусственном интеллекте.

Даже те, кто боится возможностей новых технологий, должны поддерживать их развитие, говорит Шуллер: «Я должен понимать технологию, чтобы иметь возможность использовать ее целенаправленно». Тот, кто просто запрещает, уходит с поля другим игрокам — без возможности влиять на развитие.

Аудеринг уже имеет коммерческие приложения на рынке. В маркетинговых исследованиях инструмент дает сотруднику представление о том, как его воспринимает другой человек и какие эмоции передает его собственный голос. Если он слишком часто перебивает другого человека, система подает сигнал тревоги. «Это автоматически приводит к улучшению качества общения», — говорит Шуллер.

Более: Промышленные роботы теперь слушают каждое слово

2023-08-07 08:28:38


1691421788
#Распознавание #голоса #помощью #ИИ #как #роботы #могут #слышать #эмоции

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.