Home » В исследовании говорится, что для синтетических данных необходимы четкие рекомендации, чтобы обеспечить прозрачность, подотчетность и справедливость

В исследовании говорится, что для синтетических данных необходимы четкие рекомендации, чтобы обеспечить прозрачность, подотчетность и справедливость

Кредит: Pixabay/CC0 Public Domain

В новом исследовании говорится, что необходимо установить четкие руководящие принципы для создания и обработки синтетических данных, чтобы обеспечить прозрачность, подотчетность и справедливость.

Синтетические данные, генерируемые с помощью алгоритмов машинного обучения на основе исходных реальных данных, приобретают все большую популярность, поскольку могут обеспечить сохраняющую конфиденциальность альтернативу традиционным источникам данных. Это может быть особенно полезно в ситуациях, когда фактические данные слишком конфиденциальны, чтобы ими можно было делиться, слишком скудны или имеют слишком низкое качество.

Синтетические данные отличаются от данных реального мира, поскольку они генерируются алгоритмическими моделями, известными как синтетические данные генераторы, такие как генеративно-состязательные сети или байесовские сети.

Исследование предупреждает существующие законы о защите данных это относится только к личные данные не имеют достаточного оборудования для регулирования обработки всех типов синтетических данных.

Такие законы, как GDPR, применяются только к обработке персональных данных. Определение персональных данных в GDPR включает «любую информацию, относящуюся к идентифицированному или идентифицируемому физическому лицу». Однако не все синтетические наборы данных являются полностью искусственными — некоторые могут содержать личную информацию или представлять риск повторной идентификации. Полностью синтетические наборы данных в принципе освобождаются от правил GDPR, за исключением случаев, когда существует возможность повторной идентификации.

Остается неясным, какой уровень риска повторной идентификации будет достаточным, чтобы инициировать их применение в контексте полностью синтетической обработки данных. Это создает юридическую неопределенность и практические трудности при обработке таких наборов данных.

изучатьпрофессора Аны Бедушки из Эксетерского университета, опубликовано в журнале Большие данные и общество.

В нем говорится, что должны быть четкие процедуры привлечения к ответственности лиц, ответственных за создание и обработку синтетических данных. Должны быть гарантии того, что синтетические данные не генерируются и не используются таким образом, который может привести к неблагоприятным последствиям для отдельных лиц и общества, например, к сохранению существующих предубеждений или созданию новых.

Профессор Бедушки сказал: «Необходимо установить четкие руководящие принципы для всех типов синтетических данных. прозрачность, подотчетность и справедливость. Наличие таких руководящих принципов особенно важно, поскольку генеративный искусственный интеллект и продвинутые языковые модели, такие как DALL-E 3 и GPT-4, которые можно обучать и генерировать синтетические данные, могут способствовать распространению вводящей в заблуждение информации и иметь пагубные последствия для общества. Таким образом, соблюдение этих принципов может помочь смягчить потенциальный вред и стимулировать ответственные инновации.

«Соответственно, синтетические данные должны быть четко обозначены как таковые, и информация об их создании должна быть предоставлена ​​пользователям».

Больше информации:
Ана Бедушки, Синтетическая защита данных: на пути к смене парадигмы регулирования данных?, Большие данные и общество (2024). DOI: 10.1177/20539517241231277

Предоставлено
Университет Эксетера


Цитирование: Для синтетических данных необходимы четкие рекомендации, чтобы обеспечить прозрачность, подотчетность и справедливость, говорится в исследовании (13 апреля 2024 г.), получено 13 апреля 2024 г. с https://techxplore.com/news/2024-04-guidelines-synthetic-transparency-accountability- справедливость.html

Этот документ защищен авторским правом. За исключением любых добросовестных сделок в целях частного изучения или исследования, никакая часть не может быть воспроизведена без письменного разрешения. Содержимое предоставлено исключительно в информационных целях.

2024-04-13 10:56:02


1713030712
#исследовании #говорится #что #для #синтетических #данных #необходимы #четкие #рекомендации #чтобы #обеспечить #прозрачность #подотчетность #справедливость

Read more:  Комиссия опубликует окончательный отчет для онлайн-рынков в понедельник

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.