Home » Новое исследование улучшает отслеживание физической активности

Новое исследование улучшает отслеживание физической активности

В недавнем исследовании, опубликованном в журнале Цифровая медицина NPJИсследователи использовали крупномасштабный набор данных акселерометра из Биобанка Соединенного Королевства (Великобритания), состоящий из немаркированных данных за 700 000 человеко-дней, для создания моделей для мониторинга уровней физической активности с большей точностью и возможностью обобщения.

Исследование: Самостоятельное обучение распознаванию человеческой деятельности с использованием носимых данных за 700 000 человеко-дней. Изображение предоставлено: sutadimages / Shutterstock

Фон

В сфере здравоохранения наблюдается быстрый рост разработки и использования носимых устройств с датчиками, которые можно использовать для отслеживания состояния здоровья и фитнеса, удаленного мониторинга пациентов, клинических испытаний, требующих данных в реальном времени, раннего выявления заболеваний, персонализированной медицины. и проведение медицинских исследований в больших масштабах. Эти устройства предоставляют сводные показатели движения, качества сна, количества шагов, темпа и времени сидячего образа жизни. Однако необходимы надежные алгоритмы для получения информации о деятельности человека из данных, собранных датчиком.

Хотя такие области, как обработка естественного языка и компьютерное зрение, значительно продвинулись вперед благодаря наличию избыточных данных для обучения этих моделей обучения, нехватка крупномасштабных наборов данных, которые можно использовать для обучения алгоритмов, сдерживает прогресс в разработке моделей, которые надежно и точно распознавать деятельность человека. Отсутствие достаточных данных для обучения этих моделей также исказило результаты исследований моделей глубокого обучения, предполагая, что модели глубокого обучения не работают лучше, чем традиционные методы, такие как простая статистика.

Об исследовании

В настоящем исследовании ученые использовали набор данных акселерометра из Британского биобанка, чтобы обучить модели глубокого обучения точному распознаванию физической активности. Биобанк Великобритании провел масштабное акселерометрическое исследование, в котором приняли участие около полумиллиона участников. Более ста тысяч участников носили акселерометр на запястье в течение одной недели в своей естественной среде, а не в лабораторных условиях. Это позволило получить данные о движении свободноживущего человека примерно за 700 000 человеко-дней.

Read more:  Новая квартира не дает спать соседям в Энсхеде: «Я могу посчитать травинки по ночам» | Энсхеде

Обзор предлагаемого процесса самостоятельного обучения. Шаг 1 включает в себя многозадачное самостоятельное обучение на основе 700 000 человеко-дней данных из Британского биобанка. На этапе 2 мы оцениваем полезность предварительно обученной сети в восьми контрольных базовых показателях распознавания человеческой деятельности посредством трансферного обучения.

Исследователи использовали подход к обучению с самоконтролем, который успешно применялся на таких примерах, как генеративные предварительно обученные преобразователи или GPT. В недавних исследованиях для изучения анализа данных с носимых датчиков использовались многочисленные подходы к самоконтролируемому обучению, такие как маскированная реконструкция, многозадачный самоконтроль, начальная загрузка и контрастное обучение. В настоящем исследовании метод многозадачного самоконтроля был применен к большому набору данных Британского биобанка, чтобы показать, как предварительно обученную модель можно обобщить на широкий спектр наборов данных, основанных на деятельности, имеющих медицинское и клиническое значение.

Метод многозадачного самоконтроля был впервые применен к крупномасштабному набору данных акселерометра из Британского биобанка для обучения глубокой сверточной нейронной сети. Впоследствии восемь наборов эталонных данных были использованы для оценки производительности предварительно обученной нейронной сети и качества представления различных групп населения и типов деятельности.

Маркированные наборы данных использовались для оценки успеха модели в трансферном обучении. Кроме того, в исследовании также использовался подход взвешенной выборки, чтобы обойти проблему неинформативных периодов низкой активности. Реальные данные, собранные с датчиков движения, имеют периоды бездействия, и такие статические сигналы не меняются во время преобразования, что создает проблемы для задач самостоятельного обучения. Поэтому, чтобы улучшить сходимость и стабильность процесса обучения, исследователи применили подход взвешенной выборки, при котором окна данных отбирались пропорционально, а для анализа использовалось стандартное отклонение этих выборок.

Полученные результаты

Результаты показали, что когда модели, обученные в этом исследовании, были протестированы на восьми контрольных наборах данных, они превзошли базовые показатели со средним относительным улучшением 24,4%. Кроме того, модель может быть обобщена на широкий спектр устройств с датчиками движения, среды обитания, когорт и внешних наборов данных.

Read more:  Консультирование и поддержка областей, в которых остро нуждаются женщины с раком молочной железы

Также было обнаружено, что метод многозадачного самоконтроля перед обучением эффективен для улучшения последующего распознавания человеческой деятельности, даже в немаркированных небольших наборах данных. Предварительная тренировка под самоконтролем также может оказаться более эффективной, чем контролируемый метод.

Исследователи заявили, что это исследование продемонстрировало, что многозадачный метод самоконтроля обучения может быть применен к наборам данных с носимых датчиков, и построило точные и обобщаемые модели распознавания активности с использованием алгоритмов глубокого обучения.

Команда исследователей также предоставила предварительно обученные модели исследовательскому сообществу, работающему в области цифрового здравоохранения, чтобы на их основе можно было построить высокоэффективные модели для использования в различных других областях, включающих ограниченные размеченные данные.

Выводы

Подводя итог, можно сказать, что в исследовании использовался крупномасштабный немаркированный набор данных из Британского биобанка, состоящий из данных акселерометра, для предварительной подготовки моделей глубокого обучения с помощью подхода с самоконтролем. Эти предварительно обученные модели превосходили базовые уровни при точном анализе данных датчиков движения в разных наборах данных, различающихся по когортам, сенсорным устройствам и средам обитания. Исследователи полагают, что эти модели можно построить и использовать для различных сценариев, включающих ограниченное количество помеченных данных.

Ссылка на журнал:

  • Юань Х., Чан С., Криг А.П., Тонг К., Акуа А., Клифтон Д.А. и Доэрти А. (2024). Самоконтролируемое обучение для распознавания человеческой деятельности с использованием носимых данных за 700 000 человеко-дней. Цифровая медицина Npj7(1), 91. DOI: 10.1038/s41746024010623,

2024-04-22 02:09:00


1713753600
#Новое #исследование #улучшает #отслеживание #физической #активности

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.