Новый алгоритм машинного обучения находит генную сигнатуру, характерную для опухолей

Чем раковые клетки отличаются от здоровых клеток? Новый алгоритм машинного обучения под названием «икарус» знает ответ, сообщает группа под руководством биоинформатика MDC Алтуна Акалин в журнале Genome Biology. Программа ИИ нашла генную сигнатуру, характерную для опухолей.

Когда дело доходит до выявления закономерностей в горах данных, люди не могут сравниться с искусственным интеллектом (ИИ). В частности, ветвь ИИ, называемая машинным обучением, часто используется для поиска закономерностей в наборах данных — будь то анализ фондового рынка, распознавание изображений и речи или классификация ячеек. Чтобы надежно отличить раковые клетки от здоровых, команда под руководством доктора Алтуны Акалин, главы платформы биоинформатики и науки о данных Omics в Центре молекулярной медицины Макса Дельбрюка в Ассоциации Гельмгольца (MDC), разработала программу машинного обучения. называется «икарус». Программа обнаружила в опухолевых клетках общую для разных видов рака закономерность, состоящую из характерного сочетания генов. Согласно статье команды в журнале Genome Biology, алгоритм также обнаружил типы генов в образце, которые никогда раньше не были четко связаны с раком.

По сути, машинное обучение означает, что алгоритм использует обучающие данные, чтобы научиться самостоятельно отвечать на определенные вопросы. Он делает это путем поиска шаблонов в данных, которые помогают ему решать проблемы. После этапа обучения система может обобщить то, что она узнала, чтобы оценить неизвестные данные.

Было серьезной проблемой получить подходящие данные для обучения, когда эксперты уже четко различали «здоровые» и «раковые» клетки».

Ян Домен, первый автор статьи

Удивительно высокий процент успеха

Кроме того, наборы данных секвенирования одной клетки часто зашумлены. Это означает, что содержащаяся в них информация о молекулярных характеристиках отдельных клеток не очень точна — возможно, потому, что в каждой клетке обнаруживается разное количество генов, или потому, что образцы не всегда обрабатываются одинаково. Как сообщают Домен и его коллега доктор Ведран Франке, соруководитель исследования, они просмотрели бесчисленное количество публикаций и связались с несколькими исследовательскими группами, чтобы получить адекватные наборы данных. В конечном итоге команда использовала данные клеток рака легких и колоректального рака для обучения алгоритма, прежде чем применять его к наборам данных других видов опухолей.

На этапе обучения ikarus должен был найти список характерных генов, которые затем использовались для категоризации клеток. «Мы опробовали и усовершенствовали различные подходы, — говорит Домен. Это была трудоемкая работа, как рассказывают все трое ученых. «Ключевым моментом для ikarus было использование двух списков: одного для генов рака и другого для генов из других клеток», — объясняет Франке. После этапа обучения алгоритм смог надежно различать здоровые и опухолевые клетки и при других типах рака, например, в образцах тканей больных раком печени или нейробластомой. Его показатель успеха, как правило, был чрезвычайно высок, что удивило даже исследовательскую группу. «Мы не ожидали, что будет общая сигнатура, которая так точно определяет опухолевые клетки различных видов рака», — говорит Акалин. «Но мы до сих пор не можем сказать, работает ли этот метод для всех видов рака», — добавляет Домен. Чтобы превратить икарус в надежный инструмент для диагностики рака, исследователи теперь хотят протестировать его на других видах опухолей.

ИИ как полностью автоматизированный диагностический инструмент

Проект направлен на то, чтобы выйти далеко за рамки классификации «здоровых» и «раковых» клеток. В первоначальных тестах Икарус уже продемонстрировал, что этот метод также может отличать другие типы (и некоторые подтипы) клеток от опухолевых. «Мы хотим сделать этот подход более комплексным, — говорит Акалин, — развивая его так, чтобы он мог различать все возможные типы клеток в биопсии».

В больницах патологоанатомы, как правило, только исследуют образцы тканей опухолей под микроскопом, чтобы идентифицировать различные типы клеток. Это кропотливая, требующая времени работа. С ikarus этот шаг может однажды стать полностью автоматизированным процессом. Кроме того, отмечает Акалин, данные можно использовать для выводов о непосредственном окружении опухоли. И это может помочь врачам выбрать лучшую терапию. Ведь состав раковой ткани и микроокружение часто указывают на то, будет ли определенное лечение или лекарство эффективным или нет. Более того, ИИ также может быть полезен при разработке новых лекарств. «Икарус позволяет нам идентифицировать гены, которые являются потенциальными факторами развития рака», — говорит Акалин. Затем можно было бы использовать новые терапевтические агенты для нацеливания на эти молекулярные структуры.

Сотрудничество в офисе

Примечательным аспектом публикации является то, что она была полностью подготовлена ​​во время пандемии COVID. Всех участников не было за своими обычными столами в Берлинском институте медицинской системной биологии (BIMSB), входящем в состав MDC. Вместо этого они находились в домашних офисах и общались друг с другом только в цифровом виде. Таким образом, по мнению Франке, «проект показывает, что цифровая структура может быть создана для облегчения научной работы в этих условиях».

Источник:

Ссылка на журнал:

Домен, Дж. и другие. (2022) Идентификация опухолевых клеток на уровне отдельных клеток с использованием машинного обучения. Геномная биология. doi.org/10.1186/s13059-022-02683-1.

Leave a comment

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.