Home » Новый статистический инструмент улучшает способность находить генетические варианты, вызывающие заболевания

Новый статистический инструмент улучшает способность находить генетические варианты, вызывающие заболевания

Новый статистический инструмент, разработанный исследователями из Чикагского университета, улучшает способность находить генетические варианты, вызывающие заболевания. Инструмент, описанный в новой статье, опубликованной 26 января 2024 г., в Природная генетикаобъединяет данные полногеномных ассоциативных исследований (GWAS) и прогнозы генетической экспрессии, чтобы ограничить количество ложноположительных результатов и более точно идентифицировать причинные гены и варианты заболевания.

GWAS — это широко используемый подход, позволяющий идентифицировать гены, связанные с рядом особенностей человека, включая наиболее распространенные заболевания. Исследователи сравнивают последовательности генома большой группы людей с конкретным заболеванием, например, с другим набором последовательностей здоровых людей. Различия, выявленные в группе заболеваний, могут указывать на генетические варианты, которые повышают риск этого заболевания и требуют дальнейшего изучения.

Однако большинство заболеваний человека не вызваны какой-то одной генетической вариацией. Вместо этого они являются результатом сложного взаимодействия множества генов, факторов окружающей среды и множества других переменных. В результате GWAS часто выявляет множество вариантов во многих регионах генома, связанных с заболеванием. Однако ограничением GWAS является то, что он определяет только связь, а не причинно-следственную связь. В типичном геномном регионе многие варианты сильно коррелируют друг с другом из-за явления, называемого неравновесием по сцеплению. Это связано с тем, что ДНК передается от одного поколения к другому целыми блоками, а не отдельными генами, поэтому варианты, расположенные рядом друг с другом, имеют тенденцию коррелировать.

У вас может быть много генетических вариантов в блоке, и все они коррелируют с риском заболевания, но вы не знаете, какой из них на самом деле является причинным. Это фундаментальная задача GWAS: как нам перейти от ассоциации к причинно-следственной связи».

Синь Хэ, доктор философии, доцент кафедры генетики человека и старший автор нового исследования

Проблема еще больше усложняется тем, что большинство генетических вариантов расположены в некодирующих геномах, что затрудняет интерпретацию их эффектов. Общей стратегией решения этих проблем является использование уровней экспрессии генов. Локусы количественных признаков экспрессии, или eQTL, представляют собой генетические варианты, связанные с экспрессией генов.

Read more:  Поскольку ВИЧ снижает устойчивость людей ко многим заболеваниям, близки ли мы к разработке его вакцины?

Обоснование использования данных eQTL заключается в том, что если вариант, связанный с заболеванием, является eQTL некоторого гена X, то X, возможно, является связью между вариантом и заболеванием. Однако проблема с этим рассуждением заключается в том, что близлежащие варианты и eQTL других генов могут коррелировать с eQTL гена X, в то же время напрямую влияя на заболевание, что приводит к ложноположительному результату. Было разработано множество методов для номинации генов риска из GWAS с использованием данных eQTL, но все они страдают от этой фундаментальной проблемы, связанной с путаницей близлежащих ассоциаций. Фактически, существующие методы могут генерировать ложноположительные гены более чем в 50% случаев.

В новом исследовании профессор Хе и Мэтью Стивенс, доктор философии, профессор Ральфа В. Джерарда и заведующий кафедрой статистики и профессор генетики человека, разработали новый метод, называемый исследованием причинно-транскриптомных ассоциаций, или cTWAS, который использует передовые статистические методы для снижения уровня ложноположительных результатов. Вместо того, чтобы сосредотачиваться только на одном гене за раз, новая модель cTWAS учитывает множество генов и вариантов. Используя модель байесовской множественной регрессии, можно отсеять мешающие гены и варианты.

«Если вы посмотрите на один за раз, у вас будут ложноположительные результаты, но если вы посмотрите на все близлежащие гены и варианты вместе, у вас гораздо больше шансов найти причинный ген», — сказал он.

В статье демонстрируется полезность этого нового метода путем изучения генетики уровней холестерина ЛПНП. Например, существующие методы eQTL определили ген, участвующий в репарации ДНК, но новый подход cTWAS указал на другой вариант целевого гена статина, распространенного препарата, используемого для лечения высокого уровня холестерина. В общей сложности cTWAS идентифицировал 35 предполагаемых причинных генов ЛПНП, о более чем половине из которых ранее не сообщалось. Эти результаты указывают на новые биологические пути и потенциальные цели лечения ЛПНП.

Read more:  Новое исследование показало, что Канзас входит в число штатов с самым низким уровнем увольнений

Программное обеспечение cTWAS теперь доступно для загрузки с веб-сайта лаборатории Хе. Он надеется продолжить работу над ним, чтобы расширить его возможности и включить в него другие типы данных омики, такие как сплайсинг и эпигенетика, а также использование eQTL из нескольких типов тканей.

«Программное обеспечение позволит людям проводить анализ, связывающий генетические вариации с фенотипами. Это действительно ключевая задача, стоящая перед всей этой областью», — сказал он. «Теперь у нас есть гораздо лучший инструмент для установления этих связей».

Источник:

Ссылка на журнал:

Чжао, С., и другие. (2024). Поправка на генетические помехи в исследованиях ассоциаций по всему транскриптому улучшает обнаружение генов риска сложных признаков. Природная генетика. doi.org/10.1038/s41588-023-01648-9.

2024-01-27 03:51:00


1706329803
#Новый #статистический #инструмент #улучшает #способность #находить #генетические #варианты #вызывающие #заболевания

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.