Новый статистический инструмент, разработанный исследователями из Чикагского университета, улучшает способность находить генетические варианты, вызывающие заболевания. Инструмент, описанный в новой статье, опубликованной 26 января 2024 г., в Природная генетикаобъединяет данные полногеномных ассоциативных исследований (GWAS) и прогнозы генетической экспрессии, чтобы ограничить количество ложноположительных результатов и более точно идентифицировать причинные гены и варианты заболевания.
GWAS — это широко используемый подход, позволяющий идентифицировать гены, связанные с рядом особенностей человека, включая наиболее распространенные заболевания. Исследователи сравнивают последовательности генома большой группы людей с конкретным заболеванием, например, с другим набором последовательностей здоровых людей. Различия, выявленные в группе заболеваний, могут указывать на генетические варианты, которые повышают риск этого заболевания и требуют дальнейшего изучения.
Однако большинство заболеваний человека не вызваны какой-то одной генетической вариацией. Вместо этого они являются результатом сложного взаимодействия множества генов, факторов окружающей среды и множества других переменных. В результате GWAS часто выявляет множество вариантов во многих регионах генома, связанных с заболеванием. Однако ограничением GWAS является то, что он определяет только связь, а не причинно-следственную связь. В типичном геномном регионе многие варианты сильно коррелируют друг с другом из-за явления, называемого неравновесием по сцеплению. Это связано с тем, что ДНК передается от одного поколения к другому целыми блоками, а не отдельными генами, поэтому варианты, расположенные рядом друг с другом, имеют тенденцию коррелировать.
У вас может быть много генетических вариантов в блоке, и все они коррелируют с риском заболевания, но вы не знаете, какой из них на самом деле является причинным. Это фундаментальная задача GWAS: как нам перейти от ассоциации к причинно-следственной связи».
Синь Хэ, доктор философии, доцент кафедры генетики человека и старший автор нового исследования
Проблема еще больше усложняется тем, что большинство генетических вариантов расположены в некодирующих геномах, что затрудняет интерпретацию их эффектов. Общей стратегией решения этих проблем является использование уровней экспрессии генов. Локусы количественных признаков экспрессии, или eQTL, представляют собой генетические варианты, связанные с экспрессией генов.
Обоснование использования данных eQTL заключается в том, что если вариант, связанный с заболеванием, является eQTL некоторого гена X, то X, возможно, является связью между вариантом и заболеванием. Однако проблема с этим рассуждением заключается в том, что близлежащие варианты и eQTL других генов могут коррелировать с eQTL гена X, в то же время напрямую влияя на заболевание, что приводит к ложноположительному результату. Было разработано множество методов для номинации генов риска из GWAS с использованием данных eQTL, но все они страдают от этой фундаментальной проблемы, связанной с путаницей близлежащих ассоциаций. Фактически, существующие методы могут генерировать ложноположительные гены более чем в 50% случаев.
В новом исследовании профессор Хе и Мэтью Стивенс, доктор философии, профессор Ральфа В. Джерарда и заведующий кафедрой статистики и профессор генетики человека, разработали новый метод, называемый исследованием причинно-транскриптомных ассоциаций, или cTWAS, который использует передовые статистические методы для снижения уровня ложноположительных результатов. Вместо того, чтобы сосредотачиваться только на одном гене за раз, новая модель cTWAS учитывает множество генов и вариантов. Используя модель байесовской множественной регрессии, можно отсеять мешающие гены и варианты.
«Если вы посмотрите на один за раз, у вас будут ложноположительные результаты, но если вы посмотрите на все близлежащие гены и варианты вместе, у вас гораздо больше шансов найти причинный ген», — сказал он.
В статье демонстрируется полезность этого нового метода путем изучения генетики уровней холестерина ЛПНП. Например, существующие методы eQTL определили ген, участвующий в репарации ДНК, но новый подход cTWAS указал на другой вариант целевого гена статина, распространенного препарата, используемого для лечения высокого уровня холестерина. В общей сложности cTWAS идентифицировал 35 предполагаемых причинных генов ЛПНП, о более чем половине из которых ранее не сообщалось. Эти результаты указывают на новые биологические пути и потенциальные цели лечения ЛПНП.
Программное обеспечение cTWAS теперь доступно для загрузки с веб-сайта лаборатории Хе. Он надеется продолжить работу над ним, чтобы расширить его возможности и включить в него другие типы данных омики, такие как сплайсинг и эпигенетика, а также использование eQTL из нескольких типов тканей.
«Программное обеспечение позволит людям проводить анализ, связывающий генетические вариации с фенотипами. Это действительно ключевая задача, стоящая перед всей этой областью», — сказал он. «Теперь у нас есть гораздо лучший инструмент для установления этих связей».
Источник:
Ссылка на журнал:
Чжао, С., и другие. (2024). Поправка на генетические помехи в исследованиях ассоциаций по всему транскриптому улучшает обнаружение генов риска сложных признаков. Природная генетика. doi.org/10.1038/s41588-023-01648-9.
2024-01-27 03:51:00
1706329803
#Новый #статистический #инструмент #улучшает #способность #находить #генетические #варианты #вызывающие #заболевания