Исследование показывает новый статистический алгоритм выявления потенциальных генов болезни

        

Новое исследование, связанное с UNIST, недавно представило новый статистический алгоритм, способный более точно определить и определить потенциальные гены болезни. Этот алгоритм также рассматривался как новый перспективный подход для идентификации генов-кандидатов, поскольку он эффективно работает с меньшими геномными данными и занимает всего лишь минуту или две, чтобы получить результаты.

Этот прорыв был проведен профессором Дугу Нам и его исследовательской группой в Школе наук о жизни в UNIST. Их результаты были опубликованы в Nucleic Acids Research 19 марта 2018.

В исследовании исследовательская группа представила новый метод и программное обеспечение GSA-SNP2 для анализа обогащения путей данных GWAS P-value. По данным исследовательской группы, GSA-SNP2 обеспечивает высокую мощность, достойный контроль ошибок I типа и быстрое вычисление за счет включения модели случайных множеств и счетного скорректированного показателя SNP-счета.

«GSA-SNP2 – это мощный и эффективный инструмент для обогащения путей и сетевого анализа обобщенных данных об исследовании генома (GWAS)», – говорит профессор Нам. «С помощью этого алгоритма мы сможем легко идентифицировать новые целевые наркотики, тем самым углубив наше понимание болезней и разблокируем новые методы лечения, чтобы лечить его».

Геном каждого человека представляет собой уникальное сочетание последовательностей ДНК, которые играют важную роль в определении того, кто мы. Это объясняет все индивидуальные различия, в том числе восприимчивость к болезням и разнообразные фенотипы. Такие генетические вариации среди людей известны как однонуклеотидные полиморфизмы (SNP). SNP, которые коррелируют с конкретными заболеваниями, могут служить прогностическими биомаркерами для содействия разработке новых лекарств. Через статистический анализ сводных данных GWAS можно идентифицировать связанные с заболеванием SNP.

Несмотря на астрономические суммы денег и времени, вложенные в статистический анализ данных SNP, традиционные технологии обнаружения SNP не смогли идентифицировать все возможные SNP. Это связано с тем, что большинство обычных методов обнаружения SNP предназначены для строгого контроля ложных срабатываний в результатах. Таким образом, среди десятков тысяч данных геномики и проанализированы сотни тысяч SNP, количество маркеров, описанных в генах-кандидатах, часто достигает нескольких десятков.

«Несмотря на то, что для правильной интерпретации результатов требуется контроль ложных положительных SNP, слишком большая фильтрация может затруднить его полезность в разработке лекарств», – говорит профессор Нам. «Поэтому усиленная статистическая мощность имеет важное значение для практических статистических алгоритмов».

Команда стремилась разработать алгоритм, который улучшает статистическую предсказуемость, сохраняя при этом точный контроль ложных срабатываний. Для этого они применили монотонную кривую тренда кубического сплайна к оценке гена посредством анализа конкурентного пути для данных генной экспрессии.

. В сравнительном исследовании с использованием симулированных и реальных данных GWAS GSA-SNP2 продемонстрировал высокую мощность и наилучшие приоритетные позитивные пути золотого стандарта по сравнению с шестью существующими методами, основанными на обогащении, и двумя автономными методами. На основе этих результатов была исследована разница между подходами анализа пути и были также рассмотрены эффекты структур корреляции генов на анализ обогащения путей. Кроме того, GSA-SNP2 способен визуализировать сети взаимодействия с белками внутри и через значительные пути, чтобы пользователь мог определить приоритеты для основных подсетей для дальнейших исследований.

По данным исследовательской группы, GSA-SNP2 обеспечивает значительно улучшенное управление ошибками типа I с использованием скорректированных показателей SNP-счетчика, тем не менее сохраняя высокую статистическую мощность. Он также обеспечивает как локальные, так и глобальные сети взаимодействия белка в связанных с ними путях и может облегчать интегральный анализ путей и сетей GWAS.

Исследовательская группа ожидает, что их GSA-SNP2 сможет визуализировать сети взаимодействия с белками внутри и через значительные пути, чтобы пользователь мог определить приоритеты для основных подсетей для дальнейших исследований.

      

Source link