Анализ плейотропии, который дает представление о том, как отдельные гены приводят к множественным характеристикам, становится все более ценным, поскольку медицина продолжает опираться на добычу генетики для информирования о лечении болезней. Однако положения о конфиденциальности затрудняют выполнение всестороннего анализа плейотропии, поскольку данные отдельных пациентов часто не могут легко и регулярно передаваться между сайтами.
Тем не менее, статистический метод Sum-Share, разработанный в Penn Medicine, может извлекать сводную информацию из множества разных сайтов для получения важных выводов. В ходе тестирования метода, опубликованного в Nature Communications разработчики Sum-Share смогли обнаружить более 1700 вариаций уровня ДНК, которые могут быть связаны с пятью различными сердечно-сосудистыми состояниями. Если бы использовалась информация о пациенте только из одного сайта, как это сейчас является нормой, была бы определена только одна вариация.
Полное исследование плейотропии было затруднено из-за ограничений на объединение данных пациентов из электронных медицинских карт в разных местах, но мы смогли придумать метод, который превращает данные итогового уровня в результаты, которые экспоненциально превосходят те, что мы могли бы добиться этого с доступными в настоящее время данными на индивидуальном уровне. С Sum-Share мы значительно расширяем наши возможности по выявлению генетических факторов, лежащих в основе состояний здоровья, которые варьируются от тех, которые связаны со здоровьем сердца, как это было в случае этого исследования, до психического здоровья, с множеством различных промежуточных приложений »
Джейсон Мур, доктор философии, ведущие авторы, директор Института биомедицинской информатики, профессор биостатистики, эпидемиологии и информатики
Sum-Share поддерживается биобанками, которые объединяют обезличенные данные пациентов, включая генетическую информацию, из электронных медицинских карт (EHR) для исследовательских целей. В своем исследовании Мур, соавтор исследования, Йонг Чен, доктор философии, доцент кафедры биостатистики, ведущий автор Руованг Ли, доктор философии, научный сотрудник Пенсильванского университета, и их коллеги использовали eMERGE для получения семи различных наборов электронных медицинских записей для запуска. с помощью Sum-Share в попытке обнаружить генетические эффекты между пятью сердечно-сосудистыми состояниями: ожирением, гипотиреозом, диабетом 2 типа, гиперхолестеринемией и гиперлипидемией.
С помощью Sum-Share исследователи обнаружили 1734 различных однонуклеотидных полиморфизма (SNP, которые представляют собой различия в строительных блоках ДНК), которые могут быть связаны с пятью условиями. Затем, используя результаты EHR только одного сайта, был идентифицирован только один SNP, который мог быть привязан к условиям.
Кроме того, они определили, что их выводы были идентичны независимо от того, использовали ли они данные суммарного уровня или данные индивидуального уровня в Sum-Share, что сделало его системой «без потерь».
Чтобы определить эффективность Sum-Share, команда затем сравнила результаты своего метода с предыдущим ведущим методом PheWAS. Этот метод работает лучше всего, когда он извлекает данные индивидуального уровня, которые были доступны из различных электронных записей. Но когда они были поставлены на равные условия, позволяя использовать данные на индивидуальном уровне, Sum-Share был статистически определен как более мощный в своих выводах, чем PheWAS. Итак, поскольку выводы Sum-Share на уровне сводных данных были признаны столь же проницательными, как и при использовании данных на индивидуальном уровне, это, по-видимому, лучший метод для определения генетических характеристик.
«Это было примечательно, потому что Sum-Share обеспечивает интеграцию данных без потерь, в то время как PheWAS теряет некоторую информацию при интеграции информации с нескольких сайтов», – пояснил Ли. «Sum-Share может также уменьшить штрафы за проверку множества гипотез за счет одновременного совместного моделирования различных характеристик»
В настоящее время Sum-Share в основном предназначен для использования в качестве исследовательского инструмента, но есть возможности использовать его идеи для улучшения клинических операций. И, продвигаясь вперед, есть шанс использовать его для решения некоторых из самых насущных проблем, с которыми сегодня сталкивается здравоохранение.
«Sum-Share может использоваться для COVID-19 с исследовательскими консорциумами, такими как Консорциум клинической характеристики COVID-19 с помощью EHR (4CE)», – сказал Йонг. «В этих усилиях используется федеративный подход, при котором данные остаются локальными для сохранения конфиденциальности»
Источник:
Медицинский факультет Пенсильванского университета
Диэнай