Ученые из Консорциума gnomAD опубликовали первый набор открытий о генетической изменчивости человека

Новое открытие с использованием грибов может привести к разработке эффективных радиозащитных препаратов

            

В течение последних восьми лет Консорциум базы данных агрегации генома (gnomAD) (и его предшественник, Консорциум агрегации экзома или ExAC) работал с генетиками по всему миру, чтобы собрать и изучить более 125 000 экзом и 15 000 целых геномы от населения по всему миру.

В настоящее время в семи статьях, опубликованных в Nature Nature Communications и Nature Medicine gnom Ученые консорциума описывают свой первый набор открытий из базы данных, демонстрируя мощь этой обширной коллекции данных. Вместе исследования:

1. представить более полный каталог и понимание класса редких генетических вариаций, называемых вариантами потери функции (LoF), которые, как считается, нарушают кодируемые гены белки;

2. представить самую большую всеобъемлющую справочную карту недостаточно изученного, но важного класса генетических вариаций, называемых структурными вариантами;

3. показать, как инструменты, которые учитывают уникальные формы вариаций и биологический контекст вариантов, могут помочь клиническим генетикам при попытке диагностировать пациентов с редким генетическим заболеванием; и

4. проиллюстрируйте, как наборы данных в масштабе населения, такие как gnomAD, могут помочь в оценке предполагаемых целевых показателей лекарств.

Исследователи из Широкого института Массачусетского технологического института и Гарвардской и Массачусетской больниц общего профиля (MGH) были соавторами или со-старшими авторами всех исследований, а ученые из Имперского колледжа Лондона в Соединенном Королевстве -потребительская генетическая компания 23andMe и другие учреждения, вносящие вклад в отдельные документы. Более 100 ученых и групп по всему миру предоставили консорциуму данные и / или аналитические материалы.

Эти исследования представляют собой первую значительную волну открытий, появившуюся в Консорциуме gnomAD. Мощь этой базы данных заключается в ее огромном размере и разнообразии населения, которых мы смогли достичь благодаря щедрости исследователей, которые предоставили в нее данные, и участников исследований в этих исследованиях ».

Даниэль Макартур, научный руководитель проекта gnomAD, старший автор по шести исследованиям, член института по программе «Медицина и генетика населения» в Институте Брода, а ныне директор Центра геномики населения при Институте Гарвана. Медицинский исследовательский и детский исследовательский институт Мердока в Австралии

«В некотором смысле, gnomAD является продуктом консорциума консорциумов, так как лежащие в основе данные представляют работу и вклад многих групп, которые собирали последовательности экзома и генома как способ понимания биологии человека», – сказал Конрад. Карчевски, первый автор основной статьи коллекции в Nature и вычислительный биолог в отделе аналитической и трансляционной генетики Broad и MGH. «Каждая из этих статей представляет кого-то, кто по-новому смотрит на набор данных, говоря:« У меня есть идея о том, как мы можем применить все это к работе », и создавая новый ресурс для сообщества генетиков. Было удивительно видеть это разворачиваться. "

GNOMAD LOOKBACK

Макартур и его коллеги из Broad и MGH создали ExAC, а затем gnomAD, чтобы расширить работу над Проектом 1000 геномов, первым крупномасштабным международным усилием по каталогизации генетических вариаций человека и другими проектами.

«В 2012 году моя лаборатория секвенировала геномы пациентов с редкими заболеваниями и обнаружила, что существующие каталоги нормальных вариаций не были достаточно большими или разнообразными, чтобы помочь нам интерпретировать генетические изменения, которые мы наблюдали», – вспоминает Макартур. «В то же время, наши коллеги по всему миру провели опрос десятков тысяч людей для изучения распространенных, сложных расстройств. Поэтому мы приступили к объединению этих наборов данных для создания эталонного набора данных для исследования редких заболеваний».

Консорциум ExAC выпустил свою первую коллекцию полных данных exome в октябре 2014 года. Затем он начал собирать полные данные генома, превратившись в Консорциум gnomAD и выпустив gnomAD v1.0 в феврале 2017 года.

Последующие выпуски gnomAD были сосредоточены на увеличении числа экзом и геномов, объема вариантов, выделенных в данных, и разнообразия набора данных.

Новые документы основаны на наборе данных gnomAD v2.1.1, который включает в себя геномы и экзомы более чем 25 000 человек восточного и южноазиатского происхождения, почти 18 000 латиноамериканцев и 12 000 африканцев или афроамериканцев.

КОМПЛЕКСНЫЙ КАТАЛОГ

В двух из семи работ показано, как большие наборы геномных данных могут помочь исследователям узнать больше о редких или недостаточно изученных типах генетических вариантов.

Ведущее исследование, проведенное Карчевски и Макартуром и опубликованное в Nature описывает gnomAD и отображает варианты потери функции (LoF): генетические изменения, которые, как считается, полностью нарушают функцию белка. кодирующие гены. Авторы идентифицировали более 443 000 вариантов LoF в наборе данных gnomAD, значительно превышая все предыдущие каталоги. Сравнивая количество этих редких вариантов в каждом гене с предсказаниями новой модели частоты мутаций человеческого генома, авторы также смогли классифицировать все белковые кодирующие гены в зависимости от того, насколько они толерантны к разрушительным мутациям, то есть Насколько вероятно, что гены могут вызывать значительные заболевания при нарушении генетическими изменениями. Эта новая схема классификации выявляет гены, которые с большей вероятностью участвуют в тяжелых заболеваниях, таких как умственная отсталость.

«Каталог gnomAD дает нам лучший взгляд на спектр чувствительности генов к изменению и предоставляет ресурс для поддержки обнаружения генов при распространенных и редких заболеваниях», – пояснил Карчевски.

В то время как исследования Карчевского и Макартура были сфокусированы на небольших вариантах (точечные мутации, небольшие вставки или делеции и т. Д.), Аспирант Райан Коллинз, ученый по связям с общественностью Харрисон Брэнд, член института Майкл Тальковски и коллеги использовали gnomAD для изучения структурных вариантов. Этот класс геномных вариаций включает в себя дупликации, делеции, инверсии и другие изменения с участием более крупных сегментов ДНК (обычно длиной более 50-100 оснований). Их исследование, также опубликованное в Nature представляет gnomAD-SV, каталог из более чем 433 000 структурных вариантов, идентифицированных в пределах почти 15 000 геномов gnomAD. Варианты в gnomAD-SV представляют большинство основных известных классов структурных изменений и вместе составляют самую большую карту структурных изменений на сегодняшний день.

«Структурные варианты общеизвестно трудны для идентификации в пределах данных всего генома, и ранее не исследовались в этом масштабе», – отметил Тальковский, который также является преподавателем в Центре геномной медицины при MGH. «Но они изменяют больше индивидуальных оснований в геноме, чем любые другие формы вариаций, и являются надежными факторами эволюции человека и болезней».

Несколько удивительных находок вышли из их обзора. Например, авторы обнаружили, что, по крайней мере, 25 процентов всех редких вариантов LoF в среднем индивидуальном геноме на самом деле являются структурными вариантами, и что многие люди несут то, что должно быть вредными или вредными структурными изменениями, но без фенотипов или клинических результатов, которые могли бы быть ожидается.

Они также отметили, что многие гены были так же чувствительны к дублированию, как и к делеции; то есть с эволюционной точки зрения получение одной или нескольких копий гена может быть столь же нежелательным, как и потеря одной.

«Мы многому научились, создав этот каталог в gnomAD, но мы явно лишь немного поцарапали поверхность понимания влияния структуры генома на биологию и болезни», – сказал Тальковский.

ИНСТРУМЕНТЫ ДЛЯ ЛУЧШЕЙ ДИАГНОСТИКИ

Три из статей раскрывают, как глубокие каталоги gnomAD различных типов генетических вариаций и клеточного контекста, в которых возникают варианты, могут помочь клиническим генетикам более точно определить, может ли данный вариант быть защитным, нейтральным или вредным для пациентов.

В статье Nature Берил Каммингс, бывший аспирант Broad / MGH, которая сейчас работает в Maze Therapeutics, MacArthur, и коллеги обнаружили, что тканевые различия в том, как выражаются сегменты данного гена, могут изменяться. последующие эффекты вариантов в этих сегментах на биологию и риск заболевания. Команда объединила данные из gnomAD и проекта «Экспрессия генотипной ткани» (GTEx), чтобы разработать метод, который использует эти различия для оценки клинической значимости вариантов.

В Nature Communications Макартур, аспирант Цинбо Ванг и соавторы изучили многоядерные варианты – те, которые состоят из двух или более близлежащих изменений базовой пары, которые наследуются вместе. Такие варианты могут иметь сложные эффекты, и это исследование представляет собой первую попытку систематически каталогизировать эти варианты, изучить их распределение по всему геному и предсказать их влияние на структуру и функцию генов.

И в отдельном исследовании Nature Communications Макартур, Никола Уиффин и Джеймс Уэйр из Имперского колледжа Лондона и его коллеги исследовали влияние вариантов ДНК, возникающих в 5-первичной непереведенной области генов, которые расположены непосредственно перед тем, где механизм транскрипции клетки начинает считывать код белка гена. Варианты в этих регионах могут обмануть клетку, чтобы начать читать ген в неправильном месте, но ранее не были хорошо документированы.

«Клинические лаборатории используют gnomAD каждый день», – говорит Хайди Рем, клинический генетик; член института в MPG Брода и медицинский директор Платформы секвенирования клинических исследований в Broad; главный специалист по геномике медицинского факультета MGH; и сопредседатель с членом Института Брэнда Марком Дейли из руководящего комитета gnomAD. «Методы в этих исследованиях уже помогают нам лучше интерпретировать результаты генетического теста пациента».

РУКОВОДСТВО ПО РАЗРАБОТКЕ НАРКОТИКОВ

Оставшиеся два исследования gnomAD описывают, как разнообразные генетические данные в масштабе популяции могут помочь исследователям оценить и выбрать лучшие мишени для лекарств.

В 2018 году ученый Эрик Миникель размышлял в своем исследовательском блоге о том, можно ли использовать гены с естественными предсказанными вариантами LoF для оценки безопасности попадания этих генов в наркотики. Он писал, что если ген, который инактивирован естественным путем, не оказывает вредного воздействия, возможно, этот ген можно было бы безопасно ингибировать лекарством. Эта запись в блоге стала основой статьи Nature в которой Миникель, Макартур и коллеги применили набор данных gnomAD для исследования этого вопроса. Они предлагают способы включить идеи о вариантах LoF в процесс разработки лекарств.

Используя свой опыт в Broad, Фонд Майкла Дж. Фокса начал сотрудничество между имперским колледжем Whiffin, MacArthur, коллегой по постдокторантуре Broad Ириной Армеан, 23andMe Aaron Kleinman и Полом Кэнноном и другими, чтобы использовать варианты LoF, каталогизированные в gnomAD, UK Biobank. и 23andMe для изучения потенциальных обязательств по безопасности снижения экспрессии гена под названием LRRK2, который связан с риском болезни Паркинсона. В Nature Medicine они используют эти данные, чтобы предсказать, что лекарства, которые снижают уровни белка LRRK2 или частично блокируют активность гена, вряд ли будут иметь серьезные побочные эффекты.

«Мы зарегистрировали большое количество генно-разрушительных вариаций в gnomAD», – сказал Макартур. «И с помощью этих двух исследований мы показали, как вы можете затем использовать эти варианты для освещения и оценки потенциальных целей лекарств».

Эффект роста

Публичный обмен всеми данными был основным принципом проекта gnomAD с самого начала. Данные этих семи статей были опубликованы через браузер gnomAD без ограничений на использование или публикацию в 2016 году.

«Широкое влияние, которое этот ресурс уже оказал на медицинские исследования и клиническую практику, свидетельствует о невероятной ценности обмена и агрегирования геномных данных», – сказал Макартур. «Более 350 независимых исследований уже использовали gnomAD для исследования предрасположенности к раку, сердечно-сосудистых заболеваний, редких генетических нарушений и т. Д. С тех пор, как мы предоставили данные.

«Но мы очень далеки от насыщающих открытий или решения варианта интерпретации», – добавил он. «Следующие шаги для консорциума будут направлены на увеличение размера и разнообразия популяции этих ресурсов, а также на установление связи между массивами генетических данных и крупномасштабной информацией с клинической информацией».

Источник:

Широкий институт Массачусетского технологического института и Гарварда

Ссылка на журнал:

Карчевски, К.Дж., ] и др. (2020). Спектр мутационных ограничений количественно определяется вариацией у 141 456 человек. Природа. doi.org/10.1038/s41586-020-2308-7.

        

Source link