Новый инструмент раскрывает молекулярные причины различных заболеваний

        

Исследователи из Принстонского университета получают новое понимание причин и характеристик заболеваний, используя машинное обучение для одновременного анализа молекулярных структур по сотням заболеваний. Демонстрируя новый инструмент, который теперь доступен исследователям во всем мире, команда компьютерных ученых и биологов уже обнаружила и экспериментально подтвердила ранее неизвестный вклад четырех генов в редкую форму рака, которая в основном поражает младенцев и маленьких детей.

Команда, в которую вошли сотрудники из Университета штата Мичиган и Университета Осло, представила систему и продемонстрировала ее возможности в статье, опубликованной в выпуске журнала от 23 февраля Cell Systems .

В то время как предыдущие подходы были сосредоточены на генах, связанных с конкретными заболеваниями или типами рака, новый метод использует машинное обучение, чтобы находить уникальные паттерны активности генов, рассматривая одновременно более 300 различных заболеваний, включая рак, болезни сердца, нарушения обмена веществ и многие другие. При этом выявляются различия между заболеваниями и типами тканей, в том числе тонко настраиваемые различия между родственными заболеваниями, которые невозможно было различить с помощью других методов.

Исследователи полагают, что при дальнейшем развитии этот инструмент будет полезен для клиницистов в диагностике заболеваний, адаптации и отслеживании эффективности методов лечения, а также в поиске новых подходов к лечению.

Система, получившая название «Аннотирование образца РНК при заболеваниях человека» или URSA (HD), включает информацию об активности генов из общедоступных записей о около 8000 биопсий, взятых из здоровых и больных тканей тысяч пациентов. В дальнейшем исследователи могут отправлять новые образцы в инструмент через веб-интерфейс и получать анализ возможных ассоциаций с заболеваниями и типами тканей.

«Настоящим новшеством является сравнение всех образцов с каждым другим образцом», – сказал Чандра Тисфельд, один из ведущих исследователей, наряду с Янг-Сук Ли, который получил докторскую степень. в Принстоне в 2016 году.

Теесфельд сравнил идею со способностью людей распознавать нюансы различий в поведении, основываясь на разнообразных примерах. Например, наблюдение за футболистами может выявить характеристики удара ногой, но наблюдение за футболистами и артистами балета одновременно раскрывает детали и контекст аналогичного действия с совершенно другим стилем и целью.

«Их совместное изучение дает возможность различать уникальные аспекты», – сказал Тисфельд, научный сотрудник лаборатории Ольги Троянской из Принстона и Фонда Саймонса, которая возглавляла команду. Эта точка зрения обеспечивает непредвзятый способ «узнать новые вещи о болезнях, которые невозможно найти с помощью подхода« одна болезнь за один раз », и потенциально определить новые цели для терапии или даже обнаружить новые аспекты болезни, которые не были не оценили ".

При проведении сравнений алгоритм придает большее значение различиям в активности генов, которые однозначно определяют различные ткани и заболевания. Это лишает акцента информацию о генной активности, характерной для родственных заболеваний, многие из которых уже хорошо изучены. В аналогии с футбольными танцами это все равно, что отложить в сторону крупномасштабное действие по подъему ноги в ударе и нахождению многих деталей, таких как угол ступни, которые вместе взятые, составляют характерный набор характеристик, который надежно идентифицирует одно действие или другой.

«Наш метод основан на информации о заболевании в образце пациента, поэтому он не смещен в сторону популярных генов заболевания, которые всегда изучаются», – сказал Тисфельд. «Мы можем отслеживать закономерности изменений в данных, не зная точно, что означает каждое изменение».

Theesfeld отметил, что 90 процентов исследований генов рассматривают только 10 процентов человеческих генов. URSA (HD) рассматривает весь геном человека и создает модель или сигнатуру для каждого заболевания в масштабе всего генома.

Этот подход мог бы быть особенно эффективным для редких заболеваний, для которых исследователи теперь могут создать модель с несколькими образцами. В случае нейробластомы, детского рака, исследователи обнаружили четыре гена, которые особенно способствовали заболеванию и о которых ранее не было никакой информации в научной литературе. Чтобы подтвердить полученные данные, Тисфельд провел лабораторные тесты на клетках человека, манипулируя активностью генов и наблюдая их влияние на связанные с раком процессы в клетках.

Вместо того, чтобы смотреть на саму ДНК, URSA (HD) смотрит на РНК, продукт, который клетки создают, когда они транскрибируют информацию в ДНК в рабочие молекулы, которые строят и управляют клетками и передают сигналы от клетки к клетке. Таким образом, система смотрит за пределы мутаций (скремблирование в самих генах) и вместо этого сосредотачивается на нижестоящих продуктах транскрипции, которые могут не регулироваться способами, которые вызывают проблемы, даже если исходный ген нормальный.

Исследование является частью многолетней работы в лаборатории Троянской по интеграции огромных коллекций разнородных наборов данных для извлечения информации, необходимой для точных биологических предсказаний и для направления лабораторных экспериментов для ускорения открытия. Широкий спектр науки о данных в Принстоне объединяет вычисления и биологию для разработки основополагающих инструментов и идей, способных оказать широкое влияние на здоровье и человечество.

«Междисциплинарные подходы, которые объединяют сложные науки о данных с глубокими познаниями в биологии, являются ключом к расшифровке биомедицинских головоломок, необходимых для реализации перспектив точной медицины», – сказала Троянская.

Источник:

https://engineering.princeton.edu/news/2019/02/28/data-science-tool-reveals-molecular-causes-disease-shows -Питание-младенец рака

      

Source link