Микроскопические организмы, которые наполняют наши тела, почвы, океаны и атмосферу, играют важную роль в здоровье человека и экосистемах планеты. Тем не менее, даже при современном секвенировании ДНК выяснить, что это за микробы и как они связаны друг с другом, остается чрезвычайно сложным.
В двух новых исследованиях исследователи из Университета штата Аризона представили мощные инструменты, которые делают эту работу проще, точнее и гораздо более масштабируемой. Один из инструментов улучшает то, как ученые строят микробные генеалогические древа. Другой обеспечивает программную основу, используемую во всем мире для анализа биологических данных.
Вместе эти достижения укрепляют научные основы исследований микробиома, отслеживания заболеваний, мониторинга окружающей среды и новых областей, таких как прецизионная медицина.
Наша команда создает программные инструменты с открытым исходным кодом, потому что мы считаем, что, когда каждый может получить доступ к научным инструментам и расширить их, все сообщество получает выгоду и открытия ускоряются ».
Циюн Чжу, Университет штата Аризона
Чжу является научным сотрудником Центра фундаментальной и прикладной микробиомики Биодизайна и доцентом Школы наук о жизни АлтГУ. К нему присоединяются коллеги из АлтГУ и международные сотрудники.
Первое исследование, посвященное улучшению маркерных генов, опубликовано в журнале Nature Communications. Второе исследование, описывающее библиотеку программного обеспечения с открытым исходным кодом, известную как scikit-bio, появляется в Nature Methods.
Семейное дело
Построение подробных и точных эволюционных деревьев имеет важное значение для понимания того, как микробы развиваются и влияют на мир. Лучшие эволюционные деревья улучшают отслеживание заболеваний и помогают ученым отслеживать, как вредные микробы меняются с течением времени. Они также усиливают экологические исследования, показывая, как микробные сообщества реагируют на загрязнение или изменения климата. Более четкая микробная идентификация также STRуглубляет исследования микробиома кишечника и его роли в здоровье.
Раскрытие того, как связаны микробы, начинается с выбора правильных маркерных генов - указателей в ДНК, которые прослеживают их эволюционную историю.
В течение многих лет ученые полагались на один и тот же небольшой набор традиционных маркерных генов. Но в растущей области метагеномики исследователи теперь работают с миллионами геномов, часто непосредственно из образцов окружающей среды. Метагеномика позволяет ученым вычерпывать всю ДНК в окружающей среде и секвенировать ее сразу, выявляя целые скрытые сообщества микробов.
Эти геномы чрезвычайно ценны, но они часто неполны или неравномерны по качеству. Это затрудняет использование фиксированного набора маркерных генов и ожидание точных эволюционных результатов.
Чтобы решить эту проблему, Чжу и его коллеги помогли разработать TMarSel (сокращение от Tree-based Marker Selection). Вместо того, чтобы выбирать гены вручную, TMarSel автоматически ищет тысячи возможных генови выбирает комбинацию, которая строит самое надежное эволюционное дерево. Он оценивает каждый ген на предмет того, насколько он распространен, насколько он информативен и насколько он способствует стабильной, значимой картине микробных отношений.
Результатом является гибкий, основанный на данных способ построения микробных деревьев, которые хорошо работают даже для больших и разнообразных групп организмов - и даже когда многие геномы только частично завершены.
Scikit-bio: Ancestry.com для микробов
Чжу также является ведущим разработчиком scikit-bio, обширной библиотеки программного обеспечения с открытым исходным кодом. Scikit-bio дает ученым инструменты, необходимые для анализа огромных биологических наборов данных. Это особенно полезно для изучения микробиомов - сообществ микробов, которые живут в определенной среде, такой как кишечник человека.
Биологические наборы данных не похожи ни на один другой вид данных: они чрезвычайно большие, очень разреженные и часто включают в себя тысячи взаимосвязанных признаков. Стандартные data-anaпрограммы лизиса не построены для такого уровня фрагментации и сложности. Scikit-bio восполняет этот пробел, предлагая более 500 функций для таких задач, как:
- Сравнение микробных сообществ.
- Вычисление разнообразия.
- Преобразование композиционных данных.
- Анализ последовательностей ДНК, РНК и белка.
- Построение и модификация филогенетических деревьев.
- Подготовка данных для машинного обучения.
Проект управляется сообществом, поддерживается более чем 80 участниками и поддерживается строгим тестированием и документацией. Он уже цитировался в десятках тысяч научных работ по медицине, экологии, науке о климате и биологии рака. Он стал важным инструментом для исследователей, анализирующих микробиом и другие крупные, богатые данными области современной биологии.
Новая эра в микробных исследованиях
По мере роста биологических наборов данных такие инструменты, как scikit-bio и TMarSel, проводят масштабные исследованияболее надежным и воспроизводимым.
Исследования подтверждают растущую роль ASU на стыке биологии и вычислений. Работа Чжу показывает, как сочетание эволюционного понимания с передовой разработкой программного обеспечения может привести к созданию инструментов, используемых учеными во всем мире.
Поскольку секвенирование ДНК продолжает становиться быстрее и дешевле, ученые раскроют еще больше микробной вселенной. Такие инструменты, как TMarSel и scikit-bio, гарантируют, что этот поток данных может быть преобразован в реальное научное понимание.

09:00







