Как строить филогенетические деревья

Tutorial: Building Phylogenetic Trees in UGENE

This tutorial is about phylogenetic trees building methods available in the UGENE platform. So here UGENE is presented as a phylogenetic tree maker.

UGENE allows you to visualize, edit and build phylogenetic trees and phylogenetic relationship. You can also connect it to your multiple alignment and edit the tree with its sequences.

Phylogenetic Tree Methods Overview

There are three different phylogenetic trees building methods based on different algorithms: Neighbor-joining from the PHYLIP toolset, Bayesian inference from the MrBayes software and maximum likelihood from PhyML. Each method has its own strong and weak features related to the acceptable sizes of input alignments, required computational resources, etc. All these methods, integrated into UGENE, require the multiple sequence alignment file as an input. Let’s consider them one by one.

You might want to check PHYLIP -> PHYLIP on the web -> may be read here -> Neighbor-Joining and UPGMA method documentation files.

The neighbor joining method is a distance-matrix method. It is the commonly used method because it is simple, straightforward and fast, and usually it can be run with the default settings. But the method is suitable only for small multiple alignments.

Running PHYLIP

Let’s perform the test run of PHYLIP Neighbor-Joining. Open the sample multiple alignment in UGENE. Click the “Build tree” button on the main toolbar and choose the needed method. Run the building process. The result will be automatically opened in the UGENE tree viewer.

Running PhyML

The PhyML maximum likelihood method was designed to process large data sets. In theory, it can process alignments with up to 4,000 sequences 2,000,000 character-long. PhyML has the large number of substitution models and settings. It makes possible to build phylogenetic trees going from very fast and efficient methods (for a simple phylogenetic tree) to slower but more accurate ones.

For running PhyML, repeat the previous scenario with another sample file but choose the maximum likelihood method in the dialog.

Running MrBayes

And the third method is the Bayesian inference from the MrBayes software. The method is based on building a set of possible phylogenetic trees and assuming a prior probability distribution of each tree. MrBayes is more computational resources consuming than PHYLIP neighbor joining but less than PhyML phylogenetic tree maker.

Let’s run the method using the MrBayes sample. Open the file in UGENE, click the familiar “Build tree” button and choose the MrBayes method. [Pause] Choose the GTR substitution model and set the Rate option as invgamma like it is made in the MrBayes tutorial.

Читайте также:  Экран для ванной дерево

Conclusion

UGENE integrates the algorithms making them easier to use keeping you apart of command line interface and operations on file formats.

Note that these are only the methods of building phylogenetic relationship, you might want to check visualization and simple phylogenetic tree editing options in documentations. UGENE also support multiple formats of files with trees.

Источник

5.2.3 Построение филогенетического древа

Филогения с древне-греческого дословно переводится phylon — «племя, раса» и genetikos — «имеющий отношение к рождению», в более широком смысле означает историческое развитие организмов. В биологии филогенез рассматривает развитие биологического вида во времени. Макромолекулярные данные, под которыми имеется в виду последовательности генетического материала ДНК и белков, накапливаются всё быстрыми темпами благодаря успехам молекулярной биологии. Для эволюционной биологии быстрое накопление данных последовательностей целых геномов имеет значительную ценность, потому что сама природа ДНК позволяет использовать его как «документ» эволюционной истории. Сравнения нуклеотидных или аминокислотных последовательностей у разных организмов могут сказать ученому много нового об эволюционных взаимоотношениях этих организмов, которые не могут быть обнаружены иначе, например, на основе морфологии, или внешней форме организмов, или их внутренней структуре. Поскольку геномы эволюционируют через постепенное накопление мутаций, количество отличий последовательности нуклеотидов между парой геномов разных организмов должно указать, как давно эти два генома отделились от общего предка. Два генома, которые разделились в недавнем прошлом, должны иметь меньшие отличий, чем два генома, чей общий предок более древний. Потому, сравнивая разные биологические последовательности друг с другом, возможно получить сведения об эволюционном взаимоотношения между ними. Это является главной задачей молекулярной филогенетики .

Молекулярная филогенетика пытается определить скорость и отличия изменений в ДНК и белках, чтобы восстановить эволюционную историю генов и организмов. Задачей филогенетического анализа является установление, реконструкция эволюционной истории — родственных связей, отношений между формами жизни — и датирование эволюционных событий. В филогенетических исследованиях эволюционные отношения между формами жизни представляют в виде филогенетических , или эволюционных , деревьев (phylogenetic, evolutionary trees). Филогенетическое дерево состоит из внутренних и внешних ветвей (branches), узлов (nodes), и, если исследователем выбрана соответствующая опция, — корня (root), без корня (unroot). Порядок всех ветвей дерева называют его топологией (topology). Внутренние ветви соединяют внутренние узлы, внешние ветви ведут непосредственно к объектам исследования (также они называются внешние узлы, или листья дерева, leaves). Деревья с корнем отражают направление эволюции, порядок почкования, ответвления (branching) различных эволюционных линий. Объектами филогенетического исследования могут быть гены или их участки, нуклеотидные или аминокислотные последовательности, организмы, популяции, индивидуумы, штаммы вирусов и т.д. Эти объекты исследования называют оперативными таксономическими единицами, OTU (Operational Taxonomic Units).

Деревья без корня показывают родственные отношения между анализируемыми последовательностями, но не направление эволюции. После того как мы имеем представление о большой «семье» флавивирусов (род Flavivirus), не лишним будет построить филогенетическое древо, по топологии которого наглядно видны эволюционные расстояния между видами. Порядок построения филогенетического древа: 1. Вернемся к выполненному запросу со скрининга по гомологии (GenBank), для этого удобно перейти по ссылке из письма о готовом задании, хранящемся у вас в электронной почте. 2. На странице с результатами выберите любые понравившиеся вам строки списка с неповторяющимися названиями вируса. Для того чтобы выбрать строку из списка, поставьте галочку, соответствующую этой строке.

Читайте также:  Чем обработать дерево от жука древоточца

3. Когда вы выберите все интересующие вас последовательности чтобы построить филогенетическое древо щелкните внизу на кнопку «Множественное выравнивание». Так вы сможете воспользоваться сервисом который выравнивает заданный набор последовательностей, то есть расставляет гэпы так чтобы похожие участки в разных последовательностях находились одни под другим. Для выполнения выравнивания нажмите на кнопку «рассчитать» с теми последовательностями во входной форме, которые туда были внесены когда вы перешли со страницы с результатами скрининга.; 4. После того как последовательности будут выровнены, щелкните внизу страницы с результатом выравнивания на ссылку «Перейти к филогенетическому анализу» 5. Через встроенную на сайте систему автоматических переходов (которые по английски называются pipelines) сформированный вами запрос перенаправляется на сервис Филогенетический анализ, здесь вы можете выбрать метод анализа и скомандовать « Рассчитать ». 6. Результат построения филогенетического древа появляется практически мгновенно и вы сможете оценить эволюционные расстояния внутри выбранной вами группы вирусов и топологию построенного дерева.

5.2.4 Конструирование трехмерной структуры вирусного белка NS3

Все задания выполненные до этого момента, были некоторым экскурсом для знакомства с исследуемым нами объектом, а теперь нам предстоит захватывающий этап работы, называемый Insight into, то есть взгляд внутрь. Давайте немного поразмышляем, над нашим объектом и устройством всего живого в целом. Из специализированных баз данных мы можем извлечь генетические последовательности практически для всех живых организмов живущих на Земле. Но что из себя представляет сама последовательность с точки зрения живой природы? Это — определенная матрица с которой синтезируется множество белков, выполняющих свои особенные исключительные функции в живом

организме. А благодаря белкам и существует живая материя. Как по настоящему выглядят белки, белки из которых состоит наше тело, или белки вирусной частицы, или любые другие белки? Для того чтобы узнать как выглядят белки в живой природе, существует несколько достаточно сложных экспериментальных методов — получение кристаллов белка и расшифровка их структуры с помощью рентгеноструктурного анализа и метод ядерно-магнитного резонанса, а так же компьютерное молекулярное моделирование. Метод компьютерного молекулярного моделирования, в отличии от экспериментальных методов, позволяет получать лишь предсказания структуры белков, и эти предсказанные структуры могут отличаться от экспериментально наблюдаемых. По сути они представляют собой результаты эксперимента, который выполняется in silico, то есть на компьютере. Именно поэтому на сегодняшний день с помощью моделирования можно получить пространственную структуру белка достаточно быстро и дешево, хотя без дополнительной верификации такая структура будет отличаться от реального белка в растворе. В зависимости от требований к точности пространственной структуры выбираются разные методы либо долгие и дорогостоящие исследования с кристаллизацией белка, либо быстрые и малозатратные компьютерные эксперименты. У нас есть последовательность вирусного белка NS3 по которой мы хотим воссоздать его третичную структуру, то есть увидеть как этот белок выглядит в природе. Для этого воспользуемся известным методом моделирования по гомологии, этот метод также называется гомологичное моделирование, либо сравнительное моделирование. Вкратце, суть метода можно описать так: существует база данных экспериментально определенных структур белков. Мы собираемся найти в этой базе структуру белка, который имеет гомологию по первичной последовательности с нашим заданным белком, и на основании найденной гомологии построить трехмерную модель нашего белка. Несмотря на то что в базе данных PDB хранится огромное множество трехмерных моделей для самых разных белков, не всегда можно найти расшифрованную пространственную структуру непосредственно интересующего вас белка. Например, для исследуемого белка NS3 вируса клещевого энцефалита в PDB в настоящее время нет ни одной структуры. Однако если продолжить поиск в базе PDB можно найти

Читайте также:  Славянские статуи из дерева

структуры этого же белка для близкородственных видов вируса того же рода и семейства. Если в базе белковых структур мы нашли хотя бы одну модель близкородственного белка, то можно приступать к моделированию по гомологии. Для выполнения задания по конструированию пространственной структуры вирусного белка NS3 воспользуемся сервисом «скрининг по гомологии (PDB)» на www.brishur.com 1. Откройте страницу сервиса Скрининг по гомологии (PDB) 2. По аналогии с предыдущими запросами заполните поля email и наименование задания Возьмите исследуемую последовательность белка NS3 и вставьте в поле «Последовательность» 3. Для уменьшения времени расчетов воспользуемся параметрами, заданными по умолчанию: 4. Метод скрининга для построения профиля Genebee 5. Количество последовательностей в полученном результате 100. 6. Cкомандуем « Рассчитать» . Рисунок 17: Bri-shur — скрининг по гомологии (PDB)

7. После выполнения задания в полученном вами письме перейдите по ссылке на страницу с результатом вашего запроса. 8. На странице со списком найденных гомологов выберите элемент списка с наибольшим значением Z-score 9. Щелкните внизу страницы на кнопку «Уточнить парное выравнивание» 10. Через систему пайплайнов вы окажетесь на сервисе множественное выравнивание. 11. Cкомандуем «Рассчитать». 12. Посмотрите на результат выравнивания и зрительно оцените процент сходства и совпадения исследуемой и найденной последовательностей, ориентируясь на количество условных символов * или + 13. Внизу страницы перейдите по ссылке «Перейти к моделированию по гомологии» Рисунок 18: Bri-shur — задание параметров моделирования по гомологии в Nest 14. На странице «Nest (Гомологичное моделирование)» можно еще раз посмотреть выравнивание, щелкнув по кнопке «Предварительный просмотр выравнивания»

Рисунок 19: Bri-shur — пример выровненных последовательностей 15. Скомандуем «Рассчитать». 16. Через минуту обновите страницу и если задание выполнено щелкните на ссылку download и загрузите готовую трехмерную модель структуры белка в формате файла pdb на свой компьютер. 17. Далее визуализируйте модель с помощью программы Chimera, описанной выше.

Источник

Оцените статью