T-REX (веб-сервер) - T-REX (webserver)

T-REX(интернет сайт ) (Реконструкция дерева и ретикулограммы)[1][2] свободно доступный веб сервер, разработанная на кафедре компьютерных наук Université du Québec à Montréal, посвященный выводу, проверке и визуализации филогенетические деревья и филогенетические сети. Веб-сервер T-REX[1][2] позволяет пользователям выполнять несколько популярных методов филогенетического анализа, а также некоторые новые филогенетические приложения для вывода, рисования и проверки филогенетических деревьев и сетей.

Филогенетический вывод

Доступны следующие методы для вывода и проверки филогенетических деревьев с использованием расстояний: Присоединение к соседу (Нью-Джерси), NINJA - крупномасштабное объединение соседей, BioNJ, UNJ, ADDTREE, MW, FITCH и реконструкция кругового заказа. Для максимальной экономии: DNAPARS, PROTPARS, PARS и DOLLOP, все они из ФИЛИП пакет, и для максимальной вероятности: PhyML,[3] RAxML,[4] DNAML, DNAMLK, PROML и PROMLK, четыре последних метода взяты из ФИЛИП пакет, доступны.

Рисунок дерева

Доступны иерархические вертикальные, горизонтальные, радиальные и осевые типы рисования дерева.

Входные данные могут быть в трех следующих форматах: Формат Ньюика, ФИЛИП и Формат FASTA. Все графические результаты, предоставляемые сервером T-REX, могут быть сохранены в формате SVG (масштабируемая векторная графика), а затем открыты и изменены (например, подготовлены для публикации или презентации) в графическом редакторе, предпочитаемом пользователем.

Строительство дерева

Разработанное приложение для рисования филогенетических деревьев, позволяющее сохранять их в Формат Ньюика.

Вывод дерева из неполных матриц

Доступны следующие методы восстановления филогенетических деревьев из матрицы расстояний, содержащей пропущенные значения, то есть неполные матрицы: метод треугольников Геноша и Леклерка (2001), ультраметрическая процедура для оценки пропущенных значений Ландри, Лапоинта и Кирша (1996), за которыми следует Автор: NJ, Аддитивная процедура для оценки пропущенных значений по Landry, Lapointe и Kirsch (1996), за которой следует NJ, и модифицированный взвешенный метод наименьших квадратов (MW *) Макаренкова и Lapointe (2004). Метод MW * присваивает вес 1 существующим записям, вес 0,5 оцененным записям и вес 0, когда оценка входа была невозможна. Моделирование, описанное в (Макаренков и Лапоинте, 2004), показало, что метод MW * явно превосходит по эффективности процедуры Triangles, Ultrametric и Additive.

Обнаружение горизонтального переноса генов

Полное и частичное Горизонтальный перенос генов методы обнаружения и проверки включены в сервер T-REX. Программа HGT-Detection[5] направлена ​​на определение оптимального, то есть с минимальными затратами, сценария горизонтального переноса генов, продолжая при этом постепенное согласование данных видов и генов.

Вывод ретикулограммы

Ретикулограмма, то есть программа реконструкции сетчатой ​​сети, сначала строит вспомогательное филогенетическое дерево, используя один из существующих методов вывода дерева. Вслед за этим к дереву (или сети, начиная с шага 2) на каждом шаге алгоритма добавляется ветвь ретикуляции, которая минимизирует целевую функцию методом наименьших квадратов или взвешенных наименьших квадратов.[6] Два статистических критерия, Q1 и Q2, были предложены для измерения увеличения соответствия, обеспечиваемого каждой ветвью ретикуляции.

Версия T-REX для веб-сервера также предоставляет возможность вывести поддерживающее дерево из одной матрицы расстояний, а затем для добавления ветвей ретикуляции с использованием другой матрицы расстояний. Такой алгоритм может быть полезен для изображения морфологического или генетического сходства между данными видами или для идентификации событий HGT с использованием первой матрицы расстояний для вывода дерева видов и второй матрицы (содержащей расстояния, связанные с генами), чтобы вывести ветви ретикуляции, представляющие предполагаемые горизонтальный перенос генов [6].[7]

Выравнивание последовательности

MAFFT, МЫШЦЫ (программное обеспечение для выравнивания) и ClustalW, которые являются одними из наиболее широко используемых множественное выравнивание последовательностей инструменты доступны с опциями медленного и быстрого попарного выравнивания.

Модели замещения (преобразование последовательности в расстояние)

В T-REX были включены следующие популярные модели замен в эволюции ДНК и аминокислот, позволяющие оценить эволюционные расстояния на основе данных о последовательностях: нескорректированное расстояние, Jukes-Cantor (Jukes and Cantor, 1969), K80 - 2 параметра (Kimura 1980). , T92 (Tamura 1992), Tajima-Nei (Tajima and Nei 1984), гамма Jin-Nei (Jin and Nei 1990), белок Kimura (Kimura 1983), LogDet (Lockhart et al. 1994), F84 (Felsenstein 1981), WAG (Уилан и Голдман, 2001), JTT (Джонс и др., 1992) и LG (Ле и Гаскуэль, 2008).

Топологическое расстояние Робинсона и Фулдса

Эта программа вычисляет Метрика Робинсона – Фулдса (RF) топологическое расстояние (Робинсон и Фулдс, 1981), которое является популярной мерой сходства деревьев между первым деревом и всеми последующими деревьями, указанными пользователем. Деревья могут быть предоставлены в форматах новой звезды или матрицы расстояний. Оптимальный алгоритм, описанный в (Макаренков и Леклерк 2000), выполняется для вычисления метрики RF.

Преобразование Newick в матрицу

Матрица расстояний Ньюика и преобразование матрицы расстояний в формат Ньюика. Собственное приложение позволяет пользователю конвертировать филогенетическое дерево от Newick формат в Матрица расстояний формат и наоборот.

Генератор случайных деревьев

Это приложение генерирует k случайные филогенетические деревья с n листьями, то есть видами или таксонами, и средней длиной ветви л с использованием процедуры генерации случайного дерева, описанной Kuhner и Felsenstein (1994),[8] где переменные k, п и л определяются пользователем. Длины ветвей деревьев имеют экспоненциальное распределение. Длины ветвей умножаются на 1+топор, где переменная Икс получается из экспоненциального распределения (P (Икс>k) = ехр (-k)), а константа a является настраивающим фактором, учитывающим интенсивность отклонения (как описано в Guindon and Gascuel (2002),[9] значение a было установлено равным 0,8). Случайные деревья, сгенерированные этой процедурой, имеют глубину O (log (п)).

Рекомендации

  1. ^ а б Boc A, Diallo Alpha B, Макаренков V (июнь 2012 г.). «T-REX: веб-сервер для вывода, проверки и визуализации филогенетических деревьев и сетей». Нуклеиновые кислоты Res. 40 (Проблема с веб-сервером): W573 – W579. Дои:10.1093 / нар / гкс485. ЧВК  3394261. PMID  22675075.
  2. ^ а б Макаренков В (июль 2001 г.). «T-REX: Реконструкция и визуализация филогенетических деревьев и ретикуляционных сетей». Биоинформатика. 17 (7): 664–668. Дои:10.1093 / биоинформатика / 17.7.664. PMID  11448889.
  3. ^ Гиндон С., Делсук Ф., Дюфаярд Дж. Ф., Гаскуэль О. (2009). Оценка филогении с максимальной вероятностью с помощью PhyML. Методы Мол. Биол. Методы молекулярной биологии. 537. Humana Press. С. 113–137. CiteSeerX  10.1.1.464.7907. Дои:10.1007/978-1-59745-251-9_6. ISBN  978-1-58829-910-9. PMID  19378142.
  4. ^ Стаматакис А. (август 2006 г.). «RAxML-VI-HPC: филогенетический анализ на основе максимального правдоподобия с тысячами таксонов и смешанных моделей». Биоинформатика. 22 (21): 2688–2690. Дои:10.1093 / биоинформатика / btl446. PMID  16928733.
  5. ^ Boc A, Филипп H, Макаренков V (январь 2010 г.). «Выявление и подтверждение событий горизонтального переноса генов с использованием двудольных различий». Syst. Биол. 59 (2): 195–211. Дои:10.1093 / sysbio / syp103. PMID  20525630.
  6. ^ а б Лежандр П., Макаренков В. (апрель 2002 г.). «Реконструкция биогеографических и эволюционных сетей с использованием ретикулограмм». Syst. Биол. 51 (2): 199–216. Дои:10.1080/10635150252899725. PMID  12028728.
  7. ^ Макаренков В, Лежандр П (2004). «От филогенетического дерева к сетчатой ​​сети». J. Comput. Биол. 11 (1): 195–212. Дои:10.1089/106652704773416966. PMID  15072696.
  8. ^ Kuhner MK, Felsenstein J (май 1994). «Моделирование сравнения алгоритмов филогении при равных и неравных темпах эволюции». Мол Биол Эвол. 11 (3): 459–468. Дои:10.1093 / oxfordjournals.molbev.a040126. PMID  8015439.
  9. ^ Гуиндон С., Гаскуэль О. (апрель 2002 г.). «Эффективная необъективная оценка эволюционных расстояний при разной степени замещения на разных участках». Мол Биол Эвол. 19 (4): 534–43. Дои:10.1093 / oxfordjournals.molbev.a004109. PMID  11919295.

умереть

внешняя ссылка