Bowtie (анализ последовательности) - Bowtie (sequence analysis) - Wikipedia
Оригинальный автор (ы) | Бен Лэнгмид Коул Трапнелл Михай Поп Стивен Зальцберг |
---|---|
Разработчики) | Бен Лэнгмид и другие., |
Стабильный выпуск | 2.3.5.1 / 16 апреля 2019 |
Репозиторий | |
Операционная система | Linux macOS Windows |
Размер | 14.7 МБ (Источник) |
Тип | Биоинформатика |
Интернет сайт | www |
Галстук-бабочка это программный пакет, обычно используемый для выравнивание последовательностей и анализ последовательности в биоинформатика.[1] Исходный код пакета распространяется свободно и скомпилированные двоичные файлы доступны для Linux, macOS и Windows платформы. По состоянию на 2017 год Геномная биология статья, описывающая оригинальный метод Bowtie, цитировалась более 11000 раз.[1] Bowtie это программное обеспечение с открытым исходным кодом и в настоящее время поддерживается Университет Джона Хопкинса.
История
Выравниватель последовательностей Bowtie был первоначально разработан Бен Лэнгмид и другие. на Университет Мэриленда в 2009.[1] Выравниватель обычно используется с короткими считываниями и большим эталонный геном, или для анализ всего генома. Bowtie продвигается как «сверхбыстрый, эффективный для памяти короткий выравниватель для краткости. ДНК последовательности ". Увеличение скорости Bowtie частично связано с реализацией Преобразование Барроуза – Уиллера для выравнивания, что уменьшает объем памяти (обычно около 2,2 ГБ для генома человека);[2] аналогичный метод используется BWA[3] и SOAP2[4] методы выравнивания. [2]
Bowtie проводит качественную, жадную, рандомизированную поиск в глубину через пространство возможных выравниваний. Поскольку поиск является жадным, первое действительное выравнивание, обнаруженное Bowtie, не обязательно будет «лучшим» с точки зрения количества несоответствий или с точки зрения качества.
Bowtie используется в качестве выравнивателя последовательностей рядом других связанных алгоритмов биоинформатики, включая TopHat,[5] Запонки[6] и CummeRbund Биокондуктор упаковка.[7]
Галстук-бабочка 2
16 октября 2011 года разработчики выпустили бета-версию вилка проекта под названием Галстук-бабочка 2.[8] В дополнение к преобразованию Барроуза-Уиллера, Bowtie 2 также использует FM-индекс (аналогично массив суффиксов ), чтобы уменьшить объем памяти. Благодаря своей реализации Bowtie 2 больше подходит для поиска более длинных совмещений с зазорами по сравнению с исходным методом Bowtie. В Bowtie 2 нет верхнего предела длины чтения, и это позволяет выравниванию перекрывать неоднозначные символы в ссылке.
Рекомендации
- ^ а б c Лэнгмид, Бен; Коул Трапнелл; Михай Поп; Стивен Л. Зальцберг (4 марта 2009 г.). «Сверхбыстрое и эффективное с точки зрения памяти выравнивание коротких последовательностей ДНК с геномом человека» (PDF). Геномная биология. 10 (3): 10: R25. Дои:10.1186 / gb-2009-10-3-r25. ЧВК 2690996. PMID 19261174. Получено 29 ноябрь 2013.
- ^ а б "Bowtie: сверхбыстрый выравниватель короткого чтения с эффективным использованием памяти - SourceForge". Получено 29 ноябрь 2013.
- ^ Li, H .; Дурбин, Р. (18 мая 2009 г.). «Быстрое и точное согласование короткого чтения с преобразованием Барроуза-Уиллера». Биоинформатика. 25 (14): 1754–1760. Дои:10.1093 / биоинформатика / btp324. ЧВК 2705234. PMID 19451168.
- ^ Li, R .; Yu, C .; Li, Y .; Lam, T.-W .; Yiu, S.-M .; Kristiansen, K .; Ван Дж. (3 июня 2009 г.). «SOAP2: улучшенный сверхбыстрый инструмент для согласования краткого чтения». Биоинформатика. 25 (15): 1966–1967. Дои:10.1093 / биоинформатика / btp336. PMID 19497933.
- ^ Trapnell, C .; Пахтер, Л.; Зальцберг, С. Л. (16 марта 2009 г.). «TopHat: обнаружение сплайсинговых соединений с помощью RNA-Seq». Биоинформатика. 25 (9): 1105–1111. Дои:10.1093 / биоинформатика / btp120. ЧВК 2672628. PMID 19289445.
- ^ Трапнелл, Коул; Робертс, Адам; Гофф, Верный; Pertea, Geo; Ким, Дэхван; Келли, Дэвид Р.; Пиментел, Гарольд; Зальцберг, Стивен Л; Ринн, Джон Л; Пахтер, Лиор (1 марта 2012 г.). «Дифференциальный анализ экспрессии генов и транскриптов в экспериментах с последовательностью РНК с TopHat и Cufflinks». Протоколы природы. 7 (3): 562–578. Дои:10.1038 / nprot.2012.016. ЧВК 3334321. PMID 22383036.
- ^ «CummeRbund - пакет R для постоянного хранения, анализа и визуализации RNA-Seq из выходных данных запонок». Получено 11 августа 2015.
- ^ Лэнгмид, Бен; Зальцберг, Стивен Л. (4 марта 2012 г.). «Быстрое выравнивание с пропуском чтения с Bowtie 2». Методы природы. 9 (4): 357–359. Дои:10.1038 / мес.1923. ЧВК 3322381. PMID 22388286.