Трансляционная биоинформатика - Translational bioinformatics

Трансляционная биоинформатика (TBI) является новой областью изучения информатика здоровья, сосредоточенный на конвергенции молекулярных биоинформатика, биостатистика, статистическая генетика и клиническая информатика. Его основное внимание уделяется применению методологии информатики к растущему количеству биомедицинских и геномных данных для формулирования знаний и медицинских инструментов, которые могут быть использованы учеными, клиницистами и пациентами.[1] Кроме того, это включает применение биомедицинских исследований для улучшения здоровья человека за счет использования компьютерных информационных систем.[2] TBI нанимает сбор данных и анализ биомедицинской информатики с целью получения клинических знаний для применения.[3] Клинические знания включают обнаружение сходства в популяциях пациентов, интерпретацию биологической информации для предложения терапевтических методов лечения и прогнозирования результатов для здоровья.[4]

История

Трансляционная биоинформатика - относительно молодая область трансляционных исследований.[5][6] Google тенденции указать использование "биоинформатика "уменьшилось с середины 1990-х годов, когда он был предложен в качестве трансформирующего подхода к биомедицинским исследованиям.[6] Однако он был придуман почти десятью годами ранее.[7] Затем TBI был представлен как средство для облегчения организации данных, доступности и улучшенной интерпретации имеющихся биомедицинских исследований.[6][8] Он считался инструментом поддержки принятия решений, который мог интегрировать биомедицинскую информацию в процессы принятия решений, которые в противном случае были бы опущены из-за природы человеческой памяти и моделей мышления.[8]

Первоначально фокус TBI был на онтология и дизайн словаря для поиска в массовых хранилищах данных. Однако эта попытка была в основном неудачной, поскольку предварительные попытки автоматизация привело к дезинформации. TBI необходимо было разработать основу для перекрестных ссылок на данные с алгоритмами более высокого порядка, чтобы связать данные, структуры и функции в сетях.[6] Это шло рука об руку с акцентом на разработку учебных программ для программ магистратуры и капитализацию финансирования на растущем общественном признании потенциальных возможностей в ЧМТ.[6]

Когда первый проект человеческий геном был завершен в начале 2000-х, TBI продолжал расти и демонстрировать известность как средство объединения биологических результатов с клиническая информатика, влияя на возможности как для биологии, так и для здравоохранения.[9] Профилирование выражений, интеллектуальный анализ текста для анализа тенденций был изучен, определен и признан важным вкладом в TBI интеллектуальный анализ данных населения, обеспечивающий биомедицинскую информацию, и разработка онтологий.[6][10] Достижения в этой области, которые использовались для открытия знаний, включают привязку клинических записей к данным геномики, привязку лекарств к родословной, полногеномное секвенирование для группы с общим заболеванием и семантику в изучении литературы.[10] Обсуждались совместные усилия по созданию кросс-юрисдикционных стратегий для ЧМТ, особенно в Европе. В последнее десятилетие также наблюдается развитие персонализированной медицины и обмена данными в фармакогеномика. Эти достижения укрепили общественный интерес, сгенерировали средства для инвестиций в обучение и дальнейшую разработку учебных программ, повысили спрос на квалифицированный персонал в этой области и подтолкнули текущие исследования и разработки TBI.[6]

Преимущества и возможности

В настоящее время исследования TBI охватывают несколько дисциплин; однако применение ЧМТ в клинических условиях остается ограниченным. В настоящее время частично развернут в разработка лекарств, регуляторный обзор и клинические лекарство.[8] Возможности применения TBI намного шире, поскольку в медицинских журналах все чаще упоминается термин «информатика» и обсуждаются темы, связанные с биоинформатикой.[2] Исследование TBI опирается на четыре основных дискурса: клиническая геномика, геномная медицина, фармакогеномика, и генетическая эпидемиология.[9] Растет число конференций и форумов, посвященных ЧМТ, чтобы создать возможности для обмена знаниями и развития областей. Общие темы, которые обсуждались на недавних конференциях, включают: (1) личную геномику и геномную инфраструктуру, (2) исследования лекарств и генов для выявления побочных эффектов, взаимодействий и перепрофилирования лекарств, (3) биомаркеры и представление фенотипа, (4) секвенирование, наука и системная медицина, (5) вычислительные и аналитические методологии для ЧМТ, и (6) применение взаимосвязанных генетических исследований и клинической практики.[8][10][11]

С помощью специалистов по биоинформатике биологи могут анализировать сложные данные, создавать веб-сайты для экспериментальных измерений, облегчать обмен результатами измерений и соотносить результаты с клиническими результатами.[2] Трансляционные биоинформатики, изучающие конкретное заболевание, будут иметь больше выборочных данных о данном заболевании, чем отдельный биолог, изучающий только болезнь.

С момента завершения человеческий геном, новые проекты сейчас пытаются систематически анализировать все изменения генов при такой болезни, как рак вместо того, чтобы сосредоточиться на нескольких генах одновременно. В будущем крупномасштабные данные будут интегрированы из разных источников для извлечения функциональной информации. Наличие большого количества человеческих геномов позволит проводить статистические исследования их связи с образом жизни, взаимодействиями лекарств и другими факторами. Таким образом, трансляционная биоинформатика трансформирует поиск генов болезней и становится важным компонентом других областей медицинских исследований, включая фармакогеномика.[12]

В исследовании, оценивающем вычислительные и экономические характеристики облачные вычисления При выполнении крупномасштабной интеграции данных и анализа геномной медицины облачный анализ имел схожую стоимость и производительность по сравнению с локальным вычислительным кластером. Это предполагает, что технологии облачных вычислений могут быть ценной и экономичной технологией для облегчения крупномасштабных трансляционные исследования в геномной медицине.[13]

Методологии

Место хранения

В настоящее время доступны огромные объемы биоинформатических данных, которые продолжают расти. Например, база данных GenBank, финансируемая Национальным институтом здравоохранения (NHI), в настоящее время содержит 82 миллиарда нуклеотиды в 78 миллионах последовательностей, кодирующих 270 000 видов. Эквивалент GenBank для экспрессия гена В микрочипах, известных как Омнибус экспрессии генов (GEO), содержится более 183 000 образцов из 7 200 экспериментов, и это число удваивается или утраивается каждый год. В Европейский институт биоинформатики (EBI) имеет аналогичную базу данных под названием ArrayExpress, которая содержит более 100 000 образцов из более чем 3 000 экспериментов. В целом TBI в настоящее время имеет доступ к более чем четверти миллиона образцов микрочипов.[2]

Чтобы извлечь соответствующие данные из больших наборов данных, TBI использует различные методы, такие как консолидация данных, объединение данных и хранилище данных. В подходе консолидации данных данные извлекаются из различных источников и централизованно хранятся в единой базе данных. Этот подход позволяет стандартизировать разнородные данные и помогает решать проблемы взаимодействия и совместимости между наборами данных. Однако сторонники этого метода часто сталкиваются с трудностями при обновлении своих баз данных, поскольку он основан на единой модели данных. Напротив, подход объединения данных связывает базы данных вместе и регулярно извлекает данные, а затем объединяет данные для запросов. Преимущество этого подхода заключается в том, что он позволяет пользователю получать доступ к данным в реальном времени на едином портале. Однако ограничением этого является то, что собранные данные не всегда могут быть синхронизированы, поскольку они получены из нескольких источников. Хранилище данных предоставляет единую унифицированную платформу для курирования данных. Хранилище данных объединяет данные из нескольких источников в общий формат и обычно используется в бионауках исключительно для поддержки принятия решений.[14]

Аналитика

Аналитические методы служат для преобразования биологических данных с использованием высокопроизводительных методов в клинически значимую информацию. В настоящее время существует множество программного обеспечения и методологий для запроса данных, и это число продолжает расти, поскольку все больше исследований проводятся и публикуются в таких журналах по биоинформатике, как Геномная биология, BMC Bioinformatics, BMC Genomics, и Биоинформатика. Чтобы определить лучшую аналитическую технику, были созданы такие инструменты, как Weka, которые позволяют шифровать массив программного обеспечения и выбирать наиболее подходящую технику, абстрагируясь от необходимости знать конкретную методологию.[15]

Интеграция

Интеграция данных включает разработку методов, использующих биологическую информацию в клинических условиях. Интеграция данных дает врачам инструменты для доступа к данным, открытие знаний, и поддержка принятия решений. Интеграция данных служит для использования огромного количества информации, доступной в биоинформатике, для улучшения здоровья и безопасности пациентов. Примером интеграции данных является использование системы поддержки принятия решений (DSS) на основе трансляционной биоинформатики. DSS, используемый в этом отношении, определяет корреляции у пациента электронные медицинские карты (EMR) и другие клинические информационные системы для помощи врачам в постановке диагноза.[14]

Расходы

Теперь компании могут предоставлять секвенирование генома и анализ как простая внешняя услуга. В версиях систем секвенирования второго и третьего поколения планируется увеличить количество геномов в день на каждый инструмент до 80. По словам генерального директора Complete Genomics Клиффа Рида, общий рынок секвенирования всего человеческого генома во всем мире увеличился. в пять раз в течение 2009 и 2010 годов и, по оценкам, в 2011 году будет 15 000 геномов. Более того, если цена упадет до 1000 долларов за геном, он утверждал, что компания все равно сможет получать прибыль. Компания также работает над усовершенствованием процессов, чтобы снизить внутренние затраты примерно до 100 долларов на геном, не считая затрат на подготовку образцов и оплату труда.[16][17]

Согласно Национальный институт исследования генома человека (NHGRI) затраты на секвенирование всего геном значительно снизилась с более чем 95 миллионов долларов в 2001 году до 7 666 долларов в январе 2012 года. Аналогичным образом, стоимость определения одной мегабазы ​​(миллиона баз) также снизилась с более чем 5000 долларов в 2001 году до 0,09 долларов в 2012 году. В 2008 году центры секвенирования перешли с Sanger- на основе (секвенирование завершения дидезокси-цепи) до «второго поколения» (или «следующего поколения») Секвенирование ДНК технологии. Это привело к значительному снижению затрат на секвенирование.[18]

Будущие направления

ЧМТ может сыграть значительную роль в медицине; тем не менее, многие проблемы все еще остаются. Общая цель TBI - «разработать подходы к информатике для связи между традиционно разрозненными источниками данных и знаний, позволяющими как генерировать, так и проверять новые гипотезы».[9] Текущие приложения TBI сталкиваются с проблемами из-за отсутствия стандартов, что приводит к разнообразию методологий сбора данных. Кроме того, возможности анализа и хранения ограничены из-за больших объемов данных, представленных в текущих исследованиях. Прогнозируется, что эта проблема обострится с развитием личной геномики, поскольку она приведет к еще большему накоплению данных.[6][9]

Проблемы также существуют в исследованиях лекарств и биомаркеров, геномной медицине, метагеномике дизайна белков, обнаружении инфекционных заболеваний, курирование данных, поиск литературы и разработка рабочего процесса.[6] Постоянная вера в возможности и преимущества TBI оправдывает дальнейшее финансирование инфраструктуры, защиты интеллектуальной собственности и политики доступности.[6][19]

Доступное финансирование для ЧМТ за последнее десятилетие увеличилось.[2] Спрос на трансляционные исследования в области биоинформатики частично связан с ростом во многих областях биоинформатика и информатика здоровья и частично из-за популярной поддержки таких проектов, как Проект "Геном человека".[7][9][20] Этот рост и приток финансирования позволили отрасли производить такие активы, как хранилище экспрессия гена данные и данные геномного масштаба, а также продвигается к концепции создания генома за 1000 долларов и завершения Проект "Геном человека".[9][20] Некоторые считают, что ЧМТ вызовет культурный сдвиг в способах обработки научной и клинической информации в фармацевтической промышленности, регулирующих органах и клинической практике. Это также рассматривается как средство отвода клинических испытаний от тематических исследований к анализу EMR.[8]

Лидеры в этой области представили многочисленные прогнозы относительно того, в каком направлении будет идти TBI и в каком направлении она должна двигаться. Сборник прогнозов выглядит следующим образом:

  1. Леско (2012) заявляет, что в Европейском союзе должна быть разработана стратегия преодоления разрыва между академической средой и промышленностью следующими способами - прямо цитируется:[8]
    1. Проверять и публиковать информационные данные и технологические модели в соответствии с принятыми стандартами, чтобы облегчить принятие,
    2. Преобразовать электронные медицинские карты, чтобы сделать их более доступными и совместимыми,
    3. Поощрять обмен информацией, привлекать регулирующие органы и
    4. Поощрять увеличение финансовой поддержки для роста и развития ЧМТ
  2. Альтман (2011) на саммите AMIA 2011 по TBI предсказывает, что:[10]
    1. Облачные вычисления внесут вклад в крупные биомедицинские открытия.
    2. Применение информатики в науке о стволовых клетках будет расти
    3. Иммунная геномика станет мощным источником данных
    4. Информатика проточной цитометрии будет расти
    5. Молекулярные данные и данные о экспрессии будут объединены для перепрофилирования лекарств
    6. Секвенирование экзома продлится дольше, чем ожидалось Прогресс в интерпретации некодирующих вариаций ДНК
  3. Саркар, Butte, Люсье, Tarczy-Hornoch & Ohno-Machado (2011) заявляют, что будущее TBI должно установить способ управления большим объемом доступных данных и стремиться интегрировать результаты таких проектов, как проект eMERGE (Электронные медицинские записи и геномика), финансируемый NIH, Personal Genome Project, Exome Project, Million Veteran Programme и 1000 Genomes Project.[9]

«В информационном мире изобилие информации означает недостаток чего-то еще - недостатка того, что потребляет информация. То, что потребляет информация, довольно очевидно: она поглощает внимание ее получателей. Следовательно, создается огромное количество информации. недостаток внимания и необходимость эффективно распределять это внимание среди избыточного количества источников информации, которые он может потреблять ». (Герберт Саймон, 1971).

Ассоциации, конференции и журналы

Ниже приведен список существующих ассоциаций, конференций и журналов, специализирующихся на TBI. Это ни в коем случае не исчерпывающий список, и его следует разрабатывать по мере обнаружения других.

Ассоциации
  • Американская ассоциация медицинской информатики: http://www.amia.org/
Конференции * сайты меняются ежегодно
  • Ежегодный симпозиум AMIA [Чикаго, 2012]
  • Совместные саммиты AMIA по трансляционной науке [Сан-Франциско, 2013]
  • Саммит AMIA по трансляционной биоинформатике (TBI) [Сан-Франциско, 2013]
  • Саммит AMIA по информатике клинических исследований (CRI) [Сан-Франциско, 2013]
  • TBC 2011, Конференция по трансляционной биоинформатике [Сеул, Корея, 2011]
  • TBC 2012, Конференция по трансляционной биоинформатике [Остров Чеджу, Корея, 2012]
  • TBC / ISCB-Asia 2013, Конференция по трансляционной биоинформатике [Сеул, Корея, 2013]
  • TBC / ISB 2014, Конференция по трансляционной биоинформатике [Циндао, Китай, 2014]
  • TBC2015, Конференция по трансляционной биоинформатике [Токио, Япония, 2015]
  • Рабочая конференция IFP / IMIA, Сопряжение био- и медицинской информатики [Амстердам, 2012]
Журналы
Специальные выпуски журналов по трансляционной биоинформатике

Обучение и сертификация

Неисчерпывающий список программ обучения и сертификации, относящихся к TBI, приведен ниже.

Рекомендации

  1. ^ «Трансляционная биоинформатика». Американская ассоциация медицинской информатики. Получено 24 сентября 2014.
  2. ^ а б c d е Бьют, А. Дж. (2008). «Трансляционная биоинформатика: взросление». Журнал Американской ассоциации медицинской информатики. 15 (6): 709–714. Дои:10.1197 / jamia.M2824. ЧВК  2585538. PMID  18755990.
  3. ^ Геоспиза. «Трансляционная биоинформатика». Архивировано из оригинал 28 мая 2011 г.. Получено 23 марта, 2011.
  4. ^ «Когда медицина и компьютерные науки сталкиваются». Иллинойский университет в Чикаго. Иллинойский университет в Чикаго. 2014 г.. Получено 18 сентября 2014.
  5. ^ «Колорадский институт клинических и трансляционных наук (CCTSI)». Получено 16 ноября, 2012.
  6. ^ а б c d е ж грамм час я j Узунис, К. А. (2012). «Взлет и упадок биоинформатики? Обещания и прогресс». PLOS вычислительная биология. 8 (4): 1–5. Дои:10.1371 / journal.pcbi.1002487. ЧВК  3343106. PMID  22570600.
  7. ^ а б Shah, N.H .; Jonquet, C .; Lussier, Y.A .; Tarzy-Hornoch, P .; Оно-Мачадо, Л. (2009). «Индексирование общедоступных наборов данных на основе онтологий для трансляционной биоинформатики». BMC Bioinformatics. 10 (2): S1. Дои:10.1186 / 1471-2105-10-S2-S1. ЧВК  2646250. PMID  19208184.
  8. ^ а б c d е ж Леско, Л. Дж. (2012). «Исследования лекарств и трансляционная биоинформатика». Клиническая фармакология и терапия. 91 (6): 960–962. Дои:10.1038 / clpt.2012.45. PMID  22609906.
  9. ^ а б c d е ж грамм Sarkar, I.N .; Butte, A.J .; Lussier, Y.A .; Tarczy-Hornoch, P .; Оно-Мачадо, Л. (2011). «Трансляционная биоинформатика: объединение знаний в биологической и клинической областях». J Am Med Inform Assoc. 18 (4): 345–357. Дои:10.1136 / amiajnl-2011-000245. ЧВК  3128415. PMID  21561873.
  10. ^ а б c d Альтман, Р. Б. «Трансляционная биоинформатика: итоги года». Получено 16 ноября, 2012.
  11. ^ Мендонка, Э. А. (2010). «Избранные материалы саммита 2010 г. по трансляционной биоинформатике». BMC Bioinformatics. 11 (9): 1–4. Дои:10.1186 / 1471-2105-11-S9-S1. ЧВК  2967739. PMID  21044356.
  12. ^ Канн, М. Г. (2010). «Достижения в трансляционной биоинформатике: вычислительные подходы для поиска генов болезней». Брифинги по биоинформатике. 11 (1): 96–110. Дои:10.1093 / bib / bbp048. ЧВК  2810112. PMID  20007728.
  13. ^ Дадли, Дж. Т. (2010). «Трансляционная биоинформатика в облаке: доступная альтернатива». Геномная медицина. 2 (8): 51. Дои:10,1186 / г 172. ЧВК  2945008. PMID  20691073.
  14. ^ а б Ян, Q (2010). «Трансляционная биоинформатика и подходы системной биологии для персонализированной медицины». Системная биология в открытии и разработке лекарств. Методы Мол биол. 662. С. 167–178. Дои:10.1007/978-1-60761-800-3_8. ISBN  978-1-60761-799-0. PMID  20824471.
  15. ^ Бьют, А. Дж. (2009). «Приложения трансляционной биоинформатики в геномной медицине» (PDF). Геном Мед. 1 (6): 64. Дои:10,1186 / г 64. ЧВК  2703873. PMID  19566916.
  16. ^ Хегер, М. «Полная геномика нацелена на 2015 год для новых инструментов с производительностью 80 геномов в день». Получено 1 ноября, 2012.
  17. ^ «Полная геномика». Получено 1 ноября, 2012.
  18. ^ Веттерстранд, К.А. «Стоимость секвенирования ДНК: данные программы секвенирования генома NHGRI (GSP)». Получено 3 ноября, 2012.
  19. ^ Azuaje, F.J .; Heymann, M .; Ternes, A .; Wienecke-Baldacchino, A .; Удар, Д .; Moes, D .; Шнайдер, Р. (2012). «Биоинформатика как движущая сила, а не пассажир трансляционных биомедицинских исследований: перспективы 6-й конференции по биоинформатике стран Бенилюкса» (PDF). Журнал клинической биоинформатики. 2 (7): 1–3. Дои:10.1186/2043-9113-2-7. ЧВК  3323358. PMID  22414553.
  20. ^ а б Butte, A.J .; Чен, Р. (2006). «Поиск геномных экспериментов, связанных с болезнями, в международном репозитории: первые шаги в трансляционной биоинформатике». AMIA Annu Symp Proc: 106–110. ЧВК  1839582. PMID  17238312.