Объект BioCompute - BioCompute Object

Объект BioCompute
СтатусАктивная рабочая группа IEEE
Связанные стандартыОбщий язык рабочего процесса
ЛицензияBSD-3-пункт
СокращениеBCO
Интернет сайтosf.io/ h59uh/


В Проект BioCompute Object (BCO) это инициатива сообщества по созданию основы для стандартизации и совместного использования вычислений и анализов, полученных из Секвенирование с высокой пропускной способностью (HTS - также упоминается как секвенирование следующего поколения или массово-параллельное секвенирование ). С тех пор проект был стандартизированный как IEEE 2791-2020, а файлы проекта хранятся в репозиторий с открытым исходным кодом. [1] В 22 июля 2020 г. Федерального реестра объявили, что FDA теперь поддерживает использование BioCompute (официально известный как IEEE 2791-2020) в нормативных документах, а также включение стандарта в каталог стандартов данных для представления данных HTS в NDA, ANDAs, BLA и IND к CBER, CDER, и CFSAN.

Изначально начинался как договор о сотрудничестве между Университет Джорджа Вашингтона и Управление по контролю за продуктами и лекарствами, проект расширился и включает более 20 университетов, биотехнологические компании, государственно-частные партнерства и фармацевтические компании, включая Seven Bridges и Гарвардская медицинская школа.[2] BCO призван облегчить обмен рабочими процессами HTS между различными организациями, такими как FDA, фармацевтические компании, контрактные исследовательские организации, поставщики биоинформатических платформ и академические исследователи. Из-за деликатного характера нормативных документов может быть опубликовано мало прямых ссылок на материалы. Тем не менее, в настоящее время проект финансируется для обучения рецензентов и администраторов FDA чтению и интерпретации BCO, и в настоящее время уже отправлено или почти отправлено 4 публикации.

Задний план

Одна из самых больших проблем в биоинформатике - это документирование и обмен научный рабочий процесс таким образом, чтобы вычисления и их результаты могли быть подвергнуты экспертной оценке или надежно воспроизведены.[3] Биоинформатика трубопроводы обычно используют несколько частей программного обеспечения, каждая из которых обычно имеет несколько доступных версий, несколько входных параметров, несколько выходов и, возможно, конфигурации для конкретной платформы. Как и в случае с экспериментальными параметрами в лабораторном протоколе, небольшие изменения вычислительных параметров могут иметь большое влияние на научную достоверность результатов. BioCompute Framework предоставляет объектно-ориентированный дизайн из которого может быть построен BCO, содержащий подробную информацию о трубопроводе и способах его использования, с цифровой подписью, и поделился. Изначально концепция BioCompute была разработана для удовлетворения нормативных требований FDA и анализа потребностей в оценке, валидации и проверке данных геномики. Тем не менее, структура Biocompute следует за принципами честных данных.[4] и может широко использоваться для общения и совместимость между различными платформами, отраслями, учеными и регулирующими органами[5]

Полезность

В качестве стандартизации геномных данных объекты BioCompute в основном полезны для трех групп пользователей: 1) академические исследователи, проводящие новые генетические эксперименты, 2) фармацевтические / биотехнологические компании, желающие представить свою работу в FDA для проверки регулирующими органами, и 3) клинические исследования. учреждения (больницы и лаборатории), предлагающие генетические тесты и персонализированная медицина. Полезность для академических исследователей заключается в возможности воспроизводить экспериментальные данные более точно и с меньшей неопределенностью. Полезность для организаций, желающих представить работу в FDA, - это оптимизированный подход, опять же с меньшей неопределенностью и способностью более точно воспроизводить работу. Для клинических условий критически важно, чтобы данные HTS и клинические метаданные передавались точным способом, в идеале стандартизированным способом, доступным для чтения любым заинтересованным сторонам, включая партнеров по регулирующим органам.

Формат

Объект BioCompute находится в json формат и, как минимум, содержит все версии программного обеспечения и параметры, необходимые для оценки или проверки вычислительного конвейера. Он также может содержать входные данные в виде файлов или ссылок, ссылочных геномов или исполняемых компонентов Docker. Объект BioCompute может быть интегрирован с HL7 FHIR как источник происхождения.[6] Также разрабатываются несколько совместных реализаций, которые используют ориентированный на отчеты формат BCO, в том числе CWL (одна из которых является частью активного государственного контракта с одним из основателей CWL на пилотирование и создание документации для совместного BCO-CWL, а также примеры) и РО.[7]

Консорциум BCO

Рабочая группа BioCompute Object предоставляет возможность различным заинтересованным сторонам вносить свой вклад в текущую практику BCO. Эта рабочая группа была сформирована в ходе подготовки к Семинар по вычислительным стандартам HTS для регуляторных наук, 2017 г., и изначально состоял из участников семинара. Постоянный рост рабочей группы BCO является прямым результатом взаимодействия различных заинтересованных сторон из всех заинтересованных сообществ в области стандартизации вычислительной обработки данных HTS. В Государственно-частное партнерство сформированные между университетами, частными компаниями по обработке геномных данных, программными платформами, правительством и регулирующими учреждениями, стали легкой точкой входа для новых лиц или организаций в проект BCO, чтобы они могли участвовать в обсуждении передовых методов работы с объектами.

Реализации

Простой R-пакет biocompute[8] может создавать, проверять и экспортировать объекты BioCompute. В Пакет соответствия геномики - это приложение Shiny, которое предлагает функции, аналогичные регулярным выражениям во всех современных текстовых редакторах. Есть несколько разработанных внутри компании Открытый исходный код программные пакеты и веб-приложения, реализующие спецификацию BioCompute, три из которых были развернуты в общедоступном AWS EC2 облако. К ним относятся экземпляр Высокопроизводительная интегрированная виртуальная среда, то Портал BioCompute[9] (веб-приложение на основе форм, которое может создавать и редактировать объекты BioCompute на основе IEEE-2791-2020 стандарт, и совместимый с BioCompute экземпляр Галактика.

использованная литература

  1. ^ Симонян В., Гокс Дж., Мазумдер Р. Биокомпьютерные объекты - шаг к оценке и подтверждению биомедицинских научных вычислений. КПК журнал фармацевтической науки и техники. 2017; 71 (2): 136-146. DOI: 10.5731 / pdajpst.2016.006734.
  2. ^ «Спецификации BioCompute Objects для усовершенствования анализа геномных данных». www.europeanpharmaceuticalreview.com. Получено 2017-12-21.
  3. ^ Сандве, Гейр Кьетил; Некрутенко, Антон; Тейлор, Джеймс; Ховиг, Эйвинд (24 октября 2013 г.). «Десять простых правил воспроизводимых вычислительных исследований». PLOS вычислительная биология. 9 (10): e1003285. Дои:10.1371 / journal.pcbi.1003285. ЧВК  3812051. PMID  24204232.
  4. ^ Уилкинсон, Марк Д .; Дюмонтье, Мишель; Ольберсберг, Айсбранд Ян; Эпплтон, Габриель; Акстон, Майлз; Баак, Арье; Бломберг, Никлас; Бойтен, Ян-Виллем; Сантос, Луис Бонино да Силва (2016-03-15). "Справедливые руководящие принципы управления научными данными и их рационального использования". Научные данные. 3: 160018. Дои:10.1038 / sdata.2016.18. ЧВК  4792175. PMID  26978244.
  5. ^ Альтеровиц, Гил; Дин, Деннис А .; Гобл, Кэрол; Крузо, Майкл Р .; Соиланд-Рейес, Стиан; Белл, Аманда; Хейс, Анаис; Кинг, Чарльз Хэдли Х .; Йохансон, Элейн; Томпсон, Элейн Э .; Дональдсон, Эрик; Tsang, Hsinyi S .; Гокс, Джереми; Almeida, Jonas S .; Го, Лидия; Вальдерхауг, Марк; Уолш, Пол; Кахсай, Робель; Блум, Тоби; Лай, Ючинг; Симонян, Ваган; Мазумдер, Раджа (21 сентября 2017 г.). «Обеспечение прецизионной медицины посредством стандартной передачи информации о происхождении, анализе и результатах NGS». bioRxiv: 191783. Дои:10.1101/191783 - через www.biorxiv.org.
  6. ^ «Происхождение-пример-биокомпьют-объект». HL7 FHIR, выпуск 3 (STU).
  7. ^ Сойленд-Рейес, Стиан (01.09.2020), hive-cwl-examples: Упаковка объектов BioCompute с помощью RO-Crate
  8. ^ «КРАН - Комплекс биокомпьютеров». cran.r-project.org. Получено 2019-11-28.
  9. ^ «Портал БиоКомпьютеров». github.com/biocompute-objects. Получено 2020-06-25.

внешние ссылки