Биоинформатика проточной цитометрии - Flow cytometry bioinformatics

Биоинформатика проточной цитометрии это применение биоинформатика к проточной цитометрии данные, которые включают в себя хранение, извлечение, организацию и анализ данных проточной цитометрии с использованием обширных вычислительных ресурсов и инструментов. Биоинформатика проточной цитометрии требует широкого использования и способствует развитию методов от вычислительная статистика и машинное обучение.Поточная цитометрия и связанные с ней методы позволяют количественно определять несколько независимых биомаркеры на большом количестве одиночных клетки. Быстрый рост многомерности и пропускной способности данных проточной цитометрии, особенно в 2000-х годах, привел к созданию множества методов вычислительного анализа, стандартов данных и общедоступных баз данных для обмена результатами.

Существуют вычислительные методы, помогающие в предварительной обработке данных проточной цитометрии, идентификации популяции клеток в ней, сопоставлении этих популяций клеток в образцах, а также выполнении диагностики и обнаружения с использованием результатов предыдущих шагов. Для предварительной обработки это включает компенсацию спектрального перекрытия, преобразование данные на шкалах, удобных для визуализации и анализа, оценки качества данных и нормализация данные по выборкам и экспериментам.Для идентификации населения доступны инструменты, помогающие традиционную ручную идентификацию популяций в двухмерном точечные диаграммы (стробирование), использовать уменьшение размерности для облегчения стробирования и автоматического поиска популяций в многомерном пространстве различными способами. Также можно охарактеризовать данные более полными способами, например, на основе плотности разделение двоичного пространства метод, известный как объединение вероятностей или комбинаторное стробирование. Наконец, диагностика с использованием данных проточной цитометрии может быть улучшена контролируемое обучение методы, а также открытие новых типов клеток, имеющих биологическое значение, с помощью высокопроизводительных статистических методов, как часть конвейеров, включающих все вышеупомянутые методы.

Открытые стандарты, данные и программного обеспечения также являются ключевыми частями биоинформатики проточной цитометрии. Стандарты данных включают широко принятый Стандарт проточной цитометрии (FCS), определяющий, как должны храниться данные цитометров, а также несколько новых стандартов, разрабатываемых Международным обществом по развитию цитометрии (ISAC), чтобы помочь в хранении более подробной информации об экспериментальном дизайне и этапах анализа. Открытые данные медленно растут с открытием базы данных CytoBank в 2010 г. и FlowRepository в 2012 г., обе из которых позволяют пользователям свободно распространять свои данные, а последняя из них была рекомендуется в качестве предпочтительного репозитория для данных, совместимых с MIFlowCyt, компанией ISAC. Программное обеспечение Open наиболее широко доступно в виде набора Биокондуктор пакеты, но также доступен для веб-исполнения на GenePattern Платформа.

Сбор информации

Принципиальная схема проточного цитометра, показывающая фокусировку жидкостной оболочки, лазера, оптики (в упрощенной форме, без фокусировки), фотоумножителей (ФЭУ), аналого-цифрового преобразователя и аналитической рабочей станции

Проточные цитометры работают гидродинамическая фокусировка подвешенные ячейки так, чтобы они отделялись друг от друга в потоке жидкости. поток опрашивается одним или несколькими лазерами, и в результате флуоресцентный и разбросанный свет обнаружен фотоумножители.Используя оптические фильтры, частности флуорофоры на или внутри ячеек можно количественно определить по пикам в их спектры излучения.Это может быть эндогенные флуорофоры Такие как хлорофилл или же трансгенный зеленый флуоресцентный белок, или это могут быть искусственные флуорофоры ковалентно связанный для обнаружения молекул, таких как антитела для обнаружения белки, или же зонды гибридизации для обнаружения ДНК или же РНК.

Возможность их количественного определения привела к тому, что проточная цитометрия используется в широком спектре приложений, включая, помимо прочего:

До начала 2000-х годов проточная цитометрия могла измерять только несколько флуоресцентных маркеров за раз. Однако с конца 1990-х до середины 2000-х годов быстрое развитие новых флуорофоров привело к появлению современных инструментов, способных количественно определять до 18 маркеров на клетку.[7] Совсем недавно новая технология массовой цитометрии заменяет флуорофоры на редкоземельные элементы обнаружен времяпролетная масс-спектрометрия, достигая способности измерять экспрессию 34 или более маркеров.[8]В то же время, микрофлюидный КПЦР методы обеспечивают метод, подобный проточной цитометрии, для количественного определения 48 или более молекул РНК на клетку.[9]Быстрое увеличение размерности данных проточной цитометрии в сочетании с разработкой высокопроизводительных роботизированных платформ, способных автоматически анализировать от сотен до тысяч образцов, создали потребность в улучшенных методах вычислительного анализа.[7]

Данные

Представление данных проточной цитометрии с прибора с тремя каналами рассеяния и 13 флуоресцентными каналами. Отображаются только значения для первых 30 (из сотен тысяч) ячеек.

Данные проточной цитометрии представлены в виде большой матрицы интенсивностей по M длинам волн по N событиям. Большинство событий будет относиться к определенной ячейке, хотя некоторые могут быть дублетами (парами ячеек, которые проходят через лазер близко друг к другу). Для каждого события записывается измеренная интенсивность флуоресценции в определенном диапазоне длин волн.

Измеренная интенсивность флуоресценции указывает количество этого флуорофора в клетке, что указывает на количество, связанное с молекулами детектора, такими как антитела. Таким образом, интенсивность флуоресценции может рассматриваться как показатель количества молекул детектора, присутствующих на клетке. Упрощенный, если не совсем точный способ рассмотрения данных проточной цитометрии представляет собой матрицу из M измерений, умноженных на N ячеек, где каждый элемент соответствует количеству молекул.

Этапы анализа данных вычислительной проточной цитометрии

Пример конвейера для анализа данных FCM и некоторых пакетов Bioconductor, относящихся к каждому этапу.

Процесс перехода от первичных данных FCM к диагностике заболеваний и обнаружению биомаркеров включает четыре основных этапа:

  1. Предварительная обработка данных (включая компенсацию, преобразование и нормализацию)
  2. Идентификация клеточной популяции (также известный как стробирование)
  3. Сопоставление популяций клеток для перекрестного сравнения выборок
  4. Связь популяций клеток с внешними переменными (диагностика и открытие)

Сохранение шагов, предпринятых в конкретной проточной цитометрии рабочий процесс поддерживается некоторым программным обеспечением проточной цитометрии и важен для воспроизводимости экспериментов проточной цитометрии. Однако сохраненные файлы рабочего пространства редко могут быть взаимозаменяемыми между программами.[10] Попыткой решить эту проблему является разработка Gating-ML. XML стандарт данных (более подробно обсуждается в разделе стандартов), который постепенно внедряется как в коммерческое, так и в программное обеспечение для проточной цитометрии с открытым исходным кодом.[11] Пакет CytoML R также заполняет пробел, импортируя / экспортируя Gating-ML, который совместим с программным обеспечением FlowJo, CytoBank и FACS Diva.

Предварительная обработка данных

Перед анализом данные проточной цитометрии обычно должны пройти предварительную обработку для удаления артефактов и данных низкого качества, а также для преобразования в оптимальном масштабе для идентификации представляющих интерес популяций клеток. Ниже приведены различные этапы типичного конвейера предварительной обработки проточной цитометрии.

Компенсация

Когда с одним лазером используется более одного флуорохрома, их спектры излучения часто перекрываются. Каждый конкретный флуорохром обычно измеряется с помощью полосового оптического фильтра, настроенного на узкую полосу на пике интенсивности излучения флуорохрома или рядом с ним. Результатом является то, что показание для любого данного флуорохрома фактически является суммой максимальной интенсивности излучения этого флуорохрома и интенсивности излучения. спектры всех других флуорохромов, где они перекрываются с этой полосой частот. Это перекрытие называется перетеканием, а процесс удаления перелива из данных проточной цитометрии называется компенсацией.[12]

Компенсация обычно выполняется путем запуска серии репрезентативных образцов, каждый из которых окрашен только для одного флуорохрома, чтобы получить измерения вклада каждого флуорохрома в каждый канал.[12]Общий сигнал, который необходимо удалить из каждого канала, можно вычислить, решив систему линейные уравнения на основе этих данных создать матрицу перелива, которая при перевернутый и умножение на необработанные данные цитометра дает скомпенсированные данные.[12][13]Процессы вычисления матрицы побочных эффектов или применения предварительно вычисленной матрицы побочных эффектов для компенсации данных проточной цитометрии являются стандартными функциями программного обеспечения проточной цитометрии.[14]

Трансформация

Популяции клеток, обнаруженные с помощью проточной цитометрии, часто описываются как имеющие приблизительно лог-нормальный выражение.[15]Таким образом, они традиционно были преобразованный к логарифмическая шкала В ранних цитометрах это часто выполнялось еще до сбора данных с помощью лог усилитель.В современных приборах данные обычно хранятся в линейной форме и перед анализом преобразуются в цифровом виде.

Однако данные компенсированной проточной цитометрии часто содержат отрицательные значения из-за компенсации, и действительно встречаются популяции клеток, которые имеют низкие средние значения и нормальное распределение.[16]Логарифмические преобразования не могут правильно обрабатывать отрицательные значения и плохо отображают нормально распределенные типы ячеек.[16][17]Альтернативные преобразования, которые решают эту проблему, включают лог-линейные гибридные преобразования Logicle.[16][18] и Hyperlog,[19] так же хорошо как гиперболический арксинус и Бокс-Кокс.[20]

Сравнение часто используемых преобразований пришло к выводу, что биэкспоненциальные преобразования и преобразования Бокса-Кокса при оптимальной параметризации обеспечивают наиболее четкую визуализацию и наименьшую дисперсию популяций клеток по выборкам.[17] Однако более позднее сравнение пакета flowTrans, использованного в этом сравнении, показало, что он не параметризовал преобразование Logicle способом, совместимым с другими реализациями, потенциально ставя эти результаты под сомнение.[21]

Контроль качества

В частности, в новых экспериментах с высокой пропускной способностью требуется визуализация методы, помогающие обнаружить технические ошибки в отдельных образцах. Один из подходов - визуализировать сводную статистику, такую ​​как эмпирические функции распределения отдельных размеров технических или биологических копий, чтобы убедиться, что они похожи.[22]Для большей строгости Тест Колмогорова – Смирнова может использоваться для определения отклонения отдельных образцов от нормы.[22]В Тест Граббса на выбросы может использоваться для обнаружения образцов, отклоняющихся от группы.

Метод контроля качества в многомерном пространстве состоит в использовании вероятностного биннинга с бинами, соответствующими всему набору данных, объединенных вместе.[23]Тогда стандартное отклонение количества ячеек, попадающих в ячейки в пределах каждой выборки, можно принять как меру многомерного сходства, при этом образцы, которые ближе к норме, имеют меньшее стандартное отклонение.[23]При использовании этого метода более высокое стандартное отклонение может указывать на выбросы, хотя это относительный показатель, поскольку абсолютное значение частично зависит от количества интервалов.

С помощью всех этих методов измеряется вариация между выборками. Однако это сочетание технических вариаций, вносимых приборами и обращением, и фактической биологической информации, которую желательно измерить. Устранение неоднозначности технического и биологического вклада в вариацию между образцами может быть трудной или невозможной задачей.[24]

Нормализация

В частности, в многоцентровых исследованиях технические вариации могут затруднить сопоставление биологически эквивалентных популяций клеток в разных образцах.Методы нормализации для устранения технических отклонений, часто возникающих из регистрация изображения методы, таким образом, являются критическим этапом во многих анализах проточной цитометрии. Нормализация одного маркера может быть выполнена с использованием регистрации ориентиров, в которой пики в оценка плотности ядра каждого образца идентифицируются и выравниваются по образцам.[24]

Выявление популяций клеток

Двумерные точечные диаграммы, охватывающие все три комбинации трех выбранных измерений. Цвета показывают сравнение консенсуса восьми независимых ворот с ручным управлением (многоугольники) и автоматических ворот (цветные точки). Консенсус ручных вентилей и алгоритмов был произведен с использованием пакета CLUE.[25] Рисунок воспроизведен из.[26]

Сложность исходных данных проточной цитометрии (десятки измерений от тысяч до миллионов клеток) затрудняет ответы на вопросы напрямую с помощью статистических тестов или контролируемого обучения. Таким образом, критическим шагом в анализе данных проточной цитометрии является снижение этой сложности до чего-то более легкого, при этом устанавливая общие черты для всех образцов. Обычно это включает идентификацию многомерных регионов, которые содержат функционально и фенотипически однородные группы клеток.[27] Это форма кластерный анализ. Для этого существует ряд методов, подробно описанных ниже.

Ворота

Данные, полученные с помощью проточных цитометров, могут быть отображены на одном или двух графиках. размеры произвести гистограмма или диаграмма рассеяния. Области на этих графиках могут быть последовательно разделены на основе флуоресценции. интенсивность, создав серию выделений подмножеств, называемых "ворота ". Эти ворота могут быть изготовлены с помощью программного обеспечения, например Flowjo,[28] ФТС Экспресс,[29] WinMDI,[30] CytoPaint (он же Paint-A-Gate),[31] VenturiOne, Cellcion, CellQuest Pro, Cytospec,[32] Калуца.[33] или flowCore.

В наборах данных с небольшим числом измерений и ограниченной технической и биологической вариативностью между выборками (например, в клинических лабораториях) ручной анализ конкретных популяций клеток может дать эффективные и воспроизводимые результаты. Однако исследовательский анализ большого количества популяций клеток в наборе данных большой размерности невозможен.[34] Кроме того, ручной анализ в менее контролируемых условиях (например, межлабораторные исследования) может увеличить общий коэффициент ошибок исследования.[35] В одном исследовании несколько вычислительных алгоритмов стробирования работали лучше, чем ручной анализ при наличии некоторого отклонения.[26] Однако, несмотря на значительные успехи в вычислительном анализе, ручное стробирование остается основным решением для идентификации конкретных редких популяций клеток, которые плохо отделены от других типов клеток.

Стробирование с уменьшением размеров

Количество диаграмм рассеяния, которые необходимо исследовать, увеличивается пропорционально квадрату количества измеренных маркеров (или быстрее, поскольку некоторые маркеры необходимо исследовать несколько раз для каждой группы ячеек, чтобы устранить многомерные различия между типами ячеек, которые кажутся похожи в большинстве маркеров).[36] Чтобы решить эту проблему, Анализ главных компонентов был использован для суммирования многомерных наборов данных с использованием комбинации маркеров, которая максимизирует дисперсию всех точек данных.[37] Однако PCA является линейным методом и не может сохранять сложные и нелинейные зависимости. Совсем недавно двумерный минимальное остовное дерево макеты использовались для руководства процессом ручного стробирования. Понижающая выборка и кластеризация на основе плотности использовались для лучшего представления редких популяций и управления временем и сложностью памяти в процессе построения минимального связующего дерева.[38] Более сложный уменьшение размеров алгоритмы еще предстоит исследовать.[39]

Популяции клеток в наборе данных многомерной масс-цитометрии, обработанные вручную после уменьшения размеров с использованием 2D-макета для минимального остовного дерева. Рисунок воспроизведен по данным, представленным в.[40]

Автоматизированный строб

Разработка вычислительных инструментов для идентификации клеточных популяций стала областью активных исследований только с 2008 года. кластеризация недавно были разработаны подходы, включая алгоритмы на основе моделей (например, flowClust[41] и ПЛАМЯ[42]), алгоритмы на основе плотности (например, FLOCK[43] и SWIFT, подходы на основе графов (например, SamSPECTRAL[44]) и совсем недавно - гибриды нескольких подходов (flowMeans[45] и flowPeaks[46]). Эти алгоритмы различаются по памяти и временной сложности, требованиям к программному обеспечению, способности автоматически определять необходимое количество популяций клеток, а также их чувствительности и специфичности. Проект FlowCAP (Flow Cytometry: Critical Assessment of Population Identification Methods), при активном участии большинства академических групп, занимающихся исследованиями в этой области, предоставляет способ объективного перекрестного сравнения современных подходов к автоматизированному анализу.[26]В других опросах также сравнивались инструменты автоматического стробирования по нескольким наборам данных.[47][48][49][50]

Вероятностные методы биннинга

Пример стробирования разности частот, созданный с помощью пакета flowFP Bioconductor. Точки представляют отдельные события в файле FCS. Прямоугольники представляют собой корзины.

Биннинг вероятностей - это метод анализа без стробирования, в котором данные проточной цитометрии разделяются на квантили на одномерной основе.[51] Затем расположение квантилей можно использовать для проверки различий между выборками (в переменных, которые не разделяются) с помощью критерия хи-квадрат.[51]

Позже это было расширено на несколько измерений в форме стробирования разности частот, разделение двоичного пространства метод, при котором данные итеративно разделяются по медиане.[52] Эти разделы (или бункеры) соответствуют контрольному образцу. Затем долю клеток, попадающих в каждую ячейку в тестовых образцах, можно сравнить с контрольным образцом с помощью критерия хи-квадрат.

Наконец, цитометрический фингерпринт использует вариант стробирования разности частот, чтобы установить интервалы и измерить для серии образцов, сколько клеток попадает в каждый интервал.[23] Эти бины можно использовать как ворота и использовать для последующего анализа аналогично автоматическим методам стробирования.

Комбинаторный строб

Алгоритмы высокоразмерной кластеризации часто не могут идентифицировать редкие типы клеток, которые плохо отделены от других основных популяций. Сопоставить эти небольшие популяции клеток в нескольких образцах еще сложнее. При ручном анализе предварительные биологические знания (например, биологические меры контроля) служат руководством для разумной идентификации этих популяций. Однако интеграция этой информации в исследовательский процесс кластеризации (например, как в полу-контролируемое обучение ) не увенчалась успехом.

Альтернативой высокоразмерной кластеризации является идентификация клеточных популяций с использованием одного маркера за раз, а затем их объединение для создания многомерных кластеров. Эта функция была впервые реализована в FlowJo.[28] Алгоритм flowType основан на этой структуре, позволяя исключить маркеры.[53] Это позволяет разрабатывать статистические инструменты (например, RchyOptimyx), которые могут исследовать важность каждого маркера и исключать многомерные избыточности.[54]

Диагностика и открытие

Обзор конвейера flowType / RchyOptimyx для определения коррелятов защиты от ВИЧ: во-первых, десятки тысяч клеточных популяций идентифицируются путем объединения одномерных разделов (первая панель). Затем популяции клеток анализируются с использованием статистического теста (и метода Бонферрони для множественной коррекции тестирования) для выявления тех, которые коррелируют с информацией о выживаемости. Третья панель показывает полную иерархию стробирования, описывающую все возможные стратегии стробирования этой популяции клеток. Этот график может быть использован для определения «лучшей» стратегии стробирования (то есть той, в которой наиболее важные маркеры появляются раньше). Эти иерархии для всех выбранных фенотипов показаны на панели 4. На панели 5 эти иерархии объединены в один график, который суммирует весь набор данных и демонстрирует компромисс между количеством маркеров, вовлеченных в каждый фенотип, и значимостью корреляции. с клиническим исходом (например, по оценке Оценка Каплана – Мейера на панели 6). Рисунок частично воспроизведен из[53] и.[54]

После идентификации интересующей популяции клеток может быть выполнен перекрестный анализ образцов для выявления фенотипических или функциональных вариаций, которые коррелируют с внешней переменной (например, клиническим исходом). Эти исследования можно разделить на две основные группы:

Диагностика

В этих исследованиях обычно ставится цель диагностировать заболевание (или подкласс заболевания), используя вариации в одной или нескольких популяциях клеток. Например, можно использовать многомерную кластеризацию, чтобы идентифицировать набор кластеров, сопоставить их по всем выборкам, а затем использовать контролируемое обучение для построения классификатора для прогнозирования интересующих классов (например, этот подход может быть использован для повышения точности классификации конкретных подтипов лимфомы[55]). В качестве альтернативы, все ячейки из всей когорты могут быть объединены в единое многомерное пространство для кластеризации перед классификацией.[56] Этот подход особенно подходит для наборов данных с большим количеством биологических вариаций (в которых сопоставление перекрестных выборок затруднено), но требует тщательного контроля технических вариаций.[57]

Открытие

В установках обнаружения цель состоит в том, чтобы идентифицировать и описывать популяции клеток, коррелирующие с внешней переменной (в отличие от постановки диагноза, в которой цель состоит в том, чтобы объединить прогностическую силу нескольких типов клеток для максимальной точности результатов). Подобно варианту использования диагностики, сопоставление кластеров в многомерном пространстве можно использовать для исследовательского анализа, но описательная сила этого подхода очень ограничена, так как трудно охарактеризовать и визуализировать популяцию клеток в многомерном пространстве без сначала уменьшив размерность.[56][58] Наконец, комбинаторные подходы стробирования оказались особенно успешными в исследовательском анализе данных FCM. Упрощенное представление невероятно сложных оценок (SPICE) - это программный пакет, который может использовать стробирующую функцию FlowJo для статистической оценки широкого диапазона различных популяций клеток и визуализации тех, которые коррелируют с внешним результатом. flowType и RchyOptimyx (как обсуждалось выше) расширяют эту технику, добавляя возможность исследования влияния независимых маркеров на общую корреляцию с внешним результатом. Это позволяет удалить ненужные маркеры и обеспечивает простую визуализацию всех идентифицированных типов клеток. В недавнем анализе большой (n = 466) когорты ВИЧ-положительных пациентов этот конвейер выявил три коррелята защиты от ВИЧ, только один из которых был ранее определен посредством обширного ручного анализа того же набора данных.[53]

Форматы данных и обмен

Стандарт проточной цитометрии

Стандарт проточной цитометрии (FCS) был разработан в 1984 году для записи и обмена данными проточной цитометрии.[59] С тех пор FCS стала стандартом формат файла поддерживается всеми поставщиками программного и аппаратного обеспечения для проточной цитометрии. Спецификация FCS традиционно разрабатывалась и поддерживалась Международным обществом по развитию цитометрии (ISAC).[60] За прошедшие годы были внесены обновления для адаптации к технологическим достижениям как в проточной цитометрии, так и в вычислительных технологиях с FCS 2.0, представленной в 1990 году.[61] FCS 3.0 в 1997 году,[62] и самая последняя спецификация FCS 3.1 в 2010 году.[63] FCS раньше был единственным широко распространенным форматом файлов в проточной цитометрии. Недавно ISAC разработала дополнительные стандартные форматы файлов.

netCDF

ISAC рассматривает возможность замены FCS специальной версией проточной цитометрии. Форма общих данных сети (netCDF) формат файла.[64]netCDF - это набор свободно доступных программных библиотек и машинно-независимых форматов данных, которые поддерживают создание, доступ и совместное использование научных данных, ориентированных на массивы. В 2008 году ISAC разработал первую версию соглашений netCDF для хранения необработанных данных проточной цитометрии.[65]

Стандарт архивной цитометрии (ACS)

Стандарт архивной цитометрии (ACS) разрабатывается для объединения данных с различными компонентами, описывающими цитометрические эксперименты.[66] Он фиксирует отношения между данными, метаданными, файлами анализа и другими компонентами и включает поддержку контрольных журналов, управления версиями и цифровых подписей. Контейнер ACS основан на Формат файла ZIP с XML -основанное оглавление, определяющее отношения между файлами в контейнере. В Подпись XML W3C Была принята рекомендация, позволяющая использовать цифровые подписи компонентов в контейнере ACS. Первоначальный проект ACS был разработан в 2007 году и завершен в 2010 году. С тех пор поддержка ACS была введена в нескольких программных инструментах, включая FlowJo и Cytobank.

Gating-ML

Отсутствие межсетевого взаимодействия традиционно является узким местом, препятствующим воспроизводимости анализа данных проточной цитометрии и использованию множества аналитических инструментов. Чтобы устранить этот недостаток, ISAC разработал Gating-ML, основанный на XML механизм для формального описания шлюзов и связанных преобразований (масштабирования) данных.[10]Предварительная версия рекомендации Gating-ML была одобрена ISAC в 2008 году и частично поддерживается такими инструментами, как FlowJo, flowUtils, библиотеки CytoML в R / BioConductor и FlowRepository.[66] Он поддерживает прямоугольные вентили, полигональные вентили, выпуклые многогранники, эллипсоиды, деревья решений и логические коллекции любых других типов вентилей. Кроме того, он включает в себя десятки встроенных общедоступных преобразований, которые оказались потенциально полезными для отображения или анализа данных цитометрии. В 2013 году Gating-ML версия 2.0 была одобрена Целевой группой ISAC по стандартам данных в качестве рекомендации. Эта новая версия предлагает немного меньшую гибкость с точки зрения возможностей описания стробирования; однако его также значительно проще реализовать в программных инструментах.[11]

Результаты классификации (CLR)

Формат файла результатов классификации (CLR)[67] был разработан для стандартного обмена результатами ручного стробирования и алгоритмической классификации, чтобы иметь возможность составлять отчеты и обрабатывать классификацию. CLR основан на обычно поддерживаемых Формат файла CSV со столбцами, соответствующими различным классам, и значениями ячеек, содержащими вероятность того, что событие является членом определенного класса. Они фиксируются как значения от 0 до 1. Простота формата и его совместимость с обычными инструментами работы с электронными таблицами были основными требованиями, определяющими дизайн спецификации. Хотя он был первоначально разработан для области проточной цитометрии, он применим в любой области, где требуется фиксировать нечеткую или однозначную классификацию практически любых типов объектов.

Публичные данные и программное обеспечение

Как и в других областях биоинформатики, разработка новых методов в первую очередь приняла форму бесплатное программное обеспечение с открытым исходным кодом, и создано несколько баз данных для внесения открытые данные.

AutoGate

AutoGate[68] выполняет компенсацию, стробирование, предварительный просмотр кластеров, поиск с исчерпывающей проекцией (EPP), многомерное масштабирование и фенограмму, создает визуальную дендограмму для выражения готовности HiD. Это бесплатно для исследователей и врачей академических, государственных и некоммерческих организаций.

Биокондуктор

Проект Bioconductor - это хранилище бесплатного программного обеспечения с открытым исходным кодом, в основном написанного на Язык программирования R.[69]По состоянию на июль 2013 года Bioconductor содержал 21 программный пакет для обработки данных проточной цитометрии.[70]Эти пакеты охватывают большую часть функциональных возможностей, описанных ранее в этой статье.

GenePattern

GenePattern - это платформа преимущественно для геномного анализа с более чем 200 инструментами для анализа экспрессии генов, протеомики и других данных. Веб-интерфейс обеспечивает легкий доступ к этим инструментам и позволяет создавать автоматизированные конвейеры анализа, обеспечивающие воспроизводимые исследования. Недавно был разработан пакет GenePattern Flow Cytometry Suite, чтобы предоставить экспериментаторам без навыков программирования передовые инструменты анализа данных проточной цитометрии. Он содержит около 40 модулей проточной цитометрии GenePattern с открытым исходным кодом, охватывающих методы, от базовой обработки стандартных файлов проточной цитометрии (т. Е. FCS) до расширенных алгоритмов для автоматической идентификации популяций клеток, нормализации и оценки качества. Внутри большинство этих модулей используют функциональные возможности, разработанные в BioConductor.

Большая часть функциональных возможностей пакетов Bioconductor для анализа проточной цитометрии была упакована для использования с GenePattern.[71] система рабочего процесса в виде пакета GenePattern Flow Cytometry Suite.[72]

FACSanadu

FACSanadu[73] - портативное приложение с открытым исходным кодом для визуализации и анализа данных FCS. В отличие от Bioconductor, это интерактивная программа, предназначенная для обычных аналитиков, не являющихся программистами. Он поддерживает стандартные файлы FCS, а также данные профиля COPAS.

Публичные базы данных

Минимальная информация об эксперименте по проточной цитометрии (MIFlowCyt) требует, чтобы любые данные проточной цитометрии, используемые в публикации, были доступны, хотя это не включает требование, чтобы они были депонированы в общедоступной базе данных.[74]Таким образом, хотя журналы Cytometry Part A и B, а также все журналы из Издательская группа Nature требуется соответствие MIFlowCyt, общедоступных данных проточной цитометрии по-прежнему относительно мало, однако были предприняты некоторые усилия по созданию общедоступных баз данных.

Во-первых, CytoBank, представляющий собой полноценную веб-платформу для хранения и анализа данных проточной цитометрии, стал доступен общественности в ограниченной форме.[75]В 2012 году при поддержке ISAC был разработан FlowRepository с использованием кодовой базы CytoBank в качестве общедоступного репозитория данных проточной цитометрии.[76]FlowRepository обеспечивает соответствие MIFlowCyt,[77] и по состоянию на июль 2013 г. содержал 65 общедоступных наборов данных.[78]

Наборы данных

В 2012 году сообщество проточной цитометрии начало выпускать набор общедоступных наборов данных. Подмножество этих наборов данных, представляющих существующие проблемы анализа данных, описывается ниже. Для сравнения с ручным гейтированием проект FlowCAP-I выпустил пять наборов данных, стробированных вручную специалистами-аналитиками, а два из них - восьмью независимыми аналитиками.[26] Проект FlowCAP-II включал три набора данных для двоичной классификации, а также сообщил о нескольких алгоритмах, которые смогли идеально классифицировать эти образцы. FlowCAP-III включал два больших набора данных для сравнения с ручными воротами, а также еще один сложный набор данных выборочной классификации. По состоянию на март 2013 года публичный выпуск FlowCAP-III все еще продолжался.[79] Наборы данных, используемые в FlowCAP-I, II и III, имеют небольшое количество субъектов или параметров. Однако недавно было выпущено несколько более сложных наборов клинических данных, включая набор данных о 466 ВИЧ-инфицированных субъектах, который предоставляет как анализы с 14 параметрами, так и достаточную клиническую информацию для анализа выживаемости.[54][80][81][82]

Другой класс наборов данных - это методы массовой цитометрии более высокого измерения. Типичным представителем этого класса наборов данных является исследование, которое включает анализ двух образцов костного мозга с использованием более 30 поверхностных или внутриклеточных маркеров при широком диапазоне различных стимуляций.[8] Исходные данные для этого набора данных общедоступны, как описано в рукописи, а ручной анализ маркеров поверхности доступен по запросу от авторов.

Открытые проблемы

Несмотря на быстрое развитие в области биоинформатики проточной цитометрии, еще предстоит решить несколько проблем.

Вариабельность экспериментов с проточной цитометрией возникает из-за биологической вариабельности образцов, технических вариаций используемых инструментов, а также методов анализа.В 2010 году группа исследователей из Стэндфордский Университет и Национальные институты здоровья отметил, что, хотя технические вариации могут быть улучшены путем стандартизации обработки проб, настройки прибора и выбора реагентов, решение вариаций в методах анализа потребует аналогичной стандартизации и вычислительной автоматизации методов стробирования.[83]Они также пришли к выводу, что централизация как данных, так и анализа может помочь в уменьшении вариативности между экспериментами и в сравнении результатов.[83]

Этому вторила и другая группа Тихоокеанские биологические науки и исследователи Стэнфордского университета, которые предположили, что облачные вычисления может обеспечить централизованный, стандартизованный и высокопроизводительный анализ экспериментов по проточной цитометрии.[84]Они также подчеркнули, что текущая разработка и внедрение стандартных форматов данных может и дальше способствовать снижению вариабельности экспериментов.[84]Они также предположили, что потребуются новые методы для моделирования и обобщения результатов высокопроизводительного анализа способами, которые могут быть интерпретированы биологами.[84] а также способы интеграции крупномасштабных данных проточной цитометрии с другой высокопроизводительной биологической информацией, такой как экспрессия гена, генетическая вариация, метаболит уровни и болезненные состояния.[84]

Смотрите также

Рекомендации

Эта статья была адаптирована из следующего источника под CC BY 4.0 лицензия (2013 ) (отчеты рецензента ): «Биоинформатика проточной цитометрии», PLOS вычислительная биология, 9 (12): e1003365, 5 декабря 2013 г., Дои:10.1371 / JOURNAL.PCBI.1003365, ISSN  1553-734X, ЧВК  3867282, PMID  24363631, Викиданные  Q21045422

  1. ^ Брандо, Б .; Barnett, D .; Janossy, G .; Мэнди, Ф .; Autran, B .; Rothe, G .; Scarpati, B .; d'Avanzo, G .; d'Hautcourt, J. L .; Lenkei, R .; Schmitz, G .; Kunkl, A .; Chianese, R .; Папа, С .; Гратама, Дж. У. (2000). «Цитофлуориметрические методы оценки абсолютного количества субпопуляций клеток в крови». Цитометрия. 42 (6): 327–346. Дои:10.1002 / 1097-0320 (20001215) 42: 6 <327 :: AID-CYTO1000> 3.0.CO; 2-F. PMID  11135287.
  2. ^ Ferreira-Facio, C.S .; Milito, C .; Ботафого, В .; Фонтана, М .; Thiago, L. S .; Oliveira, E .; Da Rocha-Filho, A.S .; Werneck, F .; Форни, Д. Н .; Декермахер, С .; De Azambuja, A. P .; Ferman, S.E .; Де Фариа, П. А. Н. С .; Land, M. G. P .; Орфао, А .; Коста, Э. С. (2013). Азиз, Сайед А. (ред.). «Вклад иммунофенотипирования в многопараметрическую проточную цитометрию в диагностический скрининг и классификацию рака у детей». PLOS ONE. 8 (3): e55534. Bibcode:2013PLoSO ... 855534F. Дои:10.1371 / journal.pone.0055534. ЧВК  3589426. PMID  23472067.
  3. ^ Wu, D .; Wood, B.L .; Фромм, Дж. Р. (2013). "Проточная цитометрия для неходжкинской и классической лимфомы Ходжкина". Лимфома. Методы молекулярной биологии. 971. С. 27–47. Дои:10.1007/978-1-62703-269-8_2. ISBN  978-1-62703-268-1. PMID  23296956.
  4. ^ Wang, Y .; Hammes, F .; Де Рой, К .; Verstraete, W .; Бун, Н. (2010). «Прошлое, настоящее и будущее применения проточной цитометрии в водной микробиологии». Тенденции в биотехнологии. 28 (8): 416–424. Дои:10.1016 / j.tibtech.2010.04.006. PMID  20541271.
  5. ^ Johnson, L.A .; Flook, J. P .; Смотрите, M. V .; Пинкель, Д. (1987). «Поточная сортировка сперматозоидов, несущих X и Y хромосомы, на две популяции». Gamete Research. 16 (1): 1–9. Дои:10.1002 / мрд.1120160102. PMID  3506896.
  6. ^ Baerlocher, G.M .; Vulto, I .; Де Йонг, G .; Лансдорп, П. М. (2006). «Проточная цитометрия и FISH для измерения средней длины теломер (проточная FISH)». Протоколы природы. 1 (5): 2365–2376. Дои:10.1038 / nprot.2006.263. PMID  17406480. S2CID  20463557.
  7. ^ а б Chattopadhyay, P.K .; Hogerkorp, C.M .; Рёдерер, М. (2008). «Хроматический взрыв: развитие и будущее многопараметрической проточной цитометрии». Иммунология. 125 (4): 441–449. Дои:10.1111 / j.1365-2567.2008.02989.x. ЧВК  2612557. PMID  19137647.
  8. ^ а б Behbehani, G.K .; Bendall, S.C .; Clutter, M. R .; Fantl, W. J .; Нолан, Г. П. (2012). «Цитометрия единичных клеток, адаптированная для измерения клеточного цикла». Цитометрия Часть А. 81A (7): 552–566. Дои:10.1002 / cyto.a.22075. ЧВК  3667754. PMID  22693166.
  9. ^ Уайт, А.К .; Vaninsberghe, M .; Петров, О. И .; Hamidi, M .; Сикорский, Д .; Marra, M. A .; Piret, J .; Aparicio, S .; Хансен, К. Л. (2011). «Высокопроизводительная микрофлюидная одноклеточная RT-qPCR». Труды Национальной академии наук. 108 (34): 13999–14004. Bibcode:2011PNAS..10813999W. Дои:10.1073 / pnas.1019446108. ЧВК  3161570. PMID  21808033.
  10. ^ а б Spidlen, J .; Leif, R.C .; Мур, В .; Roederer, M .; Brinkman, R. R .; Бринкман, Р. Р. (2008). "Gating-ML: описание гейтинга на основе XML в проточной цитометрии". Цитометрия Часть А. 73A (12): 1151–1157. Дои:10.1002 / cyto.a.20637. ЧВК  2585156. PMID  18773465.
  11. ^ а б Гейтинг-ML 2.0 (PDF) (Отчет). Международное общество развития цитометрии. 2013.
  12. ^ а б c Родерер, М. (2002). Дж. Пол Робинсон (ред.). Компенсация в проточной цитометрии. Текущие протоколы цитометрии. Глава 1. С. Блок Uni1.14. Дои:10.1002 / 0471142956.cy0114s22. ISBN  978-0471142959. PMID  18770762. S2CID  7256386.
  13. ^ Bagwell, C.B .; Адамс, Э. Г. (1993). «Компенсация перекрытия спектров флуоресценции для любого количества параметров проточной цитометрии». Летопись Нью-Йоркской академии наук. 677 (1): 167–184. Bibcode:1993НЯСА.677..167Б. Дои:10.1111 / j.1749-6632.1993.tb38775.x. PMID  8494206.
  14. ^ Hahne, F .; Lemeur, N .; Brinkman, R. R .; Ellis, B .; Haaland, P .; Sarkar, D .; Spidlen, J .; Штамм, E .; Джентльмен, Р. (2009). «FlowCore: пакет Bioconductor для высокопроизводительной проточной цитометрии». BMC Bioinformatics. 10: 106. Дои:10.1186/1471-2105-10-106. ЧВК  2684747. PMID  19358741.
  15. ^ Шапиро, Ховард М. (2003). Практическая проточная цитометрия. Нью-Йорк: Вили-Лисс. п. 235. ISBN  978-0-471-41125-3.
  16. ^ а б c Паркс Д.Р., Родерер М., Мур В.А. (2006). «Новый метод отображения« Logicle »позволяет избежать ложных эффектов логарифмического масштабирования для слабых сигналов и скомпенсированных данных». Цитометрия Часть А. 69 (6): 541–51. Дои:10.1002 / cyto.a.20258. PMID  16604519. S2CID  8012792.
  17. ^ а б Финак, Г .; Perez, J.M .; Weng, A .; Готтардо, Р. (2010). «Оптимизация преобразований для автоматизированного высокопроизводительного анализа данных проточной цитометрии». BMC Bioinformatics. 11: 546. Дои:10.1186/1471-2105-11-546. ЧВК  3243046. PMID  21050468.
  18. ^ Moore, W. A .; Паркс, Д. Р. (2012). «Обновление для шкалы данных логики, включая реализации операционного кода». Цитометрия Часть А. 81A (4): 273–277. Дои:10.1002 / cyto.a.22030. ЧВК  4761345. PMID  22411901.
  19. ^ Багвелл, К. Б. (2005). «Hyperlog? Гибкое преобразование типа журнала для отрицательных, нулевых и положительных значений». Цитометрия Часть А. 64A (1): 34–42. Дои:10.1002 / cyto.a.20114. PMID  15700280. S2CID  13705174.
  20. ^ Lo, K .; Brinkman, R. R .; Готтардо, Р. (2008). «Автоматическое управление данными проточной цитометрии с помощью надежной кластеризации на основе моделей». Цитометрия Часть А. 73A (4): 321–332. Дои:10.1002 / cyto.a.20531. PMID  18307272. S2CID  2943705.
  21. ^ Qian, Y .; Liu, Y .; Кэмпбелл, Дж .; Thomson, E .; Kong, Y.M .; Шойерманн, Р. Х. (2012). «FCSTrans: программная система с открытым исходным кодом для преобразования файлов FCS и преобразования данных». Цитометрия Часть А. 81A (5): 353–356. Дои:10.1002 / cyto.a.22037. ЧВК  3932304. PMID  22431383.
  22. ^ а б Le Meur, N .; Россини, А .; Гаспаретто, М .; Smith, C .; Brinkman, R. R .; Джентльмен, Р. (2007). «Оценка качества данных проточной цитометрии без проводов в высокопроизводительных экспериментах». Цитометрия Часть А. 71A (6): 393–403. Дои:10.1002 / cyto.a.20396. ЧВК  2768034. PMID  17366638.
  23. ^ а б c Rogers, W. T .; Moser, A.R .; Holyst, H.A .; Бэнтэ, А .; Mohler, E. R .; Scangas, G .; Мур, Дж. С. (2008). «Цитометрический отпечаток пальца: количественная характеристика многомерного распределения». Цитометрия Часть А. 73A (5): 430–441. Дои:10.1002 / cyto.a.20545. PMID  18383310. S2CID  23555926.
  24. ^ а б Hahne, F .; Ходабахши, А. Х .; Башашати, А .; Wong, C.J .; Gascoyne, R.D .; Weng, A. P .; Сейферт-Марголис, В .; Bourcier, K .; Asare, A .; Lumley, T .; Джентльмен, Р .; Бринкман, Р. Р. (2009). «Поканальные методы нормализации данных проточной цитометрии». Цитометрия Часть А. 77 (2): 121–131. Дои:10.1002 / cyto.a.20823. ЧВК  3648208. PMID  19899135.
  25. ^ «КЛЕЙ пакет». Получено 2013-02-15.
  26. ^ а б c d Aghaeepour, N .; Финак, Г .; Flowcap, D .; Сон, А. Х .; Hoos, P .; Mosmann, G .; Brinkman, J .; Gottardo, I .; Scheuermann, S.A .; Bramson, J .; Карнизы, C .; Weng, A. P .; Iii, E. S. F .; Хо, К .; Коллманн, Т .; Роджерс, В .; De Rosa, S .; Dalal, B .; Азад, А .; Pothen, A .; Брандес, А .; Bretschneider, H .; Bruggner, R .; Finck, R .; Jia, R .; Циммерман, Н .; Linderman, M .; Dill, D .; Nolan, G .; Чан, К. (2013). «Критическая оценка методов анализа данных автоматической проточной цитометрии». Природные методы. 10 (3): 228–238. Дои:10.1038 / nmeth.2365. ЧВК  3906045. PMID  23396282.
  27. ^ Lugli, E .; Roederer, M .; Коссарицца, А. (2010). «Анализ данных в проточной цитометрии: будущее только начинается». Цитометрия Часть А. 77A (7): 705–713. Дои:10.1002 / cyto.a.20901. ЧВК  2909632. PMID  20583274.
  28. ^ а б "FlowJo". Архивировано из оригинал на 2013-05-03. Получено 2013-04-05.
  29. ^ «ФТС Экспресс». Получено 2013-04-03.
  30. ^ "Страница программного обеспечения для цитометрии TSRI". Архивировано из оригинал в 1996-11-19. Получено 2009-09-03.
  31. ^ «CytoPaint Classic». Получено 2013-04-05.
  32. ^ "Страница программного обеспечения для цитометрии PUCL". Получено 2011-07-07.
  33. ^ «Бекман Коултер». Получено 2013-02-10.
  34. ^ Bendall, S.C .; Нолан, Г. П. (2012). «От единичных клеток к глубоким фенотипам при раке». Природа Биотехнологии. 30 (7): 639–647. Дои:10.1038 / nbt.2283. PMID  22781693. S2CID  163651.
  35. ^ Maecker, H.T .; Rinfret, A .; d'Souza, P .; Darden, J .; Roig, E .; Landry, C .; Hayes, P .; Birungi, J .; Anzala, O .; Гарсия, М .; Harari, A .; Франк, I .; Baydo, R .; Baker, M .; Holbrook, J .; Ottinger, J .; Lamoreaux, L .; Epling, C.L .; Sinclair, E .; Суни, М. А .; Punt, K .; Calarota, S .; El-Bahi, S .; Alter, G .; Maila, H .; Kuta, E .; Cox, J .; Серый, C .; Альтфельд, М .; Нугаред, Н. (2005). «Стандартизация цитокиновых тестов проточной цитометрии». BMC Иммунология. 6: 13. Дои:10.1186/1471-2172-6-13. ЧВК  1184077. PMID  15978127.
  36. ^ Дева, П. Ф .; Гиббс, Дж. Дж. (2011). «Проточная цитометрия в клинической патологии». Анналы клинической биохимии. 49 (Pt 1): 17–28. Дои:10.1258 / acb.2011.011128. PMID  22028426.
  37. ^ Costa, E. S .; Pedreira, C.E .; Barrena, S .; Lecrevisse, Q .; Флорес, Дж .; Quijano, S .; Almeida, J .; Del Carmen García-Macias, M .; Bottcher, S .; Van Dongen, J. J. M .; Орфао, А. (2010). «Автоматизированный анализ основных компонентов на основе паттернов и иммунофенотипическая классификация В-клеточных хронических лимфопролиферативных заболеваний на основе экспертной оценки: шаг вперед в стандартизации клинического иммунофенотипирования». Лейкемия. 24 (11): 1927–1933. Дои:10.1038 / leu.2010.160. ЧВК  3035971. PMID  20844562.
  38. ^ Qiu, P .; Simonds, E. F .; Bendall, S.C .; Гиббс-младший, К. Д .; Bruggner, R. V .; Linderman, M.D .; Sachs, K .; Nolan, G.P .; Плеврит, С. К. (2011). «Извлечение клеточной иерархии из данных цитометрии высокой размерности с помощью SPADE». Природа Биотехнологии. 29 (10): 886–891. Дои:10.1038 / nbt.1991. ЧВК  3196363. PMID  21964415.
  39. ^ "Набор инструментов Matlab для уменьшения размерности". Получено 2013-02-10.
  40. ^ Bendall, S.C .; Simonds, E. F .; Qiu, P .; Амир, Э. -А. D .; Krutzik, P.O .; Finck, R .; Bruggner, R. V .; Меламед, Р .; Trejo, A .; Орнатский, О. И .; Balderas, R. S .; Плеврит, С.К .; Sachs, K .; Pe'Er, D .; Tanner, S.D .; Нолан, Г. П. (2011). «Одноклеточная масс-цитометрия дифференциальных иммунных и лекарственных ответов в гемопоэтическом континууме человека». Наука. 332 (6030): 687–696. Bibcode:2011Sci ... 332..687B. Дои:10.1126 / science.1198704. ЧВК  3273988. PMID  21551058.
  41. ^ Lo, K .; Hahne, F .; Brinkman, R. R .; Готтардо, Р. (2009). «FlowClust: пакет Bioconductor для автоматического стробирования данных проточной цитометрии». BMC Bioinformatics. 10: 145. Дои:10.1186/1471-2105-10-145. ЧВК  2701419. PMID  19442304.
  42. ^ Pyne, S .; Ху, X .; Wang, K .; Россин, Э .; Lin, T. -I .; Maier, L.M .; Baecher-Allan, C .; McLachlan, G.J .; Tamayo, P .; Hafler, D. A .; De Jager, P. L .; Месиров, Дж. П. (2009). «Автоматизированный анализ данных высокоразмерной проточной цитометрии». Труды Национальной академии наук. 106 (21): 8519–8524. Bibcode:2009ПНАС..106.8519П. Дои:10.1073 / pnas.0903028106. ЧВК  2682540. PMID  19443687.
  43. ^ Qian, Y .; Wei, C .; Ын-Хён Ли, Ф .; Кэмпбелл, Дж .; Halliley, J .; Lee, J. A .; Cai, J .; Kong, Y.M .; Sadat, E .; Thomson, E .; Dunn, P .; Seegmiller, A.C .; Karandikar, N.J .; Tipton, C.M .; Мосманн, Т .; Sanz, I.A .; Шойерманн, Р. Х. (2010). «Выявление семнадцати субпопуляций В-клеток периферической крови человека и количественная оценка ответа от столбняка с использованием метода на основе плотности для автоматической идентификации клеточных популяций в данных многомерной проточной цитометрии». Цитометрия Часть B. 78B (Приложение 1): S69 – S82. Дои:10.1002 / cyto.b.20554. ЧВК  3084630. PMID  20839340.
  44. ^ Zare, H .; Shooshtari, P .; Gupta, A .; Бринкман, Р. Р. (2010). «Обработка данных для спектральной кластеризации для анализа данных высокопроизводительной проточной цитометрии». BMC Bioinformatics. 11: 403. Дои:10.1186/1471-2105-11-403. ЧВК  2923634. PMID  20667133.
  45. ^ Aghaeepour, N .; Николич, Р .; Hoos, H.H .; Бринкман, Р. Р. (2011). «Быстрая идентификация популяции клеток по данным проточной цитометрии». Цитометрия Часть А. 79A (1): 6–13. Дои:10.1002 / cyto.a.21007. ЧВК  3137288. PMID  21182178.
  46. ^ Ge, Y .; Силфон, С. К. (2012). «FlowPeaks: быстрая неконтролируемая кластеризация данных проточной цитометрии с помощью K-средних и нахождения пиков плотности». Биоинформатика. 28 (15): 2052–2058. Дои:10.1093 / биоинформатика / bts300. ЧВК  3400953. PMID  22595209.
  47. ^ Вебер, Лукас; Робинсон, Марк. «Сравнение методов кластеризации крупномерных одноклеточных данных проточной и массовой цитометрии». bioRxiv  10.1101/047613.
  48. ^ Честер, С (2015). «Алгоритмические инструменты для интеллектуального анализа данных цитометрии высокой размерности». Журнал иммунологии. 195 (3): 773–779. Дои:10.4049 / jimmunol.1500633. ЧВК  4507289. PMID  26188071.
  49. ^ Диггинс, KE (2015). «Методы обнаружения и характеристики клеточных субпопуляций в данных массовой цитометрии с высокой размерностью». Методы. 82: 55–63. Дои:10.1016 / j.ymeth.2015.05.008. ЧВК  4468028. PMID  25979346.
  50. ^ Виви, С. (2015). «Сравнение эффективности методов биомедицинской кластеризации». Природные методы. 12 (11): 1033–1038. Дои:10.1038 / nmeth.3583. PMID  26389570. S2CID  8960399.
  51. ^ а б Roederer, M .; Treister, A .; Мур, В .; Герценберг, Л. А. (2001). «Сравнение вероятностного биннинга: метрика для количественной оценки различий в одномерном распределении». Цитометрия. 45 (1): 37–46. Дои:10.1002 / 1097-0320 (20010901) 45: 1 <37 :: AID-CYTO1142> 3.0.CO; 2-E. PMID  11598945.
  52. ^ Roederer, M .; Харди, Р. Р. (2001). «Стробирование разности частот: многомерный метод определения подмножеств, которые различаются между выборками». Цитометрия. 45 (1): 56–64. Дои:10.1002 / 1097-0320 (20010901) 45: 1 <56 :: AID-CYTO1144> 3.0.CO; 2-9. PMID  11598947.
  53. ^ а б c Aghaeepour, N .; Chattopadhyay, P.K .; Ganesan, A .; О'Нил, К .; Zare, H .; Джалали, А .; Hoos, H.H .; Roederer, M .; Бринкман, Р. Р. (2012). «Ранние иммунологические корреляты защиты от ВИЧ могут быть идентифицированы с помощью компьютерного анализа сложных многомерных тестов проточной цитометрии Т-клеток». Биоинформатика. 28 (7): 1009–1016. Дои:10.1093 / биоинформатика / bts082. ЧВК  3315712. PMID  22383736.
  54. ^ а б c Aghaeepour, N .; Джалали, А .; О'Нил, К .; Chattopadhyay, P.K .; Roederer, M .; Hoos, H.H .; Бринкман, Р. Р. (2012). «RchyOptimyx: оптимизация клеточной иерархии для проточной цитометрии». Цитометрия Часть А. 81A (12): 1022–1030. Дои:10.1002 / cyto.a.22209. ЧВК  3726344. PMID  23044634.
  55. ^ Zare, H .; Башашати, А .; Kridel, R .; Aghaeepour, N .; Haffari, G .; Коннорс, Дж. М .; Gascoyne, R.D .; Gupta, A .; Brinkman, R. R .; Вен, А. П. (2011). «Автоматический анализ данных многомерной проточной цитометрии повышает точность диагностики между лимфомой из клеток мантии и малой лимфоцитарной лимфомой». Американский журнал клинической патологии. 137 (1): 75–85. Дои:10.1309 / AJCPMMLQ67YOMGEW. ЧВК  4090220. PMID  22180480.
  56. ^ а б Цю, П. (2012). Ма'Аян, Ави (ред.). «Вывод фенотипических свойств из характеристик одной клетки». PLOS ONE. 7 (5): e37038. Bibcode:2012PLoSO ... 737038Q. Дои:10.1371 / journal.pone.0037038. ЧВК  3360688. PMID  22662133.
  57. ^ Bodenmiller, B .; Zunder, E. R .; Finck, R .; Chen, T. J .; Savig, E. S .; Bruggner, R. V .; Simonds, E. F .; Bendall, S.C .; Sachs, K .; Krutzik, P.O .; Нолан, Г. П. (2012). «Мультиплексное массовое цитометрическое профилирование клеточных состояний, нарушенных низкомолекулярными регуляторами». Природа Биотехнологии. 30 (9): 858–867. Дои:10.1038 / nbt.2317. ЧВК  3627543. PMID  22902532.
  58. ^ Башашати, А .; Johnson, N.A .; Ходабахши, А. Х .; Whiteside, M.D .; Zare, H .; Скотт, Д. У .; Lo, K .; Gottardo, R .; Бринкман, Ф. С. Л .; Коннорс, Дж. М .; Slack, G.W .; Gascoyne, R.D .; Weng, A. P .; Бринкман, Р. Р. (2012). «В-клетки с высоким параметром бокового рассеяния по данным проточной цитометрии коррелируют с меньшей выживаемостью при диффузной большой В-клеточной лимфоме». Американский журнал клинической патологии. 137 (5): 805–814. Дои:10.1309 / AJCPGR8BG4JDVOWR. ЧВК  3718075. PMID  22523221.
  59. ^ Мерфи, Р. Ф .; Чузед, Т. М. (1984). «Предложение по стандарту файла данных проточной цитометрии». Цитометрия. 5 (5): 553–555. Дои:10.1002 / cyto.990050521. PMID  6489069.
  60. ^ "Международное общество развития цитометрии". Получено 5 марта 2013.
  61. ^ Dean, P.N .; Bagwell, C.B .; Lindmo, T .; Мерфи, Р. Ф .; Зальцман, Г. К. (1990). «Введение в стандарт файлов данных проточной цитометрии». Цитометрия. 11 (3): 321–322. Дои:10.1002 / cyto.990110302. PMID  2340768.
  62. ^ Seamer, L.C .; Bagwell, C.B .; Barden, L .; Редельман, Д .; Salzman, G.C .; Wood, J. C. S .; Мерфи, Р. Ф. (1997). «Предлагаемый новый стандарт файла данных для проточной цитометрии, версия FCS 3.0». Цитометрия. 28 (2): 118–122. Дои:10.1002 / (SICI) 1097-0320 (19970601) 28: 2 <118 :: AID-CYTO3> 3.0.CO; 2-B. PMID  9181300.
  63. ^ Spidlen, J .; Мур, В .; Парки, Д .; Goldberg, M .; Bray, C .; Bierre, P .; Горомбей, П .; Hyun, B .; Hubbard, M .; Lange, S .; Lefebvre, R .; Leif, R .; Novo, D .; Острушка, Л .; Treister, A .; Wood, J .; Мерфи, Р. Ф .; Roederer, M .; Сударь, Д .; Zigon, R .; Бринкман, Р. Р. (2009). "Стандарт файлов данных для проточной цитометрии, версия FCS 3.1". Цитометрия Часть А. 77 (1): 97–100. Дои:10.1002 / cyto.a.20825. ЧВК  2892967. PMID  19937951.
  64. ^ Роберт С. Лейф, Йозеф Спидлен, Райан Р. Бринкман (2009). Farkas, Daniel L; Nicolau, Dan V; Лейф, Роберт С. (ред.). «Континуум стандартов цитометрии» (PDF). Труды SPIE. Визуализация, манипулирование и анализ биомолекул, клеток и тканей VI. 6859: 17. Bibcode:2008SPIE.6859E..17L. CiteSeerX  10.1.1.397.3647. Дои:10.1117/12.762514. S2CID  62650477.CS1 maint: несколько имен: список авторов (связь)
  65. ^ Международное общество развития цитометрии (2008 г.). Стандартные соглашения NetCDF аналитической цитометрии для компонента файла двоичных данных в режиме списка
  66. ^ а б Spidlen, J .; Shooshtari, P .; Kollmann, T. R .; Бринкман, Р. Р. (2011). «Стандарты данных проточной цитометрии». BMC Research Notes. 4: 50. Дои:10.1186/1756-0500-4-50. ЧВК  3060130. PMID  21385382.
  67. ^ Формат файла результатов классификации (PDF) (Отчет). Международное общество развития цитометрии. 2012 г.
  68. ^ «CytoGenie - Домашняя страница программы AutoGate». CytoGenie.org. Лаборатория Герценберга в Стэнфордском университете. Получено 14 января 2020.
  69. ^ Джентльмен, R.C .; Кэри, В. Дж .; Бейтс, Д. М .; Bolstad, B .; Деттлинг, М .; Дудуа, С.; Ellis, B .; Gautier, L .; Ge, Y .; Gentry, J .; Хорник, К .; Hothorn, T .; Huber, W .; Iacus, S .; Irizarry, R .; Leisch, F .; Li, C .; Maechler, M .; Россини, А. Дж .; Sawitzki, G .; Smith, C .; Smyth, G .; Tierney, L .; Yang, J. Y .; Чжан, Дж. (2004). «Биокондуктор: разработка открытого программного обеспечения для вычислительной биологии и биоинформатики». Геномная биология. 5 (10): R80. Дои:10.1186 / gb-2004-5-10-r80. ЧВК  545600. PMID  15461798.
  70. ^ Биопроводник. "Просмотр биокондуктора FlowCytometry". Получено 11 июля 2013.
  71. ^ Reich, M .; Liefeld, T .; Gould, J .; Lerner, J .; Tamayo, P .; Месиров, Дж. П. (2006). «GenePattern 2.0». Природа Генетика. 38 (5): 500–501. Дои:10.1038 / ng0506-500. PMID  16642009. S2CID  5503897.
  72. ^ "Набор для проточной цитометрии GenePattern". Архивировано из оригинал 29 января 2013 г.. Получено 14 февраля 2013.
  73. ^ «FACSanadu - Бесплатное и простое в использовании программное обеспечение для анализа FCS».
  74. ^ Lee, J. A .; Spidlen, J .; Boyce, K .; Cai, J .; Crosbie, N .; Дальфин, М .; Furlong, J .; Гаспаретто, М .; Goldberg, M .; Горалчик, Э. М .; Hyun, B .; Jansen, K .; Коллманн, Т .; Kong, M .; Leif, R .; McWeeney, S .; Молошок, Т. Д .; Мур, В .; Nolan, G .; Nolan, J .; Nikolich-Zugich, J .; Пэрриш, Д .; Purcell, B .; Qian, Y .; Selvaraj, B .; Smith, C .; Чуваткина, О .; Wertheimer, A .; Wilkinson, P .; Уилсон, К. (2008). «MIFlowCyt: минимум информации об эксперименте по проточной цитометрии». Цитометрия Часть А. 73A (10): 926–930. Дои:10.1002 / cyto.a.20623. ЧВК  2773297. PMID  18752282.
  75. ^ Котеча, Н .; Krutzik, P.O .; Ирландский, Дж. М. (2010). Дж. Пол Робинсон (ред.). Интернет-анализ и публикация экспериментов по проточной цитометрии. Текущие протоколы цитометрии. Глава 10. С. 10.17.1–10.17.24. Дои:10.1002 / 0471142956.cy1017s53. ISBN  978-0471142959. ЧВК  4208272. PMID  20578106.
  76. ^ Spidlen, J .; Breuer, K .; Розенберг, С .; Котеча, Н .; Бринкман, Р. Р. (2012). «FlowRepository: ресурс аннотированных наборов данных проточной цитометрии, связанных с рецензируемыми публикациями». Цитометрия Часть А. 81A (9): 727–731. Дои:10.1002 / cyto.a.22106. PMID  22887982. S2CID  6498066.
  77. ^ Spidlen, J .; Breuer, K .; Бринкман, Р. (2012). «Подготовка минимальной информации о манускрипте, соответствующем эксперименту проточной цитометрии (MIFlowCyt), с использованием репозитория файлов FCS Международного общества развития цитометрии (ISAC) (FlowRepository.org)». В Дж. Пол Робинсон (ред.). Подготовка минимума информации об эксперименте проточной цитометрии (MIFlow Cyt) Соответствующая рукопись с использованием репозитория файлов FCS Международного общества по развитию цитометрии (ISAC) (Flow Репозиторий.org). Текущие протоколы цитометрии. Глава 10. С. Блок Ун10.18. Дои:10.1002 / 0471142956.cy1018s61. ISBN  978-0471142959. PMID  22752950. S2CID  24921940.
  78. ^ «FlowRepository».
  79. ^ «FlowCAP - Проточная цитометрия: критическая оценка методов идентификации населения». Получено 15 марта 2013.
  80. ^ «Набор данных исследования естественной истории ВИЧ IDCRP». Получено 3 марта 2013.
  81. ^ Craig, F.E .; Brinkman, R. R .; Eyck, S.T .; Агаипур, Н. (2013). «Вычислительный анализ оптимизирует проточную цитометрическую оценку лимфомы». Цитометрия Часть B: н / д. Дои:10.1002 / cytob.21115. PMID  23873623.
  82. ^ Вилланова, Ф .; Di Meglio, P .; Inokuma, M .; Aghaeepour, N .; Perucha, E .; Mollon, J .; Nomura, L .; Hernandez-Fuentes, M .; Коуп, А .; Прево, А. Т .; Heck, S .; Maino, V .; Господь, G .; Brinkman, R. R .; Нестле, Ф. О. (2013). Фон Херрат, Матиас Г. (ред.). «Интеграция проточной цитометрии на основе лиоплате и компьютерного анализа для открытия стандартизированных иммунологических биомаркеров». PLOS ONE. 8 (7): e65485. Bibcode:2013PLoSO ... 865485V. Дои:10.1371 / journal.pone.0065485. ЧВК  3701052. PMID  23843942.
  83. ^ а б Maecker, H.T .; McCoy, J.P .; Нуссенблатт Р. (2012). «Стандартизация иммунофенотипирования для проекта иммунологии человека». Nature Reviews Иммунология. 12 (3): 191–200. Дои:10.1038 / nri3158. ЧВК  3409649. PMID  22343568.
  84. ^ а б c d Schadt, E. E .; Linderman, M.D .; Соренсон, Дж .; Lee, L .; Нолан, Г. П. (2010). «Вычислительные решения для управления и анализа больших данных». Природа Обзоры Генетика. 11 (9): 647–657. Дои:10.1038 / nrg2857. ЧВК  3124937. PMID  20717155.