Критическая оценка функциональной аннотации - Critical Assessment of Function Annotation

В Критическая оценка функциональной аннотации (CAFA) - эксперимент, предназначенный для крупномасштабной оценки вычислительных методов, посвященных прогнозирование функции белка.[1] Другой алгоритмы оцениваются по их способности предсказывать Генная онтология (GO) термины в категориях Молекулярная функция, Биологический процесс, и Сотовый компонент.

Эксперимент состоит из двух треков: (i) эукариотический трек, (ii) прокариотический трек. На каждом треке организаторы предоставляют набор целей. Ожидается, что участники представят свои прогнозы к крайнему сроку подачи, после чего они будут оценены в соответствии с набором конкретных показателей.

Мотивация

В геном организма может состоять из сотен и десятков тысяч гены, которые кодируют сотни тысяч различных белок последовательности. Благодаря относительно невысокой стоимости секвенирование генома определение последовательностей генов и белков выполняется быстро и недорого. К настоящему времени были секвенированы тысячи видов, но многие белки недостаточно изучены.[2] Процесс экспериментального определения роли белка в клетке - дорогостоящая и трудоемкая задача. Более того, даже когда анализы выполняются, они вряд ли предоставят полное представление о функции белка. Поэтому стало важным использовать вычислительные инструменты для функциональной аннотации белков. Существует несколько вычислительных методов прогнозирования функции белка, которые могут сделать вывод о функции белка с использованием различных биологических и эволюционных данных, но есть значительные возможности для улучшения. Точное предсказание функции белков может иметь долгосрочные последствия для биомедицинских и фармацевтических исследований.

Эксперимент CAFA разработан для обеспечения объективной оценки вычислительных методов, стимулирования исследований в области прогнозирования вычислительных функций и обеспечения понимания общего состояния современного прогнозирования функций.

Организация

Эксперимент состоит из трех этапов:

  1. Фаза прогнозирования: ~ 4 месяца

Организаторы предоставляют сообществу последовательности белков с неизвестной или неполной функцией и устанавливают крайний срок для представления прогнозов.

  1. Целевое накопление: 6–12 месяцев

После того, как все прогнозы сохранены и эксперимент переходит в период ожидания, в течение которого функции белков, как ожидается, будут накапливаться в общедоступных базах данных

  1. Фаза анализа: 1 месяц

Предикторы ранжируются в соответствии с их эффективностью. Результаты публикуются на научных собраниях и публикуются после экспертная оценка.

История

Эксперимент CAFA проводится Специальной группой по автоматическому прогнозированию функций (AFP) (AFP / SIG). Встреча AFP / SIG была проведена одновременно с Интеллектуальные системы для молекулярной биологии конференции в 2005, 2006, 2008, 2011 и 2012 годах.[3][4][5]

CAFA 2010-2012

Первый эксперимент CAFA был организован в период с осени 2010 по весну 2012 года. Организаторы предоставили сообществу 48 000 последовательностей с задачей предсказания аннотаций генной онтологии для каждой из этих последовательностей. Из этих 48000 белков 866 были экспериментально аннотированы во время фазы целевого накопления. Результаты показали, что текущие алгоритмы прогнозирования функций работают значительно лучше, чем простое присвоение предметной области или прямое использование ВЗРЫВ пакет. Однако они также показали, что точное предсказание биологической функции белка по-прежнему остается открытой и сложной проблемой.

CAFA 2013-2014

Второй эксперимент CAFA стартовал осенью 2013 года. Начиная с августа, заинтересованные стороны могли загрузить более 100 000 целевых последовательностей 27 видов. Зарегистрированным командам предлагается аннотировать последовательности с помощью терминов генной онтологии, а дополнительная задача - аннотировать человеческие последовательности с помощью Онтология человеческого фенотипа термины. Крайний срок подачи заявок - 15 января 2014 года. Оценка прогнозов состоится в июне 2014 года.

Смотрите также

CASP: Критическая оценка предсказания структуры белка
CAPRI: Критическая оценка предсказания взаимодействий

использованная литература

  1. ^ Предраг, Радивояц; и другие. (2013). «Масштабная оценка предсказания вычислительной функции белка». Природные методы. 10 (3): 221–227. Дои:10.1038 / число 2340. ЧВК  3584181. PMID  23353650.
  2. ^ Бернал, Аксель; Uy Ear; Никос Кирпидес (2001). «База данных Genomes OnLine (GOLD): монитор геномных проектов по всему миру». Исследования нуклеиновых кислот. 29 (1): 126–127. Дои:10.1093 / nar / 29.1.126. ЧВК  29859. PMID  11125068.
  3. ^ Фридберг, Иддо; Мартин Джамбон; Адам Годзик (июнь 2006 г.). «Новые возможности в предсказании функции белков». Белковая наука. 15 (6): 1527–1529. Дои:10.1110 / пс 062158406. ЧВК  2242544. PMID  16731984.
  4. ^ Родригес, Ана; Барри Грант; Адам Годзик; Иддо Фридберг (2007). "Встреча 2006 г. по автоматизированному прогнозированию функций". Биоинформатика. 8 (Приложение 4): S1–4. Дои:10.1186 / 1471-2105-8-s4-s1. ЧВК  1892079. PMID  17570143.
  5. ^ Гиллис, Джесси; Пол Павлидис (апрель 2013 г.). «Описание современного уровня вычислительной техники для определения функции гена: уроки первой критической оценки функциональной аннотации (CAFA)» (PDF). BMC Bioinformatics. 14 (Приложение 3): S15. Дои:10.1186 / 1471-2105-14-s3-s15. ЧВК  3633048. PMID  23630983.

внешние ссылки