Единая система медицинского языка - Unified Medical Language System
В Единая система медицинского языка (UMLS) это компендиум из многих контролируемые словари в биомедицинский наук (создан в 1986 г.).[1] Он обеспечивает структуру отображения между этими словарями и, таким образом, позволяет переводить между различными системами терминологии; его также можно рассматривать как исчерпывающий тезаурус и онтология биомедицинских концепций. UMLS также предоставляет возможности для обработка естественного языка. Он предназначен для использования в основном разработчиками систем в медицинская информатика.
UMLS состоит из Источников знаний (баз данных) и набора программных инструментов.
UMLS был разработан и поддерживается нас Национальная медицинская библиотека, обновляется ежеквартально и может использоваться бесплатно. Проект был инициирован в 1986 г. Дональд А. Линдберг, M.D., затем директор Медицинской библиотеки под руководством Бетси Хамфрис.[2]
Назначение и применение
Количество биомедицинских ресурсов, доступных исследователям, огромно. Часто это является проблемой из-за большого объема документов, извлекаемых при поиске в медицинской литературе. Целью UMLS является расширение доступа к этой литературе путем облегчения разработки компьютерных систем, которые понимают биомедицинский язык. Это достигается путем преодоления двух существенных препятствий: «разнообразие способов выражения одних и тех же концепций в разных машиночитаемых источниках и разными людьми» и «распределение полезной информации среди множества разрозненных баз данных и систем».[нужна цитата ]
Лицензирование
Пользователи системы должны подписать «Соглашение UMLS» и подавать краткие годовые отчеты об использовании. Академические пользователи могут использовать UMLS бесплатно в исследовательских целях. Для коммерческого или производственного использования требуются лицензии на авторские права на некоторые из включенных исходных словарей.
Источники знаний
Метатезавр
Метатезавр составляет основу UMLS и включает более 1 миллиона биомедицинских концепций и 5 миллионов названий концепций, все из которых происходят из более чем 100 встроенных контролируемых словарей и систем классификации. Некоторые примеры встроенных контролируемых словарей: CPT, МКБ-10, MeSH, СНОМЕД КТ, DSM-IV, LOINC, Терминология ВОЗ по побочным реакциям на лекарства, Клинические условия Великобритании, RxNorm, Генная онтология, и OMIM (видеть Полный список ).
Метатезавр организован по понятиям, и каждое понятие имеет определенные атрибуты, определяющие его значение, и связано с соответствующими названиями понятий в различных исходных словарях. Представлены многочисленные отношения между концепциями, например иерархические, такие как "это «для подклассов и» является частью «для субъединиц», а ассоциативные, такие как «вызвано» или «в литературе часто встречается близко к» (последнее происходит от Медлайн ).
Объем метатезавра определяется объемом исходных словарей. Если разные словари используют разные имена для одного и того же понятия или если они используют одно и то же имя для разных понятий, то это будет точно представлено в Метатезавре. Вся иерархическая информация из исходных словарей сохраняется в Метатезавре. Концепции метатезавра также могут ссылаться на ресурсы вне базы данных, например, базы данных последовательностей генов.
Семантическая сеть
Каждому понятию Метатезавра назначается один или несколько семантические типы (категории), которые связаны друг с другом через семантические отношения.[3]В семантическая сеть представляет собой каталог этих семантических типов и отношений. Это довольно широкая классификация; Всего существует 127 семантических типов и 54 отношения.
Основными семантическими типами являются организмы, анатомические структуры, биологическая функция, химические вещества, события, физические объекты, концепции или идеи. Связи между семантическими типами определяют структуру сети и показывают важные взаимосвязи между группировки и концепции. Первичная связь между семантическими типами - это "это "ссылка, устанавливающая иерархия В сети также есть 5 основных категорий неиерархических (или ассоциативных) отношений, которые составляют остальные 53 типа отношений. Они «физически связаны с», «пространственно связаны с», «связаны во времени с», «функционально связаны с» и «концептуально связаны с».[3]
Информация о семантическом типе включает в себя идентификатор, определение, примеры, иерархическую информацию о охватывающем семантическом типе (ах) и ассоциативный отношения. Ассоциативные отношения внутри семантической сети очень слабые. Они фиксируют не более чем некоторые-некоторые отношения, то есть фиксируют тот факт, что некоторый экземпляр первого типа может быть связан значительным отношением с некоторым экземпляром второго типа. Иначе говоря, они фиксируют тот факт, что соответствующее реляционное утверждение имеет смысл (хотя оно не обязательно должно быть истинным во всех случаях).
Пример ассоциативной связи: "может привести к"в применении к терминам (курение, рак легких) даст: курение"может привести к" рак легких.
СПЕЦИАЛИСТ Лексикон
Лексикон SPECIALIST содержит информацию об общеупотребительной английской лексике, биомедицинских терминах, терминах, встречающихся в MEDLINE и термины из метатезавра UMLS. Каждая запись содержит синтаксический (как слова соединяются для создания смысла), морфологический (форма и структура) и орфографический (орфографическая) информация. Набор Ява программы используют лексику для работы с вариациями в биомедицинских текстах, связывая слова по частям речи, что может быть полезно в сеть ищет или просматривает электронная медицинская карта.
Записи могут состоять из одного или нескольких слов. Записи содержат четыре части: базовая форма (т.е. «бег» вместо «бег»); части речи (из которых Специалист распознает одиннадцать); уникальный идентификатор; и любые доступные варианты написания. Например, запрос для «анестетика» вернет следующее:[4]
{base = анестетик spelling_variant = анестезирующий элемент = E0008769 cat = существительное варианты = reg} {base = анестетик spelling_variant = анестезирующий элемент = E0008770 cat = adj варианты = inv position = attrib (3)}
Лексика СПЕЦИАЛИСТА доступна в двух форматах. Формат «единичной записи» можно увидеть выше и включает слоты и наполнители. А слот это элемент (например, "base =" или "вариант написания ="), а наполнители - значения, относящиеся к этому слоту для этой записи. "реляционная таблица "формат еще не нормализованный и содержат много избыточных данных в файлах.
Несоответствия и другие ошибки
Учитывая размер и сложность UMLS и ее разрешительную политику в отношении интеграции терминов, ошибки неизбежны.[5]Ошибки включают в себя двусмысленность и избыточность, циклы иерархических отношений (понятие является одновременно и предком, и потомком другого), отсутствующие предки (семантические типы родительских и дочерних понятий не связаны) и семантическую инверсию (отношения дочерний / родительский с семантическими типами являются не соответствует концепциям).[6]
Эти ошибки обнаруживаются и устраняются путем аудита UMLS. Ручной аудит может быть очень трудоемким и дорогостоящим. Исследователи пытались решить эту проблему несколькими способами. Для поиска этих ошибок можно использовать автоматизированные инструменты. Для структурных несоответствий (например, петель) подойдет тривиальное решение, основанное на порядке. Однако то же самое не применимо, когда несоответствие находится на уровне термина или концепции (контекстно-зависимое значение термина).[7] Это требует использования стратегии информированного поиска (представление знаний ).
Вспомогательные программные инструменты
Помимо источников знаний, Национальная медицинская библиотека также предоставляет вспомогательные инструменты.
- MetamorphoSys - настраивает Метатезавр для конкретных приложений, например, исключая определенные исходные словари.
- lvg - программа, которая использует лексику SPECIALIST для генерации лексических вариантов данного термина и для поддержки синтаксического анализа текста на естественном языке.
- MetaMap - онлайн-инструмент, который при получении произвольного фрагмента текста находит и возвращает соответствующие концепции Метатезавра.
- Перенос MetaMap (MMTx) - Реализация MetaMap на Java (больше не поддерживается).
- Сервер источника знаний - Интернет-доступ к словарям (исключен с осени 2010 г.).[8]
Стороннее программное обеспечение
- UMLS-подобие, программный пакет с открытым исходным кодом, который реализует множество мер семантического сходства и взаимосвязи.
- Веб-интерфейс UMLS-подобия, веб-интерфейс для UMLS-подобия
Смотрите также
Рекомендации
- ^ Единая система медицинского языка, 1996
- ^ Эллисон Д., Хамфрис Б.Л., Митчелл Дж. (Июль 2010 г.). «Вручение Бетси Л. Хамфрис Премии Морриса Ф. Коллена 2009 года с замечаниями получателя». Журнал Американской ассоциации медицинской информатики. 17 (4): 481–5. Дои:10.1136 / jamia.2010.005728. ЧВК 2995660. PMID 20595319.
- ^ а б Национальная медицинская библиотека (2009 г.). «Глава 5 - Семантические сети». Справочное руководство по UMLS. Bethesda, MD: Национальная медицинская библиотека США, Национальные институты здравоохранения.
- ^ Браун А.С., МакКрей А.Т., Шринивасан С. (июнь 2000 г.). Лексикон специалиста (PDF). Bethesda, MD: Национальный центр биомедицинских коммуникаций Листера Хилла, Национальная медицинская библиотека. п. 1.
- ^ Морри С.П., Геллер Дж., Халпер М., Perl Y (июнь 2009 г.). «Инструмент аудита окружения: гибридный интерфейс для аудита UMLS». Журнал биомедицинской информатики. 42 (3): 468–89. Дои:10.1016 / j.jbi.2009.01.006. ЧВК 2891659. PMID 19475725.
- ^ Геллер Дж., Морри С.П., Сюй Дж., Халпер М., Эльханан Дж., Перл Й, Хрипчак Дж. (Ноябрь 2009 г.). «Сравнение несовместимых конфигураций отношений, указывающих на ошибки UMLS». AMIA ... Материалы ежегодного симпозиума. Симпозиум AMIA. 2009: 193–7. ЧВК 2815406. PMID 20351848.
- ^ Чжу X, Фан Дж. В., Баорто Д. М., Вэн С., Чимино Дж. Дж. (Июнь 2009 г.). «Обзор методов аудита, применяемых к содержанию контролируемой биомедицинской терминологии». Журнал биомедицинской информатики. 42 (3): 413–25. Дои:10.1016 / j.jbi.2009.03.003. ЧВК 3505841. PMID 19285571.
- ^ "Новости Unified Medical Language System® (UMLS®): пересмотренное лицензионное соглашение, новые службы терминологии UMLS и браузер, прекращение поддержки UMLSKS и изменения API". Технический бюллетень NLM. Национальная медицинская библиотека США. 29 июля 2010 г.
дальнейшее чтение
- Боденрейдер О. (январь 2004 г.). «Единая система медицинского языка (UMLS): интеграция биомедицинской терминологии». Исследования нуклеиновых кислот. 32 (Проблема с базой данных): D267-70. Дои:10.1093 / нар / gkh061. ЧВК 308795. PMID 14681409.
- Кумар А., Смит Б. (2003). «Единая система медицинского языка и генная онтология: некоторые критические размышления» (PDF). Достижения в области искусственного интеллекта (конспекты лекций по искусственному интеллекту 2821. Берлин: Springer. С. 135–148.
- Смит Б., Кумар А., Шульце-Кремер С. (2004). «Пересмотр семантической сети UMLS» (PDF). В Fieschi M, et al. (ред.). Medinfo. Амстердам: IOS Press. п. 1700.
- Coiera E (2003). «Глава 17 - Медицинская терминология и системы классификации». Руководство по информатике здравоохранения (2-е изд.). Моддер Арнольд. ISBN 978-0-340-76425-1.
- Мужен Ф, Боденрейдер О (2005). «Подходы к устранению циклов в UMLS Metathesaurus: наивное против формального». Материалы ежегодного симпозиума AMIA: 550–4. ЧВК 1560864. PMID 16779100.
внешняя ссылка
- Официальный веб-сайт
- Краткое описание UMLS, со ссылками на информационные бюллетени и документацию для Metathesaurus, Semantic Network, SPECIALIST Lexicon и MetamorphoSys
- Обзор и руководство по UMLS, Рэйчел Кляйнсорге, Ян Уиллис, Аллен Браун, Алан Аронсон
- Модуль Perl для запроса установки UMLS mysql
- Единая система медицинского языка в Национальной медицинской библиотеке США Рубрики медицинской тематики (MeSH)
- UMLS.me - извлекает медицинские концепции и коды UMLS из свободного текста в браузере, автор Александр Скарлат.