UMLS включає такі підсистеми: Metathesaurus, Semantic Network, Specialist Lexicon.
Metathesaurus (метатезаурус) містить інформацію про біомедичні концепції, їх представлення та взаємозв'язки між ними. Підсистема Метатезаурус використовується в широкому колі прикладних задач:
· отримання інформації з баз знань і вільнодоступних текстів;
· поєднання записів про пацієнта з відповідною інформацією в бібліографіях;
· аналіз текстів чи натуральної мови;
· автоматичне індексування;
· введення структурованих даних.
У версії 2005 року метатезаурус містить близько 800 000 концепцій (concept) і 1900000 різних словосполучень із понад 50-ти біомедичних словників (серед яких MESH, ICD-10, SNOMED, ICPC, READ CODES та ін. див. http://www.nlm.nih.gov/research/umls/about_umls.html)
Завдання UMLS – затвердження загального єдиного розуміння сутності кожного об'єкта, описуваного концепцією, зведення альтернативних форм термінологічного відображення концепції до єдиного коду і встановлення характеру взаємозв'язку між різними концепціями.
Кожна концепція в метатезаурусі має свій код (Unique Concept Identifier - CUI). Слова і словосполучення, які мають однаковий сенс мають одне значення CUI. Набір символів, кожної з включених у вихідні бази мов (англійська, французька, німецька, іспанська, російська (transliterated), фінська, норвезька, шведська, італійська, датська, угорська та ін.), має унікальний код (Unique String Identifier - SUI) і пов'язаний із певної концепцією. Набір символів, відрізняється від іншого лише написанням (рядкові чи прописні букви), має свій SUI, але при цьому обидва матимуть одне значення CUI.
|
|
Для англійської мови рядки, які мають відмінності в написанні, але походять з однієї граматичної основи і пов'язані з однієї концепцією, об'єднані поняттям «Термін» і мають один код терміну (Common Term Identifier – LUI). У системі зазначено, який набір символів вважати "класичним" написанням терміну.
У базі UMLS 29,986 концепцій мають опис, який дозволяє уточнити їх зміст.
Бази UMLS поширюються безкоштовно, вони призначені для уніфікації медичної термінології і передбачають пряме використання в медичних інформаційних системах. При цьому розробники систем самі визначають, які дані будуть використані.
Проектом HL7 v3 передбачено використання CUI під час запису даних в комп'ютерну історію хвороби: «The primary code in coded fields can be a UMLS CUI or a proprietary code when properly licensed.»
ISO TC215 HEALTH INFORMATICS підтримує цю специфікацію HL7.