Проект UMLS unified medical language system (UMLS)

UMLS включає такі підсистеми: Metathesaurus, Semantic Network, Specialist Lexicon.

Metathesaurus (метатезаурус) містить інформацію про біомедичні концепції, їх представлення та взаємозв'язки між ними. Підсистема Метатезаурус використовується в широкому колі прикладних задач:

· отримання інформації з баз знань і вільнодоступних текстів;

· поєднання записів про пацієнта з відповідною інформацією в бібліографіях;

· аналіз текстів чи натуральної мови;

· автоматичне індексування;

· введення структурованих даних.

У версії 2005 року метатезаурус містить близько 800 000 концепцій (concept) і 1900000 різних словосполучень із понад 50-ти біомедичних словників (серед яких MESH, ICD-10, SNOMED, ICPC, READ CODES та ін. див. http://www.nlm.nih.gov/research/umls/about_umls.html)

Завдання UMLS – затвердження загального єдиного розуміння сутності кожного об'єкта, описуваного концепцією, зведення альтернативних форм термінологічного відображення концепції до єдиного коду і встановлення характеру взаємозв'язку між різними концепціями.

Кожна концепція в метатезаурусі має свій код (Unique Concept Identifier - CUI). Слова і словосполучення, які мають однаковий сенс мають одне значення CUI. Набір символів, кожної з включених у вихідні бази мов (англійська, французька, німецька, іспанська, російська (transliterated), фінська, норвезька, шведська, італійська, датська, угорська та ін.), має унікальний код (Unique String Identifier - SUI) і пов'язаний із певної концепцією. Набір символів, відрізняється від іншого лише написанням (рядкові чи прописні букви), має свій SUI, але при цьому обидва матимуть одне значення CUI.

Для англійської мови рядки, які мають відмінності в написанні, але походять з однієї граматичної основи і пов'язані з однієї концепцією, об'єднані поняттям «Термін» і мають один код терміну (Common Term Identifier – LUI). У системі зазначено, який набір символів вважати "класичним" написанням терміну.

У базі UMLS 29,986 концепцій мають опис, який дозволяє уточнити їх зміст.

Бази UMLS поширюються безкоштовно, вони призначені для уніфікації медичної термінології і передбачають пряме використання в медичних інформаційних системах. При цьому розробники систем самі визначають, які дані будуть використані.

Проектом HL7 v3 передбачено використання CUI під час запису даних в комп'ютерну історію хвороби: «The primary code in coded fields can be a UMLS CUI or a proprietary code when properly licensed.»

ISO TC215 HEALTH INFORMATICS підтримує цю специфікацію HL7.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: