Обзора (информационного пособия)

 

Тексты документов, запросов, как известно, представ­ляют собой совокупность концептографической и фактогра­фической информации, выраженную словами на естествен­ном языке в виде некоторых конструкций, представленных предложениями. Слова в предложении делятся на части речи: существительное, прилагательное, глагол, причастие, дее­причастие, местоимение, наречие, междометие, предлоги и союзы.

Распознавание частей речи в предложении не представ­ляет никаких трудностей, а сами по себе части речи в пред­ложении образуют некоторую структуру, т.е. части речи в предложении находятся во взаимном расположении и связи между собою. Таким образом, есть основание утверждать, что тексты документов представляют собой не только слож­ную структуру, но и взаимосвязи взаимоотношения слов друг с другом. Они составляют основу формализованных методов обработки документов.

Как известно, имя существительное в грамматике обо­значает предмет и выражает значение предметности. Имя прилагательное обозначает качество, свойство, принадлеж­ность предмета и выражает это значение. Числительное - слово (существительное или прилагательное) обозначает ко­личество или количественный признак, порядок при счете. Причастие в грамматике - форма глагола, обладающая на­ряду с категориями глагола (время, залог, вид) категориями прилагательного. Такие же части речи, как глаголы, место­имения, междометия, наречия, предлоги, союзы при струк­турно-семантическом анализе текстов документов (запросов) не принимаются во внимание потому, что они практически слабо связаны с раскрытием содержания предмета.

Сущность семантического анализа текстов заглавия ин­формационного продукта рассматривается как технологиче­ская операция на начальном этапе создания информационно­го продукта, и заключается в подчеркивании (выделении) ключевых слов, терминов и научных понятий заглавий темы (обзора). Ключевые слова, термины и понятия могут быть выражены словом или словосочетанием (в виде имя сущ.+имя прилаг., сущ.+прилаг.+прилаг, сущ.+сущ.). В за­главии темы информационного продукта ключевые слова выделяют только тогда, когда они раскрывают предметное содержание.

Выделенные ключевые слова (термины, понятия) необ­ходимы для того, чтобы на последующем этапе создания ин­формационного продукта обеспечить поиск тех документов, которые содержат выделенные ключевые слова (термины, понятия), передают содержание документа.

 

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: