Объединенный список ключевых слов

Ключевые слова, термины, выделенные из текста заглавия обзора и дополнительные за счет ключевых слов лексико-семантической обработки содержания понятий этих слов (фрагмент списка)
Автоматизация комплексная
Изделия (машиностроительная продукция)
Машиностроение
Механизация комплексная
Орудия труда
Продукты потребления (маш. пред.)
И т.д.

В результате обследования тематических рубрик с ука­занными классификационными индексами в справочно-информационном аппарате было обнаружено 68 документов, в т.ч.: отчеты о завершенных научно-исследовательских рабо­тах, опытно-конструкторских разработках, выполненных на­учно-исследовательскими, проектно-конструкторскими и технологическими организациями - 29, выполненными ВУ­Зами - 12; диссертаций - 3, монографий - 6, научных статей в журналах - 3, отчеты о загранкомандировках - 1, препринтов - 3, тезисы докладов на конференциях - 2, справочники - 3.

Перечисленные документы вошли в реферативный об­зор по теме «Проблемы комплексной автоматизации и меха­низации машиностроения».

Полученные результаты лексико-семантической обра­ботки ключевых слов имеют вид:

 

Ключевые слова, термины, понятия Индексы ключе­вых слов в АПУ (УДК)
Автоматизация комплексная 621:62-529
Машиностроение 621.003
Механизация комплексная 621.9.002.5
Изделие 622.9:006
Завод 621:008
Задачи (исследование, разработка, испы­тание, эксплуатация) 621.001/004
Орудия труда 621.1:002.5
Проблемы 621.9:001/009
Продукты потребления (машиностр. пром.) 621.9:002.6
Производство 621.9:002.2
Производство вспомогательное 621.9:002.7
Производство основное 621.9:002.2
Участок (организационная структура) 621:008
Цех 621:008

 

Фрагмент списка найденных документов обозначен двумя номерами, один из которых - в настоящем библиогра­фическом списке, второй - из полного списка обзора:

 

№ п/п № по реф. Название
1 3 Пуш В. И., Пигерт Р. И др. Автоматические станочные системы. - М: Машиностроение, 1982.
2 5 Черпаков Б. И., Великович В. Б. Сокращение ручного труда при применении промышленных роботов. - М: Машиностроение, 1985.
3 7 Автоматизация производственных процессов в машиностроении - Тульский политехнический институт [Отчет НИР].
4 11 Кернюхин И. Ф. Основы построения механических систем роторных технологических машин и автоматических линий. Диссертация на соискание д.т.н. - Тульский политехнический институт [Отчет НИР].
5 17 Исследование и разработка роботизированных технологических процессов. - Ужгородский государственный университет [Отчет].
6 18 Разработка, исследование и внедрение автоманипуляторов (промышленных роботов) для разгрузки станков с ЧПУ. - ПО «Уралмаш» [Отчет].
7 23 Разработка методологии выбора и моделирования структуры производственных систем [ЧПУ, ОЦ, ГПЛ, ГПС].
8 28 Оленевский В. М. Разработка и исследование систем управления на базе ЭВМ автоматизированных станочных комплексов для обработки комплексных деталей. - МИФИ [Отчет].
9 43 Гибкое автоматическое производство. Под ред. С. А. Майорова и др. Л.: Машиностроение, 1985.
10 46 Создание типового гибкого технологического комплекса из станков с ЧПУ и управления от ЭВМ для обработки корпусных деталей на опытном участке НИИГавтопрома. - УНИПТИМаш [Отчет].
11 50 Исследование и создание переналаживающихся автоматических линий для обработки тел вращения на базе оборудования с ЧПУ и средств ВТ. - УПИ [Отчет].
12 56 Черпаков В. И., Землянов В. В. Использование устройств ЧПУ в специализированных станках в автоматических линиях для массового и крупносерийного производства//Станки и инструменты. - 1985.
13 62 Шенборд М. И. и др. Распределенные АСУ технологическими процессами. - М: Энергоатомиздат, 1985.
14 65 Разработка технических требований к алгоритмическим программным модулям для автоматизированных систем управления технологическими процессами машиностроения. - ЦНИИТЦ [Отчет].
15 68 Состояние и перспективы системы числового программного управления системами ВНИИГПЭ [Отчет].

Лексико-семантическая обработка заглавий документов, вошедших в обзор. Суть лексико-семантической обработки изложена в предыдущих разделах и сводится к тому, что из текстов заглавий выделяются ключевые слова, термины, научные понятия. На каждое ключевое слово заполняется кар­точка.

 

Каждая запись на карточке получает инвентарный но­мер документа, который вошел в обзор.

Образованный массив ключевых слов, терминов и по­нятий систематизируется по алфавитному порядку и указы­вается частота появлений терминов в массиве. Алфавитная картотека после удаления дублирующих записей будет иметь следующий вид:

 

 

Алфавитный порядок позволит сберечь время на этапе индексирования ключевых слов при использовании алфавитно-предметного указателя, которым снабжаются информа­ционно-поисковые языки и создать частотный словарь клю­чевых слов, выделенных из заглавий документов, вошедших в обзор.

 

2.3. Частотные словари и подготовка информационных про­дуктов

Частота - величина, выражающая повторение ключе­вых слов, терминов, понятий в информационном массиве и документах, отобранных для подготовки информационных и библиографических пособий. В частотном словаре при каждом слове указана частота появления слова в тексте доку­ментов принадлежащих одной или нескольким предметным областям, родственным или смежным тематическим направ­лениям, производственным и технологическим процессам. О предметном содержании документов судят по модели его конструкции и ключевым словам, проще говоря, по модели «сущность - связь». Основное назначение модели «сущность - связь» заключается в семантическом описании предметной области и представлении информации для выбора схемы (модели) создаваемого информационного продукта.

Сущность - собирательное понятие или некоторая аб­стракция реально существующего мира, процесса, явления. В качестве сущности в информационных продуктах могут быть, как материальные (роторы, манипуляторы, компьюте­ры и т.д.), так и нематериальные (описания процессов, явле­ний, действий, например, описания в монографиях, научных статьях, отчетах, рефератах). Как правило, описание объек­тов, процессов, явлений, событий происходит на естествен­ном (принятом в обществе) языке.

Отображение отношений в модели «сущность-связь» показана на рисунке 8.

Тип сущности определяет набор однородных объектов.

Атрибут - это характеристика сущности, основным его назначением является описание свойства.

Экземпляр сущности - конкретный объект.

Первоосновой для создания частотных словарей являет­ся структурно-семантический анализ формулировок тем, за­главий и самих текстов документов.

Частотные словари, словари встречаемости, дескрипторные словари (тезаурусы) имеют особое значение, когда речь идет об информационной технологии (совокупности ме­тодов, способов и средств создания информационных доку­ментов).

Частотные словари позволяют выбрать лексические единицы, которые с большой эффективностью могут быть использованы не только для идентификации документа, но и поиска информации в нем. Уменьшаются затраты времени, средств при подготовке деловых документов, статистических отчетов и др.

 

 

Методы статистического индексирования документов основаны на научном предположении о том, что частота употребления слов связана с их значимостью для смысла до­кумента. У этой гипотезы есть серьезные оппоненты. Но соз­дание частотных микрословарей при подготовке информа­ционных продуктов, научно-аналитических отчетов, обзоров и других видов документов весьма полезно и эффективно. Фрагмент частотного словаря приведен ниже (табл. 4).

Алфавитный порядок используется при кодировании ключевых слов. Представление о видах записей ключевого слова дано на рис 9.

 

Таблица 4

Результаты анализа встречаемости ключевых слов в заглавиях информационного массива 68 документов, во­шедших в научно-аналитический обзор «Проблемы комплекса автоматизации и механизации производства» и 15 докумен­тов, используемых для иллюстрации настоящей методики

 

№ п/п

Ключевое слово, термин, понятие из заглавия документов, обзора

Частота встречаемости слов в коллекциях документов

68 документов 15 документов
1. Автоматизация 10 2
2. Детали корпусные 4 2
3. Внедрение 8 1
4. Загрузочное устройство 2 1
5. Исследования 15 4
6. Комплексы станочные, автоматиз. 2 2
7. Линии гибкие, автоматизированные 13 4
8. Машины роторные 6 2
9. Машиностроение 8 2
10. Механизация комплексная 4 2
11. Моделирование 1 1
12. Методология 5 1
13. Обработка материалов (технология) 11 3
14. Перспектива 1 1
15. Производство гмбкое, автоматиз. 5 2
16. Процесс производственный, технологич. 7 2
17. Разработка 21 6
18. Роботы промышленные 5 2
19. Системы станочные, автоматиз. 9 2
20. Создание 9 2
21. Средства вычислительной техники (ЭВМ) 5 1
22. Состояние 1 1
23. Станки с ЧПУ 1 2
24. Структура 3 1
25. Тело вращательное 3 1
26. Управление 3 1
27. Участок опорный (опытный) 3 1

 

Образование информационных массивов преследует цели:

• частотный словарь (табл. 4) - инструмент для оценки весомости лексических единиц при построении плана содержа­ния информационного пособия;

• результаты лексико-семантической обработки заглавий документов, (табл. 5), необходимы для определения инфор­мативности фрагментов документов на этапе их сегмента­ции (выделения);

• указатель соответствия (табл. 6), используется не только для поиска информации в информационных массивах, ор­ганизованных на основе различных ИПЯ, но и системати­зации записей в информационных пособиях (РЖ, сборни­ки НИР и ОКР, и др.);

• рубрикатор-план (табл. 7) для логической организации фрагментов документов в информационном пособии.

В методических рекомендациях использованы формали­зованные методы обработки информации на всех этапах соз­дания обзора (поиска информации, аналитико-синтетической обработки, индексирования, организации информационных массивов, включая информационный анализ документов и логической организации сегментов текстов документов). См. Приложение 2.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: