Ключевые слова, термины, выделенные из текста заглавия обзора и дополнительные за счет ключевых слов лексико-семантической обработки содержания понятий этих слов (фрагмент списка) |
Автоматизация комплексная |
Изделия (машиностроительная продукция) |
Машиностроение |
Механизация комплексная |
Орудия труда |
Продукты потребления (маш. пред.) |
И т.д. |
В результате обследования тематических рубрик с указанными классификационными индексами в справочно-информационном аппарате было обнаружено 68 документов, в т.ч.: отчеты о завершенных научно-исследовательских работах, опытно-конструкторских разработках, выполненных научно-исследовательскими, проектно-конструкторскими и технологическими организациями - 29, выполненными ВУЗами - 12; диссертаций - 3, монографий - 6, научных статей в журналах - 3, отчеты о загранкомандировках - 1, препринтов - 3, тезисы докладов на конференциях - 2, справочники - 3.
Перечисленные документы вошли в реферативный обзор по теме «Проблемы комплексной автоматизации и механизации машиностроения».
Полученные результаты лексико-семантической обработки ключевых слов имеют вид:
Ключевые слова, термины, понятия | Индексы ключевых слов в АПУ (УДК) |
Автоматизация комплексная | 621:62-529 |
Машиностроение | 621.003 |
Механизация комплексная | 621.9.002.5 |
Изделие | 622.9:006 |
Завод | 621:008 |
Задачи (исследование, разработка, испытание, эксплуатация) | 621.001/004 |
Орудия труда | 621.1:002.5 |
Проблемы | 621.9:001/009 |
Продукты потребления (машиностр. пром.) | 621.9:002.6 |
Производство | 621.9:002.2 |
Производство вспомогательное | 621.9:002.7 |
Производство основное | 621.9:002.2 |
Участок (организационная структура) | 621:008 |
Цех | 621:008 |
Фрагмент списка найденных документов обозначен двумя номерами, один из которых - в настоящем библиографическом списке, второй - из полного списка обзора:
№ п/п | № по реф. | Название |
1 | 3 | Пуш В. И., Пигерт Р. И др. Автоматические станочные системы. - М: Машиностроение, 1982. |
2 | 5 | Черпаков Б. И., Великович В. Б. Сокращение ручного труда при применении промышленных роботов. - М: Машиностроение, 1985. |
3 | 7 | Автоматизация производственных процессов в машиностроении - Тульский политехнический институт [Отчет НИР]. |
4 | 11 | Кернюхин И. Ф. Основы построения механических систем роторных технологических машин и автоматических линий. Диссертация на соискание д.т.н. - Тульский политехнический институт [Отчет НИР]. |
5 | 17 | Исследование и разработка роботизированных технологических процессов. - Ужгородский государственный университет [Отчет]. |
6 | 18 | Разработка, исследование и внедрение автоманипуляторов (промышленных роботов) для разгрузки станков с ЧПУ. - ПО «Уралмаш» [Отчет]. |
7 | 23 | Разработка методологии выбора и моделирования структуры производственных систем [ЧПУ, ОЦ, ГПЛ, ГПС]. |
8 | 28 | Оленевский В. М. Разработка и исследование систем управления на базе ЭВМ автоматизированных станочных комплексов для обработки комплексных деталей. - МИФИ [Отчет]. |
9 | 43 | Гибкое автоматическое производство. Под ред. С. А. Майорова и др. Л.: Машиностроение, 1985. |
10 | 46 | Создание типового гибкого технологического комплекса из станков с ЧПУ и управления от ЭВМ для обработки корпусных деталей на опытном участке НИИГавтопрома. - УНИПТИМаш [Отчет]. |
11 | 50 | Исследование и создание переналаживающихся автоматических линий для обработки тел вращения на базе оборудования с ЧПУ и средств ВТ. - УПИ [Отчет]. |
12 | 56 | Черпаков В. И., Землянов В. В. Использование устройств ЧПУ в специализированных станках в автоматических линиях для массового и крупносерийного производства//Станки и инструменты. - 1985. |
13 | 62 | Шенборд М. И. и др. Распределенные АСУ технологическими процессами. - М: Энергоатомиздат, 1985. |
14 | 65 | Разработка технических требований к алгоритмическим программным модулям для автоматизированных систем управления технологическими процессами машиностроения. - ЦНИИТЦ [Отчет]. |
15 | 68 | Состояние и перспективы системы числового программного управления системами ВНИИГПЭ [Отчет]. |
Лексико-семантическая обработка заглавий документов, вошедших в обзор. Суть лексико-семантической обработки изложена в предыдущих разделах и сводится к тому, что из текстов заглавий выделяются ключевые слова, термины, научные понятия. На каждое ключевое слово заполняется карточка.
Каждая запись на карточке получает инвентарный номер документа, который вошел в обзор.
Образованный массив ключевых слов, терминов и понятий систематизируется по алфавитному порядку и указывается частота появлений терминов в массиве. Алфавитная картотека после удаления дублирующих записей будет иметь следующий вид:
Алфавитный порядок позволит сберечь время на этапе индексирования ключевых слов при использовании алфавитно-предметного указателя, которым снабжаются информационно-поисковые языки и создать частотный словарь ключевых слов, выделенных из заглавий документов, вошедших в обзор.
2.3. Частотные словари и подготовка информационных продуктов
Частота - величина, выражающая повторение ключевых слов, терминов, понятий в информационном массиве и документах, отобранных для подготовки информационных и библиографических пособий. В частотном словаре при каждом слове указана частота появления слова в тексте документов принадлежащих одной или нескольким предметным областям, родственным или смежным тематическим направлениям, производственным и технологическим процессам. О предметном содержании документов судят по модели его конструкции и ключевым словам, проще говоря, по модели «сущность - связь». Основное назначение модели «сущность - связь» заключается в семантическом описании предметной области и представлении информации для выбора схемы (модели) создаваемого информационного продукта.
Сущность - собирательное понятие или некоторая абстракция реально существующего мира, процесса, явления. В качестве сущности в информационных продуктах могут быть, как материальные (роторы, манипуляторы, компьютеры и т.д.), так и нематериальные (описания процессов, явлений, действий, например, описания в монографиях, научных статьях, отчетах, рефератах). Как правило, описание объектов, процессов, явлений, событий происходит на естественном (принятом в обществе) языке.
Отображение отношений в модели «сущность-связь» показана на рисунке 8.
Тип сущности определяет набор однородных объектов.
Атрибут - это характеристика сущности, основным его назначением является описание свойства.
Экземпляр сущности - конкретный объект.
Первоосновой для создания частотных словарей является структурно-семантический анализ формулировок тем, заглавий и самих текстов документов.
Частотные словари, словари встречаемости, дескрипторные словари (тезаурусы) имеют особое значение, когда речь идет об информационной технологии (совокупности методов, способов и средств создания информационных документов).
Частотные словари позволяют выбрать лексические единицы, которые с большой эффективностью могут быть использованы не только для идентификации документа, но и поиска информации в нем. Уменьшаются затраты времени, средств при подготовке деловых документов, статистических отчетов и др.
Методы статистического индексирования документов основаны на научном предположении о том, что частота употребления слов связана с их значимостью для смысла документа. У этой гипотезы есть серьезные оппоненты. Но создание частотных микрословарей при подготовке информационных продуктов, научно-аналитических отчетов, обзоров и других видов документов весьма полезно и эффективно. Фрагмент частотного словаря приведен ниже (табл. 4).
Алфавитный порядок используется при кодировании ключевых слов. Представление о видах записей ключевого слова дано на рис 9.
Таблица 4
Результаты анализа встречаемости ключевых слов в заглавиях информационного массива 68 документов, вошедших в научно-аналитический обзор «Проблемы комплекса автоматизации и механизации производства» и 15 документов, используемых для иллюстрации настоящей методики
№ п/п | Ключевое слово, термин, понятие из заглавия документов, обзора | Частота встречаемости слов в коллекциях документов | |
68 документов | 15 документов | ||
1. | Автоматизация | 10 | 2 |
2. | Детали корпусные | 4 | 2 |
3. | Внедрение | 8 | 1 |
4. | Загрузочное устройство | 2 | 1 |
5. | Исследования | 15 | 4 |
6. | Комплексы станочные, автоматиз. | 2 | 2 |
7. | Линии гибкие, автоматизированные | 13 | 4 |
8. | Машины роторные | 6 | 2 |
9. | Машиностроение | 8 | 2 |
10. | Механизация комплексная | 4 | 2 |
11. | Моделирование | 1 | 1 |
12. | Методология | 5 | 1 |
13. | Обработка материалов (технология) | 11 | 3 |
14. | Перспектива | 1 | 1 |
15. | Производство гмбкое, автоматиз. | 5 | 2 |
16. | Процесс производственный, технологич. | 7 | 2 |
17. | Разработка | 21 | 6 |
18. | Роботы промышленные | 5 | 2 |
19. | Системы станочные, автоматиз. | 9 | 2 |
20. | Создание | 9 | 2 |
21. | Средства вычислительной техники (ЭВМ) | 5 | 1 |
22. | Состояние | 1 | 1 |
23. | Станки с ЧПУ | 1 | 2 |
24. | Структура | 3 | 1 |
25. | Тело вращательное | 3 | 1 |
26. | Управление | 3 | 1 |
27. | Участок опорный (опытный) | 3 | 1 |
Образование информационных массивов преследует цели:
• частотный словарь (табл. 4) - инструмент для оценки весомости лексических единиц при построении плана содержания информационного пособия;
• результаты лексико-семантической обработки заглавий документов, (табл. 5), необходимы для определения информативности фрагментов документов на этапе их сегментации (выделения);
• указатель соответствия (табл. 6), используется не только для поиска информации в информационных массивах, организованных на основе различных ИПЯ, но и систематизации записей в информационных пособиях (РЖ, сборники НИР и ОКР, и др.);
• рубрикатор-план (табл. 7) для логической организации фрагментов документов в информационном пособии.
В методических рекомендациях использованы формализованные методы обработки информации на всех этапах создания обзора (поиска информации, аналитико-синтетической обработки, индексирования, организации информационных массивов, включая информационный анализ документов и логической организации сегментов текстов документов). См. Приложение 2.