КТ на этапе сбора и предварительной обработки

Оглавление

1. Компьютерные технологии. Основные понятия. 2

2. КТ на этапе сбора и предварительной обработки. 3

2.3 Основные работы с СУБД. 9

Основные функции СУБД: 9

2.4 Классификации СУБД.. 10

По модели данных: 10

По степени распределённости: 10

По способу доступа к БД: 10

Основные операции, выполняемые в Access. 12

2.5. Система оптического распознавания. 14

Программы распознавания. 15

система распознавания на основе FineReader. 17

Распознавание. 19

Открытие изображения: 20

Запуск распознавания: 20

Установить расположение текста на странице: 20

Сохранить результаты распознавания в файл: 21

Принцип работы системы Trados (Традос). 27

Основные модули системы Trados (Традос) 27

Основные функции Metatexis (Метатексис). 28

База переводов и база терминологии Metatexis (Метатексис) 29

Статистика и индекс Metatexis (Метатексис): 30

Импорт и экспорт данных в Metatexis (Метатексис): 30

3. КТ в теоретических исследованиях. 31

3.2. Компьютерная поддержка в ТИ. 33

4. Задачи и состав экспериментальных исследований (ЭИ). 34

4. Обработка результатов. 37

4.2. Табличный процессор Excel В НИ. 39

5. КТ в оформлении результатов НИ.. 41

5.2. КВП. Основные сведения. 44

6. КТ в образовании. 48


 

Компьютерные технологии. Основные понятия.

 

Информационные технологии – это современные виды информационного обслуживания, основанные на использовании средств вычислительной техники (СВТ), связи, множительных средств и оргтехники.

Компьютерные технологии (КТ) являются частью информационных и обеспечивают сбор, обработку, хранение и передачу информации с помощью ЭВМ.

Основу современных КТ составляют 3 технологических достижения: возможность хранения информации на машинных носителях, развитие средств связи и автоматизация обработки информации с помощью компьютера.

Практически КТ реализуются применением программно-технических комплексов (ПТК), состоящих из персональных компьютеров (ПК) или рабочих станций (РС) с необходимым набором периферийных устройств, включенных в локальные и глобальные вычислительные сети и обеспеченных необходимыми программными средствами (ПС).

КТ повышают уровень эффективности работ в науке и образовании за счет следующих факторов:

1. Упрощение и ускорение процессов обработки, передачи, представления и хранения информации.

2. Увеличение объема полезной информации с накопителем типовых решений и обобщением опыта научных разработок.

3. Обеспечение глубины, точности и качества решаемых задач. Возможность реализации задач ранее не решаемых. Постановка исследований и получение результатов, недостижимых другими средствами.

4. Возможность анализа большого числа вариантов синтеза объектов и принятия решений.

5. Сокращение сроков разработки, трудоемкости и стоимости НИР при улучшении условий работы специалистов.

Исходя из задач НИ и порядка их реализации, можно определить следующие основные направления рационального применения КТ в научных исследованиях:

1. Сбор, хранение, поиск и выдача научно-технической информации (НТИ).

2. Подготовка программ НИ, подбор оборудования и экспериментальных устройств.

3. Математические расчеты.

4. Решение интеллектуально - логических задач.

5. Моделирование объектов и процессов.

6. Управление экспериментальными установками.

7. Регистрация и ввод в ЭВМ экспериментальных данных.

8. Обработка одномерных и многомерных (изображения) сигналов.

9. Обобщение и оценка результатов НИ.

10. Оформление и представление итогов НИ.

11. Управление научно-исследовательскими работами (НИР).

КТ на этапе сбора и предварительной обработки.

2.1 Виды НТИ и ее обработка.

При системном подходе НИ начинаются со сбора и предварительной об- работки НТИ по теме исследования. Эта информация может включать сведения о достижениях в исследуемой области, об оригинальных идеях, об открытых эффектах, научных разработках, технических решениях и т.д.

Целью данного этапа является получение ответов на следующие вопросы:

1. Какие авторы или научные группы занимаются аналогичной темой?

2. Каковы известные решения по исследуемой теме?

3. Какими известными методами и средствами решаются исследуемые проблемы?

4. Каковы недостатки известных решений и какими путями их пытаются преодолеть?

Основным источником информации являются научные документы, которые по способу представления могут быть текстовыми, графическими, аудиовизуальными и машиночитаемыми.

Научные документы подразделяются на первичные и вторичные, опубликованные и неопубликованные.

Первичные документы - это книги, брошюры, периодические издания (журналы, труды), научно-технические документы (стандарты, методические

указания). Важное значение здесь имеет также патентная документация, под

которой подразумеваются издания, содержащие сведения об открытиях, изобретениях и т.п.

К неопубликованным первичным документам относятся: научные отчеты, диссертации, депонированные рукописи и т.п. Они содержатся в фонде ВНТИЦентра.

Вторичные документы содержат краткую обобщенную информацию из одного или нескольких первичных документов: справочники, реферативныеиздания, библиографические указатели и т.п.

Сбор и обработка НТИ может быть выполнена следующими способами: анкетирование, собеседование, экспертный опрос и т.д., но основой является

работа с научно-техническими документами, которая включает поиск, ознакомление, проработку документов и систематизацию информации.

Поиск выполняется по каталогам, реферативным и библиографическим изданиям. Автоматизация этой процедуры обеспечивается использованием

специализированных информационно-поисковых систем (ИПС) библиотек и

научно-исследовательских институтов (НИИ), электронных каталогов, поиском в машиночитаемых базах данных (БД), а также с помощью программ поиска в сетях Internet.

Необходимо иметь в виду, что ИПС делятся на:

- документальные, позволяющие работать с полными текстами или адре-

сами документов;

- фактографические, которые выдают необходимые сведения из имеющихся документов;

-информационно-логические (интеллектуальные) представляют информацию, полученную в результате логического поиска и целенаправленного выбора в автоматизированном режиме.

БД - это совокупность взаимосвязанных, хранящихся вместе данных, для

поиска, изменения и добавления которых используются общие управляющие

ПС, называемые системами управления базами данных (СУБД). Кроме названного, СУБД обеспечивают сортировку, фильтрацию данных и формирование выходных документов (отчеты).

Наиболее распространенными СУБД являются Paradox, dBASE, FoxBase, FoxPro, Clipper, Informix, Oracle, Access и др. Для небольших БД могут быть использованы электронные таблицы (ЭТ).

 

2.2. Основные сведения по Internet.

Internet - всемирная система объединённых компьютерных сетей, построенная на базе протокола IP и маршрутизации IP-пакетов. Интернет образует глобальное информационное пространство, служит физической основой для Всемирной паутины (World Wide Web, WWW) и множества других систем (протоколов) передачи данных.

Интернет состоит из многих тысяч корпоративных, научных, правительственных и домашних компьютерных сетей. Объединение сетей разной архитектуры и топологии стало возможно благодаря протоколу IP (англ. Internet Protocol) и принципу маршрутизации пакетов данных.

Протокол IP был специально создан агностическим в отношении физических каналов связи. То есть любая система (сеть) передачи цифровых данных, проводная или беспроводная, для которой существует стандарт инкапсуляции в неё IP-пакетов, может передавать и трафик Интернета. Агностицизм протокола IP, в частности, означает, что компьютер или маршрутизатор должен знать тип сетей, к которым он непосредственно присоединён, и уметь работать с этими сетями; но не обязан (и в большинстве случаев не может) знать, какие сети находятся за маршрутизаторами.

На стыках сетей специальные маршрутизаторы (программные или аппаратные) занимаются автоматической сортировкой и перенаправлением пакетов данных, исходя из IP-адресов получателей этих пакетов. Протокол IP образует единое адресное пространство в масштабах всего мира, но в каждой отдельной сети может существовать и собственное адресное подпространство, которое выбирается исходя из класса сети. Такая организация IP-адресов позволяет маршрутизаторам однозначно определять дальнейшее направление для каждого пакета данных. В результате между отдельными сетями Интернета не возникает конфликтов, и данные беспрепятственно и точно передаются из сети в сеть по всей планете и ближнему космосу.

Сам протокол IP был рождён в дискуссиях внутри организации IETF (англ. Internet Engineering Task Force; Task force — группа специалистов для решения конкретной задачи), чьё название можно вольно перевести как «Группа по решению задач проектирования Интернета». IETF и её рабочие группы по сей день занимаются развитием протоколов Всемирной сети. IETF открыта для публичного участия и обсуждения. Комитеты организации публикуют так называемые документы RFC. В этих документах даются технические спецификации и точные объяснения по многим вопросам. Некоторые документы RFC возводятся организацией IAB (англ. Internet Architecture Board — Совет по архитектуре Интернета) в статус стандартов Интернета (англ. Internet Standard). С 1992 года IETF, IAB и ряд других интернет-организаций входят в Общество Интернета (англ. Internet Society, ISOC). Общество Интернета предоставляет организационную основу для разных исследовательских и консультативных групп, занимающихся развитием Интернета.

В настоящее время в Интернете существует достаточно большое количество сервисов, обеспечивающих работу со всем спектром ресурсов. Наиболее известными среди них являются:

· электронная почта (E-mail), обеспечивающая возможность обмена сообщениями одного человека с одним или несколькими абонентами;

· телеконференции, или группы новостей (Usenet), обеспечивающие возможность коллективного обмена сообщениями;

· сервис FTP — система файловых архивов, обеспечивающая хранение и пересылку файлов различных типов;

· сервис Telnet, предназначенный для управления удаленными компьютерами в терминальном режиме;

· World Wide Web (WWW, W3) — гипертекстовая (гипермедиа) система, предназначенная для интеграции различных сетевых ресурсов в единое информационное пространство;

· сервис DNS, или система доменных имен, обеспечивающий возможность использования для адресации узлов сети мнемонических имен вместо числовых адресов;

· сервис IRC, предназначенный для поддержки текстового общения в реальном времени (chat);

· Потоковое мультимедиа.

Перечисленные выше сервисы относятся к стандартным. Это означает, что принципы построения клиентского и серверного программного обеспечения, а также протоколы взаимодействия сформулированы в виде международных стандартов. Следовательно, разработчики программного обеспечения при практической реализации обязаны выдерживать общие технические требования.

Наряду со стандартными сервисами существуют и нестандартные, представляющие собой оригинальную разработку той или иной компании. В качестве примера можно привести различные системы типа Instant Messenger (своеобразные интернет-пейджеры — ICQ, AOl, Demos on-line и т. п.), системы интернет-телефонии, трансляции радио и видео и т. д. Важной особенностью таких систем является отсутствие международных стандартов, что может привести к возникновению технических конфликтов с другими подобными сервисами.

Для стандартных сервисов также стандартизируется и интерфейс взаимодействия с протоколами транспортного уровня. В частности, за каждым программным сервером резервируются стандартные номера TCP- и UDP-портов, которые остаются неизменными независимо от особенностей той или иной фирменной реализации как компонентов сервиса, так и транспортных протоколов. Номера портов клиентского программного обеспечения так жестко не регламентируются. Это объясняется следующими факторами:

· во-первых, на пользовательском узле может функционировать несколько копий клиентской программы, и каждая из них должна однозначно идентифицироваться транспортным протоколом, то есть за каждой копией должен быть закреплен свой уникальный номер порта;

· во-вторых, клиенту важна регламентация портов сервера, чтобы знать, куда направлять запрос, а сервер сможет ответить клиенту, узнав адрес из поступившего запроса.

 

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: