Инфорация: хранение символьных величин в памяти ЭВМ

Текстовая информация хранится в текстовом двоичном коде. Для этого каждому символу ставят соответствующее некоторое неотрицательное число – код символа. А это число записывается в память в двоичном виде.

Система кодировки (таблицы кодировки) - конкретное соответствие между символами и кодами.

В ПК используют 8-разрядная система. Использование 8-разрядных кодов позволяет закодировать 28=256 различных символов (каждый код занимает 1 байт памяти).

Обычно используют кодировку, которая обозначается – ASCII (American Standard Information Interchange – Американский стандартный код для информационного обмена). В ней содержатся две таблицы кодировки: базовая(0 - 127) и расширенная (128 - 255).

0 – 31: первые 32 кода отданы производителям аппаратных средств ПК. Здесь размещаются управляющие коды, которым соответствуют никакие символы языков, они не выводятся на экран (невидимые символы) и принтер, но они позволяют управлять выводом прочих данных.

32 – 127: содержат коды символов английского алфавита (у больших и маленьких букв разные коды), знаки препинания, арифметические знаки.

128 – 255: содержат расширенную таблицу, в которой хранятся коды национальных алфавитов (русский).

Русский алфавит закодирован 5-ю различными алфавитами:

1. Windows – 1251: используются в ЭВМ, работающих на платформе Windows.

2. КОИ-8: код обмена информации (8 знаков (разрядов) = 1 байт). Используется в компьютерных сетях на территории России и в российском секторе Интернет.

3. ISO (международный институт стандартизации): международный стандарт в котором закодированы русские символы.

4. Устаревшие кодировки, а также те которые используются крайне редко (ГОСТ).

Если кодировать символы 16-ю разрядами (хотя бы 2 байта отводить на один символ), то у нас получается 64536 различных кодов (216=65536).

Таблица кодировки, основанная на 16-ти разрядной кодировке называется Юникод (UNICODE). Она поддерживается некоторыми языками и операционными системами (язык – Java, и ОС Windows NT). Но есть недостаток - текстовые документы занимают больший объем памяти.

26. ПОНЯТИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА. НАПРАВЛЕНИЯ ИССЛЕДОВАНИЙ.[59]

ИИ - одно из направлений информатики, целью кот. явл. разработка аппаратно-программных средств, позволяющих пользователю ставить и решать задачи, традиционно считающиеся интеллектуальными, общаясь с ЭВМ, на ограниченном подмножестве естественного языка.

ИИ - машинное моделирование человеческих интеллектуальных функций.

Направление исследований:

1. Распознавание образов – разработка технических систем, воспринимающих визуальную и звуковую информацию, кодирующих и размещающих её в памяти ЭВМ, решение проблем понимания и логических рассуждений в процессе обработки визуальной и речевой информации (каждому объекту ставится в соответствии матрица признаков, по которой происходит его распознавание).

2. Математика и автоматическое доказательство теорем.

3. Игры и творчество – Традиционно искусственный интеллект включает в себя игровые интеллектуальные задания – шахматы, шашки и т.д. Игры, характеризующиеся конечным числом ситуаций и четко определенными правилами, с самого начала исследований по Искусственному Интеллекту привлекли к себе внимание как предпочтительные объекты исследования. Интеллектуальными системами был быстро достигнут и превзойден уровень человека средних способностей. Сейчас это скорее коммерческое направление, так как в научном плане идеи считаются тупиковыми.

4. Распозначание естественноязыковых интерфейсов и машинный перевод (Понимание естественного языка). В 50-х гг. одной из популярных тем исследований искусственного интеллекта являлась область машинного перевода. Первая программа в этой области – переводчик с английского на русский. Первая идея - - пословный перевод, оказалась неплодотворной. В настоящее время используется более сложная модель, включающая анализ и синтез естественно-языковых сообщений, которая состоит из нескольких блоков. Для анализа это (синтез включает аналогичные этапы, но несколько в другом порядке):

· Морфологический анализ – анализ слов в тексте.

· Синтаксический анализ – анализ предложений, грамматики и связей между словами.

· Семантический анализ – анализ смысла каждого предложения на основе некоторой предметно-ориентированной базы знаний.

· Прагматический анализ – анализ смысла предложений в окружающем контексте на основе собственной базы знаний.

5. Новые архитектуры ПК – Это направление занимается разработкой новых аппаратных решений и архитектур, направленных на обработку символьных и логических данных. Создаются Пролог- и Лисп- машины, компьютеры V и VI поколений. Последние разработки посвящены компьютерам баз данных и параллельным компьютерам.

6. Интеллектуальные роботы – Роботы – это электромеханические устройства, предназначенные для автоматизации человеческого труда. Идея создания роботов исключительно древняя. Само слово появилось в 20-х годах. Его автор – чешский писатель Карел Чапек. Со времени создания сменилось несколько поколений роботов. В настоящее время в мире изготавливается более 60 тыс. роботов в год.

I. Роботы с жесткой схемой управления. Практически все современные промышленные роботы принадлежат к первому поколению. Фактически это программируемые манипуляторы.

II. Адаптивные роботы с сенсорными устройствами. Есть образцы таких роботов, но в промышленности их пока не используются.

III. Самоорганизующиеся или интеллектуальные роботы. Это конечная цель развития робототехники. Основная проблема при создании интеллектуальных роботов – проблема машинного зрения.

7. Выявление и представление знаний специалистов в экспертных системах. ЭС-интеллектуальные системы, вобравшие в себя знания специалистов в конкретных видах деятельности – имеют большое практическое значение, с успехом применяются во многих областях, таких как автоматизированное проектирование, медицинская диагностика, химический анализ.

8. Специальное и программное обеспечение – В рамках этого направления разрабатываются специальные языки для решения задач невычислительного плана. Эти языки ориентированы на символьную обработку информации – LISP, PROLOG, SMALLTALK, РЕФАЛ и др. Помимо этого создаются пакеты прикладных программ, ориентированные на промышленную разработку интеллектуальных систем, или программные инструментарии искусственного интеллекта, например KEE, ARTS[10]. Достаточно популярно создание так называемых пустых экспертных систем, или оболочек, - EXSYS, M1 и др., в которых можно наполнять базы знаний, создавая различные системы.

9. Обучение и самообучение – Активно развивающаяся область искусственного интеллекта. Включает модели, методы и алгоритмы, ориентированные на автоматическое накопление знаний на основе анализа и обобщения данных. Включает обучение по примерам (или индуктивное), а также традиционные подходы распознавания образов.

Данные – это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства. Данные хранятся в базе данных.

Знаний – это выявленные закономерности предметной области (принципы, связи, законы), позволяющие решать задачи в этой области (или хорошо структурированные данные, или данные о данных, или метаданные). Знания хранятся в базе знаний. База знаний – основа любой интеллектуальной системы.

27. МОДЕЛЬ ДАННЫХ (МД). ПОНЯТИЕ МД. ВИДЫ МД. СВЯЗЬ МД С БД. ВИДЫ БД. ПРИМЕРЫ БД. РЕЛЯЦИОННАЯ БД (РБД): ПОНЯТИЕ, ОСНОВНЫЕ ЭЛЕМЕНТЫ БД И КРАТКАЯ ХАРАКТЕРИСТИКА РАБОТЫ С РБД.[33]

В основе любой БД лежит модель данных (информационная структура) – она является ядром БД.

Модель данных (МД) - совокупность правил организации структуры данных в БД, операций над ними, а также ограничений целостности, определяющих допустимые связи и значения данных, последовательность их изменения.

К числу классических относятся следующие модели данных: сетевая, иерархическая и реляционная. Однако в последние годы появляются новые МД, основанные на комбинации классических моделей или на некотором их подмножестве, например, постреляционная, многомерная и объектно-ориентированная. Разрабатываются также системы, основанные на таких МД, как объектно-реляционная, семантическая или ориентированная.

Виды МД:

1. Иерархическая модель – подчиненность объектов нижнего уровня объектам верхнего уровня (каталог файлов).

2. Сетевая модель – возможность устанавливать к вертикальным горизонтальные связи; произвольный граф, между верхними и нижними объектами задано соотношение «многие ко многим».

3. Реляционная МД – (relation-связь, отношение) организация данных таблиц. Каждая реляционная таблица – двумерный массив со следующими свойствами:

· Каждый элемент таблицы один.

· Все столбцы однородны, то есть имеют одинаковый тип и длину.

· Каждый столбец имеет уникальное имя.

· Одинаковые строки отсутствуют;

· Порядок следования строк и столбцов может быть произвольным.

4 .Многомерная БД предназначена для интерактивной аналитической обработки информации. Многомерность модели характеризует в 1-ю очередь лог структуру представления информации (не x, y, z, а строка, столбец, глубина). Эта модель удобна и эффективна при анализе данных (глубина). Но слишком громоздка для простейших задач.

5. Объектно-ориентиров МД - объединяет 2 модели: реляционную и сетевую. Логическая структура внешне похожа на иерархическую, отличается от неё методами нумерования данных.

6. Постреляционная представляет собой расширенную реляционную, сжимающую ограничения целостности данных, хранящихся в записи таблиц. Достоинство: возможность представления совокупности таблиц одной постреляционной таблицей. Недостаток: сложность решения проблем обеспечения целостности данных.

7. Объектно-реляционнная МД – гибрид объектной технологии и реляционной МД (работает с Visual Basic).

Классификация БД и примеры:

По характеру хранения:

1. Фактографическая – факты регистрируются как конкретные значения об объектах реального мира (картотеки, хранящиеся в хронологическом порядке).

2. Документальная – совокупность неструктурированных текстов, документов и графических объектов (архив).

По технологии обработки данных:

1. Централизованные – представлены на одном из множества компьютеров.

2. Распределенные – разделены на части и из частей представлена на конкретном ПК. Работа с такой БД осуществляется с помощью системы управления распределенной базой данных (СУРБД).

По способу доступа к данным:

1. С удаленным доступом (сетевая) – обращение к БД с другого компьютера.

2. С локальным доступом – обращение к БД текущего ПК без выхода в сеть.

Существует особый тип БД, кот называется БЗ (база Знаний) – лежит в основе экспертных систем, кот имитируют функции человека эксперта. В ней происходит анализ и накопление данных.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: