Основы кодирования данных двоичным кодом

Кафедра правовой информатики, информационного права

И естественнонаучных дисциплин

УТВЕРЖДАЮ

Заведующий кафедрой,

к.т.н., доцент

А.В. Мишин

«__» ноября 2014 г.

ПЛАН

Лекционного занятия

Дисциплина: «МАТЕМАТИКА И ИНФОРМАТИКА»

Тема 3: «ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ В ПЕРСОНАЛЬНОМ КОМПЬЮТЕРЕ»

Разработал:

профессор кафедры

д.т.н., доцент

Л.Е. Мистров

Материалы обсуждены и одобрены

на заседании кафедры ПИИПЕД,

Протокол № _ от «__» ноября 2014г.

Воронеж - 2014

План

и методические указания студентам на лекционное занятие

Тема 3: «Представление информации в персональном компьютере»

Цели занятия

1. Ознакомить с основами кодирования различного типа данных двоичным кодом в вычислительной технике.

2. Дать представление об основных структурах хранения данных.

3. Ознакомить с понятием файла, файловой структуры и единицах представления данных.

Учебно-материальное обеспечение

1. План и методические указания студентам на практическое занятие по данной теме.

2. Доска, мел.

ПЛАН ПРОВЕДЕНИЯ ЗАНЯТИЯ

Учебные вопросы Время, мин.
Вступительная часть ……………………………………………………... 1. Основы кодирования данных двоичным кодом …………………….. 2. Основные структуры данных ……………………………………….... 3. Файлы и файловая структура. Единицы представления данных…… Заключительная часть……………………………………………  

СОДЕРЖАНИЕ ЗАНЯТИЯ И МЕТОДИКА ЕГО ПРОВЕДЕНИЯ

Подготовительная часть. В часы самоподготовки студенты изучают рекомендованную литературу.

Литература:

основная:

1. Мистров Л.Е. Информатика и математика: Информатика: учеб. пособие / Л.Е. Мистров, А.Ю. Кузьмин, С.А. Мишин. – Воронеж: Научная книга, 2007.

дополнительная:

2. Информатика для юристов и экономистов: учебник для вузов / под ред. С.В. Симоновича. – СПб.: Питер, 2004.

Содержание занятия и методика его проведения

Подготовительная часть. В часы самоподготовки студенты повторяют лекционный материал, посвящённый вопросам представления числовых данных, изучают рекомендованную литературу и письменно выполняют следующую задачу.

Вступительная часть. Преподаватель проверяет наличие и готовность студентов к проведению занятия, делает соответствующие записи в журнале. Объявляется тема, цель и план проведения занятия. Акцентируется внимание студентов на важности изучаемой темы для усвоения последующего материала учебной дисциплины.

ОСНОВЫ КОДИРОВАНИЯ ДАННЫХ ДВОИЧНЫМ КОДОМ

Для автоматизации работы с различного типа данных необходимо унифицировать их форму представления на основе использования приема кодирования, то есть выражения данных одного типа через данные другого типа. Естественные человеческие языки — это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки (системы кодирования компонентов языка с помощью графических символов). Универсальные средства кодирования достаточно успешно реализуется в отдельных отраслях техники, науки и культуры (системы записи математических выражений, телеграфная азбука, морская флажковая азбука, система Брайля для слепых и многие другие).

Своя система кодирования существует и в вычислительной технике — она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков; 0 и 1. Эти знаки называются двоичными цифрами, по-английски — binary digit, или, сокращенно, bit (бит).

Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т. п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия: 00 01 10 11. Тремя битами можно закодировать восемь различных значений: 000 001 010 011 100 101 110 111. То есть, увеличивая каждый раз на единицу количество разрядов, увеличивается в два раза количество значений, которое может быть выражено в данной системе счисления.

Кодом называется уникальное беззнаковое целое двоичное число, поставленное в соответствие некоторому символу. Для хранения двоичного кода одного символа выделен 1 байт=8 бит. Учитывая, что каждый бит принимает значение 1 или 0, количество возможных сочетаний единиц и нулей равно 28=256. Следовательно, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов.

Кодирование целых и действительных чисел. Для кодирования целых чисел от 0 до 255 достаточно иметь 8 разрядов двоичного кода (бит).

00000000=0

0000 0001=1

……………….

1111 1110=254

11111111=255

Шестнадцать бит позволяют закодировать целые числа от 0 до 65535, а 24 бита — уже более 16,5 миллионов разных значений.

Особенностью кодирования чисел является то, что они кодируются в двух случаях - при вводе-выводе и когда они встречаются в тексте. Если они используются в вычислениях, то осуществляется их преобразование двоичный код по правилам перевода чисел из одной системы счисления в другую. При использовании числа в тексте потребует для своего представления 2 байта, поскольку каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII в виде: 00110010 00110111. При использовании в вычислениях код этого числа получается по специальным правилам перевода и представляется в виде 8-разрядного двоичного числа 00011011, на что потребуется 1 байт.

Кодирование текстовых данных. Для кодирования текстовых данных необходимо каждому символу алфавита сопоставить определенное целое число (например, порядковый номер) - это позволяет с помощью двоичного кода кодировать и текстовую информацию. Различных комбинаций восьми двоичных разрядов достаточно для кодирования 256 различных строчных и прописных символов английского и русского алфавитов, знаков препинания, символов основных арифметических действий и некоторых общепринятых специальных символов.

Технически реализовать это просто, однако всегда существовали организационные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время вызваны, наоборот, изобилием одновременно действующих и противоречивых стандартов.

Институтом стандартизации США (ANSI — American National Standard Institute) введена в действие системы кодирования ASCII (American Standard Code for Information Interchange — стандартный код информационного обмена США), в которойзакреплены две таблицы кодирования: базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Первые 32 символа являются управляющими и предназначены в основном для передачи команд управления. Их назначение может варьироваться в зависимости от программных и аппаратных средств. В базовой таблице, начиная с 32 кода по 127 код размещены коды символов английского алфавита, знаков препинания, цифр, арифметических действий и некоторых вспомогательных символов. Расширенная таблица (символы с номерами от 128 до 255) американским стандартом не определена и предназначена для символов национальных алфавитов, псевдографических и некоторых математических символов. В разных странах могут использоваться различные варианты второй половины кодовой таблицы.

Отсутствие единого стандарта расширенной таблицы ASCII кодов привело к множественности одновременно действующих кодировок. Только в России можно указать несколько действующих стандартов кодировки. Так, например, кодировка символов русского языка, известная как кодировка Windows-1251, была введена компанией Microsoft, и учитывая широкое распространение программных продуктов этой компании в России, глубоко закрепилась и нашла широкое распространение. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows (она также стала стандартной в российском секторе World Wide Web).

Другая распространенная кодировка носит название КОИ-8 (код обмена информацией, восьмизначный). Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в некоторых службах российского сектора Интернета. В частности, в России она является стандартной в сообщениях электронной почты и телеконференций.

Аналогичные системы кодирования текстовых данных были разработаны и в других странах. Так, например, в СССР в этой области действовала система кодирования КОИ-7 (код обмена информацией, семизначный). Однако поддержка производителей оборудования и программ вывела американский код ASCII на уровень международного стандарта, и национальным системам кодирования использовать вторую часть расширенной системы кодирования, определяющую значения кодов со 128 по 255.

Основные организационные трудности, связанные с созданием единой системы кодирования текстовых данных вызваны ограниченным набором кодов (256). Очевидно, что если, например, кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного больше. Такая система, основанная на 16-разрядном кодировании символов, получила название универсальной — UNICODE. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65536 различных символов — этого достаточно для размещения в одной таблице символов большинства языков планеты.

Несмотря на тривиальную очевидность такого подхода, простой механический переход на данную систему долгое время сдерживался из-за недостаточных ресурсов средств вычислительной техники (в системе кодирования UNICODE все текстовые документы автоматически становятся вдвое длиннее). В настоящее время технические средства достигли необходимого уровня обеспеченности ресурсами, и сегодня осуществляется постепенный перевод документов и программных средств на универсальную систему кодирования.

Кодирование графических данных. Если рассмотреть с помощью увеличительного стекла черно-белое графическое изображение, то видно, что оно состоит из мельчайших точек, образующих характерный узор, называемый растром. Так как линейные координаты и индивидуальные свойства каждой точки (яркость) можно выразить с помощью целых чисел, то растровое кодирование позволяет использовать двоичный код для представления графических данных. Общепринятым на сегодняшний день считается представление черно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета. Исходя из этого для кодирования яркости любой точки достаточно восьмиразрядного двоичного числа.

Для кодирования цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие. В качестве таких составляющих используют три основных цвета: красный (Red, R), зеленый (Green, G) и синий (Blue, В). На практике считается, что любой цвет, видимый человеческим глазом, можно получить путем механического смешения этих трех основных цветов. Такая система кодирования называется системой RGB по первым буквам названий основных цветов.

Если для кодирования яркости каждой из основных составляющих использовать по 256 значений (восемь двоичных разрядов), как это принято для полутоновых черно-белых изображений, то на кодирование цвета одной точки надо затратить 24 разряда. При этом система кодирования обеспечивает однозначное определение 16,5 млн. различных цветов, что близко к чувствительности человеческого глаза. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color).

Каждому из основных цветов можно поставить в соответствие дополнительный цвет, то есть цвет, дополняющий основной цвет до белого. Нетрудно заметить, что для любого из основных цветов дополнительным будет цвет, образованный суммой пары остальных основных цветов. Соответственно, дополнительными цветами являются: голубой (Cyan, С), пурпурный (Magenta, М) и желтый (Yellow, Y). Принцип декомпозиции произвольного цвета на составляющие компоненты можно применять не только для основных цветов, но и для дополнительных, то есть любой цвет можно представить в виде суммы голубой, пурпурной и желтой составляющей. Такой метод кодирования цвета принят в полиграфии, но в полиграфии используется еще и четвертая краска — черная (Black, К). Поэтому данная система кодирования обозначается четырьмя буквами CMYK (черный цвет обозначается буквой К, потому что буква В уже занята синим цветом), и для представления цветной графики в этой системе надо иметь 32 двоичных разряда (такой режим тоже называется полноцветным (Тrие Color)).

Если уменьшить количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объем данных. При этом диапазон кодируемых цветов заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color.

При кодировании информации о цвете с помощью восьми бит данных можно передать только 256 цветовых оттенков. Такой метод кодирования цвета называется индексным. Смысл названия в том, что, поскольку 256 значений совершенно недостаточно, чтобы передать весь диапазон цветов, доступный человеческому глазу, код каждой точки растра выражает не цвет сам по себе, а только его номер (индекс) в некоей справочной таблице, называемой палитрой. Эта палитра должна прикладываться к графическим данным — без нее нельзя воспользоваться методами воспроизведения информации на экране или бумаге.

Кодирование звуковой информации. Приемы и методы работы со звуковой информациейнашли применение в вычислительной технике сравнительно недавно. Поэтому методы кодирования звуковой информации двоичным кодом далеки от стандартизации. Множество отдельных компаний разработали свои корпоративные стандарты.

В общем случае кодирование звуковой информации представлятся технологически следующим образом. Звук - это упругая продольная волна в воздушной среде. Чтобы ее представить в виде, читаемом компьютером, необходимо звуковой сигнал преобразовать в электрический аналог звука с помощью микрофона (см. рис. 1). Электрический аналог имеет аналоговую форму и не обрабатываться на цифровом компьютере. Для перевода сигнала в цифровой код необходимо его пропустить через аналого-цифровой преобразователь (АЦП). При воспроизведении происходит обратное преобразование - цифро-аналоговое (через ЦАП). Конструктивно АЦП и ЦАП находятся в звуковой карте компьютера.

Таким образом при двоичном кодировании аналогового звукового сигнала непрерывный сигнал дискретизируется (оцифровывается), т.е. заменяется серией отдельных выборок (см. рис. 2). Качество двоичного кодирования зависит от количества распознаваемых дискретных уровней сигнала и количества выборок в секунду.

Рис. 1. Схема обработки звукового сигнала

Рис. 2. Схема дискретизации звукового сигнала

Различные звуковые карты могут обеспечить как 8-, так и 16-битные выборки. При замене непрерывного звукового сигнала его дискретным представлением в виде ступенек 8-битные карты позволяют закодировать 256 различных уровней дискретизации звукового сигнала, соответственно 16-битные - 65 536 уровней.

Частота дискретизации аналогового звукового сигнала (количество выборок в секунду) также может принимать различные значения (5.5, 11, 22 и 44 кГц). Исходя из этого качество звука в дискретной форме может быть очень плохим (качество радиотрансляции) при 8 битах и 5,5 кГц и весьма высоким (качество аудио-СD) при 16 битах и 44 кГц.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: