Информация и её свойства

Информация – это любые сведенья, являющиеся объектом хранения, передачи, преобразования.

Источники информации: лекции, доклады, лабораторные работы, практические занятия, СМИ, Интернет, устное общение, фотографии и т.д.

Источником информации может быть как человек, так и система, генерирующая информацию по состоянию некоторого физического объекта. Под генерирование понимают всю совокупность процессов, в результате которых возникает новая информация, то есть та, которая отсутствует в системе и которую нельзя получить на основе уже имеющейся. В процессе генерирования осуществляется целенаправленное извлечение и анализ сведений о каком-либо объекте.

Информация – это совокупность некоторых сведений о какой-либо материальной системе (предмете, объекте, процессе, событии), предназначенных для передачи, преобразования и хранения.

 

Информация:

. Личная

. Массовая

. Специальная

Важным является то, что независимо от природы и способов получения информация обладает четырьмя общими свойствами: её можно создавать, хранить, обрабатывать и передавать. Самый дорогой товар в настоящее время – информация.

Виды и меры информации:

1) Синтаксический.

2) Семантический.

3) Прагматический.

Синтаксическая информация формально отображает структурные характеристики информации и не затрагивает их смыслового содержания. Такую информацию называют данными, так как при этом не имеет значения смысловая сторона. Данные – это факты, признаки, наблюдения, фиксирующие результат или ход процесса. Они могут быть представлены в числовом, буквенном, графическом изображении и других, то есть это продукт, подлежащий переработке в целях обеспечения информационных задач.

Семантическая информация характеризует смысловое содержание сообщения.

Прагматическая информация отображает отношение информации и её потребителя, соответствие информации цели управления, которая на её основе реализуется. Прагматический аспект связан с рассмотрением её ценностей.

Количество информации I– это степень уменьшения неопределенности после получения сообщения в виде некоторого сигнала, которая определяется как разность неопределенности до и после получения сообщения.

I=H(α)-H(β)

H(α) – мера неосведомленности потребителя информации до получения информации.

H(β) – мера неосведомленности после получения информации.


 

Понятие Тезауруса:

Тезаурус - это совокупность сведений, которыми располагает пользователь или система в конкретной предметной области.

Максимальное количество семантической информации потребитель приобретает при согласовании её смыслового содержания с его тезаурусом.

Количество семантической информации в сообщении, то есть количество новых знаний, полученных пользователем, является величиной относительной.

Понятие системы счисления:

Система счисления – это совокупность цифр и правила для обозначения чисел.

Системы счисления:

- позиционная.

- непозиционная.

Непозиционные системы счисления – системы, в которых символы, использующиеся для представления числа, не меняют своего значения с изменением местоположения. Например, римская:I, V, X, C (правило: если цифра слева меньше цифры справа, то левая вычитается из правой. Если цифра справа меньше или равна цифре слева, то эти цифры складываются).

Позиционная система счисления – это упорядоченный набор символов, заданных алфавитом. Число символов или цифр алфавита называют основанием системы

десятеричная двоичная восьмеричная шестнадцатеричная
       
       
       
       
       
       
       
       
       
       
      А
      Б

Двоичная система счисления.

Достоинства:

-простота вычисления элементарных операций

-простота технической реализации технических элементов и устройств хранения

-тесная взаимосвязь с символьной.

Недостатки:

-длинна

Шестнадцатеричная система счисления (0123456789ABCDEF)

Используется в программировании для сокращения записи двоичных чисел.

Внутри компьютеров информация представляется в двоичной системе. В операциях ввода\вывода она преобразуется в другие системы и обратно. Различают перевод целых, дробных и смешанных чисел.

Перевод целых чисел из 10-ой в q-ую.

-деление на основание системы

-метод поразрядного взвешивания

-метод взвешенного кодирования.

Деление на основание: исходное Х делится на основание q и получаются остатки до получения остатка меньшего q.Полученные остатки являются рядами чисел в q-ой системе. Последний является старшим разрядом нового числа.

Разрядное взвешивание:

-необходимо определить число двоичных разрядов, требуемое для размещения данного двоичного числа

-исключаем ненужные веса, путем выбора нулевых значение соответствующих коэффициентов.

Перевод дробных чисел:

При переводе дробных чисел говорят о переводе с заданной точностью, используют метод последовательного умножения на основания новой системы счисления q. Исходное число Х и получившиеся дробные части последовательно умножают на q до получения дробной части, равной 0 или до получения нужного количества цифр в q-ой записи числа. При переводе дробных чисел,содержащих знаменатель в форме кратной двойки, числитель переводится по правилу целых чисел, а затем точка переносится на n разрядов влево, где n- степень двойки.

Перевод смешанных чисел:

При переводе смешанного числа его целая и дробная части переводятся отдельно, а затем соединяются через точку.

Информация и данные:

Понятия «информация» и «данные» часто отождествляют, но это неправильно.

Данные – это конкретная реализация информации. Они могут быть представлены в числовом, графическом или символьном виде. Данные становятся информацией только при решении конкретной проблемы, то есть в ходе их потребления.

Информация – это лишь те данные, которые устраняют неопределенность в холе решения вопроса и позволяют принять соответствующее решение.

Превращение данных в информации осуществляется потребителем на основе собственной информационной модели. Информационная модель объекта – совокупность характеристик объекта вместе с числовым или иным значением.

Форма представления данных определяется время и усилия, которые необходимо затратить пользователю на получение информации, что влияет на потребительскую деятельность и стоимость информации.

Операции с данными:

Сбор данных – накопление информации с целью обеспечения достаточной полноты для принятия решения.

Формализация – приведение данных к одной форме.

Сортировка – упорядочение данных по заданному признаку.

Архивация - организация хранения данных в удобной и доступной форме.

Преобразование – переход данных из одной формы в другую.

Защита данных – комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных.

Транспортировка - процесс передачи информации.

Общая схема передачи данных:

Процессы, связанные с операциями над данными называются информационными процессами, а символы, реализующие их – информационными системами.

Информационная система – организационно упорядоченная совокупность документов и информационных технологий, реализующих вопросы.

Различают информационные системы:

1) Информационно-справочные системы.

2) Информационно-поисковые системы.

3) Системы обработки и передачи данных.

4) Системы связи.

5) Системы управления.

Количественная оценка информации:

Такая оценка информации необходима, чтобы сравнить друг с другом массивы хранящейся или передаваемой информации, а также оценить размеры носителей.

Для количественной оценки информации, выраженной в любой из форм, её принято представлять в виде двоичной последовательности (количество бит).

Представление различных видов информации:

- какие коды использовать

- в каком порядке их записывать

- в каком порядке хранить

- в каком порядке передавать

То есть должен быть определен язык представления информации, а основными характеристиками языка являются способ представления и объем.

Кодирование символов байтом:

Вид это количество информации, находящееся в сообщении, в котором одна случайная величина с равной вероятностью может принимать одно из двух значений.

Байт это 8-ми разрядная двоичная последовательность.

А-110000012

кб=1024байт=210байт=1024∙8бит

мб=1024кб=220байт

гб=1024мб=230байт

тб=1024гб=240байт

для хранения графической информации в двоичной системе используется растровое представление. Изображение представляется в виде матрицы, состоящей из квадратных областей, то есть точек или пикселей. Любой цвет может быть представлен в виде суммы 3 цветов: зеленого, синего и красного. Есть две характеристики: цвет и яркость. Если яркость разбить на 256 градаций, то для хранения информации о каждой точки нужно 8 бит или 24 бита.

Вероятностная оценка количества информации:

Сообщение передается от источника к приемнику в материально-энергетической форме, например, в форме энергетического, звукового или иного сигнала.

В реальной жизни мы имеем дело с событиями, точный результат которых непредсказуем. Идеализированную модель таких событий называют опытом, а возможный вариант результата исходом.

Вероятность – это число, характеризующее меру потенциальной возможности осуществления.

Понятие энтропии:

Н=-ΣPilog2Pii=(1…n)

Количество информации тем больше, чем больше свободы в выборе сообщения, то есть чем более неопределенно или менее вероятно передаваемое сообщение.

Оценка качества информации:

1) Достаточность

2) Адекватность

3) Реливантность

4) Важность

5) Толерантность

Адекватность определяется двумя характеристиками:

1) Объективность информации о предмете.

2) Продолжительность интервала времени между началом съемной информации и текущим сообщением.

Отличают 2 вида информации: документальную и фактографическую.

К первому относят источники, где могут быть данные, а ко второму факты.

Толерантность характеризуется временем на извлечение, средствами, затраченными на извлечение, возможностью восприятия.

Информация о внешнем мире поступает через органы чувств в огромных количествах. Часть мозга, которую условно называют процессором восприятия, постоянно без участия сознания перерабатывает её, сравнивая с прошлым опытом, и помещает в хранилище в виде звуковых, зрительных и прочих образов.

Любые значимые или внезапные изменения в окружении привлекают наше внимание, и тогда интересующая нас информация поступает в кратковременную память. Если наше внимание не было привлечено, то информация пропадает, замещаясь следующей.

Каждый момент времени фокус внимания может фиксироваться в одной точке.

Средства и способы передачи информации:

Сообщение – некоторая форма представления информации (текст, звук, видео…)

Сообщение – это (с формальной точки зрения) некоторая совокупность знаков или первичных сигналов.

Представление сообщения – это его конкретная форма.

Помимопредставление важно выявлять способ выявления значения информации.

Переход от представления информации к её значению называется интерпретацией.

Извлечение информации обычно связано с изменением во времени значений некоторой величины, характеризующей состояние источника информации. Сообщение можно представить в виде функции времени. Эта функция может быть двух видов: аналоговой или дискретной.

Аналоговая функция представляется в виде непрерывного ряда вещественных значений физической величины в диапазоне времени.

Дискретная функция на любом конечном отрезке или интервале принимает конечное число различных значений.

Сообщения, описываемые функциями, могут быть аналоговыми или дискретными.

Виды сигналов и их классификации:

Сигнал – это физическое явление или процесс, несущий информацию, то есть сообщение о каком либо событии или состоянии объекта наблюдения.

По характеру все сигналы можно разделить на 4 группы:

1) Непрерывная функция непрерывного аргумента. Такие сигналы называются непрерывными или аналоговыми. Изменяться такие сигналы могут в произвольный момент времени и принимать могут любые значения из бесконечного множества.

2) Непрерывная функция дискретного аргумента. Функция может принимать произвольные значения, но изменяться только в определенные моменты времени (квантование по времени/дискретизация). Дискретизация позволяет любой непрерывный сигнал представить набором отдельных мгновенных значений.

3) Дискретная функция непрерывного аргумента. Дискретный сигнал может изменяться в произвольный момент времени, но величина сигнала может принимать только разрешенные дискретные уровни.

Процесс замены непрерывной функции ограниченным числом значений по шкале уровней называется квантованием по уровню.

Непрерывное значение сигнала в некоторый момент времени tможно представить ближайшим значением по шкале уровней. Такое квантование приводит к погрешностям (эта погрешность называется шумом квантования). Обычно считают, что шум кантования случайный и подчиняется равномерному закону распределения.

 

 

4) Дискретная функция дискретного аргумента.

5)

Система связи осуществляет перенос сигнала из одной точки пространства в другую.

Передатчик преобразовывает сообщение в некоторый сигнал по строго определенным правилам. Затем этот сигнал на основе некоторого физического носителя передается по каналу связи. Сигнал по каналу связи поступает в приемник, где его необходимо преобразовать в сообщение обратно. Это сообщение отличается от исходного, так как в канале связи бывают помехи. Восстановление переданного сообщения по принятому сигналу осуществляется по некоторому правилу приемником путем выбора из известного множества сообщений одного, которое в идеальном случае полностью совпадает с переданным, а в общем случае было бы близким. Степень соответствия между принятым и переданным сигналом определяет достоверность передачи данных достоверность передачи данных в вычислительной технике характеризуется вероятностью искажения бита(10-5/10-6).


Спектральное представление сигналов:

Реальные электромагнитные сигналы представляют совокупность множества частот. Любой периодический сигнал может быть представлен в виде суммы синусоид (ряд Фурье)

Каждая из составляющих синусоид называется гармоникой. W1 – собственная частота. Все остальные частоты кратны этой собственной частоте. Тогда полученный сигнал будет периодическим.

Если U0не равен нулю, то сигнал UTсодержит постоянную составляющую(смещение среднего значение сигнала от нуля). Такое представление сигнала называется синусно-косинусным. Оно удобно для вычисления, но неудобно, что на каждой частоте имеются различные компоненты (sinиcos)

Амплитудно-фазовое представление сигнала:

Диаграмма распределения сигнала по частоте амплитуд и фаз гармонических составляющих называется спектральной диаграммой сигнала. Структура частотного спектра полностью определяется двумя характеристиками: амплитудой и фазой. Если нас интересует не значение амплитуд и фаз, а только частоты, на которых они присутствуют, то говорят о частотном спектре сигнала:

Все аналоговые и цифровые сигналы состоят из набора гармоник, принадлежащих некоторому диапазону частот (спектру). Так же у сигнала выделяется такое понятие, как ширина полосы. Абсолютной шириной полосы сигнала называют ширину его спектра. Большая часть энергии таких сигналов в общем случае ширины бесконечна, но большая часть сигнала находится в узкой полосе частот (фиктивная полоса сигнала).

Искажающие факторы:

1) Затухание – это относительное уменьшение амплитуды или мощности сигнала при передаче по каналу связи. Затухание: А=lg(Pвыхода/Pвхода)

2) Ограниченность полосы пропускания – характеристика, определяющая диапазон частот, которые передаются по каналу связи без значительных искажений.

3) Задержка.

4) Шумы.

5) Пропускная способность линий характеризует максимально возможную скорость передачи данных по линии связи. Пропускная способность зависит от АЧХ(амплитудно-частотная характеристика).

 

Передача данных:

Система передачи данных – это совокупность технических средств, служащих для передачи данных на расстоянии.

Источник (например, компьютер) генерирует данные.

Переданные данные преобразуются в сигнал, который преобразовывается в физической среде.

Преобразование:

1) Преобразование формы.

2) Модуляция.

3) Кодирование.

Приемник преобразует полученный сигнал в форму, удобную для обработки.

Задача передачи сигнала, имеющего определенные характеристики, требует согласование этих характеристик с соответствующими параметрами канала связи: 1) длительность передачи (Тс) 2) максимальная частота спектра (Fc) 3) мощность сигнала (Sc). Под мощностью понимают допустимые превышения средней мощности передаваемого сигнала над средней мощностью помехи. Sc=lg(Pе/Pn)

Объем сигнала: Vc=TcFcSс

Аналогические характеристики используются для канала связи.

Для того, чтобы передать сигнал без искажения, должно выполняться соотношение Vc<Vkc(Vkc-объем канала связи).

Следует различать понятия «канал связи» и «линии связи».

Канал связи (кс) – средство односторонней передачи данных (например, полоса частот, выделенная одному передатчику).

Линия связи (лс) – некоторая физическая среда, по которой передается сигнал. Линии: проводные(телеграф), кабельные, радиоканалы, инфракрасные частоты.

Кабель – это изделие, содержащее проводники, заключенные в несколько слоев изоляции. Этими слоями могут быть электрическая изоляция, электромагнитная изоляция, механическая и климатическая изоляции. В вычислительной технике применяются 3 вида кабеля: 1) Витая пара (кабель на основе скрученных пар медных проводников). Может быть экранированной и неэкранированной. Скручивание проводников снижает влияние внешних помех на полезные сигналы. 2) Коаксиальный кабель. Представляет полный цилиндр (один из проводников), внутри вложен второй, изолированный проводник. Коаксиальный кабель меньше подвержен воздействию интерференции и перекрестных помех, поэтому он используется при прокладке линии связи на больших расстояниях. 3) Волоконно-оптический кабель. Состоит из волокон диаметром в несколько микрон, окруженных твердым покрытием и помещенных в защитную оболочку. Средой распространения сигнала является свет. Источник сигнала – светодиод. Этот диод является монохромным. Позволяет организовывать несколько каналов. Такой кабель более помехозащищенный, имеет меньший вес, более низкое затухание сигнала, намного более низкое излучение, как следствие всего этого, позволяет передавать информацию с высокой скоростью (10 мегабит и выше)


 

Радиолинии:

В радиолиниях передачей сигнала физической средой являются высокочастотные электромагнитные колебания.

Диапазоны частот:

1) От 30МГц до 100МГц – часть диапазона ультравысоких частот (радио, телевиденье)

2) От 2 до 40 МГц – диапазон сверхвысоких частот (в спутниковой связи). Линия связи должна быть в прямой видимости.

3) От 3∙1011 до 2∙1014 Гц – инфракрасный диапазон (при передаче данных в ограниченном пространстве, в двухточечных и многоточечных приложениях).

Модуляция сигналов:

Аналоговая обработка – модуляция. Цифровая – цифровое кодирование.

Преимущества: 1)для передачи сигнала требуются более низкие частоты. 2) модуляция допускает частотное уплотнение, что позволяет эффективно использовать высокоскоростные линии связи.

Модуляция –это процесс изменения параметров сигнала переносчика в соответствии с передаваемым сообщением.

Различают 3 вида модуляции:

1) Амплитудная модуляция.Амплитудно-модулированный сигнал- это сигнал,амплитуда которого изменяется во времени по какому-либо закону.

2) Частотная модуляция- более помехоустойчива

3) Фазовая модуляция

Также используются цифровые модуляции аналоговых сигналов:

1) Импульсно-кодовая модуляция- используется для передачи сигнала по цифровым линиям связи. В цифровой телефонии используется 8-ми битное кодирование, частота 11Кгц.

2) Дельта-сигма модуляция- при кодировании каждого уровня аналогового сигнала требуется передавать только несколько битов, определяющих разнице с предыдущим уровнем. На практике часто используется единичное изменение уровня(1бит). Если использовать достаточно большую частоту(2.8 Мгц), то качество звука будет сопоставимо с качеством аудио dvd. Для уменьшения информационного потока часто применяется кодирование повторяющихся последовательностей битов.

Кодирование информации:

Кодирование информации – это преобразование формы представления информации с целью удобства её передачи по каналам связи или хранением. В более широком смысле под кодированием можно понимать представление символов одного алфавита символами другого.

Декодирование информации – операция обратная кодированию (обычно восстановление принятого сообщения).

Устройства кодирования называют кодерами, декодирования – декодерами.

Будем рассматривать кодирование, как представление дискретных сообщений в виде некоторых комбинаций, составленных по определенным правилам из определенного числа символов, то есть элементов кода. Число различных элементов, из которых составляется комбинация называется основанием кода q.

Общее количество кодовых комбинаций можно определить по формуле:

m=qn

общие требования к кодированию:

1) Среднее число символов, приходящихся на единицу сообщения, должно быть минимальным. Такое требование при отсутствии помех приводит к выигрышу в скорости передачи сообщения, а также позволяет сократить затраты памяти на хранение сообщения. Такое кодирование называется безызбыточным или оптимальным.

2) Кодирование должно обеспечивать заданную достоверность при передаче или хранении сообщения. Такое кодирование называется избыточным или помехоустойчивым.

Разрешение противоречий этих требований в системе передачи данных – использование двух различных алфавитов:

1) Внешний (для представления сообщений на языке источника и получателя). Он имеет достаточно большой объем.

2) Внутренний используется для передачи информации по каналу связи. Он использует меньший объем, поскольку, чем меньше символов содержит внутренний алфавит, тем легче их различать в условия помех.

Типы кодов: 1. Безызбыточные(первичные). 2. Избыточные(корректирующиеся).

 

 

Диапазон представления для беззнаковых чисел0≤х≤2n-1

Для чисел со знаком -2n-1≤х≤2n-1-1

Отрицательные числа обычно хранятся в дополнительном коде

ХДК=Х, если 0≤Х

ХДК=|X|+1, если Х<0

Принцип организации ЭВМ:

-архитектура

-структура

Архитектура- это совокупность свойств компьютера, которые существенны для пользователя.

Структура- это некоторая модель, описывающая логическую модель на уровне аппаратуры.

Структура УП имеет линейно-адресную организацию, состоит из расположенными друг за другом ячеек (байтов)0-1. Такая память называется адресное пространство. Номер ячейки- ее адрес.

Представление информации в ЭВМ:

Данные в ЭВМ представляются в виде, удобном для восприятия ЭВМ(двоичное кодирование)

старший байт-7 -- -- -- -- -- -- 0-младший байт

Регистровая модель процессора:

31 15 0

  AH AL
  BY BL
  CH CL
  DH DL

EAX

EBX

ECX

EDX

Регистр- это устройство для хранения одного машинного слова.

Основные параметры процессора:

-разрядность х86-16-ти разрядные

-регистровая модель

-быстродействие- каждая команда занимает по времени некоторое количество тактов. Тактовые сигналы процессоры получают от материнских плат(микросхемы 100-133 Mhz) Быстродействие процессора определяет не только тактовая частота, но и его архитектура. Супер-скалярная архитектура- это архитектура вычислительного ядра, которая использует несколько потоков команд, нагружающих работой определенные исполнительные блоки.

Системы команд.

Формат целых чисел в ЭВМ:

Для представления целых чисел в памяти компьютера используется три машинных формата:

-байт

-слово

-двойное слово.

ЭВМ работает не с числами а с их кодами. Длина числа в дополнительном коде может быть увеличена до любого числа разрядов, путем ранжирования слева знакового разряда. Коды, формирующие кодовые комбинации различной длины называются неравномерными, а коды равной длины - равномерными. В блочных кодах кодовые комбинации кодируются и декодируются независимо друг от друга. Различают разделимые и неразделимые избыточные блочные коды. В неразделимых кодах все разряды равномерные, и в кодовой комбинации нельзя отделить информационные разряды от проверочных.

Кодирование как средство контроля передаваемой информации.

При кодировании сообщений безызбыточными равномерными двоичными кодами изменение полярности одного или более символов в какой-либокодовой комбинации в следствии помех приводит к ошибочному декодированию. Наиболее опасным для кодовых комбинаций являются помехи, под действием которых 0 может быть принят за 1 и наоборот. Безызбыточные коды не обладают помехозащищенностью и не позволяют обнаруживать ошибки. Для обнаружения и исправления ошибок в принимаемых комбинациях необходимо вводить избыточность.

Помехоустойчивость избыточного кода обеспечивается благодаря тому, что для передачи информации используются не все 2^n кодовых комбинаций равномерного кода, а лишь часть из них, получившие название разрешенных кодовых комбинаций. Оставшаяся часть комбинаций составляющие запрещенные КК, при передачи информации не принимается. В разрешенных комбинациях полярность элемента должна отличаться друг от друга, по крайней мере в двух разрядах. Если в результате помех разрешенная комбинация превратиться в запрещенную, то ошибка может быть обнаружена и исправлена. Когда меняется полярность только одного элемента комбинации, комбинация не может быть принята за сообщение, т.к. не является идентичной на одной из разрешенных, что и указывает на ошибку в передаваемом сообщении. Таким образом, появление запрещенных КК на приемной стороне может служить индикатором того, что произошла ошибка. Следовательно, 3-разрядный двоичный код в данном примере является помехоустойчивым и позволяет обнаруживать однократные ошибки в сообщения. Кратностью ошибки называют количество искажений символов в КК. Для защиты сообщений от двухкратных ошибок избыточность КК необходимо увеличить, т.е. кодировать их более длинными комбинациями.

Корректирующие способности кода.

В качестве корректирующих кодов наиболее часто используют систематические коды. Систематический код- это код, который кроме информационных разрядов содержит и контрольные, в которые записывается некоторая информация об некотором числе. Систематический код обладает избыточностью. Избыточность указывает степень удлинения кодовой комбинации для достижения определенной корректирующей способности. При этом абсолютная избыточность будет выражаться количеством контрольных разрядов. Информационные и контрольные разряды во всех кодовых комбинациях занимают всегда одни и те же позиции. Вероятностная оценка корректирующей способности кода.

Импульсные помехи, приводящие к изменению кода носят случайные характер. Если искажение отдельных символов кодовой последовательности считать событиями независимыми и принять, что искажения нулевых и единичных символов одинаковы, то в качестве модели помехи используют помеху с биноминальным законом распределения. Количественно-корректирующая способность кода определяется вероятностью обнаружения или исправления ошибки.

Оценка по кодовому расстоянию.

Кодовое расстояние для кодовых комбинаций определяющихся числом символов, которыми они отличаются друг от друга. Для определения кодового расстояния, которое называют расстоянием по Хеммингу, достаточно посчитать вес третьей кодовой комбинации, которая получается в результате сложения по модулю двух исходных комбинаций. Весом двоичной кодовой комбинации называется количество единиц в ней. Минимальное кодовое расстояние dmin- это минимальное расстояние, взятое по всем парам разрешенных КК. Систематический код способен обнаруживать ошибки только тогда, когда dmin больше 2t, где t- кратность обнаруживаемых ошибок. При dmin больше или равно 2t никакое вариант t- кратной ошибки не может перевести одну разрешенную КК в другую разрешенную. Если dmin меньше или равно 2t, то найдется вариант t- кратной ошибки, который трансформирует одну комбинацию в другую.

Исправление ошибок.

В общем случае, метод исправления ошибок применяется для кратности ошибок не более Т. Число комбинаций разбивается на классы по количеству разрешенных кодовых комбинаций. Принятая комбинация отождествляется с разрешением, которая находится от нее на минимальном расстоянии. На практике получается, что для исправления каждой ошибки должна приводить к запрещенной комбинации.

Методы эффективного кодирования.

При передаче по каналу связи требуется устранять избыточность.

1)Статистический способ

2)Вероятностное кодирование.

Впервые алгоритмы, позволяющие строить неравномерные коды на основе частот появления символов были предложены двумя учеными: Шенсоном и Фано.

Ku=ncp-nmin|ncp, где ncp и nmin- средняя и минимальная величина КК.

Метод Шеннона-Фано:

- Буквы алфавита сообщения выписываются в столбец в порядке их вероятностей

- Далее они разделяются на две группы так, чтобы суммы вероятностей в каждой из них были по возможности одинаковы. Разбитие производится, пока в каждой из групп не останется по одному сообщению

- При соответствующем разбиении принадлежность к верхней половине обозначается 0, а нижний- 1, что и представляет символы кода Шеннона-Фано.

Метод кодирования по Хаффмену:

- аналогично Шеннону-Фано

- два нижних символа обьединяются в один, при этом верхнему ставиться 0, нижнему- 1

- получившиеся символы располагаются в порядке убывания вероятностей

- повторяется шаг-два, в итоге получился один символ, вероятностью 1

- для составления КК необходимо проследить путь по строкам и столбцам таблицы. В последнем столбце содержится 2 символа. К большей вероятности- 1, к меньшей- 0.

По аналогичному принципу присваиваются 0 и 1 обьединенным символам в последнем столбце. Процесс продолжается до возвращения в 1-й столбец.

Сжатие данных. Сжатие- это процесс сокращения количества битов, необходимых для передачи и хранения некоторого обьема информации. Бывает сжатие без потерь: восстановленная информация соответствует исходной и сжатие с потерями.

Сжатие без потерь: алгоритм Лемпель-Зива, RLE- алгоритм бегущей длины, по методу Хаффмана.

RLE лежит в основе всех архиваторов. Применяется для сжатия видео. Непрерывная последовательность двумя символов заменяется двумя байтами. Алгоритм jpeg используется для сжатия изображений.

Вещественные числа:

Вещественными называются числа, имеющие дробную часть. Обозначаются [REAL]. Для их представления используется «представление плавающей точки».

Х=∓Мхqnx, q – основание системы исчисления, Мх – мантисса.

Мх=∓0.d1d2d3(d≠0 – признак нормализованного числа)

х|- диапазон мантисс для нормализованного числа2-1≤Мх≤1

Х=-21=-101012=-0.10101∙2+5=-0.10101∙2101

Х=-0.10101е5

Х=-1.0101е4

В нормализованной форме разряд d1всегда равен 1, поэтому в машинном представлении он не хранится и называется скрытый бит.

Такой формат представления чисел с плавающей точкой позволяет увеличить диапазон и точность представления чисел при той е длине используемой разрядной сетки, что и для чисел с фиксируемой точкой.

Представление памяти вещественных чисел:

Представление памяти вещественных чисел стандартизировано. Они хранятся в памяти в прямом коде. Стандарт, регламентирующий хранение – «IEEE – 754». Согласно этому стандарту вводятся 3 машинных формата:

1) Одинарной точности (размер 4 байта)

2) Двойной точности (размер 8 байт)

3) Расширенной точности (размер 10 байт)

Язык паскаль использует 6 байтовый формат.

 

Канонический двоичный формат

-21=-0.10101∙2+101

Знак мантиссы 1

Мантисса 10101

Знак порядка 0

Порядок 101

Машинные информаторы вещественных чисел:

В различных алгоритмических языках принятые стандарты описываются разными ключевыми словами. Например, в паскале определены следующие форматы вещественных чисел:

Название типа Длина в байтах Мантисса десятизначных чисел Диапазон десятичного порядка
Single   7…8 От(-45) до (+38)
Real   11…12 От (-39) до (+38)
Double   15…16 От (-324) да (+308)

Во всех типах мантисса хранится в прямом коде. Порядок или экспонента задается в смещенной форме. Смещение выбирается таким образом, чтобы порядок был целым положительным числом. В этом случае не требуется хранить его знак. Например для realсмещение равно 129, для single 127? Для double 1023. Соответственно смещенный порядок Е определяется по формуле Е=П +смещение (П-истинный порядок).

Мантисса хранится в прямом коде в следующем виде: d0.d1d2… (d1d2… реально хранится в памяти).

 

Файловые системы:

Файловые системы – часть операционной системы, назначение которой состоит в том, чтобы обеспечивать пользователю удобный интерфейс при работе с данными, хранящимися на носителе информации, а также обеспечить возможность совместного использования файлов несколькими пользователями и процессорами.

Типы файловых систем:

1) Дисковые ФС

2) Запись-ориентированныеФС

3) Распределенные ФС

4) Шифрованные ФС

5) ФС специального назначения

Понятие ФС включает в себя:

1) Совокупность всех файлов на диске

2) Набор из структурных данных, используемый для управления файлом. К этим структурам относятся каталоги, дескрипторы файлов, таблицы распределения свободного и занятого пространства.

3) Комплекс системных программных средств, реализующих управление файлами (создание, уничтожение, создание записей, поиск…)

 

Жесткий диск:

Жесткий диск – набор одной или нескольких стеклянных или металлических пластин, покрытых с одной или с двух сторон магнитным материалом. На каждой стороне каждой пластины размечены тонкие концентрические кольца. Их называют дорожками. На них хранятся данные. Нумерация дорожек начинается с 0 от внешнего края диска к внутреннему. Совокупность дорожек одного радиуса на всех поверхностях всех пластин носителя называется цилиндром. Каждая дорожка разбивается на фрагменты, которые называются секторы или блоки. Разбиение производится таким образом, что все дорожки имеют равное количество секторов. На внешних дорожках выделяются дополнительные секторы, которые могут использоваться для горячей замены. Сектор имеет фиксированный, определенный для каждой системы горячий размер. Обычно этот размер 512 байт. Чтобы считывающее устройство могло найти на диске нужный сектор, ему нужно передать 3 параметра: номер цилиндра, номер поверхности, номер сектора. Флэшки симулируют описанную структуру, поэтому имеют подобную адресацию.

ОС использует единицу дискового пространства, называемого кластером. Кластер – совокупность из нескольких секторов.

Дорожки и секторы создаются в результате физического (низкоуровневого) форматирования.

Перед логическим форматированием диск необходимо разбить на разделы.

Раздел – непрерывная часть физического диска, которую ОС представляет пользователю, как логическое устройство.

 

Надежность файловых систем:

При работе с файловыми системами возможна потеря информации (из-за программного или аппаратного сбоя). Решение этих проблем:

1) Резервное копирование и восстановление.

2) Проверка целостности или непротиворечивости ФС

3) Использование отказоустойчивой ФС (например, NTFS)

 

Современные ФС:

1) ФайловаясистемаFAT (12;16;32) (FileAllocationTable - таблица размещения файлов). В этой файловой системе всё пространство диска разделяется на области фиксированной длины (кластеры). FATпредставляет собой базу данных, связывающую кластеры дискового пространства с самими файлами. Каталог в этой файловой системе так же представляет собой базы данных, которые входят в список файлов с указателями на первые кластеры этих файлов. ФС FAT(32) позволяет использовать длинные имена до 255 символов. FAT(12) – 13 символов. Корневой каталог FAT(32) расширен до 65536 элементов (FAT(16) – 255 элементов). Размер файла не может превышать 4 гигабайт, размер раздела – 32 гигабайт.

2) ФС SS (system) (другое название – Unix) – первая файловая система, разработанная с использованием языка программирования высокого уровня. Архитектура данной ФС – древовидная структура в виде ориентированного графа. Глобальное использование концепции файлов: все объекты представлены в виде файлов, в том числе внешние устройства. Файл с точки зрения Unix – специальным образом именованный набор файлов, размещенный в файловой системе.

Виды файлов:

. обычные файлы или данные

. каталоги

. специальные файлы устройств sdf (specialdevicefile) – специальные файлы, с помощью которых можно использовать соответствующие драйверы устройств.

. именованные каналы (namedpipe) – подвид обычных файлов, которые имеют фиксированную систему доступа FIFO (FirstInFirstOut – первым вошел первым вышел)

. link – специальные файлы, которые могут нарушать древовидную организацию

. сокеты (socket) – специальные файлы для взаимодействия процессов в рамках одной машины или в сети.

ФС обеспечивают возможность связывания одного и того же файла с различными именами.

Используется трехуровневая иерархия пользователей: 1) все пользователи 2) группы пользователей 3) конкретный пользователь. Регламентируется 3 действия: чтение, запись, выполнение RWX (read, write,execute)

 

Синхронизация при параллельном доступе к файлу:

Unixиспользует простой подход к управлению доступом: любому количеству пользователей разрешается параллельно осуществлять доступ к одному и тому же файлу в любом режиме (чтение, запись, выполнение). Контроль доступа осуществляется пользовательскими процессами. Начиная с файловой системы S4,появились средства синхронизации параллельного доступа. Синхронизация была возможна в пределах потока одного и того же процесса.

Физическая организация файловой системы Unixделит всё дисковое пространство на 3 категории:

1) Суперобласть (в которой хранится информация о настройках файловой системы и её состоянии)

2) Область индексных дескрипторов (inodes) – средство построения индексного графа.

3) Область рабочих блоков ФС. В ней расположены как сами блоки данных содержимого файла, так и различные системные структуры данных.

Эти 3 категории могут повторяться. Чтобы исключить дублирование выделяют дополнительную область – bootсектор (загрузочный сектор/бутсектор). В ней описывается группа повторяющихся блоков.

Физическая организация ФС SS:

Индексный дескриптор – специальная структура в ФС, которая ставится в однозначное соответствие каждому файлу файловой системы.

Состоит индексный дескриптор из полей:

1) Определяет тип файла

2) Поле кода защиты

3) Количество ссылок на данный дескриптор из всех возможных каталогов файловой системы. Если значение 0, то считается, что дескриптор свободен

4) Длина файла в байтах

5) Статистика, дата создания, изменения

6) Поле адресации блоков файла

7) Массив номера блока

8) Идентификатор пользователей

Особенности:

1) Специально создана для ОС windows

2) Поддерживает транзакции

3) Все данные хранятся в файлах

4) Поддержка 64 битных указателей

5) Поддержка имени до 255 символов

6) Поддержка сжатия

7) Поддержка шифрования

8) Устойчивость отказа

9) Поддержка нескольких потоков данных для одного файла

Система, как и большинство других, работает с кластерами (размером от 512 байт до 64 килобайт. Стандартный размер 4 килобайта). При этом весь жесткий диск делится на 2 части: 12% отводится под MFT. Запись каких-либо данных пользователей в эту зону невозможна. В этой зоне постепенно расширяется метафайл MFT. Пространство, необходимое для максимального размера файла, всегда остается пустым (для того, чтобы главные метафайл не фрагментировался). Максимальный размер MFT не ограничивается.

Структура NTFS:

Механизм использования MFT зоны:

Когда файлы пользователя (88%) нельзя записать в свободное пространство, а в MFTзоне свободное пространство имеется, то это свободное пространство MFTсокращается. В это свободное пространство записываются данные. При этом не исключена ситуация, когда освобождается свободное пространство в обычные области. В этом случае MFT зона снова может расширяться.

Каждый элемент представляет собой файл. Самый главный элемент NTFS (MTF) так же является файлом. Он представляет собой общую таблицу, то есть централизованный каталог всех файлов в ФС, в том числе и самого себя. Эта таблица поделена на записи фиксированного размера(обычно 1 килобайт). Первые 16 записей относятся к служебным файлам, они не доступны операционной системе. Эти файлы называются метафайлами. Эти 16 файлов – единственная часть диска, имеющая фиксированной положение. Все остальные записи могут располагаться произвольно. Тогда восстановить любую запись можно с использование 16 метазаписей. Метафайлы находятся в корневом каталоге диска, их имена начинаются с символа $. Получить доступ к ним можно только с использованием специальных утилит.

Файлы NTFS:

1) Запись MFT. В этой записи хранится имя файла, размер на диске и положение на диске нескольких первых фрагментов файла. Если размер файла такой, что одной записи MFTнедостаточно для того, чтобы обрисовать все его фрагменты, то могут быть использованы дополнительные MFTзаписи, причем, необязательно расположенные подряд.

2) Второй необязательный элемент – потоки данных. Файл может не иметь данных вообще. В этом случае на него не расходуется пространство диска. Если объем данных небольшой, тогда все его данные будут храниться прямо в MFT. Файлы в NTFSимеют абстрактное строение, то есть у них нет как таковых данных, а есть streams(поток). Потоками файла являются, например, его атрибуты. Использование подобной абстракции позволяет, например, прикрепить к файлу дополнительные потоки, например, атрибуты: автор, содержание. Поэтому при удалении файла нулевого размера может освободиться пространство в несколько гигабайт.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: