Оценка безошибочности данных

Эффективность применения и качество функционирования информационной системы во многом определяются качеством данных.

Под качеством данных будем понимать совокупность их свойств, обуславливающих и пригодность удовлетворять определенные потребности в соответствии с их назначением. Одним из важнейших свойств данных является достоверность. В свойстве достоверности выделяется безошибочность данных.

Под безошибочностью данных понимается свойство данных не иметь скрытых ошибок. Случайные ошибки в данных обусловлены, как правило, ненамеренными искажениями содержания сведений человеком или сбоями технических средств при переработке данных в ИС.

В качестве показателя безошибочности даны может быть использована вероятность Р отсутствия ошибок в данных единичного объема. В виду того, что значения Р близки в единице, удобнее использовать вероятность Q наличия хотя бы одной ошибки в данных единичного объема.

В качестве единичного объема данных используют десятичный знак, символ (знак), реквизит. Могут быть использованы и другие объемы.

Установлено, что основным источником ошибок в данных является человек. До 95% ошибок вносятся на этапах заполнения исходных документов и подготовки данных на машинных носителях.

Операционные цепи, не содержащие операций контроля. Возможно последовательное и параллельное выполнение операций обработки. В последовательных информационных цепях (рис.40,а) выполнение очередной операции по обработке данных начинается после окончания предыдущей.

Вероятность наличия хотя бы одной ошибки в выходных данных

(135)

где qi – вероятность возникновения ошибок при выполнении i -ой операции обработки.

При малых qi<<1 обычно можно считать

(136)

Рис.40. Последовательная (а) и параллельная (б) информационные цепи.

Параллельное выполнение операций может применяться с целью или ускорения обработки данных, или повышения их безошибочности путем применения резервирования.

В первом случае применяют параллельные информационные цепи (рис.40,б), в которых каждая связана с обработкой определенной доли γi (гамма) общего объема данных, т.е. относительного объема, причем

После выполнения всех операций общий объем данных будет представлять смесь результатов отдельных операций. В этой смеси среднее значение доли ошибок

(137)

Если части работы выполняются специалистами одинаковой квалификации (qi=q), то Q=q.

Необходимо отличать параллельную информационную цепь от резервированной информационной цепи. В последнем случае в каждой из параллельно выполняемых операций обрабатывается весь объем данных. Дальнейшая их переработки производиться при выполнении некоторых дополнительных условий.

Информационные цепи с операциями контроля. При контроле возможны ошибки двух типов, которые не увеличивают число имеющихся в данных ошибок, однако влияют на безошибочность результата.

Ошибки первого типа возникают, когда бракуются годные данные. Однако при обнаружении «ошибок» такого типа происходит обсуждение этих фактов и, как правило, эти ошибки исключаются.

Основной является ошибка второго типа, которая состоит в пропуске имеющихся в проверяемых данных ошибок.

Однократный контроль с исправлением ошибок. Вероятность наличия ошибок после контроля (рис.41).

(138)

где Qj – вероятность наличия ошибок перед контролем;

β – вероятность пропуска ошибок при контроле.

Если при исправлении ошибок допускаются ошибки (с вероятностью q и), то после контроля вероятность наличия ошибок

(139)

Многократный контроль всего объема данных без повторной обработки. Рисунок 41,б соответствует случаю, когда операция контроля выполняется К раз. Если при исправлении не вносятся ошибки, то после К -го цикла контроля и исправления

(140)

Если при исправлении допускаются ошибки, то после К-го цикла контроля и исправления

(141)

Рис.41. Типовые структуры переработки данных:

а – однократный контроль с исправлением ошибок;

б – многократный контроль всего объема данных без повторной обработки


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: