Контрольные суммы
Хранение данных и их передача может сопровождаться ошибками. Приемнику и передатчику информации необходимо знать, что данные в потоке соответствуют определенным правилам. Приводя реальный поток в соответствие с этими правилами, приемник может восстановить его исходное содержание. Количество и типы восстановимых ошибок определяются применяемыми правилами кодирования.
Соответствие потока данных тем или иным правилам теория информации описывает как наличие статистических автокорреляций или информационной избыточности в потоке.
Естественные языки обеспечивают высокую (в письменной форме 2х- и 3х - кратную, а в звуковой еще большую) избыточность за счет применения фонетических, лексических и синтаксических правил. Способом дополнительного повышения избыточности человеческой речи являются стихи.
С задачей восстановления искаженных сообщений на естественных языках в общем случае может справиться лишь человеческий мозг.
Простейшим способом внесения избыточности является полное дублирование данных. Этот способ иногда применяется на практике, но обладает недостатками:
- избыточность этого метода высока для многих практических применений
- он позволяет только обнаруживать ошибки, но не исправлять их (мы не можем знать, какая из копий верна, а какая ошибочна).
Троекратное копирование обеспечивает еще более высокую избыточность, при его использовании для каждого расходящегося бита мы можем проводить голосование. Трехкратное копирование, таким образом, позволяет восстанавливать данные, но имеет слишком уж высокую избыточность.
Эти примеры демонстрируют важную классификацию избыточных кодов:
- только обнаруживают ошибки
- позволяют их восстанавливать.
При передаче данных по сети, целесообразно запросить повтор испорченного пакета, поэтому коды, способные только обнаруживать ошибки, широко применяются.
предыдущаяследующая