Электронный учебник:


Курс лекций:


Дополнительно:

Практикум:



Наши хостеры:

Представление текстовых данных

Все символы-расширения в национальных алфавитах находятся на определенных местах, но при использовании кодировки ASCII для представления этих символов сохранить этот порядок невозможно - соответствующие коды уже заняты. Решением в таких случаях является использование для сравнения и лексикографической сортировки промежуточных таблиц, в которых для каждого допустимого кода указан его номер в лексикографическом порядке. Это осуществляется на уровне библиотек языков высокого уровня.

При обмене данными между системами, использующими разные кодировки, необходимо учитывать этот факт. Стандартный способ такого учета, применяемый во многих форматах документов (HTML, MIME) - это сообщение где-то в теле документа или в передаваемой вместе с документом метаинформации об используемых языке и кодировке. Большинство средств просмотра почты и документов HTML умеют интерпретировать эту метаинформацию.

Два основных подхода к представлению форматированного текста - это языки разметки и сложные структуры данных, используемые в текстовых процессорах. Примерами языков разметки являются HTML, LATEX, troff. В этих языках обычный текст снабжается командами, указывающими на то, каким шрифтом следует отображать конкретный фрагмент текста и как его следует форматировать.

предыдущаяследующая