Здесь рассматривается использование различного программного обеспечения при работе с кодировкой koi8-u. Во многих случаях здесь упоминается кодировка koi8-r. Это вызвано тем, что кодировка koi8-u еще не принята как официальный стандарт, и не может поддерживаться большинством программных продуктов. В данном случае, существует близкая к koi8-u кодировка koi8-r, которая стандартизована в RFC-1489 и должна поддерживаться приложениями, работающими в Internet. Она является очень близкой к предлагаемому стандарту, и часто позволяет с минимальными измененеиями и доработками в конфигурации работать также с koi8-u.
Данный документ, в общем-то, "сырой", и требует доработки. Заранее прошу извинения за ошибки, которые Вы, возможно, здест встретите.
<TITLE>
.
ALT
в кодировке koi8-u
(перезагрузите эту страницу
несколько раз и пробовуйте захватывать текст ALT
преред, загрузкой
изображения). Если ваш WWW-клиент правильно поддерживает
кодировку в ALT - вы увидите текст в данной кодировке (также как
на изображении), иначе, вы увидите неразборчивый текст.
charset
в заголовке HTTP-запроса должно отменять значение
charset
определенное через отметку <META ...>
. Загрузите
эту тестовую страницу
с различным полем charsets в заголовке HTTP-запроса и метке МЕТА и
посмотрите, то что в кокой кодовой таблице отображается техт
в WWW-клиент. Если ваш WWW-клиент обрабатывает это правильно, - вы
увидить текст koi8-r а не неразборчивый текст в кодировке cp1251. Не
обращайте много внимания на экран но, однако, проверьте установки
Document Encoding settings или Document Info, чтобы
увидеть фактически установленную кодировку.
<PARAM>
не
переданы в аплет вообще.
NullPointerException
становится наиболее частой ошибкой. Это может быть исправлено установкой
Document Encoding
в Western(Latin1)
.
Tests: | Font | Special Chars | FORM Input | Title | ALT= text | ACCEPT_ CHARSET |
META charset= | Text Java applets | HTTP over META |
---|---|---|---|---|---|---|---|---|---|
Netscape 3.01 (MS Windows) (*) | Yes | No | Yes | No | No | No | Yes | No | No |
Netscape 4.0b4 (MS Win95) | Broken (1) | Yes | Yes | Yes | Yes | Broken (2) | Yes | Yes | No |
Netscape 3.01 (X11) (3*) | Yes | No | No | Yes (4) | Yes | No | Yes | No | No |
Netscape 4.0b3 (X11) (5*) | Yes | No | No | Yes (4) | Yes | Broken (2) | Yes | Broken (6) | No |
MS Internet Explorer 4.0b1 | Yes | Yes | Yes | Yes | Yes | No | Yes | Yes | Yes |
MS Internet Explorer 3.02 | Yes | Yes | No | No | No | No | Yes | Yes | No |
Lynx 2.7.1 (6*) | N/A | Yes | Yes | Yes | Yes | Yes | Yes | N/A | Yes |
Tango 2.5 | Yes | Yes | Yes | Yes | Yes | No | Yes | N/A | Yes |
Ariadna 1.2b3 | Broken (7) | Yes | Yes | Yes | N/A | No | Yes | Yes | No |
(*) Требуются шрифты koi8-u:
(1) Допустимы только символы и специальные объекты HTML, другие символы отображаются неправильно.
(2) Только unalterable, iso-8859-1 и utf-8
(3) Требуется дополнительная нестандартная настройка
(4) Зависит от настроек Window Manager'а
(5) Java не может выполняться с определенными значениями системной
переменной LANG (и соответствующими locale), например
uk_UA.KOI8-U
.
(6) Текст-ориентированные WWW-клиенты, в ваш терминал должны быть предварительно загружены соответствующие шрифты.
(7) Корректная работа только с буквами, специальные символы отображаются неправильно.
Замечание: Большинство людей никогда не беспокоятся о том, чтобы следовать стандартам написания HTML-документов в кириллице, много из которых, написанных в кодировке koi8 или cp1251, или не имеют атрибута charset, или он установлен неправильно. В результате чего WWW-клиенты, которые придерживаются стандартов, могут отображать такие документы, используя кодировку Latin1 (ISO 8859-1), что делает текст полностью нечитабельным. Это не вина WWW-клиента. В этом случае рекомедуется обратиться к автору HTML-документа, и попросить его привести их в соответствие со стандартами, используя один из методов, описанных здесь.
Замечание: Хотя все шрифты ниже - Win3.1 совместимые, возможно также их использование и в WFW3.11 и в Windows95. В отличие от истинных кириллических шрифтов Windows кодировки cp1251, кириллица в этих шрифтах размещаются в диапазоне кодов 128-255 вместо их позиций Unicode.
После их загрузки и разархивирования, добавьте эти шрифты в Windows, используя стандартную процедуру, то есть через Control Panel -> Fonts.
Замечание: ForteAgent имеет специальный режим когда он пытается использовать таблицы перекодировок (называемый Русский koi8-r - cp1250) но работает неправильно в большинстве случаев (например в заголовках статей); работа с этим режимом не рекомендуется.
Pegasus2.53 (16-битный), - cвободно распространяемый почтовый пользовательский агент в общем, поддерживает koi8-u. Использует таблицы перекодировки, следовательно, требуется только поддержка koi8-u Windows.
Для стандартного Windows95, удостоверьтесь что вы установили многоязыковую поддержку. В группе Control Panel -> Add/Remove Programs, выберите "Windows Setup" и удостоверьтесь, что установлена MultiLanguage Support. Этот пункт включен в поставку версии PanEuropian, и устанавливается по умолчанию. То же касается и Русской версии Windows95. (В стандартной американской версии требуется ее доустановка. а в версию, поставляемую на дискетах она не включена совсем. Так, если вы установили систему с дискет, загрузите указанный модуль многоязыковой поддержки с сервера Microsoft). Затем, выберите Русский в Control Panel -> Regional Setting.
Windows95 предъявляет более строгие требования к шрифтам. Для нормальной работы требуется наличие всех вариантов шрифтов (жирный, курсив, жирный курсив), и если присутствуют только нормальные варианты шрифта - на местах использования несуществующих вариантов отображаются пробелы.
Замечание: В отличие от предыдущих версий, он не работает с широко распространенными исправленными шрифтами ISO 8859-1 (там символы ISO 8859-1 заменены на символы koi8-r), вам следует использовать Европейские UNICODE-шрифты Windows95, использовать русскую редакцию Win95, или устанавливать "MultiLanguage Support".
Настройка.
Замечание: ForteАгент имеет специальный режим когда он
пытается использовать таблицы перекодировки (называемый русский
koi8-r - cp1250) но работает неправильно в большинстве случаев
(в заголовках статей), и использование этого режима не рекомендуется.
См. также домашнюю страницу WinVN.
/usr/X11R6/lib/X11/fonts/cyrillic/koi8-u
но если вы не можете изменять системные директории, поместите их в любой
директорий. Система должна сначала обращаться в этот директорий в списка
FontPath, (смотрите /etc/XF86Config или подобный ему файл
конфигурации в вашем варианте X11), если вы устанавливаете шрифты в
системном директории, или наберите команду:
чтобы добывить их локально в конфигурацию системы.
Для проверки, стоит ли данный директорий первым в списке, используйте
команду:
Locales:
Для koi8-u пока не существует locale. До его подготовки можно использовать
существующий locale для koi8-r.
В этом случае вам необходимо произвести следующие дейстия:
Закоментировать строку:
XkbDisable
Здесь приведен файл .Xmodmap-ua, который переопределяет клавши для работы в
koi8-u. Данная раскладка клавиатуры пока не стандартизована, но она уже
используется во FreeBSD. Обычное расположение для файла .Xmodmap -
директорий:
/usr/X11R6/lib/X11/xinit
Вы можете расположить данный файл в указанном директории, или в любом
другом, если вам не даны полномочия изменять системные директории. В таком
случае, вам необходимо, например, в файле .xinitrc вписать следующую строку:
usermodmap=$HOME/.Xmodmap-ua
соответственно, расположив этот файл у себя в "home"-директории.
При этом строка
XkbDisable
файла /etc/XF86Config
должна быть раскоментирована.
Замечание: В версии XFree86 3.1.2 применим только метод с использованием
Xmodmap. Одновременно оба метода для разных пользователей одной системы
одновременно использованы быть не могут. Явный признак ошибочного
использования их одновременно - некорректная работа некоторых клавиш в
основном цифровой клавиатуры.
Метод с Xkb потенциально более удобен для возможных доработок, которые могут
позволить работать с несколькими раскладками клавиатуры (более двух, как это
реализовано в данном варианте
/usr/X11R6/lib/X11/xkb/symbols/ua
Кроме того, для работы Netscape в директории /usr/X11R6/lib/X11/nls должны присутствовать файлы данного архива
Для работы с koi8-u во FreeBSD существует комплект необходимых файлов, подготовленный Игорем Свиридовым Он включает в себя locale LC_CTYPE. До разработки соответствующего koi8-u рекомендуется использовать аналогичный LC_COLLATE из локализации для koi8-r Шрифты из данного комплекта соответствуют кодировке ruscii а файлом,управляющим выводом на экран, осуществляется перекодировка в соответствиикодировке koi8-u.
В оригинальном комплекте, предлагаемом Свиридовым содержатся также скрипты для доустановки их в стартовые скрипты системы, которые приводят в рабочее состояние шрифты и клавиатуру koi8-u. Видимо, это было сделано для более старых версий FreeBSD. Однако, после копирования всех необходимых файлов достаточно произвести следующие изменения в файлах системной конфигурации:
Для работы с koi8-u в Linux существует пакет, подготовленный Игорем Романенко при помощи Андрея Блохинцева, Игоря Свиридова, Руслана Белкина, Станислава Вороного и Дмитрия Кохманюка.
Настройка:
В файле
Настройка Pine: в режиме (S)ETUP -> (C)ONFIGURE устанавлите
enable-8bit-esmtp-negotiations, enable-8bit-nntp-posting и
pass-control-character-as-is.
Затем, установите caracter-set в koi8-u, и сохраните установки.
Замечание: этот метод работает только с ESMTP-совместимыми sendmail.