Unicode

From JaWiki (Jabber/XMPP wiki)
Revision as of 07:00, 13 April 2007 by Juriks (Talk | contribs) (Юникод)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

Информации мало или она отсутствует

Пока в данной статье мало информации. Приносим извинения.

Если вы хотите написать по теме, — сделайте это.

Двухбайтовая кодировка символов. Как правило, первый байт отводится на языковую страницу, второй — на номер символа на странице.

Аббревиатура UTF рашифровывается как Unicode Transformation Format — формат Юникодного преобразования.

Модификации

Unicode

Собственно Юникод. Строго 2 байта на символ (для программной обработки текстов).

UTF-8

От 1 до 4 байт на символ. Для символов латиницы получается по одному байту на символ, для русских и "европейских" (расширенная латиница) — по два. 3 и 4 байта — для языков народов Азиатско-Тихоокеанского региона. Применяется, в основном, для хранения передачи текста по каналам связи.

UTF-16

от 2 до ? байт.

UTF-32

?

UTF-7

?

Юникод в Жабере

В Жабере для передачи любой екстовой информации должен применяться UTF-8.

Ссылки