Difference between revisions of "Unicode"

From JaWiki (Jabber/XMPP wiki)
Jump to: navigation, search
m (термин)
(ничего лишнего)
 
Line 1: Line 1:
{{stub}}
+
{{interwiki
Двухбайтовая кодировка символов. Как правило, первый байт отводится на языковую страницу, второй — на номер символа на странице.
+
| ruwiki = Юникод
 +
| enwiki = Unicode
 +
}}
  
Аббревиатура UTF рашифровывается как Unicode Transformation Format формат Юникодного преобразования.
+
Двухбайтовая кодировка символов. Как правило, первый байт отводится на языковую страницу, второй на номер символа на странице.
  
== Модификации ==
+
Наряду с основной кодировкой Юникод (Unicode, также UCS-2) применяются кодировки UTF (Unicode Transformation Format — формат Юникодного преобразования). В них количество байт, представляющих символ, для разных символов неодинаково.
  
=== Unicode ===
+
[[Основы XMPP]] предписывают для передачи любой текстовой информации в системе [[Jabber]] применять кодировку '''{{w|UTF-8}}'''.
Собственно Юникод. Строго 2 байта на символ (для программной обработки текстов).
+
  
=== UTF-8 ===
+
== Ссылки ==
От 1 до 4 байт на символ. Для символов латиницы получается по одному байту на символ, для русских и "европейских" (расширенная латиница) — по два. 3 и 4 байта — для языков народов Азиатско-Тихоокеанского региона. Применяется, в основном, для хранения передачи текста по каналам связи.
+
  
=== UTF-16 ===
+
* http://unicode.org/
от 2 до ? байт.
+
  
=== UTF-32 ===
 
?
 
 
=== UTF-7 ===
 
Аналогично UTF-8, но все байты в строке имеют 0 в старшем разряде, что позволяет передавать текст по очень старым каналам связи, не поддерживающим передачу октетов.
 
{{fixme|надеюсь, правильно}}
 
 
== Юникод в Жабере ==
 
В Жабере для передачи любой текстовой информации должен применяться UTF-8.
 
 
== Ссылки ==
 
* http://unicode.org/
 
  
 
[[Category:Термины]]
 
[[Category:Термины]]

Latest revision as of 13:21, 24 August 2009

Двухбайтовая кодировка символов. Как правило, первый байт отводится на языковую страницу, второй — на номер символа на странице.

Наряду с основной кодировкой Юникод (Unicode, также UCS-2) применяются кодировки UTF (Unicode Transformation Format — формат Юникодного преобразования). В них количество байт, представляющих символ, для разных символов неодинаково.

Основы XMPP предписывают для передачи любой текстовой информации в системе Jabber применять кодировку UTF-8.

Ссылки[edit]