Difference between revisions of "Unicode"

From JaWiki (Jabber/XMPP wiki)
Jump to: navigation, search
m (UTF-7: AFAIK)
(ничего лишнего)
 
(One intermediate revision by one other user not shown)
Line 1: Line 1:
{{stub}}
+
{{interwiki
Двухбайтовая кодировка символов. Как правило, первый байт отводится на языковую страницу, второй — на номер символа на странице.
+
| ruwiki = Юникод
 +
| enwiki = Unicode
 +
}}
  
Аббревиатура UTF рашифровывается как Unicode Transformation Format формат Юникодного преобразования.
+
Двухбайтовая кодировка символов. Как правило, первый байт отводится на языковую страницу, второй на номер символа на странице.
  
== Модификации ==
+
Наряду с основной кодировкой Юникод (Unicode, также UCS-2) применяются кодировки UTF (Unicode Transformation Format — формат Юникодного преобразования). В них количество байт, представляющих символ, для разных символов неодинаково.
  
=== Unicode ===
+
[[Основы XMPP]] предписывают для передачи любой текстовой информации в системе [[Jabber]] применять кодировку '''{{w|UTF-8}}'''.
Собственно Юникод. Строго 2 байта на символ (для программной обработки текстов).
+
  
=== UTF-8 ===
+
== Ссылки ==
От 1 до 4 байт на символ. Для символов латиницы получается по одному байту на символ, для русских и "европейских" (расширенная латиница) — по два. 3 и 4 байта — для языков народов Азиатско-Тихоокеанского региона. Применяется, в основном, для хранения передачи текста по каналам связи.
+
  
=== UTF-16 ===
+
* http://unicode.org/
от 2 до ? байт.
+
  
=== UTF-32 ===
 
?
 
  
=== UTF-7 ===
+
[[Category:Термины]]
Аналогично UTF-8, но все байты в строке имеют 0 в старшем разряде, что позволяет передавать текст по очень старым каналам связи, не поддерживающим передачу октетов.
+
{{fixme|надеюсь, правильно}}
+
 
+
== Юникод в Жабере ==
+
В Жабере для передачи любой текстовой информации должен применяться UTF-8.
+
 
+
== Ссылки ==
+
* http://unicode.org/
+

Latest revision as of 13:21, 24 August 2009

Двухбайтовая кодировка символов. Как правило, первый байт отводится на языковую страницу, второй — на номер символа на странице.

Наряду с основной кодировкой Юникод (Unicode, также UCS-2) применяются кодировки UTF (Unicode Transformation Format — формат Юникодного преобразования). В них количество байт, представляющих символ, для разных символов неодинаково.

Основы XMPP предписывают для передачи любой текстовой информации в системе Jabber применять кодировку UTF-8.

Ссылки[edit]