Уведомления

Группа в Telegram: @pythonsu

#1 Март 30, 2010 16:04:42

o7412369815963
От:
Зарегистрирован: 2009-06-17
Сообщения: 1986
Репутация: +  32  -
Профиль   Отправить e-mail  

статья "Кодировки в python"

ZZZ
o7412369815963
но лучше utf8 всегда и везде
И снова неправда. :-)
ты сам себе противоречишь
ZZZ
Я о том, что использовать надо только utf-8. Всегда и везде.
ZZZ
В некоторых случаях UTF-16 куда эффективнее – по два байта на символ куда легче обрабатывать, чем символы переменной длины.
для этого в питоне есть уникод

а вообще, харе придираться :)

Офлайн

#2 Март 31, 2010 06:50:07

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

статья "Кодировки в python"

ZZZ
что касательно иероглифов так я по сей день не могу подключить чтоб в браузере обрисовывалось :) глупячие морские_обезьяны :)

Офлайн

#3 Март 31, 2010 08:24:09

.Serj.
От:
Зарегистрирован: 2008-09-27
Сообщения: 181
Репутация: +  0  -
Профиль   Отправить e-mail  

статья "Кодировки в python"

что касательно иероглифов так я по сей день не могу подключить чтоб в браузере обрисовывалось
Шрифт юникодный установи, например Bitstream Cyberbit, если не охота для каждого в языка отдельный шрифт тянуть.

И вообще http://idn.icann.org/Fonts



Офлайн

#4 Март 31, 2010 08:39:29

ZZZ
От: Москва
Зарегистрирован: 2008-04-03
Сообщения: 2161
Репутация: +  26  -
Профиль   Адрес электронной почты  

статья "Кодировки в python"

o7412369815963
ты сам себе противоречишь
Нет. Просто для разных вещей – разные кодировки.
Но за однобайтные нужно предавать анафеме и сжигать на кострах за багохульство! (с) ZZZ

sypper-pit
а вообще, харе придираться :-)
Всё. Снова сплю. :-)



Офлайн

#5 Апрель 1, 2010 15:06:52

bialix
От:
Зарегистрирован: 2006-07-13
Сообщения: 774
Репутация: +  1  -
Профиль   Отправить e-mail  

статья "Кодировки в python"

ZZZ
o7412369815963
но лучше utf8 всегда и везде
И снова неправда. :-)
В некоторых случаях UTF-16 куда эффективнее – по два байта на символ куда легче обрабатывать, чем символы переменной длины.
А про набор иероглифов в UTF-32 я вообще молчу…
а как насчет буквы “й” в UTF-16? Ничё что она 4х байтная?



Офлайн

#6 Апрель 1, 2010 15:23:48

o7412369815963
От:
Зарегистрирован: 2009-06-17
Сообщения: 1986
Репутация: +  32  -
Профиль   Отправить e-mail  

статья "Кодировки в python"

bialix
а как насчет буквы “й” в UTF-16? Ничё что она 4х байтная?
>>> u'й'.encode('utf-16')
'\xff\xfe9\x04'
>>> len(u'й'.encode('utf-16'))
4
>>> len(u'а'.encode('utf-16'))
4
>>> u'а'.encode('utf-16')
'\xff\xfe0\x04'

и не только “й”

Отредактировано (Апрель 1, 2010 15:27:40)

Офлайн

#7 Апрель 1, 2010 17:43:29

MapaT
От:
Зарегистрирован: 2008-12-07
Сообщения: 13
Репутация: +  0  -
Профиль   Отправить e-mail  

статья "Кодировки в python"

bialix
а как насчет буквы “й” в UTF-16? Ничё что она 4х байтная?
Если отбросить BOM то будет 2 байта:
>>> u'й'.encode('utf_16_le')
'9\x04'



Отредактировано (Апрель 1, 2010 17:49:24)

Офлайн

#8 Апрель 1, 2010 19:06:23

ZZZ
От: Москва
Зарегистрирован: 2008-04-03
Сообщения: 2161
Репутация: +  26  -
Профиль   Адрес электронной почты  

статья "Кодировки в python"

bialix, я думаю, что не стоит объяснять тебе, как строятся символы в UTF-16 (32)…
Да, обработку составных символов всё равно придётся делать, но это всё равно лучше, чем UTF-8, потому что составные символы состоят из символов, длина которых постоянна и равняется двум байтам.
Ну и, как подметил MapaT, BOM.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version