Есть код
content = "Тут строка большая, не буду ее тут писать..." print content # Выводит нормально print chardet.detect(content) #{'confidence': 0.23266364493766054, 'encoding': 'UTF-8'} content = re.sub("(?i)[^-0-9a-zа-яё«»\&\;\/\<\>\.,\s\(\)\*:!\?]", "", content) print content #кракозябры print chardet.detect(content) #{'confidence': 0.23266364493766054, 'encoding': 'ISO-8859-5'}
Что делать? Я уже реально задолбался с этими кодировками в питоне… (может кто знает, в 3.* все норм с кодировками?)
Python 2.7, в начале файла “#coding:utf-8”, файл в utf-8, ide - pycharm
Спасибо.