shiza
модуль - есть такой smile
http://chardet.feedparser.org/
Определяет кодировку. Весьма успешно юзаю.
Будут вопросы по использованию - задавай.
Спасибо за ссылку :). Есть вопрос.
По утверждению разработчиков, объект UniversalDetector автоматически остановится, как только сможет достаточно уверено сообщить о результатах. Однако он, похоже, не останавливается. Например:
# -*- coding: utf-8 -*-
import urllib
from chardet.universaldetector import UniversalDetector
usock = urllib.urlopen('http://lib.ru/NICSHE/zaratustra.txt')
detector = UniversalDetector()
num = 0
for line in usock.readlines():
num += 1
detector.feed(line)
if detector.done:
print num
break
detector.close()
usock.close()
print detector.result
В этом примере “detector.done” никогда не истинно, текст долго и нудно хавается целиком.