Как определить кодовую страницу по заданному charset?
От: Аноним  
Дата: 13.08.07 11:07
Оценка:
HTML код сожержит тэг <META>, который может задавать кодировку html страницы. Эта же информация будет содержатчя в HTTP заголовке:

Content-Type: text/html; charset=windows-1251

Как определить номер кодовой страницы по кодеровки, заданной в тэги <META> или в HTTP заголовке?

Пробовал делать через EnumSystemCodePages и GetCPInfoEx, но GetCPInfoEx возвращает имя кодовой страницы в другом формате. Например для кодировки windows-1251, GetCPInfoEx возвращает имя: 1251 (ANSI — Cyrillic). Поэтому я немогу пробегая по всем системным кодовым страницам с помощью EnumSystemCodePages сравнить charset из HTTP заголовка с тем именем, которое выдает GetCPInfoEx, и определить является ли текущая кодовая страница той, которая указана в charset'е.

В приведенном примере charset содержит номер кодовой страницы, откуда его можно извлеч. Есть ли гарантия, что charset для других кодировок будет содержать номер кодовой страницы?

Есть идеи как разрулить?

Спасибо,
Виталий
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.