Как определить кодовую страницу по заданному charset?
От: Аноним  
Дата: 13.08.07 11:07
Оценка:
HTML код сожержит тэг <META>, который может задавать кодировку html страницы. Эта же информация будет содержатчя в HTTP заголовке:

Content-Type: text/html; charset=windows-1251

Как определить номер кодовой страницы по кодеровки, заданной в тэги <META> или в HTTP заголовке?

Пробовал делать через EnumSystemCodePages и GetCPInfoEx, но GetCPInfoEx возвращает имя кодовой страницы в другом формате. Например для кодировки windows-1251, GetCPInfoEx возвращает имя: 1251 (ANSI — Cyrillic). Поэтому я немогу пробегая по всем системным кодовым страницам с помощью EnumSystemCodePages сравнить charset из HTTP заголовка с тем именем, которое выдает GetCPInfoEx, и определить является ли текущая кодовая страница той, которая указана в charset'е.

В приведенном примере charset содержит номер кодовой страницы, откуда его можно извлеч. Есть ли гарантия, что charset для других кодировок будет содержать номер кодовой страницы?

Есть идеи как разрулить?

Спасибо,
Виталий
Re: Как определить кодовую страницу по заданному charset?
От: korzh.pavel Россия  
Дата: 13.08.07 12:31
Оценка:
Здравствуйте, Аноним, Вы писали:

А>HTML код сожержит тэг <META>, который может задавать кодировку html страницы. Эта же информация будет содержатчя в HTTP заголовке:


А>Content-Type: text/html; charset=windows-1251


А>Как определить номер кодовой страницы по кодеровки, заданной в тэги <META> или в HTTP заголовке?


А>Пробовал делать через EnumSystemCodePages и GetCPInfoEx, но GetCPInfoEx возвращает имя кодовой страницы в другом формате. Например для кодировки windows-1251, GetCPInfoEx возвращает имя: 1251 (ANSI — Cyrillic). Поэтому я немогу пробегая по всем системным кодовым страницам с помощью EnumSystemCodePages сравнить charset из HTTP заголовка с тем именем, которое выдает GetCPInfoEx, и определить является ли текущая кодовая страница той, которая указана в charset'е.


А>В приведенном примере charset содержит номер кодовой страницы, откуда его можно извлеч. Есть ли гарантия, что charset для других кодировок будет содержать номер кодовой страницы?


А>Есть идеи как разрулить?



http://www.rsdn.ru/Forum/?mid=257031
Автор: c-smile
Дата: 01.05.03
Re[2]: Как определить кодовую страницу по заданному charset?
От: vita5555  
Дата: 13.08.07 15:18
Оценка:
Здравствуйте, korzh.pavel, Вы писали:

KP>http://www.rsdn.ru/Forum/?mid=257031
Автор: c-smile
Дата: 01.05.03


Большое спасибо!

Виталий
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.