Re[4]: детект языка по юникоду
От: makdak  
Дата: 14.06.16 08:01
Оценка:
Здравствуйте, Ops, Вы писали:

Ops>Что это значит? Цифры и пунктуацию легко отделят обычные регекспы. Но есть еще псевдографика, символы типа © ™ и т.п., математические (которые могут совпадать, например, с греческим или ивритом), смайлы, другие символы. Что именно нужно отделять?


Ops>Тут ведь главная задача формализовать твои требования, иначе никакая библиотека-всемогутор не поможет.

нужно отделить [a-zA-Z](буквы из алфавита. у всех же народов он есть?) от остальных. или хотя б для большинства современных. для дальнейшего вывода на экран.
регекспы-тоже думал о них, но оставил этот вариант на последок, т.к. думаю это ресурсоемко и не удобно(хотя не пробовал еще)
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.