Re[4]: детект языка по юникоду

Здравствуйте, Ops, Вы писали:

Ops>Что это значит? Цифры и пунктуацию легко отделят обычные регекспы. Но есть еще псевдографика, символы типа © ™ и т.п., математические (которые могут совпадать, например, с греческим или ивритом), смайлы, другие символы. Что именно нужно отделять?

Ops>Тут ведь главная задача формализовать твои требования, иначе никакая библиотека-всемогутор не поможет.
нужно отделить [a-zA-Z](буквы из алфавита. у всех же народов он есть?) от остальных. или хотя б для большинства современных. для дальнейшего вывода на экран.
регекспы-тоже думал о них, но оставил этот вариант на последок, т.к. думаю это ресурсоемко и не удобно(хотя не пробовал еще)

	От:	makdak
	Дата:	14.06.16 08:01
	Оценка: