Re[4]: детект языка по юникоду
|
От: |
makdak
|
|
Дата: | 14.06.16 08:01 |
|
Оценка: |
|
Здравствуйте, Ops, Вы писали:
Ops>Что это значит? Цифры и пунктуацию легко отделят обычные регекспы. Но есть еще псевдографика, символы типа © ™ и т.п., математические (которые могут совпадать, например, с греческим или ивритом), смайлы, другие символы. Что именно нужно отделять?
Ops>Тут ведь главная задача формализовать твои требования, иначе никакая библиотека-всемогутор не поможет.
нужно отделить [a-zA-Z](буквы из алфавита. у всех же народов он есть?) от остальных. или хотя б для большинства современных. для дальнейшего вывода на экран.
регекспы-тоже думал о них, но оставил этот вариант на последок, т.к. думаю это ресурсоемко и не удобно(хотя не пробовал еще)
Пока на собственное сообщение не было ответов, его можно удалить.