Re[4]: Алгоритмы классификации текстов.
От: ashg  
Дата: 07.03.08 18:12
Оценка:
Здравствуйте, Аноним, Вы писали:

J>>>ээээ... так тебе классификацию или кластеризацию? Все-таки это немного разные вещи


К>>И того и другого и побольше ...

К>>Но больше, конечно классификаци. Допустим есть некоторый набор текстов, разбитых на группы и куча не обработанных. Нужен алгоритм (ну или почитать про то, как они разрабатываются; пример алгоритма...)
К>>Особенно интересен пример по калссификации новостей на порталах.

К>>Я, конечно, и сам найду, но если профессионалы подскажут классику в этом "жанре" в виде публикаций или готовых реализаций — будет супер.


А>Для новостей, думаю, стоит выделить такие данные, как

А>- имена собственные
А>- места
А>- даты
А>- редкие слова
А>, составить из них множество. Свести задачу к задаче кластеризации этих множеств, для которой есть много вариантов решения.
Боюсь имена собственные врядли сильно могут помочь особенно если это имена известных людей.Например такое имя как Джордж Буш может быть связано и с политикой,и с экономикой и со скандалами.

и что имеется ввиду под классификацией? Topic Detection? Opinion Mining?or?

P.S.Кондор ты получил мое собшение?
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.