А никто не встречал каких-нибудь работ, связанных с парсингом неизвестных формальных языков? Интересует построение парсера, умеющего (к примеру) все C-подобные языки, даже не существовавшие на момент его разработки. Понятное дело, точного парсинга тут быть не может, но хотя бы на уровне распознавания основных C-like управляющих конструкций и операторов?
Нутром чую, что нужно смотреть в сторону машинного обучения (то есть нужно смотреть в сторону NLP), но может есть иные подходы? Какие-нибудь универсальные толерантные грамматики там, или ещё что-то такое?
... << RSDN@Home 1.0.0 alpha 5 rev. 0>>