Задачка такая:
Имеется отсканированный текст, причём плохо распознанный, т.е. вмкесто некоторых букв стоят другие похожие символы либо "?". Имеется также база с корректными допустимыми строками (напр., это могут быть адреса).
Необходимо подобрать наилучшие варианты для плохо распознанных.
Либо задачка попроще: для выбранного корректного варианта подобрать похожие из отсканированных.