Технологии уперлись в предел своих возможностей. Объяснения Б.Гейтса и прочих, утверждающих, что прогресс невозможен без "верхних" уровней научно несостоятельны: распознавалки распознают произвольные слова хуже человека.
Существует постоянный незначительный прогресс в совершенствовании существующих методов (DBN, повышение качества и объема выборки, адаптация к диктору и т.п.).
Проблему текущих технологий (HMM и моделирования пл.вероятностей в состояниях, а также LM) можно сформулировать так: для линейного роста качества требуется экспоненциальный рост к-ва выборки (теоретический результат).
Прогресс возможен при резкой смене базовой технологии. ИМХО, это возможно и скоро.
Кстати, Siri использует движок Nuance (ваш, КО). Довольно остроумное техническое решение: распознавание на сервере, способное адаптироваться к каждому конкретному диктору.