Была такая статья: https://sysblok.ru/blog/gorkij-urok-abbyy-kak-lingvisty-proigrali-poslednjuju-bitvu-za-nlp/
Это про компанию ABBYY и ее попытку построить "вавилонскую башню" моделей описания языков для своего переводчика над которым работали сотни лингвистов и проигрыш сначала google translate с его статистическими методами и big data, а затем и llm. В общем, ABBYY не потянула масштаб задачи и "необъяснимая эффективность больших данных" победила.
А вот интересно — с развитием генерацией кода llm (вайб кодинг) у первого подхода (т.е. больших детерминированных алгоритмов и моделей) есть шанс? Это же практически дистилляция знаний в конкретной области llm в код.
И этот код работает намного быстрее топовых llm. Что думаете, был бы у ABBYY сейчас шанс?
Здравствуйте, TheBeginner, Вы писали:
TB>Что думаете, был бы у ABBYY сейчас шанс?
Пока у ABBYY монополия на распознавание. Если нужно распознавать большое количество LLM курят, а абби запускается на обычных процах и работают очень быстро. Это знание у АББИ проприетарно. И я думаю многое под патентами.
Здравствуйте, TheBeginner, Вы писали:
TB>А вот интересно — с развитием генерацией кода llm (вайб кодинг) у первого подхода (т.е. больших детерминированных алгоритмов и моделей) есть шанс? Это же практически дистилляция знаний в конкретной области llm в код.
Можете эту фразу объяснить, не понятно о чем речь? Дистиляция знаний чего (каких моделей?) в код? Что с чем сравнивается?
TB>Это про компанию ABBYY и ее попытку построить "вавилонскую башню" моделей описания языков для своего переводчика над которым работали сотни лингвистов и проигрыш сначала google translate с его статистическими методами и big data, а затем и llm. В общем, ABBYY не потянула масштаб задачи и "необъяснимая эффективность больших данных" победила.
Статью не читал, но отмечу один из известных принципов — экстенсивное развитие вычислительных мощностей делает ненужным сложные алгоритмические решения. Как это случилось, скажем, с шахматными программами. Или с Го (игрой, не языком). Ровно то же случилось и с переводом, тупо залить мощностью оказалось проще и надежнее.
Была классная статья на эту тему (на английском), но я потерял ссылку.
Ага
Вот чего я не знал, но заглянув в заглавную статью, узнал, — так это что гугл еще в 2009 опубликовал примерно тот же манифест. Я до этого дошел лет на 10 позже. Что, конечно, объясняет успех Гугл — там не только очень умные люди, но и очень большие возможности. Которых попросту не могло быть у маленьких компаний. Это, в свою очередь, объясняет столь ярко выраженное стремление бизнесов вести себя подобно раку: стремиться к максимальному разрастанию. Даже если это приведет к смерти носителя.