Здравствуйте, BSOD, Вы писали:
N>>В одном местном чатике коллега нарвался на то, что у него почему-то попортилась кодировка в файлах и вместо кириллицы сплошные '�'. Он решил скормить код такому ИИ и посмотреть, восстановит ли тот логику. Просто комментарии, по сишному (а не ассемблерному) — то есть задача на порядки проще.
BSO>Коллега сам дурак, верящий в чудеса. Вместо использования ИИ надо искать уцелевшие исходники и/или восстанавливать вручную.
"Был бы я таким умным, как моя жена завтра" (ц)
Он потом нашёл бэкап исходников, я как раз привёл его кусок как вторую цитату (ты мог бы это заметить, если бы внимательнее прочитал). Но на это по разным причинам ушла пара дней, а до того он думал, что потерял.
BSO>Чтобы восстанавливать испоррченную кодировку нужны модели специально на это обученные, а также понимающие языки программирования и предметную область. BSO>А иначе получится то что и получилось. BSO>К теме декомпиляции твой пост имеет косвенное отношение.
Самое прямое. Декомпиляция, что человеком, что моделью, это определение логики и перевод её на другой язык. Есть код, надо понять его логику и описать так, чтобы это стало понятно человеку. Чем более высокоуровневый язык у конкретного кода, тем легче всем, и человеку, и модели, понимать логику происходящего. Точно так же и предметная область. Не зная, что делает вызов функции foo или запись в регистр по имени buka, нельзя понять, что происходит при выполнении.
Накачать конкретными данными конкретную модель — может, года через три и можно будет делать это достаточно дёшево, чтобы применять, как ТС. Но не сейчас.