Информация об изменениях

Сообщение Re[11]: Семантическая алгебра от 06.12.2016 13:48

Изменено 06.12.2016 13:49 Sinix

Здравствуйте, Kernighan, Вы писали:


K>>>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.

S>>Не даёт, ибо контекст.
K>И чего, "контекст"? Выразись понятнее.

В этом и была задумка
Без контекста (твоего "возможность описывать естественный язык") предложение выше бессмысленно.


S>>С интересом жду описания 4 слов выше с помощью небольшого числа (несколько десятков) булевых переменных

K>Если ты про фразу "Не даёт, ибо контекст". То она описывается всего одной переменной — "смысл отсутствует"
Бинго! 99% "естественного" языка не имеет смысла при анализе не то что отдельных слов — абзацев. Значение любого слова может зависеть от подразумеваемой интонации, порядка слов, предыдущего ответа, пунктуации, отсылок к известным культурным феноменам, цитатам или мемам и так далее. Ну, т.е. если анализатор текста распознал "Бинго" не как "Как и было сказано" и не учёл кавычки вокруг "естественного" — отстой этот ваш анализатор.

Человек всё вышеперечисленное делает на автомате, поэтому даже оборванные или формально некорректные фразы воспринимаются вполне. А вот формализовать такие штуки как-то не очень получается.


K>Ну, поскольку сейчас нет достаточно эффективных подходов, то можно(нужно) придумывать свои(новые).

Ну да. Только их надо предлагать не по принципу "мне нравится == истинно", а на базе любого научного подхода по вкусу. Иначе получается полушаманская методика, которая позволяет лишь зафиксировать некий результат, но не умеет ни в прогнозы, ни уж тем более в верификацию. Только это уже не гносеология будет, а что-то из эпистемологии, пардон мой французский.


K>Мне интереснее "лёгкие подходы", потому что они позволяют упражняться исследователю-одиночке.

Угу,

любая сложная задача имеет простое, легкое для понимания и неправильное решение.

не, при должном упорстве и если звёзды сошлись, что-то путное может и получится, но это явно не наш случай, кмк.


K>Да и вообще мне кажутся более перспективными, потому что только "лёгкие данные" могут уместиться в человеческой голове.

Гхмм...

The math showed that a single brain synapse could hold 4.7 bits of information, and the whole brain could actually hold one petabyte.

(с)
понятно, что это сферические петабайты в вакууме, но проблема не в этом. Проблема в том, что перед тем, как браться за задачу, неплохо хотя бы приблизительно представлять себе её масштабы. Корректный семантический анализ текста ненамного проще задачи моделирования человеческого сознания.

P.S. Вывод "у топикстартера с анализом никаких проблем, так что с сознанием тоже быстро разберёмся" — неправильный
Re[11]: Семантическая алгебра
Здравствуйте, Kernighan, Вы писали:


K>>>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.

S>>Не даёт, ибо контекст.
K>И чего, "контекст"? Выразись понятнее.

В этом и была задумка
Без контекста (твоего "возможность описывать естественный язык") предложение выше бессмысленно.


S>>С интересом жду описания 4 слов выше с помощью небольшого числа (несколько десятков) булевых переменных

K>Если ты про фразу "Не даёт, ибо контекст". То она описывается всего одной переменной — "смысл отсутствует"
Бинго! 99% "естественного" языка не имеет смысла при анализе не то что отдельных слов — абзацев. Значение любого слова может зависеть от подразумеваемой интонации, порядка слов, предыдущего ответа, пунктуации, отсылок к известным культурным феноменам, цитатам или мемам и так далее. Ну, т.е. если анализатор текста распознал "Бинго" не как "Как и было сказано" и не учёл кавычки вокруг "естественного" — отстой этот ваш анализатор.

Человек всё вышеперечисленное делает на автомате, поэтому даже оборванные или формально некорректные фразы воспринимаются вполне. А вот формализовать такие штуки как-то не очень получается.


K>Ну, поскольку сейчас нет достаточно эффективных подходов, то можно(нужно) придумывать свои(новые).

Ну да. Только их надо предлагать не по принципу "мне нравится == истинно", а на базе любого научного подхода по вкусу. Иначе получается полушаманская методика, которая позволяет лишь зафиксировать некий результат, но не умеет ни в прогнозы, ни уж тем более в верификацию. Только это уже не гносеология будет, а что-то из эпистемологии, пардон мой французский.


K>Мне интереснее "лёгкие подходы", потому что они позволяют упражняться исследователю-одиночке.

Угу,

любая сложная задача имеет простое, легкое для понимания и неправильное решение.

не, при должном упорстве и если звёзды сошлись, что-то путное может и получится, но это явно не наш случай, кмк.


K>Да и вообще мне кажутся более перспективными, потому что только "лёгкие данные" могут уместиться в человеческой голове.

Гхмм...

The math showed that a single brain synapse could hold 4.7 bits of information, and the whole brain could actually hold one petabyte.

(с)
понятно, что это сферические петабайты в вакууме, но проблема не в этом. Проблема в том, что перед тем, как браться за задачу, неплохо хотя бы приблизительно представлять себе её масштабы. Корректный семантический анализ произвольного текста ненамного проще задачи моделирования человеческого сознания.

P.S. Вывод "у топикстартера с анализом никаких проблем, так что с сознанием тоже быстро разберёмся" — неправильный