Сообщение Re[11]: Семантическая алгебра от 06.12.2016 13:48
Изменено 06.12.2016 13:49 Sinix
Здравствуйте, Kernighan, Вы писали:
K>>>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.
S>>Не даёт, ибо контекст.
K>И чего, "контекст"? Выразись понятнее.
В этом и была задумка
Без контекста (твоего "возможность описывать естественный язык") предложение выше бессмысленно.
S>>С интересом жду описания 4 слов выше с помощью небольшого числа (несколько десятков) булевых переменных
K>Если ты про фразу "Не даёт, ибо контекст". То она описывается всего одной переменной — "смысл отсутствует"
Бинго! 99% "естественного" языка не имеет смысла при анализе не то что отдельных слов — абзацев. Значение любого слова может зависеть от подразумеваемой интонации, порядка слов, предыдущего ответа, пунктуации, отсылок к известным культурным феноменам, цитатам или мемам и так далее. Ну, т.е. если анализатор текста распознал "Бинго" не как "Как и было сказано" и не учёл кавычки вокруг "естественного" — отстой этот ваш анализатор.
Человек всё вышеперечисленное делает на автомате, поэтому даже оборванные или формально некорректные фразы воспринимаются вполне. А вот формализовать такие штуки как-то не очень получается.
K>Ну, поскольку сейчас нет достаточно эффективных подходов, то можно(нужно) придумывать свои(новые).
Ну да. Только их надо предлагать не по принципу "мне нравится == истинно", а на базе любого научного подхода по вкусу. Иначе получается полушаманская методика, которая позволяет лишь зафиксировать некий результат, но не умеет ни в прогнозы, ни уж тем более в верификацию. Только это уже не гносеология будет, а что-то из эпистемологии, пардон мой французский.
K>Мне интереснее "лёгкие подходы", потому что они позволяют упражняться исследователю-одиночке.
Угу,
K>Да и вообще мне кажутся более перспективными, потому что только "лёгкие данные" могут уместиться в человеческой голове.
Гхмм...
понятно, что это сферические петабайты в вакууме, но проблема не в этом. Проблема в том, что перед тем, как браться за задачу, неплохо хотя бы приблизительно представлять себе её масштабы. Корректный семантический анализ текста ненамного проще задачи моделирования человеческого сознания.
P.S. Вывод "у топикстартера с анализом никаких проблем, так что с сознанием тоже быстро разберёмся" — неправильный
K>>>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.
S>>Не даёт, ибо контекст.
K>И чего, "контекст"? Выразись понятнее.
В этом и была задумка
Без контекста (твоего "возможность описывать естественный язык") предложение выше бессмысленно.
S>>С интересом жду описания 4 слов выше с помощью небольшого числа (несколько десятков) булевых переменных
K>Если ты про фразу "Не даёт, ибо контекст". То она описывается всего одной переменной — "смысл отсутствует"
Бинго! 99% "естественного" языка не имеет смысла при анализе не то что отдельных слов — абзацев. Значение любого слова может зависеть от подразумеваемой интонации, порядка слов, предыдущего ответа, пунктуации, отсылок к известным культурным феноменам, цитатам или мемам и так далее. Ну, т.е. если анализатор текста распознал "Бинго" не как "Как и было сказано" и не учёл кавычки вокруг "естественного" — отстой этот ваш анализатор.
Человек всё вышеперечисленное делает на автомате, поэтому даже оборванные или формально некорректные фразы воспринимаются вполне. А вот формализовать такие штуки как-то не очень получается.
K>Ну, поскольку сейчас нет достаточно эффективных подходов, то можно(нужно) придумывать свои(новые).
Ну да. Только их надо предлагать не по принципу "мне нравится == истинно", а на базе любого научного подхода по вкусу. Иначе получается полушаманская методика, которая позволяет лишь зафиксировать некий результат, но не умеет ни в прогнозы, ни уж тем более в верификацию. Только это уже не гносеология будет, а что-то из эпистемологии, пардон мой французский.
K>Мне интереснее "лёгкие подходы", потому что они позволяют упражняться исследователю-одиночке.
Угу,
не, при должном упорстве и если звёзды сошлись, что-то путное может и получится, но это явно не наш случай, кмк.любая сложная задача имеет простое, легкое для понимания и неправильное решение.
K>Да и вообще мне кажутся более перспективными, потому что только "лёгкие данные" могут уместиться в человеческой голове.
Гхмм...
(с)The math showed that a single brain synapse could hold 4.7 bits of information, and the whole brain could actually hold one petabyte.
понятно, что это сферические петабайты в вакууме, но проблема не в этом. Проблема в том, что перед тем, как браться за задачу, неплохо хотя бы приблизительно представлять себе её масштабы. Корректный семантический анализ текста ненамного проще задачи моделирования человеческого сознания.
P.S. Вывод "у топикстартера с анализом никаких проблем, так что с сознанием тоже быстро разберёмся" — неправильный
Re[11]: Семантическая алгебра
Здравствуйте, Kernighan, Вы писали:
K>>>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.
S>>Не даёт, ибо контекст.
K>И чего, "контекст"? Выразись понятнее.
В этом и была задумка
Без контекста (твоего "возможность описывать естественный язык") предложение выше бессмысленно.
S>>С интересом жду описания 4 слов выше с помощью небольшого числа (несколько десятков) булевых переменных
K>Если ты про фразу "Не даёт, ибо контекст". То она описывается всего одной переменной — "смысл отсутствует"
Бинго! 99% "естественного" языка не имеет смысла при анализе не то что отдельных слов — абзацев. Значение любого слова может зависеть от подразумеваемой интонации, порядка слов, предыдущего ответа, пунктуации, отсылок к известным культурным феноменам, цитатам или мемам и так далее. Ну, т.е. если анализатор текста распознал "Бинго" не как "Как и было сказано" и не учёл кавычки вокруг "естественного" — отстой этот ваш анализатор.
Человек всё вышеперечисленное делает на автомате, поэтому даже оборванные или формально некорректные фразы воспринимаются вполне. А вот формализовать такие штуки как-то не очень получается.
K>Ну, поскольку сейчас нет достаточно эффективных подходов, то можно(нужно) придумывать свои(новые).
Ну да. Только их надо предлагать не по принципу "мне нравится == истинно", а на базе любого научного подхода по вкусу. Иначе получается полушаманская методика, которая позволяет лишь зафиксировать некий результат, но не умеет ни в прогнозы, ни уж тем более в верификацию. Только это уже не гносеология будет, а что-то из эпистемологии, пардон мой французский.
K>Мне интереснее "лёгкие подходы", потому что они позволяют упражняться исследователю-одиночке.
Угу,
K>Да и вообще мне кажутся более перспективными, потому что только "лёгкие данные" могут уместиться в человеческой голове.
Гхмм...
понятно, что это сферические петабайты в вакууме, но проблема не в этом. Проблема в том, что перед тем, как браться за задачу, неплохо хотя бы приблизительно представлять себе её масштабы. Корректный семантический анализ произвольного текста ненамного проще задачи моделирования человеческого сознания.
P.S. Вывод "у топикстартера с анализом никаких проблем, так что с сознанием тоже быстро разберёмся" — неправильный
K>>>Построение смыслового тензора даёт возможность описывать естественный язык с помощью небольшого числа (несколько десятков) булевых переменных.
S>>Не даёт, ибо контекст.
K>И чего, "контекст"? Выразись понятнее.
В этом и была задумка
Без контекста (твоего "возможность описывать естественный язык") предложение выше бессмысленно.
S>>С интересом жду описания 4 слов выше с помощью небольшого числа (несколько десятков) булевых переменных
K>Если ты про фразу "Не даёт, ибо контекст". То она описывается всего одной переменной — "смысл отсутствует"
Бинго! 99% "естественного" языка не имеет смысла при анализе не то что отдельных слов — абзацев. Значение любого слова может зависеть от подразумеваемой интонации, порядка слов, предыдущего ответа, пунктуации, отсылок к известным культурным феноменам, цитатам или мемам и так далее. Ну, т.е. если анализатор текста распознал "Бинго" не как "Как и было сказано" и не учёл кавычки вокруг "естественного" — отстой этот ваш анализатор.
Человек всё вышеперечисленное делает на автомате, поэтому даже оборванные или формально некорректные фразы воспринимаются вполне. А вот формализовать такие штуки как-то не очень получается.
K>Ну, поскольку сейчас нет достаточно эффективных подходов, то можно(нужно) придумывать свои(новые).
Ну да. Только их надо предлагать не по принципу "мне нравится == истинно", а на базе любого научного подхода по вкусу. Иначе получается полушаманская методика, которая позволяет лишь зафиксировать некий результат, но не умеет ни в прогнозы, ни уж тем более в верификацию. Только это уже не гносеология будет, а что-то из эпистемологии, пардон мой французский.
K>Мне интереснее "лёгкие подходы", потому что они позволяют упражняться исследователю-одиночке.
Угу,
не, при должном упорстве и если звёзды сошлись, что-то путное может и получится, но это явно не наш случай, кмк.любая сложная задача имеет простое, легкое для понимания и неправильное решение.
K>Да и вообще мне кажутся более перспективными, потому что только "лёгкие данные" могут уместиться в человеческой голове.
Гхмм...
(с)The math showed that a single brain synapse could hold 4.7 bits of information, and the whole brain could actually hold one petabyte.
понятно, что это сферические петабайты в вакууме, но проблема не в этом. Проблема в том, что перед тем, как браться за задачу, неплохо хотя бы приблизительно представлять себе её масштабы. Корректный семантический анализ произвольного текста ненамного проще задачи моделирования человеческого сознания.
P.S. Вывод "у топикстартера с анализом никаких проблем, так что с сознанием тоже быстро разберёмся" — неправильный