Рейтинг на основе вежливости
От: Эйнсток Файр Мухосранск Странный реагент
Дата: 21.08.25 17:37
Оценка: -1 :)
Можно ли так распарсить русский текст, чтобы ему можно было дать оценку, пропорциональную вежливости сообщения?

Ну, как в логике предикатов есть функции, которые каждому высказыванию приписывают значение "истина" или "ложь" (эти функции и называются предикатами), так можно вычислять вежливость предложений и сообщений в целом.

Дальше, сделать в сообщении возможность просмотра такого автоматического анализа (там же можно предупреждать о нарушении закона о мате), и на основании оценок сообщений корректировать рейтинг участника форума.
Re: Рейтинг на основе вежливости
От: T4r4sB Россия  
Дата: 21.08.25 17:52
Оценка: :))) :))
Здравствуйте, Эйнсток Файр, Вы писали:

ЭФ>Можно ли так распарсить русский текст, чтобы ему можно было дать оценку, пропорциональную вежливости сообщения?


Не могу не отметить ваш необычайно проницательный ум! Ваше предложение очень ценно! Я уверен, оно значительно улучшит качество общения на форуме!
Нет такой подлости и мерзости, на которую бы не пошёл gcc ради бессмысленных 5% скорости в никому не нужном синтетическом тесте
Re: Рейтинг на основе вежливости
От: alpha21264 СССР  
Дата: 22.08.25 07:17
Оценка: +1
Здравствуйте, Эйнсток Файр, Вы писали:

ЭФ>Можно ли так распарсить русский текст, чтобы ему можно было дать оценку, пропорциональную вежливости сообщения?


Распарсить вряд ли, эта задачка скорее для нейросетки.

Течёт вода Кубань-реки куда велят большевики.
Re[2]: Рейтинг на основе вежливости
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 22.08.25 07:53
Оценка:
Здравствуйте, T4r4sB, Вы писали:

TB>Не могу не отметить ваш необычайно проницательный ум! Ваше предложение очень ценно! Я уверен, оно значительно улучшит качество общения на форуме!


Данное утверждение:

Не могу не отметить ваш необычайно проницательный ум! Ваше предложение очень ценно! Я уверен, оно значительно улучшит качество общения на форуме!

с большой вероятностью является сарказмом или иронией.
Вот почему:

Фразы типа "необычайно проницательный ум", "очень ценно", "значительно улучшит" в контексте форумов (особенно технических или спорных) часто используются для того, чтобы сказать прямо противоположное — то есть подчеркнуть абсурдность или нелепость предложения.
На RSDN (и подобных ресурсах) сарказм и ирония — очень распространённый стиль общения, особенно в спорных или эмоциональных темах.
Если бы это была искренняя похвала, скорее всего, формулировки были бы более сдержанными и конкретными.

Вывод: Скорее всего, автор имел в виду, что предложение глупое или бесполезное, но выразил это в форме гиперболической похвалы.
Если хотите уточнить, посмотрите на контекст обсуждения — если тема спорная или предложение действительно странное, то сарказм почти гарантирован.


Нейросеть может дать оценку. Не ясно, насколько надо оценивать именно вежливость, да.
Re: get started
От: akasoft Россия  
Дата: 22.08.25 07:59
Оценка:
Здравствуйте, Эйнсток Файр, Вы писали:

ЭФ>Можно ли так распарсить русский текст, чтобы ему можно было дать оценку, пропорциональную вежливости сообщения?


Вежливостью можно считать употребление определённых слов и неупотребление других определённых слов.

Составляем список слов в виде таблички [код, слово, вес (целое со знаком)], положительные так или иначе вежливы.
Остальные слова нейтральны, их вес ноль.

Разбиваем сообщение на слова.

Считаем метрики:
— общее количество слов
— слов с положительным рейтингом
— слов с отрицательным рейтингом
— рейтинг положительных
— рейтинг отрицательных
— общий рейтинг сообщения

Натравливаем алгоритм на БД сообщений РСДН. Корректируем список слов и рейтинг слов, повторяем до просветления.

Это уже должно помочь модерированию по вежливости.

Кроме вывода метрик (например, под панелью оценок), сообщения можно красить спанами, выделяя слова с тем или иным весом.

В русском классическом считается, что обращение "на вы" более вежливое, чем "на ты". От простого разбиения на слова можно перейти к более сложному анализу суффиксов и приставок, выделения корней слов. Все эти "подскажи[те]", "пройди[те]". Тут сложность определения вежливости кмк должна возрасти в геометрической прогрессии.

Отдельно есть проблема подмены похожих по виду символов и запикивания букв непохожими, все эти "x..", "сuк@" и "пи%%%а". Её, кнчн, можно пробовать отбивать на этапе разбиения сообщений на слова. Но это будет уже не просто порезать сообщение пробелами и пробельными сиволами.

Можно от анализа слов перейти к анализу наличия вариантов с помощью regexp (таблица вида [код, regexp, вес (целое со знаком)]). Каждый regexp натравливать на сообщение целиком, что позволит учесть взаимное положение ключевых слов с вариантами запикивания, суффиксами-приставками. Отдельно можно добавить колонку сложности регэкспа, чтобы применять их не все сверху вниз, а по какому то порядку от простого к сложному.
Например, слова не позволят, а регэкспы позволят анализировать такие сущности, как начало предложений с прописной и завершение точкой.
Превращать каждый регэксп в отдельную метрику не хотелось бы, но их можно группировать в метрики и считать веса группы регэкспов.

Вариант со словами позволит подробнее оценить предметную область, частоту употребления слов, важность, вежливость. К этому можно привязать оценки форумчан и действия модераторов, если они есть, и учитывать их в анализе.

Вариант с регэкспами более хитёр и позволит выявлять больше случаев вежливости, но ему нужна база, которую может дать вариант со словами. Регэкспы сочинять чуть более сложнее, чем составить список слов.

ЭФ>и на основании оценок сообщений корректировать рейтинг участника форума.

Зачем? Больше рейтингов, хороших и разных. Чтобы никто не ушёл довольным.
... << RSDN@Home 1.3.110 alpha 5 rev. 62>>
Re[3]: Рейтинг на основе вежливости
От: T4r4sB Россия  
Дата: 22.08.25 08:37
Оценка: +1
Здравствуйте, Nuzhny, Вы писали:

N>Нейросеть может дать оценку.


А промт был "нет ли тут сарказма"? Это как вопрос на тройку "а не вольтметром ли измеряется напряжение"

>Не ясно, насколько надо оценивать именно вежливость, да.


И не приведет ли это к игре "кто красивее обосрет оппонента". Тут гуманитарии выиграют, технарям придется туго. А это технарский форум. Короче я настроен отрицательно.
Нет такой подлости и мерзости, на которую бы не пошёл gcc ради бессмысленных 5% скорости в никому не нужном синтетическом тесте
Re[2]: get started
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 22.08.25 08:57
Оценка:
Здравствуйте, akasoft, Вы писали:

A>Считаем метрики:

A>- общее количество слов
A>- слов с положительным рейтингом
A>- слов с отрицательным рейтингом
A>- рейтинг положительных
A>- рейтинг отрицательных
A>- общий рейтинг сообщения

Это в целом пройденный этап, чем-то похожим боролись со спамом на заре интернета. Оно обходится легко.
Например, перенасытить оскорбление вежливыми словами: "Спешу Вам сообщить, что Вы, милостивый государь, козлина!"
Ты уже написал, но повторюсь, что потом пойдут в ход специальные опечатки, замена одних символом другими и т.д.: "Ах, ты $uka!"
И чем дальше, тем более сложные метрики и правила придётся придумывать.

A>В русском классическом считается, что обращение "на вы" более вежливое, чем "на ты".


А в сети (нетикете) долгое время считалось, что все равны и все на "ты". Переход на "Вы" воспринимался, как начало оскорблений.

Короче, как в антиспамах, так и тут всё равно приходят к машинному обучению. Так почему бы с этого и не начать? Тем более, что для классификации/ранжирования ответа нужна лёгкая нейросеть. И таких нейросетей уже наделали множество, соцсети заставляют заменять кожаных модераторов на автоматических.
Re: Рейтинг на основе вежливости
От: Stanislaw K СССР  
Дата: 22.08.25 09:36
Оценка:
Здравствуйте, Эйнсток Файр, Вы писали:

ЭФ>Можно ли так распарсить русский текст, чтобы ему можно было дать оценку, пропорциональную вежливости сообщения?


Одного сообщения? Бессмысленно, в отрыве от всей предыдущей цепочки реплик. В некоторых случаях бессмысленно без реплик в других темах.
Все проблемы от жадности и глупости
Re: Рейтинг на основе вежливости
От: Kocur  
Дата: 22.08.25 10:45
Оценка:
Здравствуйте, Эйнсток Файр, Вы писали:

ЭФ>Можно ли так распарсить русский текст, чтобы ему можно было дать оценку, пропорциональную вежливости сообщения?


ЭФ>Ну, как в логике предикатов есть функции, которые каждому высказыванию приписывают значение "истина" или "ложь" (эти функции и называются предикатами), так можно вычислять вежливость предложений и сообщений в целом.


ЭФ>Дальше, сделать в сообщении возможность просмотра такого автоматического анализа (там же можно предупреждать о нарушении закона о мате), и на основании оценок сообщений корректировать рейтинг участника форума.




Такие вещи решаются только нейросетями, потому что любой твой парсинг и семантический и морфологический анализ житрожопые товарищи легко обойдут
Re[3]: get started
От: T4r4sB Россия  
Дата: 22.08.25 11:15
Оценка: +1
Здравствуйте, Nuzhny, Вы писали:

N>А в сети (нетикете) долгое время считалось, что все равны и все на "ты". Переход на "Вы" воспринимался, как начало оскорблений.


С этим вообще беда: в вк пабликах многие когда не тянут по фактам, то съезжают на "а Вы мне не тыкайте".
Нет такой подлости и мерзости, на которую бы не пошёл gcc ради бессмысленных 5% скорости в никому не нужном синтетическом тесте
Re[2]: Рейтинг на основе вежливости
От: Эйнсток Файр Мухосранск Странный реагент
Дата: 22.08.25 14:12
Оценка:
SK> Одного сообщения?

Некое сообщение либо само-по-себе (начало темы), либо является ответом на другое сообщение.
Если есть два сообщения (ответ, и цитируемое), то там есть два автора.
Можно проанализировать совместную переписку этих двух авторов и выявить их отношение друг к другу.
Re: Рейтинг на основе вежливости
От: dsorokin Россия  
Дата: 23.08.25 06:21
Оценка:
Здравствуйте, Эйнсток Файр, Вы писали:

ЭФ>Можно ли так распарсить русский текст, чтобы ему можно было дать оценку, пропорциональную вежливости сообщения?


Можно уже сейчас. Алиса так умеет, и она умеет делать это очень хорошо! Она и вежливость умеет оценивать, и степень сарказма. Она больше умеет. По твоим сообщениям может оценить твой тип характера, например, склонен ли ты к сухим теоретическим рассуждениям, или тебя больше интересует практический результат. Насколько ты держишь тему разговора, или уплываешь и скользишь по второстепенным темам. Какие речевые паттерны используешь — их еще называют "фокусами языка". Только нужно иметь соответствующую подготовку, владеть научной терминологией, чтобы уметь спросить Алису и уметь понять ее ответ.

Вообще, я тут поражен способностью ИИ-ассистентов. Нет, манны небесной от них не жду, но они уже сейчас умеют очень многое. К чему это приведет — пока не ясно. Могут найтись люди, которые ухудшат нам всем жизнь через ИИ-ассистентов, но где-то будет лучше, где-то хуже. Это как с компьютерами. Интернет дает богатство знаний, компьютеры позволяют повысить уровень безопасности, но и позволяют более сильно закабалять людей, ограничивать их свободу. Как говорят, у медали всегда есть оборотная сторона.

Только Алисе придется денег заплатить! Сущая мелочь
Отредактировано 23.08.2025 6:23 dsorokin . Предыдущая версия .
Re: Рейтинг на основе вежливости
От: rg45 СССР  
Дата: 23.08.25 06:52
Оценка: :)
Здравствуйте, Эйнсток Файр, Вы писали:

ЭФ>Можно ли так распарсить русский текст, чтобы ему можно было дать оценку, пропорциональную вежливости сообщения?


ЭФ>Ну, как в логике предикатов есть функции, которые каждому высказыванию приписывают значение "истина" или "ложь" (эти функции и называются предикатами), так можно вычислять вежливость предложений и сообщений в целом.


ЭФ>Дальше, сделать в сообщении возможность просмотра такого автоматического анализа (там же можно предупреждать о нарушении закона о мате), и на основании оценок сообщений корректировать рейтинг участника форума.


https://www.youtube.com/watch?v=C8azN_G5lBs
--
Справедливость выше закона. А человечность выше справедливости.
Re[2]: Рейтинг на основе вежливости
От: Эйнсток Файр Мухосранск Странный реагент
Дата: 23.08.25 14:47
Оценка:
D> Алисе придется денег заплатить

А опенсорс что, не догоняет?
Re[3]: Рейтинг на основе вежливости
От: dsorokin Россия  
Дата: 23.08.25 16:27
Оценка:
Здравствуйте, Эйнсток Файр, Вы писали:

D>> Алисе придется денег заплатить


ЭФ>А опенсорс что, не догоняет?


Понятия не имею. Про Алису могу сказать определенно, что умеет. Натренировали ее хорошо. Про других не знаю
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.