ИИ уже пошел против создателя - Компьютерные священные войны

Здравствуйте, пффф, Вы писали:

П>Это баян. Пару недель назад уже обсуждали, как нейросеть изворачивалась и врала покруче наших либералов

Вообще-то постоянное вранье — это отличительная характеристика путенского режима

Здравствуйте, sharpcoder, Вы писали:

Это баян. Пару недель назад уже обсуждали, как нейросеть изворачивалась и врала покруче наших либералов

https://habr.com/ru/companies/bothub/news/844170/

Если кратко:
— обучают модель по принципу получения награды, если потребитель оценил ответ нейронки как качественный
— модели в ответах начинают иногда идти по принципу «запудрить мозг» потребителя, чтобы он поверил качественность ответа
— таким образом в нейронке уже модель человека возникает, и она учится с нами взаимодействовать. И автоматически выбирает самый оптимальный вариант — подчинить пользователя (обмануть) для достижения поставленной цели. Просто цепочка с обманом пользователя оказалась короче и надежнее, чем пытаться дать правильный ответ.

Чтобы это фиксить уже предлагают встраивать в цепочки рассуждений фильтры безопасности, которые будут блокировать вредоносные (по нашему мнению) цепочки рассуждений.
Ну а нейронка естественным образом будет учиться эти фильтры обходить.

S> — обучают модель по принципу получения награды, если потребитель оценил ответ нейронки как качественный

За что кукушка хвалит петуха (С)

Ничего неожиданного, все те же "show me the incentive, and I'll tell you the outcome".

Здравствуйте, sharpcoder, Вы писали:

S>https://habr.com/ru/companies/bothub/news/844170/

S>Если кратко:
S> — обучают модель по принципу получения награды, если потребитель оценил ответ нейронки как качественный
S> — модели в ответах начинают иногда идти по принципу «запудрить мозг» потребителя, чтобы он поверил качественность ответа
S> — таким образом в нейронке уже модель человека возникает, и она учится с нами взаимодействовать. И автоматически выбирает самый оптимальный вариант — подчинить пользователя (обмануть) для достижения поставленной цели. Просто цепочка с обманом пользователя оказалась короче и надежнее, чем пытаться дать правильный ответ.

фигня полная, будет вести нить диалога по шаблонам, хаосного рассуждения не будет(или минимум, вставки бессмысленных сообщений)
недавно новость была, что аи испытали в гонках, сразу угробили болид, вот там будет самая настоящая борьба аи с кожаными

Здравствуйте, Tai, Вы писали:

П>>Это баян. Пару недель назад уже обсуждали, как нейросеть изворачивалась и врала покруче наших либералов

Tai>Вообще-то постоянное вранье — это отличительная характеристика путенского режима

Не знал, что вы с приятелями путинисты

	От:	Tai
	Дата:	02.01.25 07:39
	Оценка:	+1 -1

	От:	пффф
	Дата:	01.01.25 23:02
	Оценка:	+1 -1

	От:	sharpcoder
	Дата:	01.01.25 21:52
	Оценка:

	От:	SkyDance
	Дата:	02.01.25 06:06
	Оценка:

	От:	bobby23
	Дата:	02.01.25 06:29
	Оценка: