Re: Режим дообучения в нейросетях
От: rg45 СССР  
Дата: 18.03.25 14:00
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Такой вопрос.

S>Хотите ли себе нейросеть, которая по результатам каждого вашего разговора — сама себя дообучает?
S>Похоже что придется делать типа режим сна, когда, подобно человеку, будет происходить перестроение нейронных связей.
S>Т.е. она будет помнить каждый ваш разговор, возможно что напитываться нужными данными, что-то дозаписать себе — чтобы в следующий раз продолжить разговор более предметно.
S>Хотите?
S>И как вы думаете — когда это будет возможно?

--
Справедливость выше закона. А человечность выше справедливости.
Re[12]: Режим дообучения в нейросетях
От: Shmj Ниоткуда  
Дата: 18.03.25 14:01
Оценка:
Здравствуйте, Privalov, Вы писали:

S>>Ну я не знаю кому это может быть нужно — на мой взгляд это хлам.

P>Скажем, исследователям творчества Достоевского.

И в чем проблема? Пусть они скажут какие именно аспекты им интересны.

S>>Вот более конкретное — изучить книги по написанию драйверов для Windows, чтобы я мог задавать вопросы и получать быстрые ответы.

P>Лучше их самому изучить. Книги пишут не для искусственного интеллекта. Как можно писать драйвер, не понимая принципов работы ОС?

Самому долго. Можно задавать вполне конкретные вопросы и получать глубокие ответы из книг.

S>>Естественный язык не сложнее.


P>Следующий текст ИИ разберёт? Батарея – деепричастие?

P>

P>Её вокзал он,
P>Тихо батарея


Проверял уже?
=сначала спроси у GPT=
Re[13]: Режим дообучения в нейросетях
От: Privalov  
Дата: 18.03.25 14:18
Оценка:
Здравствуйте, Shmj, Вы писали:

S>И в чем проблема? Пусть они скажут какие именно аспекты им интересны.


А что если они не смогут корректно сформулировать вопрос? У Достоевского пока до чего-то важного доберёшься, мозг вывихнуть можно.

S>Самому долго. Можно задавать вполне конкретные вопросы и получать глубокие ответы из книг.


А как можно задавать конкретные вопросы, не зная матчасть? Которую невозможно изучить, не читая книги, статьи, документацию.

S>Проверял уже?


Я на гораздо более простых вещах проверял. Так что не вижу смысла.
Re[14]: Режим дообучения в нейросетях
От: Shmj Ниоткуда  
Дата: 18.03.25 14:21
Оценка:
Здравствуйте, Privalov, Вы писали:

P>А как можно задавать конкретные вопросы, не зная матчасть? Которую невозможно изучить, не читая книги, статьи, документацию.


Реальность — судья всему. Мы развиваемся когда соприкасаемся с реальностью. А когда столкнешься с практикой и попытаешься заюзать то что сам сделал — сразу возникнут вопросы сами.

P>Я на гораздо более простых вещах проверял. Так что не вижу смысла.


Какие модели проверял?
=сначала спроси у GPT=
Re[15]: Режим дообучения в нейросетях
От: Privalov  
Дата: 18.03.25 14:28
Оценка: +1
Здравствуйте, Shmj, Вы писали:

S>Реальность — судья всему. Мы развиваемся когда соприкасаемся с реальностью. А когда столкнешься с практикой и попытаешься заюзать то что сам сделал — сразу возникнут вопросы сами.


Что значит соприкасаемся с реальностью? Вот я, например, живу в реальности. И где-то пару часов назад у меня возникли вопросы, почему в моей программе не всё нормально работает после того, как я в неё кое-что добавил. Чтобы разобраться, мне ИИ не нужен. Я свой собственный код пока ещё сам читать в состоянии. Даже писать в состоянии.

S>Какие модели проверял?


Мне хватило, что ИИ не справился с простейшей задачкой из 1ё0 строк на шарпе. А про то, что естественный язык не сложнее, лингвистам расскажи.
Re[16]: Режим дообучения в нейросетях
От: Shmj Ниоткуда  
Дата: 18.03.25 14:30
Оценка:
Здравствуйте, Privalov, Вы писали:

P>Что значит соприкасаемся с реальностью? Вот я, например, живу в реальности. И где-то пару часов назад у меня возникли вопросы, почему в моей программе не всё нормально работает после того, как я в неё кое-что добавил. Чтобы разобраться, мне ИИ не нужен. Я свой собственный код пока ещё сам читать в состоянии. Даже писать в состоянии.


В случае драйвера — установить на железо и попробовать использовать с т.з. пользователя. Не заработало, возникли ошибки — вот и соприкоснулись с реальностью. И сразу вопрос — почему не работает — задаете и получаете ответ.

P>Мне хватило, что ИИ не справился с простейшей задачкой из 1ё0 строк на шарпе. А про то, что естественный язык не сложнее, лингвистам расскажи.


Какой ИИ — какая версия? Проверяли ли на новых моделях?
=сначала спроси у GPT=
Re[17]: Режим дообучения в нейросетях
От: Privalov  
Дата: 18.03.25 14:43
Оценка:
Здравствуйте, Shmj, Вы писали:

S>В случае драйвера — установить на железо и попробовать использовать с т.з. пользователя. Не заработало, возникли ошибки — вот и соприкоснулись с реальностью. И сразу вопрос — почему не работает — задаете и получаете ответ.


Сунули драйвер в систему, получили синий экран. Что спрашивать?

S>Какой ИИ — какая версия? Проверяли ли на новых моделях?


Неважно. Не наботает нигде.
Re[18]: Режим дообучения в нейросетях
От: Shmj Ниоткуда  
Дата: 18.03.25 15:48
Оценка:
Здравствуйте, Privalov, Вы писали:

P>Сунули драйвер в систему, получили синий экран. Что спрашивать?


Так и пишешь — синий экран. Сетка скажет тебе добавить логирование и прислать ей результаты логов.

S>>Какой ИИ — какая версия? Проверяли ли на новых моделях?

P>Неважно. Не наботает нигде.

Вы все же ответьте на каких моделях проверяли и задавали ли уточняющие вопросы?
=сначала спроси у GPT=
Re[19]: Режим дообучения в нейросетях
От: Privalov  
Дата: 18.03.25 18:08
Оценка: +1 :)
Здравствуйте, Shmj, Вы писали:

S>Так и пишешь — синий экран. Сетка скажет тебе добавить логирование и прислать ей результаты логов.


Логи разработчик пишет для себя. Как их ИИ читать будет?
Помню, какая-то верия CoolReader-а, падая, вываливала несколько метров лога. Копаться в нём довольно утомительно было. Лучшим решением оказалось поставить более старую версию. А тут драйвер. Работа которого может зависеть от массы факторов.

S>Вы все же ответьте на каких моделях проверяли и задавали ли уточняющие вопросы?


Хоть это и государственная тайна, но так и быть: на неработающих.
Re[20]: Режим дообучения в нейросетях
От: Shmj Ниоткуда  
Дата: 18.03.25 18:21
Оценка:
Здравствуйте, Privalov, Вы писали:

P>Логи разработчик пишет для себя. Как их ИИ читать будет?


Кнопочка Ctrl+A, Ctrl+C в окошке с логами — и Ctrl+V в окошке с ИИ. И он вам говорит что нужно сделать, чтобы не было синего экрана.

P>Помню, какая-то верия CoolReader-а, падая, вываливала несколько метров лога. Копаться в нём довольно утомительно было. Лучшим решением оказалось поставить более старую версию. А тут драйвер. Работа которого может зависеть от массы факторов.


Так и спрашиваете — логов слишком много — как изменить код, чтобы оставить только самое важное.

S>>Вы все же ответьте на каких моделях проверяли и задавали ли уточняющие вопросы?

P>Хоть это и государственная тайна, но так и быть: на неработающих.

Номера моделей ИИ назовите. А так же — писали ли вы какую проблему получаете и просили ли ИИ чтобы он решил вопрос с учетом возникших проблем?
=сначала спроси у GPT=
Re[21]: Режим дообучения в нейросетях
От: Privalov  
Дата: 18.03.25 19:02
Оценка: +1 :)
Здравствуйте, Shmj, Вы писали:

S>Кнопочка Ctrl+A, Ctrl+C в окошке с логами — и Ctrl+V в окошке с ИИ. И он вам говорит что нужно сделать, чтобы не было синего экрана.


Как вариант: не писать драйвер, не включать комп. И не будет синего экрана.

S>Так и спрашиваете — логов слишком много — как изменить код, чтобы оставить только самое важное.


А откуда он знает, что важно, а что нет? Частенько бывает, что одна строчка в тоннах логов указывает, что произошло.

S>Номера моделей ИИ назовите. А так же — писали ли вы какую проблему получаете и просили ли ИИ чтобы он решил вопрос с учетом возникших проблем?


Не скажу. Пробоем-то оно всё равно никаких не решает.
Еще раз, доя понимания: не скажу. Пусть ваш ИИ скажет.
Re[3]: Режим дообучения в нейросетях
От: gress Россия  
Дата: 18.03.25 20:07
Оценка: -1 :)
Здравствуйте, Shmj, Вы писали:

S>Здравствуйте, gress, Вы писали:


G>>Хотим, чтобы ты минимально ознакомился с роликами в YouTube про то, что такое нейросетка, как ее разрабатывают и обучают, изучил архитектуру сервисов, прежде чем обсуждать вопросы архитектуры в приличном обществе. Но похоже, что это несбыточные мечты.


S>Ты возможно будешь удивлет, но я на низком уровне обучал нейросети в т.ч. создавал свои, пусть и не очень сложные, многослойные сетки для специфических задач.


S>Так с чем ты не согласен? Думаешь нейросетка по заданному тобой списку текста не сможет создать сет для дообучения?


Список текста — что это за зверь?

Обычно обучение модели делается отдельным сервисом, а сервис нс подсасывает модель уже обученную — это, во-первых, сокращает время бездействия сервиса при замене модели, во-вторых, снижает ресурсные требования сервиса исполнения модели, тк ресурсы (память, ЦПУ) на обучение модели в разы превышает ресурсные требования сервиса исполнения модели.

Это элементарные архитектурные вещи, базис. А ты постоянно пытаешься придумать велосипед. Причем мешает тебе твой ограниченный кругозор. Ты его не пытаешься расширить, чтобы более эффективно решать задачи, а пытаешься считерить, типа — вот я сам базу осваивать не буду, мне нейронка какая-то неведомая все выдаст.

Кстати, вот про это прямо отлично сказано было в Гостях из прошлого:

https://www.youtube.com/watch?v=rp24VAaz4SY
Отредактировано 18.03.2025 20:08 gress . Предыдущая версия .
Re[4]: Режим дообучения в нейросетях
От: Shmj Ниоткуда  
Дата: 18.03.25 21:58
Оценка: -1
Здравствуйте, gress, Вы писали:

G>Список текста — что это за зверь?


Как студентам выдают список литературы/текста — так же, в идеале, чтобы каждый мог выдавать своему агенту для проработки.

G>Обычно обучение модели делается отдельным сервисом,


Так вот речь как раз о том, чтобы совместить этот отдельный сервис и позволить каждому пользователю дообучать свою нейронку простым способом (без участия труда человека) на основе заданных им текстов (список литературы или даже форумных сообщений и пр.).

G>тк ресурсы (память, ЦПУ) на обучение модели в разы превышает ресурсные требования сервиса исполнения модели.


Ресурсы — не вопрос, скоро будет просто достаточно. Каждые два года количество транзисторов в процессоре удваивается. Через лет 10 будет достаточно и не дорого.

G>Это элементарные архитектурные вещи, базис. А ты постоянно пытаешься придумать велосипед. Причем мешает тебе твой ограниченный кругозор. Ты его не пытаешься расширить, чтобы более эффективно решать задачи, а пытаешься считерить, типа — вот я сам базу осваивать не буду, мне нейронка какая-то неведомая все выдаст.


Ты сначала потрудись вникнуть о чем вообще разговор.
=сначала спроси у GPT=
Re[22]: Режим дообучения в нейросетях
От: Shmj Ниоткуда  
Дата: 18.03.25 22:00
Оценка:
Здравствуйте, Privalov, Вы писали:

P>Как вариант: не писать драйвер, не включать комп. И не будет синего экрана.


Это вариант избегания реальности — конечно тогда никаких проблем не будет.

S>>Так и спрашиваете — логов слишком много — как изменить код, чтобы оставить только самое важное.


P>А откуда он знает, что важно, а что нет? Частенько бывает, что одна строчка в тоннах логов указывает, что произошло.


Узнает.

S>>Номера моделей ИИ назовите. А так же — писали ли вы какую проблему получаете и просили ли ИИ чтобы он решил вопрос с учетом возникших проблем?


P>Не скажу. Пробоем-то оно всё равно никаких не решает.

P>Еще раз, доя понимания: не скажу. Пусть ваш ИИ скажет.

Попробуйте модель GPT 4.5. Если не решит с первого раза — напишите ей детали. Уверен на 99% что решит ваши задачи.
=сначала спроси у GPT=
Re[2]: Режим дообучения в нейросетях
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 19.03.25 06:42
Оценка:
Здравствуйте, Sinclair, Вы писали:

S>Вопрос не "когда" или "как", а "зачем".


Вопрос "как" тоже стоит. Если обучать лично, то у тебя должны быть соответствующие вычислительные ресурсы, несопоставимые по мощности для инференса и обучения. Далее будет проблем не меньше принципиальных, алгоритмических.
Re[3]: Режим дообучения в нейросетях
От: Sinclair Россия https://github.com/evilguest/
Дата: 19.03.25 07:13
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Вопрос "как" тоже стоит. Если обучать лично, то у тебя должны быть соответствующие вычислительные ресурсы, несопоставимые по мощности для инференса и обучения. Далее будет проблем не меньше принципиальных, алгоритмических.


Хмм. Почему вы так думаете? Чудовищные ресурсы нужны не оттого, что сам процесс обучения как-то страшно дорог, а оттого, что через него нужно прогнать триллионы документов.
Backpropagation на материалах чата размером в пару десятков страниц будет стоить не сильно дороже forward propagation.
Дисклеймер: я не эксперт в этой области, могу чего-то не понимать.
Уйдемте отсюда, Румата! У вас слишком богатые погреба.
Re[3]: Режим дообучения в нейросетях
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 19.03.25 07:35
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Ты возможно будешь удивлет, но я на низком уровне обучал нейросети в т.ч. создавал свои, пусть и не очень сложные, многослойные сетки для специфических задач.

S>Так с чем ты не согласен? Думаешь нейросетка по заданному тобой списку текста не сможет создать сет для дообучения?

Я не согласен со всем и присоединяюсь к тому, что тебе всё таки надо разобраться с нейросетями. В том, чтобы дообучиться на своих данных есть проблемы:
1) твоих данных катастрофически мало, нейросеть обучалась на миллиардах токенов, твои данные не окажут никакого существенного влияния на выход нейросети;
2) если твоих данных будет так много, что на нейросеть они смогут повлиять, то в ней начнётся процесс cathastrofic forgetting, когда запоминая твои данные, она начнёт ухудшать показатели в других областях;
3) если у тебя получится набрать достаточно своих данных и также использовать достаточно сторонних во избежание (2), то где ты найдёшь столько мощности для обучения?

Вот. Теперь объясни, чем тебе не подходит контекст (в виде большого промта или в виде RAG)? Зачем портить саму нейросеть?
Re[4]: Режим дообучения в нейросетях
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 19.03.25 07:37
Оценка:
Здравствуйте, Sinclair, Вы писали:

S>Хмм. Почему вы так думаете? Чудовищные ресурсы нужны не оттого, что сам процесс обучения как-то страшно дорог, а оттого, что через него нужно прогнать триллионы документов.

S>Backpropagation на материалах чата размером в пару десятков страниц будет стоить не сильно дороже forward propagation.

Я думаю, что обученная на миллиардах-триллионах токенов нейросеть от одного прогона на килобайте данных: 1) эти данные не выучит; 2) скорее сама испортится.
Re[23]: Режим дообучения в нейросетях
От: Privalov  
Дата: 19.03.25 07:47
Оценка: 3 (1) +1 :))
Здравствуйте, Shmj, Вы писали:

S>Это вариант избегания реальности — конечно тогда никаких проблем не будет.


С точки зрения ИИ вполне нормально. Как и ампутация головы.


S>Узнает.


Потребует корректно сформулировать вопрос?

S>Попробуйте модель GPT 4.5. Если не решит с первого раза — напишите ей детали. Уверен на 99% что решит ваши задачи.


Чем она от остальных отличается?

Вся правда про ChatGPT. Картинка выше отсюда.
Re[4]: Режим дообучения в нейросетях
От: Shmj Ниоткуда  
Дата: 19.03.25 08:59
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>1) твоих данных катастрофически мало, нейросеть обучалась на миллиардах токенов, твои данные не окажут никакого существенного влияния на выход нейросети;


Как насчет задать приоритет? Т.е. чтобы нейросеть учитывала не только количество но и важность данных?

N>2) если твоих данных будет так много, что на нейросеть они смогут повлиять, то в ней начнётся процесс cathastrofic forgetting, когда запоминая твои данные, она начнёт ухудшать показатели в других областях;


А вот это нужно бы исправить — значит это алгоритмическая проблема, которую предстоит решить.

N>3) если у тебя получится набрать достаточно своих данных и также использовать достаточно сторонних во избежание (2), то где ты найдёшь столько мощности для обучения?


Во! Это уже вопрос практический. Но учитывая что количество транзисторов в процессоре по прежнему удваивается каждые 2 года — то через время мощности, достаточные для обучения, будут у каждого в смартфоне.

N>Вот. Теперь объясни, чем тебе не подходит контекст (в виде большого промта или в виде RAG)? Зачем портить саму нейросеть?


Контекст не очень большой. Можно ли туда внедрить библиотеку книг или код проекта в 10 млн. строк кода?
=сначала спроси у GPT=
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.