Re: Зачем делают Open Source LLM?
От: hi_octane Беларусь  
Дата: 26.12.25 11:59
Оценка:
VD>DeepSeek, Qwen и теперь и Open AI выкатила gpt-oss-120b и gpt-oss-20b. Какой смысл тем кто делает коммерческие LLM делать еще и Open Source LLM (модели с открытыми весами)?

С Китаем и даже Meta понятно — имея другие источники финансирования, стратегически выгодно хоть немного подрезать финансовый фундамент компаний которые занимаются только ИИ. Самые жирные покупатели ведь не простые пользователи с запросами на тысячи токенов, а конторы, которым надо лопатить мегабайты исходников и документов — там счёт на миллионы токенов. И наличие сравнимой/дообучаемой open-source версии становится аргументом, для того чтобы запускать DeepSeek локально, и держать исходники дома, и при этом не платить десятки тысяч в месяц OpenAI или Anthropic. Меньше денег и запросов от корпоративных пользователей => меньше инвестиции и медленнее развитие. Больше кассовый разрыв между инвестициями в дата-центры и модели, и отдачей. Плюс, появляются шансы что инвесторы разочаруются, котировки полетят вниз, начнётся стагнация, или безудержные слияния и поглощения, а в это время китайские конторы сохранят темп и уйдут вперёд. Плюс, подрезается ещё и фундамент для обучения — запросы обывателей достаточно просты и тупы, а вот рабочие запросы и принятые ответы (те что стали кодом, письмами, планами) — это вообще мякотка. Таких данных в открытом интернете просто нет. (первым моделям было сложнее всего, примеров именно 'бесконечно терпеливого отвечальщика' куда меньше, чем томов Донцовой). Чем меньше диалогов у конкурентов, тем лучше. И ради такого можно выдать бесплатно в мир даже топовую модель (рассчитывая, например, что внутри Китая данные собрать получится).

OpenAI GPT-OSS не совсем понятно. Может отмывка брэнда перед выходом на биржу — до выхода всё сообщество LocalLLM, упоминало OpenAI строго в плохом контексте. Может просто желание подсадить конторы на своё API и особенности своих моделей, а потом выйдет предложение "self-hosted GPT-5" и снимет страхи по поводу слива исходников. Одно чувствую точно — её бы не было, если бы не было китайского опен-сорса. Остаётся только продолжать наблюдение.
Re[2]: Зачем делают Open Source LLM?
От: TheBeginner  
Дата: 26.12.25 16:03
Оценка:
Здравствуйте, hi_octane, Вы писали:

_>OpenAI GPT-OSS не совсем понятно. Может отмывка брэнда перед выходом на биржу — до выхода всё сообщество LocalLLM, упоминало OpenAI строго в плохом контексте. Может просто желание подсадить конторы на своё API и особенности своих моделей, а потом выйдет предложение "self-hosted GPT-5" и снимет страхи по поводу слива исходников. Одно чувствую точно — её бы не было, если бы не было китайского опен-сорса. Остаётся только продолжать наблюдение.


Интересно, если OpenAI не будет делать инференс, а только обучение, насколько меньшими вычислительными мощностями ей надо обладать? Продавать локальные LLM крупному бизнесу и забыть про рынок облачный?
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.