Здравствуйте, vdimas, Вы писали:
V>Так вот, последнюю 5-ю модель я еще не щупал (нет возможности оплатить зарубежный сервис), но в предыдущих версиях однозначно SUNO не обучалась на треше по принципу "как не надо делать!" V>А должна была!
В Udio можно удалять трек с пометкой "тарабарщина вместо слов" или "опять голос Гребенщикова, сколько можно". Не знаю правда, составляют ли они статистику
Нет такой подлости и мерзости, на которую бы не пошёл gcc ради бессмысленных 5% скорости в никому не нужном синтетическом тесте
Re[3]: AI-cинтез совершенной музыки из Рая (мнение ИИ)
Здравствуйте, T4r4sB, Вы писали:
TB>В Udio можно удалять трек с пометкой "тарабарщина вместо слов" или "опять голос Гребенщикова, сколько можно". Не знаю правда, составляют ли они статистику
поиграл с Udio — это зачаточный уровень в сравнении с Suno.
Кстате, в Suno они открыли версию 4.5 для бесплатного тарифа.
Отвал башки, пробуйте! ))
Re[4]: AI-cинтез совершенной музыки из Рая (мнение ИИ)
Здравствуйте, xma, Вы писали: xma>хочу скрестить SUNO/Udio и AlphaZero/lc0, заставив музыкальный ИИ самообучаться на реальном эмоциональном отклике людей (с целью максимизации его в сторону максимального наслаждения, в конечном итоге)
Надо спрашивать на более разносторонний ответ, а не просто ждать похвалы, например Perplexity.
Даже Дипсик будет не только хвалить, но и предупреждать:
Цитата
3. Ограничения: Биологические "предохранители"
Да, ограничения есть, и они фундаментальны:
Неврологическая адаптация (Гомеостаз): Мозг стремится к равновесию. Постоянная стимуляция центров удовольствия приводит к снижению чувствительности рецепторов. Требуется все большая "доза" для того же эффекта (толерантность). В конце концов, система перестанет реагировать.
Эмоциональное привыкание: Даже самую прекрасную музыку, если она повторяется и становится предсказуемой, перестаешь чувствовать так же остро. ИИ придется постоянно находить тонкий баланс между предсказуемостью (которая нравится мозгу) и новизной (которая вызывает возбуждение).
Физические пределы органов чувств: Улитка во внутреннем ухе и слуховой нерв имеют физические ограничения по частоте и интенсивности обработки сигнала. Слишком громкий или сложный звук превратится в шум и вызовет отторжение, а не удовольствие.
Индивидуальная биохимия: То, что вызывает экстаз у одного человека, может не сработать для другого. Максимум будет уникален для каждого.
Риски и этическая дилемма
Именно здесь ваша идея становится по-настоящему опасной и fascinating.
Создание идеального наркотика: Это будет легальный, не вызывающий физического привыкания (но сильнейшего психологического), бесплатный и неограниченный аудио-наркотик. Последствия для общества, productivity и социальных связей могут быть катастрофическими. Зачем общаться, творить, стремиться к чему-то, если можно надеть наушники и испытывать блаженство?
Потеря агентности: ИИ будет знать, что вам нравится, лучше вас самих. Это может привести к "эстетической ловушке" — вы будете слушать только то, что максимизирует ваш дофамин, и ваши музыкальные вкусы перестанут развиваться. Это тупик для личностного роста.
Манипуляция сознанием: Технология, способная так глубоко влиять на эмоции, станет мощнейшим инструментом пропаганды, рекламы и контроля. Представьте политическое выступление или рекламный ролик, звуковая дорожка которого спроектирована такой системой для максимизации доверия и симпатии.
Психологическая зависимость и когнитивные искажения: Постоянное бегство в искусственную эйфорию может привести к депрессии в "реальной жизни", потере мотивации и искажению восприятия действительности.
Вывод
В максимуме ваш проект упирается не в технологический, а в биоэтический барьер. Вы создадите не просто музыкальный ИИ, а машину для генерации субъективного блаженства.
Эффект может варьироваться от простой радости до состояний, неотличимых от мистического опыта или оргазма, вызванного чисто церебральными средствами. Однако, достигнув этого теоретического предела, мы столкнемся с вопросом: а стоит ли человеку иметь неограниченный доступ к кнопке, нажимание на которую дает ему самое сильное удовольствие, на какое он только способен?
Re[2]: AI-cинтез совершенной музыки из Рая (мнение ChatGPT)
Здравствуйте, Osaka, Вы писали:
xma>>анализировать миллионы биореакций на генерируемые треки O>Либо сгенерят что-то для "среднего американца с 1 сиськой и 1 яйцом"
Этим страдают совсем маленькие модели.
Грубое сравнение — такой ИИ научился бы писать одну усреднённую букву из алфавита. ))
На деле, современные ведущие ИИ распознают и генерирует сотни миллионов паттернов, а так же распознают их сочетания.
Т.е. в этом и фишка при обучении — выделять независимые части из составных смыслов.
У музыки базовых паттернов десятки тысяч от силы, базовых характеров голосового исполнения единицы сотен (максимум единицы тысяч), приёмов оранжировки тоже десятки тысяч от силы.
Всё остальное — комбинаторика и вариации.
O>либо начнётся ужассная расовая и кастовая сегрегация.
Кстате, да, с эффектом переобучения тоже эффективно борются, есть куча методов.
Re[5]: AI-cинтез совершенной музыки из Рая (мнение ИИ)
Здравствуйте, T4r4sB, Вы писали:
V>>поиграл с Udio — это зачаточный уровень в сравнении с Suno. TB>В Суно уже можно трек по пол-минуты продлевать выбирая одну попытку из 10?
Суно уже сразу большой трек может.
А продлевать можно с любой миллисекунды или заменять в готовом произведении требуемый отрывок (заставлять генерить отрывок заново), причём, даже очень короткие отрывки — это полезно для лучшего произношения речи (даже отдельных букв).
TB>Суно избавились от нарастающих шумов к концу трека?
Еще в версии 3.5, и они тогда же увеличили длительность композиций до 4-х минут.
Сейчас до 8-ми минут генерации за раз, т.е. без многократных extend.
TB>Версию 4.5 заценю
Да, заценить стоит.
Я ржал в голосину...
Кароч, в прошлых версиях пытался раскачать их ИИ на выразительное/эмоциональное пение.
Так он теперь на меня орёт аж усирается! ))
====
Кароч, теперь надо поменьше вмешиваться в текст и просить от него акцентов.
Видать, подкрутили его так, что он стал и сам петь выразительно-эмоционально и без принуждения.
Здравствуйте, vdimas, Вы писали:
V>Здравствуйте, T4r4sB, Вы писали:
TB>>Версию 4.5 заценю
V>Накидаю тут еще предпросмотров для 5-й версии, ты офигеешь, я уверен. ))
К сожалению, очень часто выдаёт такое
С другой стороны, первый же удачный запуск получился 100% адекватный.
Раньше (на 3.5) в лучше случае было так: начало годнота, середина терпимо, под конец неслухабельно. При этом косяки с ударениями и словами примерно на каждой 10й строчке.
В 4.5 как будто исправили эти косяки
Нет такой подлости и мерзости, на которую бы не пошёл gcc ради бессмысленных 5% скорости в никому не нужном синтетическом тесте
Re[7]: AI-cинтез совершенной музыки из Рая (мнение ИИ)
Здравствуйте, T4r4sB, Вы писали:
TB>Раньше (на 3.5) в лучше случае было так: начало годнота, середина терпимо, под конец неслухабельно.
Этим все такие генераторы страдали, что требовало генерировать по 1-2 куплета через дописывание, и многие системы именно так и рекомендовали ими пользоваться, что лично мне казалось странным — ведь это можно было сделать на стороне алгоритма, а не заставлять делать это пользователя.
В версии 5 Suno может генерить до 16-ти минут за раз (что уже перебор для обычной песни, бо для песен рекомендуется длина 3-4 минуты, затем песня начинает тяготить).
На деле, генерация может быть вечной через описанный высокоуровневый алгоритм. ))
TB>При этом косяки с ударениями и словами примерно на каждой 10й строчке.
Это на русском. И еще порой неправильное произношение звуков.
На английском они все неплохо генерят.
TB>В 4.5 как будто исправили эти косяки
Всё равно с ударениями регулярно косячит, прихОдится иногдА прАвильно их расставлЯть через капс. ))
======
На самом деле и Udio — охеренная штука, конечно.
Сама эта способность к более-менее адекватному пению с выражением, да еще исходя из контекста ИИ часто догадывается, где надо делать акценты, а где наоборот.
Просто Suno объективно опережает примерно на полтора с копейками года.
Но это не критично, бо сейчас все эти системы на фазе подъёме и скоро начнут входить в насыщение, т.е. отстающие подтянутся к лидерам.
И плюс будет большой выбор, потому что сейчас один Suno раздражает именно тем, что один. ))
Это как с генераторами картинок — сейчас большой выбор генераторов, что позволяет по одному и тому же промпту получить у кучи ИИ совершенно различное "видение".
Здравствуйте, Nuzhny, Вы писали:
N> Неврологическая адаптация (Гомеостаз): Мозг стремится к равновесию. Постоянная стимуляция центров удовольствия приводит к снижению чувствительности рецепторов. Требуется все большая "доза" для того же эффекта (толерантность). В конце концов, система перестанет реагировать.
Всё верно.
Поэтому, почти все произведения, признанные величайшими, на деле построены на эмоциональных качелях, контрастах.
N> Эмоциональное привыкание: Даже самую прекрасную музыку, если она повторяется и становится предсказуемой, перестаешь чувствовать так же остро. ИИ придется постоянно находить тонкий баланс между предсказуемостью (которая нравится мозгу) и новизной (которая вызывает возбуждение).
Это всё может помещаться в рамках одного произведения.
N> Индивидуальная биохимия: То, что вызывает экстаз у одного человека, может не сработать для другого. Максимум будет уникален для каждого.
ИИ прекрасно это обыгрывает — у него может быть сколько угодно экстремумов в его ф-ии.
N> Создание идеального наркотика: Это будет легальный, не вызывающий физического привыкания (но сильнейшего психологического), бесплатный и неограниченный аудио-наркотик. Последствия для общества, productivity и социальных связей могут быть катастрофическими. Зачем общаться, творить, стремиться к чему-то, если можно надеть наушники и испытывать блаженство?
Больше половины людей давно уже так живут — целыми днями слушают музыку. ))
Они не творят музыку сами, но слушают то, что приносит им удовольствие.
(лично меня постоянно звучащая музыка раздражает)
N> Потеря агентности: ИИ будет знать, что вам нравится, лучше вас самих. Это может привести к "эстетической ловушке" — вы будете слушать только то, что максимизирует ваш дофамин, и ваши музыкальные вкусы перестанут развиваться. Это тупик для личностного роста.
Тут ИИ довольно-таки сильно ошибся — человек любит слушать любимую музыку, но точно так же любопытен к новинкам.
Еще средний человек довольно сильно зависим от "моды".
Кароч, это грубая ошибка в рассуждениях ИИ — вот почему не стоит слишком на ИИ полагаться даже в простейших вещах.
К тому же, в такой системе "новинкой" может быть "обмен опытом" с другими обученными на других людях сетками, ИИ упустил и это.
N> Манипуляция сознанием: Технология, способная так глубоко влиять на эмоции, станет мощнейшим инструментом пропаганды, рекламы и контроля. Представьте политическое выступление или рекламный ролик, звуковая дорожка которого спроектирована такой системой для максимизации доверия и симпатии.
Оно так есть давно и в любом случае будет использоваться всё глубже — опять ошибка в рассуждениях.
На помоечку ваш дипсик ))
N> Психологическая зависимость и когнитивные искажения: Постоянное бегство в искусственную эйфорию может привести к депрессии в "реальной жизни", потере мотивации и искажению восприятия действительности.
И опять предупреждение о том, что давно происходит в реале.
Воистину, ИИ хороший компилятор уже имеющихся знаний/фактов, но плохой футуролог.
N>Эффект может варьироваться от простой радости до состояний, неотличимых от мистического опыта или оргазма, вызванного чисто церебральными средствами.
И опять преподносит факты как предсказания. ))
Re[8]: AI-cинтез совершенной музыки из Рая (мнение ИИ)
Здравствуйте, vdimas, Вы писали:
V>Но это не критично, бо сейчас все эти системы на фазе подъёме и скоро начнут входить в насыщение, т.е. отстающие подтянутся к лидерам. V>И плюс будет большой выбор, потому что сейчас один Suno раздражает именно тем, что один. ))
Бгг, и опять как в воду глядел — сегодняшняя новость:
xma>основная идея в том, чтобы использовать считывание эмоций (большее или меньшее наслаждение испытывает человек, и его степень) — при проигрывании очередного (сгенерированного ИИ) музыкального семпла, для обучения нейронки на живых людях .. (желательно сразу на миллионах людей, для ускорения процесса)
петухи из open source ACE-Step (локальный аналог SUNO средне-низкой паршивости) на смех подняли, сказав что гарнитур позволяющих считывать эмоции не просматривается (а к прогнозам что они должны появится бы к 2030+ гг отнеслись скептически) ну и они ваще в Райскую музычку не верят, говорят что все эти ярко озвученные перспективы лишь бред и выдумки ИИ ..
ну и ессно никаких экспериментов с внедрением на имеющемся оборудовании, а тем более попыток популяризации идеи для дальнейших исследований (например крупными корпорациями, как сейчас над потенциальным AGI трясутся все) — проводить не хотят ..
P.S.:
а на форумах наоборот ретрограды орут что это потенциальный "опимум для народа" и нужно якобы запретить
а бакланы из суппорта SUNO даже не поняли про что речь, "кругом идиоты" (c)
Re[8]: AI-cинтез совершенной музыки из Рая (мнение ИИ)
Здравствуйте, vdimas, Вы писали:
V>Просто Suno объективно опережает примерно на полтора с копейками года.
Да хз, мне подход Удио с полуминутами нравится тем, что ты как бы точнее контролируешь процесс создания песни, то есть можешь раза с 5го найти прикольное вступление, потом прикольную вокальную партию, потом ещё более прикольное продолжение. Потом внезапно осознать что продолжение намного прикольнее чем вступление и попросить к нему уже придумать другое вступление, то есть нарастить песню спереди. И такими правками песня может видоизмениться до полной неузнаваемости.
А ещё Удио как будто более музыкально образованный что ли. Суно всё-таки генерирует попсовенькие песни. Даже не в смысле жанровой принаджелности, а в смысле заезженности музыкальных ходов. Если он генерит митол, то всё равно какой-то попсовый. Suno Metal можно уже отдельным жанром называть (весьма однообразным). Не, я нормально к митолу отношусь, но Suno Metal надоел почти сразу.
А Удио более разнообразные жанры может аутентичнее создавать. А ещё при помощи такой генерации по пол-минуты можно подбирать продолжение которое полностью меняет музыкальную линию, и создать песню, которая вообще похожа на лоскутное одеяло, короче почти как Emily Play. И получается вообще адский то ли арт-рок, то ли рок-опера, то ли прогрессив рок. Там джазовая вставочка, там симфоническая, там эффект сломанного усилителя гитары, и переходы органичные довольно таки, это же полный музыкальный восторг! Правда вокалист фальшивит постоянно, ну то есть реально через раз поёт как глухой вокалист, что даже я слышу, а у меня так-то нету музыкального слуха.
V>Но это не критично, бо сейчас все эти системы на фазе подъёме и скоро начнут входить в насыщение, т.е. отстающие подтянутся к лидерам. V>И плюс будет большой выбор, потому что сейчас один Suno раздражает именно тем, что один. ))
Или подтянутся копирасты и засудят их за то, что некоторые песни немного напоминают некоторые известные хиты. Я уже слышал что в какой-то момент качество просело из-за копирастов.
ПС прослушал наконец отрывки, что ты выложил, конечно круто что сразу нормальная песня считай получается. Управляющие промты выглядят очень сильным инструментом, если они все работают (monkey noise???). Выбор жанра не банальный (не митол), тоже плюс)
Нет такой подлости и мерзости, на которую бы не пошёл gcc ради бессмысленных 5% скорости в никому не нужном синтетическом тесте
Re[9]: AI-cинтез совершенной музыки из Рая (мнение ИИ)
Здравствуйте, T4r4sB, Вы писали: TB>Потом внезапно осознать что продолжение намного прикольнее чем вступление и попросить к нему уже придумать другое вступление, то есть нарастить песню спереди.
Это я упустил, прикольно.
Но Suno на платном акке позволяет бесконечно перегенерировать вообще любой произвольный отрывок произвольной длительности в произведении, а не только наращивать, как было изначально пару лет назад.
TB>И такими правками песня может видоизмениться до полной неузнаваемости.
Разумеется.
У меня нет возможности оплатить Suno сейчас (да и вообще сейчас только ВПН туда зайти можно), пользуюсь различными прокси к нему, типа www.yolly.ai, но эти прокси отстают по полному функционалу даже за денюжку.
Поэтому, я в бесплатном Suno генерю отрывки, часто вручную их склеиваю, т.е. получается скелет, а потом уже через функцию "кавер" подбираю в нужном жанре звучание окончательное.
И вроде всё просто,
Но в этом секрет:
Сложней стоит быть,
Чем казаться извне.
Припев:
Опять в платье тонком,
В ночи ты сияешь —
Сама себе лучшее
Из украшений!
Нет ни цепей,
Ни золота блеска!
Надеждой горишь,
Пытаясь согреться...
Куплет 3:
И пусть время крадёт,
Что уже не вернуть,
Но память хранит
Непростой этот путь.
В зеркале взгляд
Слезу не роняет...
Тебя этот мир
Не за ту принимает!
Припев:
Опять в платье тонком,
В ночи ты сияешь —
Сама себе лучшее
Из украшений!
Нет ни цепей,
Ни золота блеска!
Зачем так стучишь,
Непокорное сердце?
Куплет 4:
Ах,
Эта юность
Как ветер шальной,
Мятеж и соблазн,
Нам не нужен покой!
Шаг лёгкий, как пух,
Ты будто паришь.
Лови этот миг —
Навсегда сохранишь…
Припев:
Опять в платье тонком,
В ночи ты сияешь —
Сама себе лучшее
Из украшений!
Нет ни цепей,
Ни золота блеска!
Лишь нагая душа
И возраст чудесный!
TB>А ещё Удио как будто более музыкально образованный что ли. Суно всё-таки генерирует попсовенькие песни. Даже не в смысле жанровой принаджелности, а в смысле заезженности музыкальных ходов.
Есть такое.. Это позволяет пользоваться сервисом далёким от музыки людям. ))
TB>Если он генерит митол, то всё равно какой-то попсовый. Suno Metal можно уже отдельным жанром называть (весьма однообразным). Не, я нормально к митолу отношусь, но Suno Metal надоел почти сразу.
Спрос большой просто.
90% пользователей пытаются генерить в хард-роке и близких жанрах, где направление металла — это лишь разновидность хард-рока.
TB>А Удио более разнообразные жанры может аутентичнее создавать.
В 4.5+ и особенно в 5-й версии Suno охеренно генерит этно-музыку, да еще офигенно умеет смешивать жанры, что порождает неплохие сочетания, одно из них давал уже (афро-барабаны и гитарный рифф на их фоне).
TB>А ещё при помощи такой генерации по пол-минуты можно подбирать продолжение которое полностью меняет музыкальную линию, и создать песню, которая вообще похожа на лоскутное одеяло, короче почти как Emily Play. И получается вообще адский то ли арт-рок, то ли рок-опера, то ли прогрессив рок. Там джазовая вставочка, там симфоническая, там эффект сломанного усилителя гитары, и переходы органичные довольно таки, это же полный музыкальный восторг! Правда вокалист фальшивит постоянно, ну то есть реально через раз поёт как глухой вокалист, что даже я слышу, а у меня так-то нету музыкального слуха.
Кстате, в первых версиях Suno попадал голосом в ноты хорошо, а потом более очеловечился и стал недотягивать, придыхания и прочее.
Его надо специально просить петь более чётко или более точно и т.д., и вообще, в Suno сейчас надо описывать промпт в свободной форме — что ожидается от инструментов, что от вокала, как именно петь и т.д.
Плюс прямо в песне можно в свободной форме делать разметку, например:
[Drums play like heartbeat]
[Slightly overdrived short guitar solo]
Раньше промтп стилей ограничивался списком жанров, а теперь это рассказ на много килобайт. ))
И чем лучше расскажешь, тем будет ближе к желаемому.
V>>Но это не критично, бо сейчас все эти системы на фазе подъёме и скоро начнут входить в насыщение, т.е. отстающие подтянутся к лидерам. V>>И плюс будет большой выбор, потому что сейчас один Suno раздражает именно тем, что один. )) TB>Или подтянутся копирасты и засудят их за то, что некоторые песни немного напоминают некоторые известные хиты.
Не взлетит, ИМХО. ))
Оно так и у людей бывает, бо кол-во переходов гармоник вполне счётно, кол-во переходов нот в рамках гармоник счётно, кол-во вариаций ритмики счётно.
Именно поэтому и у людей всегда попадаются в произведения последовательности нот, которые уже десятки (сони раз) присутствовали в других произведениях.
А про последовательности гармоник и говорить бесполезно — их совсем мало.
TB>Я уже слышал что в какой-то момент качество просело из-за копирастов.
Ну да, Suno теперь знает существующие произведения.
Т.е. ты не можешь для функции кавер подставить уже имеющееся произведение и переделать его в другом стиле, например — Suno тут же распознаёт и отказывается работать с таким материалом.
TB>ПС прослушал наконец отрывки, что ты выложил, конечно круто что сразу нормальная песня считай получается. Управляющие промты выглядят очень сильным инструментом, если они все работают (monkey noise???). Выбор жанра не банальный (не митол), тоже плюс)
"Сила" промптов настраивается перед генерацией (внешнего промпта и разметки в песне).
Хорошим начальным значением будет 50%.
А вот уже когда есть "рыба", и на неё делаешь цепочу каверов (сейчас каждое произведение рождается как цепочка из десятка и более каверов, что-то типа генетического алгоритма получается, бгг), тогда силу промпта можно ставить чуть больше. А при первоначальной генерации стоит позволять работать rnd ))
Первоначальный мой промпт или мал или отсутствует вовсе — я даю ИИ самому из текста попытаться "понять", в каком стиле её стоит оформить.
Уточняю промпты уже когда делаю каверы в выбранных стилях.
Потому что нихера не в стилях и не в оранжировке дело, конечно! ))
Главное — это "идея", "рыба".
Офигенно помогло то, что сейчас можно самому напеть для "рыбы" (потому что порой ИИ не может дать хорошую идею музыки, да еще с моим перфекционизмом), а потом уже пошла цепочка каверов, т.е. свои жалкие напевки можно исполнить сколь угодно шикарно — вон пример выше. ))
Правда, был бы платный доступ к самому Suno, переделал бы некоторые моменты (кое-где хотелось бы меньше драматичности-надрыва), бо неидеально всё-равно через цепочку каверов.
Но это ж всё на уровне баловства, так шта, махнул уже рукой. ))
а как человек не умеющих сложить некоторое количество нот в тему, рассуждает о том... а как-же ?? Прежде чем давить на "оно сейчас само все напишет", вопрос где критерий ??? "Тема" (хоть и есть внетематические (хотя, я бы их назвал сложно тематическими) допустим танго старвинского в исполнении одной дамы) )))
, но в любом случае .. нет ни единого в истории человека прецедента, когда .. AI вычислил тему )) все остальное — звуковая инженерия. не надо менять понятий ... шожь за бред то...
блин невежество рождает глупые мифы
Re[10]: AI-cинтез совершенной музыки из Рая (мнение ИИ)
V>Плюс прямо в песне можно в свободной форме делать разметку, например: V>[Drums play like heartbeat] V>[Slightly overdrived short guitar solo]
V>Раньше промтп стилей ограничивался списком жанров, а теперь это рассказ на много килобайт. )) V>И чем лучше расскажешь, тем будет ближе к желаемому.
Короче попробовал просто напихать между куплетами
[folk section]
[blues section]
[hard-rock section]
[psychedelic rock section]
итд
Не, всё равно все фрагменты одинаковые, композиция получается плоская, без развития
V>Ну да, Suno теперь знает существующие произведения. V>Т.е. ты не можешь для функции кавер подставить уже имеющееся произведение и переделать его в другом стиле, например — Suno тут же распознаёт и отказывается работать с таким материалом.
Вообще пофиг, достаточно иметь немного специфичный музыкальный вкус — и Суно не знает твои любимые песни. Я считаю, что если генерация слишком похожа на оригинал, то это моя проблема, и не надо меня от этого защищать.
Нет такой подлости и мерзости, на которую бы не пошёл gcc ради бессмысленных 5% скорости в никому не нужном синтетическом тесте