Сообщение Re[6]: Некоторые размышления об ИИ от 19.12.2025 11:59
Изменено 19.12.2025 12:14 Pavel Dvorkin
Re[6]: Некоторые размышления об ИИ
Здравствуйте, hi_octane, Вы писали:
_>Так новым графическим моделькам, которые запускаются на потребительской видюхе, достаточно одной фото человека, чтобы они нарисовали другое фото этого же человека в совершенной другой одежде и обстановке (PullId, InstantId, и даже Qwen Edit). Люди такое могут только после долгих лет обучения в художке.
Ну в разработке такой программы я сам принимал участие еще в конце 90-х. Посмотреть, как на этом человеке будет выглядеть рубашка из данной ткани. Там чистая машинная графика и никакого ИИ не нужно было, и даже GPU мы не использовали. Вот насчет обстановки — не знаю, не делал, да и обстановка — понятие растяжимое.
_>Современные модели zero shot voice cloning могут послушать одну фразу, 5-30 секунд, голоса человека и синтезировать неотличимую речь. На сотне языков. Сколько человек на планете так смогут?
_>Вчера вышло обновление модельки ИИ, которая с одного фото делает полноценную 3D-модель для 3d-печати/игры. Это как если бы ребёнок увидел одно фото дикобраза, и запилил его скульптуру во всех деталях. Сколько человек на планете смогут также?
_>Это всё домашние модели, работающие на потребительских видеокартах. Железо для игр сделанное. Когда выходили видеокарты 4090 никто и не думал о таких применениях. Оказалось что это всё можно, просто не было понимания архитектуры таких штук и математики для этого. Не более.
И все же это немного другое. Генерация на базе имеющихся данных, а не обобщение.
Я и не спорю, что человек многое не может сделать, что может машина. Тут спорить глупо.
Но все же хотелось бы посмотреть на программу, которой дается
20-30 фотографий домашних кошек
20-30 фотографий собак разных пород. От пуделя до бульдога.
Никакую иную информацию она использовать не имеет права.
После чего она по любой фотографии с почти 100% надежностью говорит, кто на ней изображен — кошка или собака. Причем на фото это животное может быть в профиль, в фас и даже со спины.
Любой ребенок 5 лет со средним интеллектом это сделает.
Есть такие ?
_>Так новым графическим моделькам, которые запускаются на потребительской видюхе, достаточно одной фото человека, чтобы они нарисовали другое фото этого же человека в совершенной другой одежде и обстановке (PullId, InstantId, и даже Qwen Edit). Люди такое могут только после долгих лет обучения в художке.
Ну в разработке такой программы я сам принимал участие еще в конце 90-х. Посмотреть, как на этом человеке будет выглядеть рубашка из данной ткани. Там чистая машинная графика и никакого ИИ не нужно было, и даже GPU мы не использовали. Вот насчет обстановки — не знаю, не делал, да и обстановка — понятие растяжимое.
_>Современные модели zero shot voice cloning могут послушать одну фразу, 5-30 секунд, голоса человека и синтезировать неотличимую речь. На сотне языков. Сколько человек на планете так смогут?
_>Вчера вышло обновление модельки ИИ, которая с одного фото делает полноценную 3D-модель для 3d-печати/игры. Это как если бы ребёнок увидел одно фото дикобраза, и запилил его скульптуру во всех деталях. Сколько человек на планете смогут также?
_>Это всё домашние модели, работающие на потребительских видеокартах. Железо для игр сделанное. Когда выходили видеокарты 4090 никто и не думал о таких применениях. Оказалось что это всё можно, просто не было понимания архитектуры таких штук и математики для этого. Не более.
И все же это немного другое. Генерация на базе имеющихся данных, а не обобщение.
Я и не спорю, что человек многое не может сделать, что может машина. Тут спорить глупо.
Но все же хотелось бы посмотреть на программу, которой дается
20-30 фотографий домашних кошек
20-30 фотографий собак разных пород. От пуделя до бульдога.
Никакую иную информацию она использовать не имеет права.
После чего она по любой фотографии с почти 100% надежностью говорит, кто на ней изображен — кошка или собака. Причем на фото это животное может быть в профиль, в фас и даже со спины.
Любой ребенок 5 лет со средним интеллектом это сделает.
Есть такие ?
Re[6]: Некоторые размышления об ИИ
Здравствуйте, hi_octane, Вы писали:
_>Так новым графическим моделькам, которые запускаются на потребительской видюхе, достаточно одной фото человека, чтобы они нарисовали другое фото этого же человека в совершенной другой одежде и обстановке (PullId, InstantId, и даже Qwen Edit). Люди такое могут только после долгих лет обучения в художке.
Ну в разработке такой программы я сам принимал участие еще в конце 90-х. Посмотреть, как на этом человеке будет выглядеть рубашка из данной ткани. Там чистая машинная графика и никакого ИИ не нужно было, и даже GPU мы не использовали. Вот насчет обстановки — не знаю, не делал, да и обстановка — понятие растяжимое.
_>Современные модели zero shot voice cloning могут послушать одну фразу, 5-30 секунд, голоса человека и синтезировать неотличимую речь. На сотне языков. Сколько человек на планете так смогут?
_>Вчера вышло обновление модельки ИИ, которая с одного фото делает полноценную 3D-модель для 3d-печати/игры. Это как если бы ребёнок увидел одно фото дикобраза, и запилил его скульптуру во всех деталях. Сколько человек на планете смогут также?
_>Это всё домашние модели, работающие на потребительских видеокартах. Железо для игр сделанное. Когда выходили видеокарты 4090 никто и не думал о таких применениях. Оказалось что это всё можно, просто не было понимания архитектуры таких штук и математики для этого. Не более.
И все же это немного другое. Генерация на базе имеющихся данных, а не обобщение.
Я и не спорю, что человек многое не может сделать, что может машина. Тут спорить глупо.
Но все же хотелось бы посмотреть на программу, которой дается
20-30 фотографий домашних кошек
20-30 фотографий собак разных пород. От пуделя до бульдога.
Никакую иную информацию она использовать не имеет права.
После чего она по любой фотографии с почти 100% надежностью говорить, кто на ней изображен — кошка или собака. Причем на фото это животное может быть в профиль, в фас и даже со спины.
Любой ребенок 5 лет со средним интеллектом это сделает.
Есть такие ?
Ну и из личного опыта. Попался мне лет 5 назад сайт, где обещали примерно такое — определить, что за животное на фото. Конечно, не ИИ там был, а просто какой-то алгоритм. Скормил я ему фото моего тогдашнего кота, а он был совершенно белый и длинношерстный. Ну и оказался он на 40% кроликом, и только на 20% котом. Судя по всему, исследовали структуру шерсти, а они и впрямь похожи. Но никакой ребенок не будет под микроскопом или даже без него пристально эту структуру рассматривать. Просто взглянет и скажет — кис-кис.
_>Так новым графическим моделькам, которые запускаются на потребительской видюхе, достаточно одной фото человека, чтобы они нарисовали другое фото этого же человека в совершенной другой одежде и обстановке (PullId, InstantId, и даже Qwen Edit). Люди такое могут только после долгих лет обучения в художке.
Ну в разработке такой программы я сам принимал участие еще в конце 90-х. Посмотреть, как на этом человеке будет выглядеть рубашка из данной ткани. Там чистая машинная графика и никакого ИИ не нужно было, и даже GPU мы не использовали. Вот насчет обстановки — не знаю, не делал, да и обстановка — понятие растяжимое.
_>Современные модели zero shot voice cloning могут послушать одну фразу, 5-30 секунд, голоса человека и синтезировать неотличимую речь. На сотне языков. Сколько человек на планете так смогут?
_>Вчера вышло обновление модельки ИИ, которая с одного фото делает полноценную 3D-модель для 3d-печати/игры. Это как если бы ребёнок увидел одно фото дикобраза, и запилил его скульптуру во всех деталях. Сколько человек на планете смогут также?
_>Это всё домашние модели, работающие на потребительских видеокартах. Железо для игр сделанное. Когда выходили видеокарты 4090 никто и не думал о таких применениях. Оказалось что это всё можно, просто не было понимания архитектуры таких штук и математики для этого. Не более.
И все же это немного другое. Генерация на базе имеющихся данных, а не обобщение.
Я и не спорю, что человек многое не может сделать, что может машина. Тут спорить глупо.
Но все же хотелось бы посмотреть на программу, которой дается
20-30 фотографий домашних кошек
20-30 фотографий собак разных пород. От пуделя до бульдога.
Никакую иную информацию она использовать не имеет права.
После чего она по любой фотографии с почти 100% надежностью говорить, кто на ней изображен — кошка или собака. Причем на фото это животное может быть в профиль, в фас и даже со спины.
Любой ребенок 5 лет со средним интеллектом это сделает.
Есть такие ?
Ну и из личного опыта. Попался мне лет 5 назад сайт, где обещали примерно такое — определить, что за животное на фото. Конечно, не ИИ там был, а просто какой-то алгоритм. Скормил я ему фото моего тогдашнего кота, а он был совершенно белый и длинношерстный. Ну и оказался он на 40% кроликом, и только на 20% котом. Судя по всему, исследовали структуру шерсти, а они и впрямь похожи. Но никакой ребенок не будет под микроскопом или даже без него пристально эту структуру рассматривать. Просто взглянет и скажет — кис-кис.