Информация об изменениях

Сообщение Re[6]: Некоторые размышления об ИИ от 19.12.2025 11:59

Изменено 19.12.2025 12:14 Pavel Dvorkin

Старый текст
Новый текст
Разница

Re[6]: Некоторые размышления об ИИ

Здравствуйте, hi_octane, Вы писали:

_>Так новым графическим моделькам, которые запускаются на потребительской видюхе, достаточно одной фото человека, чтобы они нарисовали другое фото этого же человека в совершенной другой одежде и обстановке (PullId, InstantId, и даже Qwen Edit). Люди такое могут только после долгих лет обучения в художке.

Ну в разработке такой программы я сам принимал участие еще в конце 90-х. Посмотреть, как на этом человеке будет выглядеть рубашка из данной ткани. Там чистая машинная графика и никакого ИИ не нужно было, и даже GPU мы не использовали. Вот насчет обстановки — не знаю, не делал, да и обстановка — понятие растяжимое.

_>Современные модели zero shot voice cloning могут послушать одну фразу, 5-30 секунд, голоса человека и синтезировать неотличимую речь. На сотне языков. Сколько человек на планете так смогут?

_>Вчера вышло обновление модельки ИИ, которая с одного фото делает полноценную 3D-модель для 3d-печати/игры. Это как если бы ребёнок увидел одно фото дикобраза, и запилил его скульптуру во всех деталях. Сколько человек на планете смогут также?

_>Это всё домашние модели, работающие на потребительских видеокартах. Железо для игр сделанное. Когда выходили видеокарты 4090 никто и не думал о таких применениях. Оказалось что это всё можно, просто не было понимания архитектуры таких штук и математики для этого. Не более.

И все же это немного другое. Генерация на базе имеющихся данных, а не обобщение.

Я и не спорю, что человек многое не может сделать, что может машина. Тут спорить глупо.

Но все же хотелось бы посмотреть на программу, которой дается

20-30 фотографий домашних кошек
20-30 фотографий собак разных пород. От пуделя до бульдога.

Никакую иную информацию она использовать не имеет права.

После чего она по любой фотографии с почти 100% надежностью говорит, кто на ней изображен — кошка или собака. Причем на фото это животное может быть в профиль, в фас и даже со спины.

Любой ребенок 5 лет со средним интеллектом это сделает.

Есть такие ?

Re[6]: Некоторые размышления об ИИ

Здравствуйте, hi_octane, Вы писали:

_>Так новым графическим моделькам, которые запускаются на потребительской видюхе, достаточно одной фото человека, чтобы они нарисовали другое фото этого же человека в совершенной другой одежде и обстановке (PullId, InstantId, и даже Qwen Edit). Люди такое могут только после долгих лет обучения в художке.

Ну в разработке такой программы я сам принимал участие еще в конце 90-х. Посмотреть, как на этом человеке будет выглядеть рубашка из данной ткани. Там чистая машинная графика и никакого ИИ не нужно было, и даже GPU мы не использовали. Вот насчет обстановки — не знаю, не делал, да и обстановка — понятие растяжимое.

_>Современные модели zero shot voice cloning могут послушать одну фразу, 5-30 секунд, голоса человека и синтезировать неотличимую речь. На сотне языков. Сколько человек на планете так смогут?

_>Вчера вышло обновление модельки ИИ, которая с одного фото делает полноценную 3D-модель для 3d-печати/игры. Это как если бы ребёнок увидел одно фото дикобраза, и запилил его скульптуру во всех деталях. Сколько человек на планете смогут также?

_>Это всё домашние модели, работающие на потребительских видеокартах. Железо для игр сделанное. Когда выходили видеокарты 4090 никто и не думал о таких применениях. Оказалось что это всё можно, просто не было понимания архитектуры таких штук и математики для этого. Не более.

И все же это немного другое. Генерация на базе имеющихся данных, а не обобщение.

Я и не спорю, что человек многое не может сделать, что может машина. Тут спорить глупо.

Но все же хотелось бы посмотреть на программу, которой дается

20-30 фотографий домашних кошек
20-30 фотографий собак разных пород. От пуделя до бульдога.

Никакую иную информацию она использовать не имеет права.

После чего она по любой фотографии с почти 100% надежностью говорить, кто на ней изображен — кошка или собака. Причем на фото это животное может быть в профиль, в фас и даже со спины.

Любой ребенок 5 лет со средним интеллектом это сделает.

Есть такие ?

Ну и из личного опыта. Попался мне лет 5 назад сайт, где обещали примерно такое — определить, что за животное на фото. Конечно, не ИИ там был, а просто какой-то алгоритм. Скормил я ему фото моего тогдашнего кота, а он был совершенно белый и длинношерстный. Ну и оказался он на 40% кроликом, и только на 20% котом. Судя по всему, исследовали структуру шерсти, а они и впрямь похожи. Но никакой ребенок не будет под микроскопом или даже без него пристально эту структуру рассматривать. Просто взглянет и скажет — кис-кис.