Поиск дубликатов папок и файлов
От: Shmj Ниоткуда  
Дата: 18.06.24 07:01
Оценка:
Существует ли прога, которую можно натравить на некий архив данных (размер 1000 Гб) и оно найдет там все дубликаты папок (т.е. папки с одинаковым содержимым) а затем дубликаты файлов?
=сначала спроси у GPT=
Re: Поиск дубликатов папок и файлов
От: Stanislaw K СССР  
Дата: 20.06.24 15:24
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Существует ли прога, которую можно натравить на некий архив данных (размер 1000 Гб) и оно найдет там все дубликаты папок (т.е. папки с одинаковым содержимым) а затем дубликаты файлов?


существует.

даже существуют проги, которые находят дубликаты изображений. даже если эти одно из изображений другого размера и разрешения.
Все проблемы от жадности и глупости
Отредактировано 20.06.2024 15:26 Stanislaw K . Предыдущая версия .
Re[2]: Поиск дубликатов папок и файлов
От: Shmj Ниоткуда  
Дата: 20.06.24 18:27
Оценка:
Здравствуйте, Stanislaw K, Вы писали:

S>>Существует ли прога, которую можно натравить на некий архив данных (размер 1000 Гб) и оно найдет там все дубликаты папок (т.е. папки с одинаковым содержимым) а затем дубликаты файлов?

SK>существует.

Вы знаете как шизофреники отвечают на вопрос — "у вас есть часы?". Говорят — да, есть. Но человек то время хотел узнать.

Мне интересно кто какими прогами пользовался и что можете порекомендовать.
=сначала спроси у GPT=
Re[3]: Поиск дубликатов папок и файлов
От: Stanislaw K СССР  
Дата: 20.06.24 19:03
Оценка: 6 (1) +2
Здравствуйте, Shmj, Вы писали:

S>>>Существует ли прога, которую можно натравить на некий архив данных (размер 1000 Гб) и оно найдет там все дубликаты папок (т.е. папки с одинаковым содержимым) а затем дубликаты файлов?

SK>>существует.

S>Вы знаете как шизофреники отвечают на вопрос — "у вас есть часы?". Говорят — да, есть. Но человек то время хотел узнать.


Тот, кто хочет узнать время спрашивает "подскажите пожалуйста — который сейчас час?"

S>Мне интересно кто какими прогами пользовался и


dupdetector,

auslogics duplicate file finder.


S> что можете порекомендовать.


разгрести это руками и больше не допускать бардака.
Все проблемы от жадности и глупости
Re[2]: Поиск дубликатов папок и файлов
От: Буравчик Россия  
Дата: 20.06.24 20:07
Оценка:
Здравствуйте, Stanislaw K, Вы писали:

SK>даже существуют проги, которые находят дубликаты изображений. даже если эти одно из изображений другого размера и разрешения.


Вот только работают они слишком примитивно. Просто выводят дубликаты файлов

А обычно дублируются целые папки, а иногда и части папок.
И хороший дедупликатор должен выявлять дубликаты на этом уровне.

Я для разбора изображений написал скрипт, который раскладывает фото по папкам (год-дата-папка). Причем все фото в папке удовлетворяют условиям:
— все они от одной даты (снималось одно и то же событие)
— все они сделаны с одного фотоаппарата (так отсеиваются скопированные фото от других людей)
— все их копии лежат в одних и тех же папках (так отсеиваются полные копии папок, и, например, отделяются "хорошие" фото скопированные в соседнюю папку)
— в папке лежат названия папок, в которых лежат исходные фото (это позволяет получить контекст сделанного фото — название мероприятия, источник фото и т.п.)

Остается пробежаться по папкам и переименовать их, подглядывая в названия.
Best regards, Буравчик
Re[3]: Поиск дубликатов папок и файлов
От: Stanislaw K СССР  
Дата: 21.06.24 05:27
Оценка:
Здравствуйте, Буравчик, Вы писали:


SK>>даже существуют проги, которые находят дубликаты изображений. даже если эти одно из изображений другого размера и разрешения.


Б>Вот только работают они слишком примитивно. Просто выводят дубликаты файлов


ну, как примитивно? я вот помню сохранял прон с одного сайта в одну папку, а прон с другого сайта в другую.

как это обычно бывает на сайтах с проном, они друг у друга заимствуют контент. и я натравил дедупликатор.

дедупликатор нашёл большинство дублей. не смотря на то, что в одной папке картинка jpg лежала 1024х800, а в другой png 640х480, или bmp 800х600, или gif.

естественно, никакой метаинформации там изначально не было, даты создания файлов можно считать случайными, crc32 очевидно не совпадают.
Все проблемы от жадности и глупости
Re[4]: Поиск дубликатов папок и файлов
От: Shmj Ниоткуда  
Дата: 23.06.24 12:57
Оценка:
Здравствуйте, Stanislaw K, Вы писали:

SK>dupdetector,

SK>auslogics duplicate file finder.

В общем, ни одна из прог не подошла.

Мне нужно сначала на основе целых папок. К примеру, если две папки полностью одинаковые — нет смысла мне показывать каждый фал по отдельности. А вот если папки разные, но файлы там похожие (почти одинаковые) — то желательно так же отобразить процент схожести.
=сначала спроси у GPT=
Re[5]: Поиск дубликатов папок и файлов
От: Stanislaw K СССР  
Дата: 23.06.24 14:29
Оценка: +1
Здравствуйте, Shmj, Вы писали:

S>В общем, ни одна из прог не подошла.


S>Мне нужно сначала на основе целых папок. К примеру, если две папки полностью одинаковые — нет смысла мне показывать каждый фал по отдельности. А вот если папки разные, но файлы там похожие (почти одинаковые) — то желательно так же отобразить процент схожести.



ты-ж программист. напиши!
Все проблемы от жадности и глупости
Re[5]: Поиск дубликатов папок и файлов
От: m2user  
Дата: 23.06.24 16:03
Оценка:
S>Мне нужно сначала на основе целых папок. К примеру, если две папки полностью одинаковые — нет смысла мне показывать каждый фал по отдельности. А вот если папки разные, но файлы там похожие (почти одинаковые) — то желательно так же отобразить процент схожести.

По каталогам вроде умел WinMerge сравнивать. Но без процентов конечно (степень похожести это вообще субъективное ).
Re[6]: Поиск дубликатов папок и файлов
От: flаt  
Дата: 23.06.24 17:02
Оценка:
Здравствуйте, m2user, Вы писали:

M>По каталогам вроде умел WinMerge сравнивать. Но без процентов конечно (степень похожести это вообще субъективное ).


И Araxis Merge (Compare) — он и картинки умеет.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.