Doppelte Dateien finden

Sept. 10, 2012·
Julio Batista Silva
Julio Batista Silva
· 1 Min Lesezeit

Dubletten vergeuden Speicherplatz. Glücklicherweise gibt es Tools, die die Suche automatisieren.

fdupes

Installieren:

sudo pacman -S fdupes

Rekursiv laufen lassen und Ausgabe in Datei schreiben:

fdupes -r . > dupes1.txt

Auf meinem Rechner dauerte das ~7 min für ~23.500 Dateien. dupes1.txt hatte 5714 Zeilen.

fdupes -rf . > dupes2.txt

Nach ~7 min: dupes2.txt mit 3878 Zeilen. Leere Zeilen entfernen mit sed -i '/^$/d' dupes2.txt → 2054 Zeilen.

Viele Treffer sind beabsichtigt identisch (z. B. Beispielcode in Büchern). VCS‑Verzeichnisse (git, svn, …) können als doppelt erscheinen, sollten aber nicht gelöscht werden.

Wer sicher Speicher sparen will, kann doppelte Dateien durch Hardlinks ersetzen.

Löschen aller doppelten Dateien (Vorsicht!):

while read f; do rm "$f"; done < dupes2.txt

Gemini (macOS)

Kostenpflichtige Alternative mit GUI: Gemini.

Julio Batista Silva
Autoren
Senior Cloud-Entwickler
comments powered by Disqus