Doppelte Dateien finden
Sept. 10, 2012·
·
1 Min Lesezeit
Julio Batista Silva
Dubletten vergeuden Speicherplatz. Glücklicherweise gibt es Tools, die die Suche automatisieren.
fdupes
Installieren:
sudo pacman -S fdupes
Rekursiv laufen lassen und Ausgabe in Datei schreiben:
fdupes -r . > dupes1.txt
Auf meinem Rechner dauerte das ~7 min für ~23.500 Dateien. dupes1.txt hatte 5714 Zeilen.
fdupes -rf . > dupes2.txt
Nach ~7 min: dupes2.txt mit 3878 Zeilen. Leere Zeilen entfernen mit sed -i '/^$/d' dupes2.txt →
2054 Zeilen.
Viele Treffer sind beabsichtigt identisch (z. B. Beispielcode in Büchern). VCS‑Verzeichnisse (git,
svn, …) können als doppelt erscheinen, sollten aber nicht gelöscht werden.
Wer sicher Speicher sparen will, kann doppelte Dateien durch Hardlinks ersetzen.
Löschen aller doppelten Dateien (Vorsicht!):
while read f; do rm "$f"; done < dupes2.txt
Gemini (macOS)
Kostenpflichtige Alternative mit GUI: Gemini.