| Überblick |
Der Fuzzy DupeFinder ist ein nützliches Werkzeug um doppelt vorhandene Dateien in größeren
Dateisammlungen zu ermitteln und zu löschen. Vor allem in umfangreichen MP3 Sammlungen häufen
sich mit der Zeit immer mehr Duplikate an, die nur unnötig Plattenplatz verschwenden. Dies muß
nicht sein!
Es gibt bereit diverse Programme, die mehrfach vorhandene Dateien ermitteln können. Diese sind zum Teil
eigenständige Tools, zum Teil in andere Programme integriert.
Warum also noch ein anderes Programm?
Die meisten Programme verwenden zum Dateivergleich entweder Prüfsummen, die den Dateiinhalt beschreiben,
oder den Dateinamen und/oder Metainformationen wie z.B. ID3-Tags bei MP3 Songs. Es wird aber immer geprüft,
ob die Werte exakt identisch sind.
Der Hauptvorteil des Fuzzy DupeFinder liegt - wie der Name schon andeutet - in der Unschärfe des Vergleichs,
d.h. es werden auch Dateien als Duplikate erkannt, deren Bezeichnungen leicht voneinander abweichen.
Beipiel:
01 - Artist - Song.mp vs. Song - Artist.mp3
Ein einfacher Dateinamensvergelich scheitert hier. Sind die Dateien mit unterschiedlichen Bitraten kodiert
oder auch unterschiedlich getagged scheitert ein Prüfsummenvergleich ebenfalls.
Der Fuzzy DupeFinder findet dieses Duplikat!
|
| Systemvoraussetzungen |
|
Windows 2000, XP, Vista
.NET Framework (Download hier)
|
| Installation |
|
Schritt 1: Download des gepackten Installationskits.
Schritt 2: Auspacken des Archivs in ein Verzeichnis Ihrer Wahl. Die Verzeichnisstruktur des Archivs dabei beibehalten!
Schritt 3: Ausführen der DupeFinder.exe. Keine Installation erforderlich.
|
| Erwerben Sie die Vollversion ! |
Für nur 5 Euro können Sie die Vollversion mittels PayPal erwerben. Nach erfolgter Zahlung können
Sie die Vollversion im Downloadbereich herunterladen.Stellen Sie bitte sicher, dass Ihre PayPal E-Mail Adresse
noch gültig ist !.
Erfahren Sie mehr zu den Unterschieden zwischen Demoversion und Vollversion hier.
5 Euro
|
| Screenshots |
|
| Bedienung |
Suchoptionen
Zuerst sollten Sie das Verzeichnis angeben, in dem nach Duplikaten gesucht werden soll. Es werden
alle Dateien innerhalb dieses Ordners (inkl. Unterverzeichnissen) durchsucht.
Oft ist es sinnvoll die Suche auf bestimmte Dateitypen einzuschränken. Dies erreichen Sie, indem Sie
eine Dateiendung vorgeben. Dann werden nur Dateien mit dieser Endung berücksichtigt. Sie können
auch mehrere Dateiendungen angeben, indem Sie sie mit Strichpunkt trennen: mp3;ogg (ab Version 1.2)
Um wenig aussagekräftige Dateien (z.B. Track1, Track2, usw.) von vorneherein auszuschließen,
können Sie diese in der entsprechenden Textbox angeben. Sobald ein Dateiname den angegebenen Text enthält
wird diese Datei ignoriert. "Track" schließt also Track1 und Track2 aus. Auch hier können
Sie mehrere Schlüsselwörter mit Strichpunkt getrennt angeben (ab Version 1.2).
Vergleichsoptionen
Hier können Sie die Arbeitsweise - und damit die Treffgenauigkeit - des Algorithmus beeinflussen.
Sind alle Optionen deselektiert werden die Dateinamen vor dem Vergleich nicht verändert. Dies ist
jedoch in vielen Fällen wünschenswert.Wichtig: Die "unscharfe" Vergleichsoperation an sich wird dadurch
nicht verändert, nur die Ausgangsdaten!
Leerzeichen entfernen: Vor dem Vergleich werden alle im Dateinamen enthaltenen Leerzeichen entfernt
Groß/Kleinschreibung berücksichtigen: Vor dem Vergleich wird keine Umwandlung in Kleinbuchstaben durchgeführt
Regulärer Ausdruck: Die wohl mächtigste (und auch performanceintensivste) Option. Hier wird vor dem Vergleich
der Dateiname mittels einem regulären Ausdruck verändert.
Damit lassen sich z.B. für Vergleich nicht unbedingt relevante Zeichen wie _ & oder () herausfiltern und damit die
Trefferquote verbessern. Der Ausdruck [^a-zA-Z] filtert z.B. alle Zeichen außer den 26 Groß- und Kleinbuchstaben aus.
Schwellenwert: Gibt an ab wieviel Prozent Übereinstimmung die Datei in der Ergebnisliste erscheint. 70 hat sich als
guter Wert erwiesen.
Dateipools
Sie haben prinzipiell zwei Möglichkeiten Dateien nach Duplikaten zu durchsuchen:
Innerhalb eines Dateipools. D.h. alle Dateien in den ausgewählten Verzeichnissen werden in einen Topf geworfen.
Jede Datei wird mit jeder Datei auf Gleichheit geprüft.
Zwei Dateipools. Sie wählen zwei Sets an Verzeichnissen aus. Alle Dateien eines Sets werden nun in einen Topf geworfen.
Danach wird jede Datei eines Sets mit allen Dateien Dateien des anderen sets auf Gleichheit geprüft. Diese Option ist
v.a. nützlich, wenn Sie neue Dateien in einen bestehenden Bestand integrieren wollen.
Ergebnisfenster
Nach durchgeführter Suche finden Sie hier die gefundenen Duplikate. In der linken und rechten Spalte befinden sich
jeweils Informationen zur Datei, in der Mitte der Grad der Übereinstimmung. Sie können die Spalten auch durch
einen Klick auf die Spaltenüberschrift sortieren.
Ein Klick auf eine Datei in der Ergebnisliste markiert diese Rot. Diese Dateien können Sie mit Hilfe des Schalters
Markierte Dateien löschen löschen. Ein Doppelklick öffnet diese Datei (z.B. um sie Probe zu hören).
|
| Unterschiede zwischen Demoversion und Vollversion |
Die Demoversion ist bis auf folgende zwei Unterschiede exakt identisch zur Vollversion:
Sie können keine Duplikate direkt aus dem Programmfenster heraus löschen.
Die Voransicht der Dateien durch Doppelklick ist nicht möglich
Der Suchalgorithmus zum Auffinden der Duplikate ist absolut identisch. Es bestehen keine zeitlichen Beschränkungen.
|
|
|