Fuzzy DupeFinder
[ English version ]
Überblick
Der Fuzzy DupeFinder ist ein nützliches Werkzeug um doppelt vorhandene Dateien in größeren Dateisammlungen zu ermitteln und zu löschen. Vor allem in umfangreichen MP3 Sammlungen häufen sich mit der Zeit immer mehr Duplikate an, die nur unnötig Plattenplatz verschwenden. Dies muß nicht sein!
Es gibt bereit diverse Programme, die mehrfach vorhandene Dateien ermitteln können. Diese sind zum Teil eigenständige Tools, zum Teil in andere Programme integriert.

Warum also noch ein anderes Programm?

Die meisten Programme verwenden zum Dateivergleich entweder Prüfsummen, die den Dateiinhalt beschreiben, oder den Dateinamen und/oder Metainformationen wie z.B. ID3-Tags bei MP3 Songs. Es wird aber immer geprüft, ob die Werte exakt identisch sind.
Der Hauptvorteil des Fuzzy DupeFinder liegt - wie der Name schon andeutet - in der Unschärfe des Vergleichs, d.h. es werden auch Dateien als Duplikate erkannt, deren Bezeichnungen leicht voneinander abweichen.


Beipiel:
01 - Artist - Song.mp vs. Song - Artist.mp3



Ein einfacher Dateinamensvergelich scheitert hier. Sind die Dateien mit unterschiedlichen Bitraten kodiert oder auch unterschiedlich getagged scheitert ein Prüfsummenvergleich ebenfalls.

Der Fuzzy DupeFinder findet dieses Duplikat!

Systemvoraussetzungen
  • Windows 2000, XP, Vista
  • .NET Framework (Download hier)

  • Installation
  • Schritt 1: Download des gepackten Installationskits.
  • Schritt 2: Auspacken des Archivs in ein Verzeichnis Ihrer Wahl. Die Verzeichnisstruktur des Archivs dabei beibehalten!
  • Schritt 3: Ausführen der DupeFinder.exe. Keine Installation erforderlich.

  • Erwerben Sie die Vollversion !
    Für nur 5 Euro können Sie die Vollversion mittels PayPal erwerben. Nach erfolgter Zahlung können Sie die Vollversion im Downloadbereich herunterladen.Stellen Sie bitte sicher, dass Ihre PayPal E-Mail Adresse noch gültig ist !. Erfahren Sie mehr zu den Unterschieden zwischen Demoversion und Vollversion hier.

    5 Euro
    Screenshots
    Klick fuer grosses Bild

    Bedienung
    Suchoptionen

    Zuerst sollten Sie das Verzeichnis angeben, in dem nach Duplikaten gesucht werden soll. Es werden alle Dateien innerhalb dieses Ordners (inkl. Unterverzeichnissen) durchsucht.
    Oft ist es sinnvoll die Suche auf bestimmte Dateitypen einzuschränken. Dies erreichen Sie, indem Sie eine Dateiendung vorgeben. Dann werden nur Dateien mit dieser Endung berücksichtigt. Sie können auch mehrere Dateiendungen angeben, indem Sie sie mit Strichpunkt trennen: mp3;ogg (ab Version 1.2)

    Um wenig aussagekräftige Dateien (z.B. Track1, Track2, usw.) von vorneherein auszuschließen, können Sie diese in der entsprechenden Textbox angeben. Sobald ein Dateiname den angegebenen Text enthält wird diese Datei ignoriert. "Track" schließt also Track1 und Track2 aus. Auch hier können Sie mehrere Schlüsselwörter mit Strichpunkt getrennt angeben (ab Version 1.2).

    Vergleichsoptionen

    Hier können Sie die Arbeitsweise - und damit die Treffgenauigkeit - des Algorithmus beeinflussen. Sind alle Optionen deselektiert werden die Dateinamen vor dem Vergleich nicht verändert. Dies ist jedoch in vielen Fällen wünschenswert.Wichtig: Die "unscharfe" Vergleichsoperation an sich wird dadurch nicht verändert, nur die Ausgangsdaten!

  • Leerzeichen entfernen: Vor dem Vergleich werden alle im Dateinamen enthaltenen Leerzeichen entfernt
  • Groß/Kleinschreibung berücksichtigen: Vor dem Vergleich wird keine Umwandlung in Kleinbuchstaben durchgeführt
  • Regulärer Ausdruck: Die wohl mächtigste (und auch performanceintensivste) Option. Hier wird vor dem Vergleich der Dateiname mittels einem regulären Ausdruck verändert. Damit lassen sich z.B. für Vergleich nicht unbedingt relevante Zeichen wie _ & oder () herausfiltern und damit die Trefferquote verbessern. Der Ausdruck [^a-zA-Z] filtert z.B. alle Zeichen außer den 26 Groß- und Kleinbuchstaben aus.
  • Schwellenwert: Gibt an ab wieviel Prozent Übereinstimmung die Datei in der Ergebnisliste erscheint. 70 hat sich als guter Wert erwiesen.

    Dateipools

    Sie haben prinzipiell zwei Möglichkeiten Dateien nach Duplikaten zu durchsuchen:
  • Innerhalb eines Dateipools. D.h. alle Dateien in den ausgewählten Verzeichnissen werden in einen Topf geworfen. Jede Datei wird mit jeder Datei auf Gleichheit geprüft.
  • Zwei Dateipools. Sie wählen zwei Sets an Verzeichnissen aus. Alle Dateien eines Sets werden nun in einen Topf geworfen. Danach wird jede Datei eines Sets mit allen Dateien Dateien des anderen sets auf Gleichheit geprüft. Diese Option ist v.a. nützlich, wenn Sie neue Dateien in einen bestehenden Bestand integrieren wollen.

    Ergebnisfenster

    Nach durchgeführter Suche finden Sie hier die gefundenen Duplikate. In der linken und rechten Spalte befinden sich jeweils Informationen zur Datei, in der Mitte der Grad der Übereinstimmung. Sie können die Spalten auch durch einen Klick auf die Spaltenüberschrift sortieren.
    Ein Klick auf eine Datei in der Ergebnisliste markiert diese Rot. Diese Dateien können Sie mit Hilfe des Schalters Markierte Dateien löschen löschen. Ein Doppelklick öffnet diese Datei (z.B. um sie Probe zu hören).

  • Unterschiede zwischen Demoversion und Vollversion
    Die Demoversion ist bis auf folgende zwei Unterschiede exakt identisch zur Vollversion:
  • Sie können keine Duplikate direkt aus dem Programmfenster heraus löschen.
  • Die Voransicht der Dateien durch Doppelklick ist nicht möglich
    Der Suchalgorithmus zum Auffinden der Duplikate ist absolut identisch. Es bestehen keine zeitlichen Beschränkungen.
  • Sitemap
    News
    Fuzzy DupeFinder
    Infrared Dialer
    Download
    Kontakt und Feedback
    Disclaimer und
    Datenschutz