Ziffernabdrücke | InfoWatch

You are here

Ziffernabdrücke

Die Technologie "Ziffernabdrücke" ist zum Schutz von Dokumenten mit großem Volumen geeignet, deren Inhalt nicht bzw. nicht wesentlich geändert wird. Der Detektor von Ziffernabdrücken, der in InfoWatch Traffic Monitor benutzt wird, ermöglicht es, im analysierten Text Zitate aus Musterdokumenten herauszufinden, die vertrauliche Informationen enthalten.
 

Bei der Systemeinstellung wird eine Datenbank vertraulicher Dokumente erstellt, für die später Ziffernabdrücke geschaffen werden. Aus den Ziffernabdrücken wird die Datenbank der Musterdokumente gebildet. In der Technologie der Ziffernabdrücke sind alle Kenndaten für die Bildung der Musterdatenbank so ausgewählt, dass eine optimale Qualität der Ermittlung bei minimalem Umfang der Musterdatenbank gewährleistet ist. Dabei ist es unmöglich, mithilfe von Informationen, die in der Musterdatenbank gespeichert wurden, einen Ausgangstext der Musterdokumente wiederherzustellen. So werden alle in das System eingegebenen vertraulichen Dokumente zuverlässig geschützt: auch wenn der Angreifer Zutritt zur Musterdatenbank der Ziffernabdrücke InfoWatch Traffic Monitor erlangt, erfolgt kein Datenabfluss.

Der Hauptunterschied der Technologie der "Ziffernabdrücke", die im Produkt InfoWatch Traffic Monitor verwendet wird, zu analogen Verfahren in Produkten anderer Firmen, ist die komplexe Bearbeitung des zu analysierenden Textes, darunter inklusive der linguistischen Unterstützung.

Dieser Ansatz erhöht deutlich die Qualität der Ermittlung der vertraulichen Informationen und sichert die Zuverlässigkeit der Methode nicht nur im Falle einfachster Textänderungen (wie Formatierungsänderungen, "Verschmutzung" des Textes mit Leerzeichen oder Interpunktion etc.), sondern auch in schwereren Fällen wie z.B.:

  • Verschiedene Varianten der Buchstabierung eines und desselben Wortes (z.B. groß oder klein geschrieben, Buchstaben е/ё in der russischen Sprache, Varianten deutscher Ligaturen etc.);
  • verschiedene Formen eines und desselben Wortes und diverse Varianten der Buchstabierung von komplizierten Wörtern, Technologie der Ermittlung von Tippfehlern / Fehlern, der Transliteration etc.
 

Vorteile der Technologie:

  • Schutz von selten geänderten bzw. nicht geänderten (statischen) Dokumenten;
  • Ermittlung von nicht nur wortwörtlichen Übereinstimmungen, sondern auch modifizierten Textfragmenten;
  • Unterstützung der linguistischen Bearbeitung des analysierten Textes (darunter für mehrsprachige Dokumente), Möglichkeit der morphologischen Analyse;
  • automatische Erkennung der Ähnlichkeit von Dokumenten und Herausfinden der Zitate aus den Musterdokumenten.

SchablonenanalysatorLinguistische Analyse