You are here

Linguistische Analyse in den InfoWatch Lösungen

Die Verwendung der linguistischen Analyse ist einer der Vorteile der InfoWatch-Lösungen im Vergleich zur Konkurrenz, weil nur diese Methode ein hohes Niveau der Ermittlung von kritischen Informationen auf jeder Etappe des Lebenszyklus der Dokumente gewährt. Auch gerade nach der Erstellung, was es ermöglicht, nicht nur das Format des Dokuments zu ermitteln, sondern auch dessen Sinn zu verstehen. Das ermöglicht ein Resultat von hoher Qualität auch bei der Analyse von kleinen Textfragmenten, die in jedes Dokument eingefügt oder in einer informellen Korrespondenz bzw. durch Systeme des Nachrichtensofortversandes (ICQ, jabber etc.) gesendet werden können.
 

Datenbank der Contentfiltration

Definition der BCF

Die Datenbank der Contentfiltration ist eine Datenbank, die eine Liste (Baum) von Kategorien mit x-beliebiger Anzahl von enthaltenen Ebenen darstellt, die aufgrund der Wahrscheinlichkeitsrechnung und mathematischer Methoden hierarchisch organisiert ist und Wörter und Redewendungen enthält, deren Vorhandensein im Dokument ermöglicht, die Thematik und Vertraulichkeitsgrad der Informationen zu bestimmen.

Mit dieser Methode erfolgt die automatische Bestimmung der Thematik des Textes aufgrund der zuvor erstellten Basis der Contentfiltration (BCF). Die BCF kann nicht nur die Kategorien der Informationen beschreiben, die im Unternehmen zirkulieren, sondern auch verschiedene Attribute ihrer Vertraulichkeit berücksichtigen, darunter die Spezifikationen der Unternehmenstätigkeit und deren Anforderungen an die Sicherheit. Nach den Ergebnissen der linguistischen Analyse werden dem Text diese oder jene Kategorien zugeordnet, die Thematik und Inhalt entsprechen. In den zu analysierenden Informationen können Begriffe aus verschiedenen Kategorien erscheinen (Wörter und Wortgruppen), deswegen können diese einer oder mehreren Kategorien von BCF zugeordnet sein.

Daher ist es wichtig, eine Datenbank zu erstellen, die zuverlässige Filtrationsergebnisse nach Kategorien ermöglicht. Die Hauptmethode der linguistischen Analyse mithilfe der BCF ist die Suche von Wörtern und Wortgruppen im zu analysierenden Fragment, die vertrauliche Daten beschreiben und nach Kategorien strukturiert sind.

Erstellung der BCF

 

Vorteile der Technologie

  • proaktiver Schutz, auch für die Daten, die jeden Tag "ab Null" erstellt werden;
  • automatische Klassifizierung des zu analysierenden Textes;
  • Unterstützung aller europäischen Sprachen, linguistische Unterstützung für Russisch, Englisch, Französisch, Deutsch, Spanisch, Italienisch, Ukrainisch, Arabisch, Polnisch, Rumänisch, Lettisch; automatische Ermittlung der Sprachen;
  • Möglichkeit der Arbeit mit mehrsprachigen Dokumenten;
  • Unterstützung der Wortänderung (Wörterbuch- und unscharfe Morphologie), automatische Auswahl der Methode der morphologischen Analyse;
  • vorgegebene Datenbank der Contentfiltration allgemeinen Charakters, die Möglichkeit, Branchendatenbanken zu benutzen und eigene DBhinzuzufügen.

ZiffernabdrückeSchablonenanalysator