Erstellung der BCF | InfoWatch

You are here

Erstellung der BCF

Für die Erstellung der BCF muss man zuerst deren Struktur festlegen: einen Rubrikator oder einen Baum mit Contentkategorien. Solch ein Baum stellt eine hierarchische Liste mit Kategorien und Subkategorien dar.
 

Charakteristische und häufig benutzte Begriffe

Die zur BCF gehörenden Begriffe teilen sich in charakteristische und häufig benutzte Begriffe.

Ein charakteristischer Begriff ist ein Begriff, der nach dem einmaligen Erscheinen im zu analysierenden Fragment zu 100% davon zeugt, dass dieses einer bestimmten Kategorie gehört.

Ein häufig benutzter Begriff ist ein Begriff, der bei seinem Vorhandensein im zu analysierenden Fragment mit einer bestimmten Wahrscheinlichkeit davon zeugt, dass dieses Fragment einer bestimmten Kategorie angehört.

Dann wird jede Kategorie mit eine Liste von Begriffen, Schlüsselwörtern, Wortgruppen und Phrasen gefüllt, deren Erscheinen im zu analysierenden Fragment auf ihre Zugehörigkeit einer bestimmten Contentkategorie hinweist. Danach wird für jeden Begriff / jede Wortgruppe das "Gewicht" festgelegt, das dieser Begriff bei der Zuweisung von Informationen der bestimmten Kategorie haben wird. Die Entscheidung, ob dieser Text der Contentkategorie relevant ist, wird nach den Ergebnissen der gesamten gewichteten im Text gefundenen Summe der Begriffe mit einer Relevanzschwelle dieser Kategorie getroffen.

Für die qualitätsgerechte Kategorisierung ist die BCF zu aktualisieren, d.h. die Kategorien, die sich mit der Zeit ändern, sind zu redigieren, Begriffe und Wortgruppen sind hinzuzufügen bzw. zu löschen, deren Gewicht ist zu ändern etc.

Zu InfoWatch Traffic Monitor Enterprise gehört eine standardmäßige Datenbank für die Contentfiltration, die allgemeine Kategorien und Begriffe enthält, die praktisch in allen Branchen anzutreffen sind. Diese BCF garantiert die Ermittlung nach den Themen wie "Rechnungen", "Buchhaltung", "Kredite", "Tender", "HR" etc. Für die effiziente linguistische Analyse braucht die BCF weitere Nachbearbeitung für das Unternehmen, dabei sind sowohl Branchen-, als auch spezifische Besonderheiten der Organisation zu berücksichtigen.

Aufgrund der langjährigen Zusammenarbeit mit den Unternehmen, die in verschiedenen vertikalen Märkten arbeiten, hat InfoWatch mehrere Datenbanken der Contentfiltration entwickelt, die den Bedürfnissen von konkreten Marktsegmenten optimal entsprechen. Heute bietet InfoWatch folgende vertikal angepasste BCFs an:

  • für die Bankbranche (Finanzbranche)
  • für die Versicherung
  • für die Erdöl- und Gasbranche
  • für die Telekommunikation
  • Entwicklung von Software
  • staatliche PCFs (Herausfindung der Verletzungen der Russischen Gesetzgebung)

Die Optimierung der BCF für ein bestimmtes Marktsegment bedeutet, dass solche BCF die meist verbreiteten Kategorien enthält, die für diese Branche kennzeichnend sind. Der Start von InfoWatch Traffic Monitor mit einer vorgegebenen Datenbank der Contentfiltration, die für einen bestimmten vertikalen Markt optimiert ist, ermöglicht dem Unternehmen die sofortige Nutzung des Produktes und eine hohe Genauigkeit der Ermittlung von vertraulichen Informationen.

Schlüsselfertige BCFs sind eine Dienstleistung von InfoWatch, wobei die branchenorientierte BCF unter Beachtung der Tätigkeitsspezifikationen des konkreten Unternehmens nachbearbeitet wird. In der Datenbank der Contentfiltration, die den Bedürfnissen einer bestimmten Marktvertikale angepasst wurde, sind etwa 80% der Kategorien für alle Unternehmen dieses Sektors gleich. Die übrigen 20% gehören zu Kategorien, die für eine konkrete Gesellschaft kennzeichnend sind.

Die Ergänzung der branchenorientierten BCF durch Kategorien, die die Spezifikationen der Tätigkeit dieser Gesellschaft widerspiegeln, ermöglichen eine bessere Kategorisierung und genauere Ermittlung von vertraulichen Informationen in den Informationsströmen von mehr als 85%. Die Ergänzung der spezifischen Kategorien kann entweder manuell oder mithilfe des Programmproduktes InfoWatch Autolinguist erfolgen.

InfoWatch Autolinguist zum Erstellen einer eigenen BCF

InfoWatch Autolinguist ist eine Komponente der InfoWatch-Traffic Monitor-Lösung, die es ermöglicht, den Erstellungsprozess von einer eigenen oder der Nachbearbeitung einer branchenorientierten BCF zu automatisieren und sie auf dem aktuellen Stand zu halten.

Um eine BCF mithilfe von InfoWatch Autolinguist zu erstellen, ist es notwendig, eine repräsentative Sammlung von Unternehmensdokumenten vorzunehmen und diese auf separate Ordner je nach Thematik aufzuteilen, zum Beispiel: Finanzunterlagen, Verträge über die Geheimhaltung etc. Nach der Bearbeitung der Dokumentensammlung bilden diese Ordner mithilfe von InfoWatch Autolinguist die Struktur des Rubrikators.

InfoWatch Autolinguist analysiert die heruntergeladene Dokumentensammlung und markiert automatisch die Begriffe, auf deren Basis die Zuordnung der Informationen zu dieser oder jener Kategorie erfolgt.

Die Abschlussetappe bei der Erstellung der Datenbank der Contentfiltration ist deren Ergänzung mit charakteristischen Begriffen, die nicht automatisch ermittelt werden können, jedoch gleichzeitig auf die Vertraulichkeit des Dokuments hinweisen, wie zum Beispiel der Name eines geheimen Projektes.

Im Vergleich zu Lösungen, die auf Technologien der Ziffernabdrücke basieren (Fingerprints, Shingles etc.), ermöglicht diese Technologie den Schutz nicht nur selten geänderter Daten, wie z.B. die Satzung des Unternehmens oder das Aktionärsregister, sondern auch ständig geänderter oder neu erstellter Daten, wie z.B. verschiedenster Verträge mit Partnern bzw. Auftragnehmern sowie Beschreibungen neuer Technologien, Pläne der Einführung neuer Produkten im Markt, Fragebogen von Kunden mit der Angabe von Bedingungen der Zusammenarbeit und persönlichen Daten, sowie vieler anderer Dokumente.

Die Lösung basiert auf folgenden Produkten:

Die Software-Lösung (DLP-System) ist für die Kontrolle von Informationsströmen, den Schutz von vertraulichen Informationen vor Verlust und unerlaubter Verbreitung vorgesehen.