Daten-Pseudonymisierung
Namen oder Substantive mit Realismus de-identifizieren und mischen
Herausforderungen
Beim Maskieren von Daten oder beim Erzeugen nützlicher Testdaten benötigen Sie Ausgabewerte, die echt aussehen, aber keine persönlich identifizierbaren Informationen (PII) enthalten. Dies gilt insbesondere für die Namen von Menschen, Orten und Dingen.
Verschlüsselungs-, Deidentifizierungs- und andere Maskierungs-, Hashing- und Bit-Verschleierungsfunktionen schützen gefährdete Daten, bieten aber nicht den Grad an Realismus, den bestimmte Empfänger benötigen. Sie benötigen eine einfachere Möglichkeit, die Individualisierungsmerkmale von Daten mit einem substituierten, aber realistischen Ausgabewert zu ändern.
Sie müssen auch sicherstellen, dass der echte Name nicht ohne weiteres durch Umkehrung oder Vermutung entdeckt werden kann.
Lösungen
Wenn Sie mit PII in Tabellen oder Flat-Files arbeiten, verwenden Sie IRI FieldShield - oder das SortCL-Programm im IRI CoSort Produkt oder in der IRI Voracity-Plattform - um diese Daten durch sichere, aber realistische Ersatzausgaben zu ersetzen, die in DB-Tabellen oder externen Datensätzen, den so genannten Set-Dateien, gespeichert sind. Wenn Sie dasselbe mit Bereichen in Excel tun müssen, verwenden Sie IRI CellShield, oder für unstrukturierte Datenquellen IRI DarkShield. Sie unterstützen:
Wiederherstellbare Pseudonymisierung |
Geben Sie ein Lookup-Set an, bei dem echte und gefälschte Namen entweder vorbelegt oder automatisch nach dem Zufallsprinzip zugeordnet sind. Verwenden Sie das Wiederherstellungsset, um die ursprünglichen Namen wiederherzustellen. |
Nicht wiederherstellbare Pseudonymisierung |
Wählen Sie zufällig Ersatznamen für den Originalwert aus einer Mengendatei, die echte oder gefälschte Namen enthält. Auf diese Weise hat der ursprüngliche Namenswert keine automatische Grundlage für die Wiederherstellung. |
Legen Sie die in Ihren Ausgabefeldern verwendete Pseudonym-Methode in einfachen 4GL-Jobskripten fest, oder verwenden Sie den Pseudonymisierungsdialog in den Maskierungsdialogen der FieldShield-GUI oder der DarkShield-Assistenten in der gleichen Eclipse™-IDE oder in CellShield, das auch pseudonyme Lookup-Ersetzungen von Werten in Excel unterstützt.
Die Pseudonymisierung ist nur eine Methode, mit der FieldShield Informationen in einem Datensatz identifizieren kann. Außerdem kann es Pseudonyme mit anderen Funktionen der Datensicherheit auf Feldebene kombinieren.
Benötigen Sie Testnamen?
Neben der Pseudonymisierung und anderweitigen Maskierung von Produktionsdaten gibt es eine eigenständige Lösung zur Herstellung sicherer, aber realistischer Vor- und Nachnamen von Geschlechtern (oder anderen Nomen). IRI RowGen verwendet die gleichen Metadaten wie FieldShield (und SortCL), um Pseudonyme für die Verwendung als Testdatenwerte (oder in formatierten Testdatenzielen) zu erstellen und zu formatieren.
RowGen ist besonders notwendig, um anonyme, aber realitätsnahe Testdaten bereitzustellen, wenn Produktionsdaten nicht verfügbar oder unzureichend sind. RowGen baut strukturell und referenziell korrekte Testdaten in Datenbank-, Datei- und Berichtsziele auf. Beachten Sie, dass RowGen auch in Voracity enthalten ist.