XML-Dateien

 

Konvertieren, Transformieren, Maskieren, Berichten, Testen

Herausforderungen

 

Obwohl XML ein beliebtes Dateiaustauschformat für SOA, Datenbanken und andere Anwendungen ist, war es kein praktisches Format für die Übertragung großer Datenmengen. Darüber hinaus basieren Konvertierungen zwischen Legacy-Index oder Flat Files und XML auf langsameren Parsing-Technologien wie XSLT und ermöglichen nicht gleichzeitig die Verarbeitung.

 

Transformationen mit XQuery können große Mengen an XML-Daten nicht oder nur kurzfristig in aussagekräftige Informationen in XML (oder einem anderen Format) verwandeln. Es gab keine effiziente Möglichkeit, riesige XML-Dateien schnell zu konvertieren, zu verarbeiten, zu schützen oder zu erstellen.

 

Beispielsweise kann es erforderlich sein:

  • Sortieren einer riesigen XML-Datei
  • Extrahieren von Daten oder Berichten aus einer XML-Datei
  • Konvertieren Sie eine CSV-, LDIF- oder andere Datei in XML
  • Konvertieren Sie XML in Text, CSV, LDIF, ISAM, etc.
  • Maskieren, Verschlüsseln oder anderweitiges Deidentifizieren von Feldern in einer XML-Datei
  • Daten in einer XML-Datei mit einer anderen XML- oder einer anderen Quelle zu verknüpfen
  • XML-Daten in eine Tabellenkalkulation oder Datenbank laden
  • Erstellen einer XML-Datei aus einer Alt- oder Extraktdatei
  • Generierung von Testdaten in XML-Dateiformaten

 

Möglicherweise müssen Sie sogar mehr als eine dieser Funktionen gleichzeitig ausführen, und zwar gegen viele massive Quell- und Zieldateien.

Lösungen
IRI bietet XML- und andere Dateikonvertierungsfunktionen in verschiedenen Produkten. Wählen Sie nach Bedarf:

Verwenden Sie die kostenlose Lite Edition von IRI NextForm, um riesige, Flat-XML-Dateien* in andere Formate (wie CSV, LDIF, COBOL, Text, etc.) oder aus diesen anderen Formaten in XML zu konvertieren. Wenn Ihre XML-Dateien semistrukturiert oder unstrukturierter sind, können Sie die:

    Assistent zur Erkennung Dark Data, um die benötigten Elemente anhand von Musterübereinstimmungen zu suchen und zu strukturieren
    "Sonra's Flexter Data Liberator" Add-on für Voracity
    NextForm Legacy Edition, um Ihre Quelldateien im Datenquellen-Explorer mit einem XML-Treiber anzuzeigen.

NextForm enthält einen XML-Dateiparser, um automatisch die XDEF-Feldlayouts zu erstellen, die in den Dateikonvertierungsskripten verwendet werden. NextForm unterstützt auch die Datentypkonvertierung auf Feldebene und die Neuzuordnung von Datensatzlayouts. NextForm-Jobdefinitionen funktionieren auch in CoSort SortCL und Voracity, wenn Sie sich später für ein Upgrade entscheiden!

Verwenden Sie das Programm SortCL in der IRI Voracity-Plattform oder im IRI CoSort-Paket, um neue XML-Dateien und andere Ziele, die strukturierte Daten darstellen, zu konvertieren, zu transformieren, zu maskieren, zu berichten und zu erstellen.

Deklarieren Sie eine oder mehrere XML- und Nicht-XML-Dateien für die Ein- und Ausgabe als Teil eines jeden SortCL-Jobs, der Daten beinhaltet:

    Filterung (Auswahl, Scrub, Links zu DQ-Tools)
    Transformation (Sortierung, Zusammenführung, Aggregation, Berechnung, etc.)
    Konvertierung (Datentyp- und Dateiformat-Migrationen)
    Berichterstattung (CDC, Detail- und Zusammenfassungsformate)
    Schutz (Feldverschlüsselung, De-ID, Maskierung)

SortCL stellt all diese Funktionen, eine oder mehrere auf einmal, Datenarchitekten zur Verfügung, die mit XML und anderen Quellen arbeiten müssen.

Verwenden Sie IRI FieldShield oder IRI DarkShield, um PII in XML-Dateien zu verschlüsseln, zu bearbeiten oder anderweitig zu de-identifizieren. Beide Tools teilen sich Datenklassen und Maskierungsfunktionen und werden in der IRI Workbench unterstützt und in Voracity enthalten sein.

Verwenden Sie IRI RowGen, um XML-Testdateien zu erstellen. RowGen verwendet die gleichen Layout-Metadaten wie CoSort, NextForm und FieldShield, so dass Sie problemlos zwischen der Generierung von Testdaten und der Transformation von Echtdaten wechseln können.

* XML-Datenelemente müssen einer abgeflachten Struktur entsprechen und ein gleichnamiges Element auf einer bestimmten Ebene extrahieren. Wenn Sie mehrere Tags gleichen Namens haben, extrahieren IRI-Engines das zuletzt vorkommende Tag eines bestimmten Namens. Feldnamen müssen eindeutig sein und einen einzelnen Datensatz ohne zusätzliche Abhängigkeiten umfassen.