Dateiformat-Konvertierung und mehr
Dateiformate migrieren, transformieren, schützen und report.
Herausforderungen
Mainframe-, Legacy- und andere proprietäre Datentypen und Dateiformate können für relationale Datenbanken, Data-Warehousing- und Berichtsumgebungen auf den heutigen verteilten Systemen ungeeignet sein. Umgekehrt kann dies auch der Fall sein, wenn Sie Daten noch auf einem Mainframe oder für einen Mainframe verarbeiten. Aus diesem Grund müssen Sie möglicherweise Variablenblock- oder COBOL-Indexdateien in CSV konvertieren oder Text in I-SAM umwandeln.
Auch XML ist ein beliebtes Austauschformat, aber große XML-Dateien sind für die Manipulation oder Konvertierung nicht geeignet. ASN.1 CDR-, LDIF- und Parquet-Dateien wiederum enthalten große Mengen an Informationen, sind aber keine Dateiformate, die viele Anwendungen importieren oder verarbeiten können.
Daher benötigen Sie möglicherweise eine Möglichkeit, zwischen Dateiformaten und Datentypen zu konvertieren. Möglicherweise müssen Sie auch Daten in mehreren Dateiformaten bearbeiten, aus ihnen Berichte erstellen und sie schützen - möglicherweise sogar gleichzeitig. Die meisten verfügbaren Lösungen sind komplexe Dateikonvertierungstools, teure Produktsuiten oder individuelle Datenkonvertierungsdienste.
Lösungen
Das IRI NextForm Datenmigrations- und Dateikonvertierungstool ermöglicht die Zuordnung zwischen gängigen Flat-File- und Legacy-Indexdateiformaten, dem Layout ihrer Datensätze und den Datentypen innerhalb der Felder. NextForm unterstützt die Übersetzung von mehr als 100 Daten und 126 Dateitypen, darunter:
XML (flat) |
Die NextForm Unstructured Data Edition ist ein Upgrade, das Datenelemente aus einer beliebigen Anzahl (und Kombination) von doc/x-, xls/x-, ppt/x-, pdf-, txt-, Bild-, DICOM- und Parquet-Dateien finden/extrahieren und in Flat Files strukturieren kann. Dieser Artikel erklärt, wie Sie Ihre Lizenz für diese Edition und die IRI Workbench Front-End-GUI nutzen, um die „Dark Data“-Suchfunktionalität von IRI DarkShield zusammen mit SortCL-Aufträgen (die auch NextForm unterstützen) zu nutzen, um einen reduzierten (aber nicht assoziierten) Bericht mit den gefundenen Werten zu erstellen, den Sie mit ähnlichen Werten in anderen Quellen kombinieren können.
Das im Datenmanipulationspaket IRI CoSort oder in der Datenmanagement-Plattform IRI Voracity enthaltene Programm SortCL unterstützt die gleichzeitige Transformation (sort, join, aggregate, remap) und den Austausch (Konvertierung und Erstellung) der gleichen Daten und Dateitypen, die von NextForm unterstützt werden. SortCL kann auch Detail- und Zusammenfassungsberichte aus diesen Dateiformaten generieren und sensible Daten auf Feldebene mit einer Vielzahl von Datenmaskierungsfunktionen schützen.
Diese Funktionen sind nützlich für den Import von Mainframe- und Datenbankmigrationen, ETL-, SOA- und Desktop-Anwendungen.
Um eine Dateiformatkonvertierung in NextForm oder SortCL festzulegen, deklarieren Sie einfach die Ein- und Ausgabeformate in einem Skript oder über die auf Eclipse basierende IRI Workbench GUI. Die Quellspezifikation kann enthalten:
/INFILE=/path/filename1 /PROCESS=CSV
und die Ausgabedeklarationen könnten sein:
/OUTFILE=/path/filename2 /PROCESS=XML /OUTFILE=/path/filename3 /PROCESS=LDIF
Sie können auch zwischen Felddatentypen in SortCL- oder NextForm-Aufträgen konvertieren. Weitere Informationen finden Sie unter:
Mehr Details dazu hier:
- Profilerstellung und Suche nach Werten in Flat Files, siehe: Workbench > Datenermittlung
- Konvertierung zwischen Dateiformaten und Datentypen, siehe: Produkt > NextForm
- Integration, Transformation und Neuformatierung von Dateien, siehe: Produkt > CoSort > SortCL
- Manipulation großer Datendateien im Allgemeinen, siehe: Lösungen > Datentransformation
- Generierung von Berichten aus Ihren Dateien, siehe: Lösungen > Business Intelligence
- Schutz vertraulicher Daten in Dateien, Datensätzen und Feldern, siehe: Lösungen > Datenmaskierung
- Prototyping-Anwendungen sicher mit Testdaten, siehe: Lösungen > Testdaten
Details dazu im Blog: