Text-Dateien

 

Konvertieren und Verarbeiten von "Fixed" und "Delimited" Formaten

Herausforderungen

Strukturiert

 

Strukturierte Textdateien sind feste oder variable, sequentielle (Flat) Dateien, die so klein sein können wie ein Datensatz oder Milliarden von archivierten Zeilen aus Datenbankextrakten, Weblogs, Transaktionsfeeds, Mainframe-Datensätzen und anderen Anwendungen enthalten.

 

Sie müssen eventuell:

  • Eine große Textdatei sortieren
  • Daten extrahieren oder einen Bericht aus einer Textdatei erstellen
  • Zwischen Text- und XML-Dateiformaten konvertieren
  • Eine Textdatei in ein anderes Format konvertieren
  • Verschlüsseln oder Deidentifizieren von Feldern in einer Textdatei
  • Laden von Textdaten in eine Tabellenkalkulation oder Datenbank
  • Umformatierung einer Textdatei aus Alt- oder Binärdaten

 

Möglicherweise müssen Sie mehr als eine dieser Funktionen gleichzeitig ausführen und zwar mit vielen umfangreichen Quell- und Zieldateien.

Unstrukturiert

 

Unstrukturierte Textquellen, einschließlich Dateien und Repositories in diesen Formaten:

  • ASN.1 TAP3
  • .DOC, .DOCX
  • .EML, .OST, .PST
  • .PDF, RTF
  • .PPT., .PPTX
  • .TXT, .XML
  • .XLS, .XLSX

 

können konvertiert werden, aber die Daten in ihnen können nicht einfach extrahiert oder so verwendet werden, wie es strukturierte Daten können.

Lösungen

Nur Textdatei-Konvertierung

Verwenden Sie IRI NextForm, um strukturierte Textdateien in andere Formate (z.B. CSV, ODBC, XML, etc.) oder von anderen Formaten in Text zu konvertieren. NextForm unterstützt die Datentypkonvertierung auf Feldebene und die Neuzuordnung des Datensatzlayouts. Die NextForm Edition "für Unstrukturierte Daten" kann Daten in unstrukturierten Textdateien für die auf dieser Seite und im gesamten IRI-Produktstapel beschriebenen Vorgänge analysieren und strukturieren.

NextForm-Dateidefinitionen funktionieren auch in SortCL-Programmen unter IRI CoSort. Verwenden Sie die Metadaten wieder, wenn Sie auf CoSort aktualisieren, um eine schnelle Datentransformation und -berichterstattung zu ermöglichen.

Textdatentransformation & -konvertierung

Das Programm SortCL in CoSort kann:

  • Transformieren der Daten (z.B. Sortieren, Verbinden, Aggregieren, Querrechnen, etc.) in Textdateien
  • Textdateien in andere Dateiformate konvertieren und Textdateien aus diesen Formaten erstellen
  • Bericht aus Textdateiquellen

mit einem einfachen 4GL für Layout- und Manipulationsdefinitionen oder einer leistungsfähigen freien GUI auf Eclipse-Basis.

Ordnen Sie eine oder mehrere Eingabedateien im Textformat anderen Dateiformaten zu und von ihnen zu. Erstellen Sie Detail-, Change Data Captures- und Slowly Changing Dimensions- Berichte) aus Textdateien. Übergeben Sie vorsortierte, gefilterte und konvertierte Teilmengen an BI-Werkzeuge, Datenbankladeprogramme oder andere Anwendungen.

Textdatenmaskierung & Testdaten

Verwenden Sie IRI FieldShield, um Felder in strukturierten Textdateien mit Verschlüsselung, Maskierung usw. zu schützen.

Verwenden Sie IRI RowGen, wenn Sie Testdaten in Textdateiformaten benötigen. RowGen verwendet die gleichen Layout-Metadaten wie CoSort (SortCL) und NextForm, so dass Sie problemlos zwischen der Generierung von Testdaten und der Transformation von Echtdaten wechseln können.