Substring-Manipulation

 

Musterabgleich von Ausdrücken und Zeichenkettenfunktionen

Herausforderungen
 

Die Ausdruckslogik auf String-Ebene wird verwendet, um Daten nach bestimmten Mustern zu suchen und zu manipulieren. Diese Funktionalität wird oft mit Texteditoren und Shell-Befehlen in Verbindung gebracht, ist aber selten in hochvolumige Datenverarbeitungsvorgänge integriert.

 

Mit anderen Worten, String-Parsing, Pattern-Matching und andere Low-Level-Manipulationen müssen in der Regel in separaten Tools und I/O-Schritten erfolgen, was den Programmier- und Verarbeitungsaufwand erhöht.

Lösungen

Das SortCL-Programm in IRI CoSort und IRI Voracity unterstützt die Perl Compatible Regular Expression (PCRE)-Logik für den Musterabgleich sowie das Suchen und Ersetzen und andere Manipulationen auf Zeichenketten- und Teilzeichenkettenebene. SortCL unterstützt auch das Auffüllen und Ausrichten von Feldern, die Zeichenprüfung und das Neuzuordnen von Feldern.

Diese Funktionen sind auch im Zusammenhang mit der Datenermittlung, der Stammdatenverwaltung und der Verbesserung der Datenqualität nützlich.

Noch wichtiger ist, dass diese komplizierte Datentransformation im gleichen Jobskript und I/O-Pass mit allen anderen gleichzeitigen Funktionen, die SortCL ausführt, stattfinden kann, wie z.B.:

    Datentransformation (Sortierung, Verknüpfung, Aggregation, Filter, Remap, etc.)
    Datenmigration (von Datentypen und Dateiformaten)
    Datenschutz (Verschlüsselung auf Feldebene, De-ID, Maskierung, etc.)
    Reporting (Batch, Delta, Detail und Zusammenfassung BI)

Bitte teilen Sie uns unten Ihre spezifischen Anforderungen an die Datenmanipulation mit.