Talend-Turboaufladung


Beschleunigung der Talend-Jobs

Herausforderungen

 

Auch nach der Beratung und Abstimmung können große Datenmengen (d.h. mehr als eine Million Zeilen) nur langsam transformiert werden, insbesondere ohne ein teures Hardware- oder Versionsupgrade von Talend.

 

Große Datenengpässe sind große Sortierungen, Joins, Aggregationen, Ladungen und manchmal auch Entladungen. Die Parallelisierung oder Optimierung in anderen Ebenen oder Tools kann unhandlich, wenn nicht sogar teuer sein und die Leistung für andere Benutzer beeinträchtigen.

 

Aus Sicherheitssicht bietet Talend möglicherweise nicht die Funktionen zum Erkennen, Klassifizieren oder Maskieren von Daten oder zum Testen von Datenfunktionen, die Datenverwalter und Anwendungsentwickler benötigen.

Lösungen

Transformationen beschleunigen

Sort-Beschleunigung, Aggregation und Zusammenführen von Talend ETL-Strömen mit einem tSystem-Aufruf an die Programme CoSort Sort Sort Control Language (SortCL). Führen Sie große Datentransformationen mehrfach zeitsparend aus, ohne aus Mangel an Speicherplatz zusammenzubrechen und ohne andere Jobs in Talend, Ihrem DB- oder BI-Tool zu belasten. Geben Sie außerdem Dateiformat- und Datentypkonvertierungen, Maskierungs- und Bereinigungsfunktionen auf Feldebene, benutzerdefinierte Berichtslayouts und vorsortierte Ladedateien an.

In diesem Artikel finden Sie Benchmarks und Ratschläge zur Leistungssteigerung durch tSystem-Aufrufe, die CoSort- oder Voracity-Anwendern zur Verfügung stehen. Beschleunigen und kombinieren Sie Transformations- und andere große Daten-Staging-Aufträge in viel weniger Zeit und Speicherplatz.

PII-Daten maskieren

Daten, die sich in Tabellen und Flat-Files innerhalb von DataStage befinden, können sensibel sein und personenbezogene Daten enthalten, die Vertraulichkeitsbeschränkungen und Datenschutzgesetzen unterliegen. Sowohl IRI Voracity als auch IRI FieldShield können Felder in strukturierten Datensätzen in jeder ODBC-verbundenen Datenbank oder jedem Flat-File-Format schützen.

Ihre Geschäftsregeln bestimmen die Funktion, die Sie für jede Spalte wählen, d.h. formaterhaltende AES-256, FIPS-konforme OpenSSL-, 3DES- und/oder GPG-Verschlüsselung, Lookup-Wert-Substitution (Pseudonymisierung), Zeichenmaskierung, Hashing, Redaktion, benutzerdefinierte Ausdruckslogik, Teilzeichenkette oder Benutzerfeldfunktion.

Testdaten erstellen

IRI Voracity erzeugt durch sein konstitutives (oder eigenständiges) IRI RowGen-Softwareprodukt sichere, realistische Testdaten unter Verwendung von COBOL- oder CoSort-Metadaten sowie aller über JDBC verbundenen RDB-Datenmodelle. Verwenden Sie RowGen, um konforme, realistische Testdaten aus zufälliger Generierung und/oder Set-Datei-Auswahl zu erstellen und sie mit integrierten Datenmanipulations- und Formatierungsfunktionen noch weiter anzupassen.

Re-Platfform der Jobs

Automatische Konvertierung von Mappings in Talend in schnellere, einfachere und kostengünstigere ETL-Operationen in IRI Voracity mit Erwin (ehemals AnalytiX DS) Mapping Manager oder Code-Automation Frameworks (CATfx). Diese bewährte Technologie, zusammen mit den erwin Lite Speed Conversion Services, gibt ETL-Architekten und der CIO/CFO-Suite routinemäßig die Möglichkeit, zehn bis hunderttausende von Euro pro Jahr zu sparen.