Pentaho erweitern
Transformationsbeschleunigung, Schutz von PII, Prototypbetrieb
Herausforderungen
Pentaho Data Integration (PDI) ist zwar ein leistungsfähiges Werkzeug zur Aufbereitung und Integration von Daten, weist aber auch einige Mängel auf:
Langsame Transformierungen
Native Sorts usw. laufen möglicherweise nicht schnell genug und nicht bei großer Menge.
Eingeschränkte De-ID-Funktionen
Daten, die durch Kettle fließen, können nicht maskiert oder verschlüsselt werden.
Begrenzte Testdaten
Kein Prototyp von ETL-Aufträgen ohne Verwendung von Produktionsdaten möglich.
Lösungen
PDI-Workflows unterstützen Systembefehle, so dass Daten ohne Unterbrechung extern verarbeitet werden können. IRI Voracity oder seine Komponentensoftware kann Pentaho-Anwendern auf folgende Weise helfen:
Transformationen beschleunigen
Verwenden Sie den Shell-Schritt von PDI, um einen IRI CoSort-Auftrag (z.B. SortCL-Skript) aufzurufen, um die Sortier-, Joint- und Aggregationszeiten drastisch zu reduzieren.
Ausführen mehrerer Aufträge in einer Batch-Datei
Erhalten Sie Ergebnisse 14-16 mal schneller als Pentaho allein.
Mit CoSort den Sortierprozess in Pentaho beschleunigen: Jetzt lesen.
PII-Daten maskieren
Ausführen von IRI FieldShield-Aufträgen aus dem Shell-Schritt in Pentaho zum Schutz von Daten im Ruhezustand
Maskieren, verschlüsseln und kodieren Sie (und andere) Daten in Ihrem gewünschten Format
Datensicherheit auf Feldebene
Maskieren von Daten in Pentaho: Jetzt lesen.
Testdaten erstellen
Führen Sie IRI RowGen aus, um Tabellen, Dateien und Berichte mit synthetischen Testdaten zu füllen, die Produktionsdaten nachahmen
Generieren Sie struktur- und referenzkorrekte DB-Testdaten für die gesamte EDW
Bewahren Sie die Produktionsdaten sicher auf
Testdaten für Pentaho anlegen: Jetzt lesen.