Testdaten für das Benchmarking

 

Große, intelligente Datensätze für Systemtests

Herausforderungen

 

Die Bewertung der Leistung von Hardware-Plattformen und Software-Anwendungen erfordert die Verwendung realistischer Produktionsdaten. Dateien und Tabellen müssen die richtige Größe haben und die richtigen Datentypen, Dateiformate, Datensatzlayouts und -anzahlen sowie Werteverteilungen (Datenhäufigkeit) enthalten.

 

Standard-Benchmarks, die von Organisationen wie dem Transaction Processing Performance Council (TPC) herausgegeben werden, können ebenfalls ein breites Spektrum an vorbestimmten Volumina und Layouts von Testdaten erfordern.

 

Das Erstellen und Laden großer Dateien und Tabellen kann ohne die richtigen Tools und Techniken sehr lange dauern. Das Heraussuchen von Beispieldaten aus der Produktion kann Zeit in Anspruch nehmen und gegen Datenschutzbestimmungen verstoßen.

 

Testdatentools wie TDG oder Snowfakery für Salesforce können auch schwierig zu bedienen sein oder erfordern spezielle Programmierkenntnisse (wie Java oder YAML). Aufwändigere Testdatenverwaltungszentren, die synthetische Testdaten generieren, sind zu teuer und nicht für die Anpassung und Geschwindigkeit des Datenvolumens ausgelegt, die viele Systembenchmarks erfordern.

Lösungen

Das IRI RowGen Testdaten-Tool - oder die IRI Voracity Datenmanagement-Plattform, die RowGen beinhaltet - kann sichere, große Testdatendateien - in CSV, JSON, XML, LDIF, ASN.1, COBOL und vielen anderen strukturierten Formaten (sogar Report) - synthetisieren und intelligente Daten in relationale und NoSQL-Datenbankplattformen einfügen oder in großen Mengen laden.

Mit RowGen können Sie eine vollständige und konsistente Batterie von Dateien und Tabellen generieren, um verschiedene Software- und Hardwareplattformen unter Stress zu testen. Die einzigartige eingebettete Datentransformationsfunktionalität kann Ihnen auch dabei helfen, eine Bewertung der Datenqualität durchzuführen oder die besten Verarbeitungsparadigmen für Ihre Umgebung zu evaluieren.

RowGen kann eine beliebige Anzahl (und Größe) von Dateien oder relationalen Tabellen mit einer beliebigen Anzahl von Spalten in einer festen oder abgegrenzten Position erstellen, wobei mehr als 100 verschiedene Datentypen verfügbar sind. Es kann auch automatisch Testdaten für mehrere Ziele in verschiedenen Formaten gleichzeitig erzeugen und laden.

Mit RowGen können Sie die synthetischen Datensatz- (Zeilen-) und Felddaten (Spalten) sogar filtern oder auswählen und transformieren, um Produktionsdaten zu emulieren und zu simulieren, wie sich die nachgeschaltete Transformationslogik auf diese Daten auswirkt. Sie können auch entscheiden, ob Sie die generierten Werte in aufeinanderfolgenden Läufen durch zufälliges Seed-Management beibehalten oder ändern wollen.

Wenn ein Benchmarking von Datenbankprototypen, Data Vault-Architekturen oder Data Warehouse-ETL-Vorgängen erforderlich ist, berücksichtigt RowGen das Layout und die Beziehungen von Produktionstabellen aus der vorhandenen DDL. Es erstellt ein Batch-Skript, das Sie ausführen können, um schnell Test-DB-Ziele zu erstellen und aufzufüllen, die strukturell und referenziell korrekt sind.

Jeder Wert in Ihren Testdatensätzen kann entweder zufällig generierte Daten enthalten oder Daten, die nach dem Zufallsprinzip aus bestimmten Dateien oder numerischen Bereichen ausgewählt werden, um so realistisch wie nötig zu sein.

Verwandte Lösungen

Produkt-Links