Select / Filtern

Nur Verarbeitung und Ausgabe der Daten, die Sie benötigen

Herausforderungen

Sie müssen doppelte Datensätze entfernen oder speichern und Datensätze, die auf Geschäftsregeln basieren, aus einer Vielzahl von Gründen ein- oder ausschließen, einschließlich:

    Datenbankaktualisierungen, einschließlich der Erfassung von Änderungsdaten und "Slowly Changing Dimensions" (SCD)
    Business Intelligence, einschließlich Kundendatenintegration und Segmentierung
    Datenbank-Subsetting, zur Maskierung von Produktionsdaten
    Datenmigration, Replikation und Föderation
    Massendatenreduktion, Datenforensik und Datenqualitätsinitiativen

SQL Select-Anweisungen eignen sich hervorragend für "normale" Tabellengrößen der Datenbank, können aber im Volumen (und abhängig von den Schlüsselbeziehungen) sehr lange dauern. Sie sind auch datenbankspezifisch und können Massenentlade- und Abfragevorgänge behindern, wenn sie für Daten-Subsetting durchgeführt werden.

Die Filterung über eine Datenbank hinaus kann insbesondere im Rahmen einer heterogenen Datenintegration schwierig sein. Komplexe ETL-Arbeiten oder benutzerdefinierter Code können erforderlich sein. Daher können sowohl die Spezifikation als auch die Ausführung ineffizient sein.

Lösungen

Das Programm SortCL in IRI CoSort (und IRI Voracity) bietet mehrere horizontale (Datensatz-/Zeilenebene) und vertikale (Feld-/Spaltenebene) Auswahlmöglichkeiten für einen beliebigen Satz von strukturierten Datenquellen. CoSort/SortCL Spin-off-Produkte - darunter IRI FieldShield (zur Datenmaskierung), IRI NextForm (zur Datenmigration und -replikation) und IRI RowGen (zur Testdatengenerierung) - verfügen alle über die gleichen Funktionen zur Zeilen- und Spaltenauswahl (Filterung).

Verwalten Sie die Datensatzgröße, -anzahl und -fluss vor, während und nach der Datentransformation. Eliminieren, reduzieren oder übergeben Sie Datensätze für eine schnelle, SQL-orientierte Datenfilterung während der Ein- und Ausgabe. Die Massendatenreduktion erhöht die Effizienz von SortCL-Transformationen, Berichten, Lasten und anderen nachgelagerten Prozessen.

Verwenden Sie die Bedingungslogik (z.B. "if-then-else"-Ausdrücke), um Datensätze während der Transformation, des Berichtswesens und/oder des Schutzes aufzunehmen, wegzulassen und neu zu formatieren. Filtern Sie Datensätze durch Deduplizierung und byte-, header- und datensatzbezogene Befehle. Geben Sie beispielsweise an, welche Wertebereiche gültig sind und geben Sie nur Datensätze außerhalb dieser Werte aus.

Validieren Sie Zeichenformulare und führen Sie andere Datenintegritätsprüfungen durch, um fehlerhafte Datensätze abzulehnen oder zu isolieren, bevor Sie sie in eine Datenbank laden.

Basieren Sie Spezifikationen auf Ihrer Geschäftslogik und speichern Sie sie in Textskripten, die in Eclipse verwaltet werden, um sie einfach zu modifizieren und wiederzuverwenden.

Verwandte Lösungen

Blog-Artikel

Select/Filtern zur Reduzierung der Datenmenge

Produktlinks

Cookie	Dauer	Beschreibung
cookielawinfo-checkbox-advertisement	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Advertisement" category .
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Cookie	Dauer	Beschreibung
_gcl_au	3 months	Provided by Google Tag Manager to experiment advertisement efficiency of websites using their services.
CONSENT	16 years 3 months 4 days 12 hours 23 minutes	YouTube sets this cookie via embedded youtube-videos and registers anonymous statistical data.

Cookie	Dauer	Beschreibung
IDE	1 year 24 days	Google DoubleClick IDE cookies are used to store information about how the user uses the website to present them with relevant ads and according to the user profile.
test_cookie	15 minutes	The test_cookie is set by doubleclick.net and is used to determine if the user's browser supports cookies.
VISITOR_INFO1_LIVE	5 months 27 days	A cookie set by YouTube to measure bandwidth that determines whether the user gets the new or old player interface.
YSC	session	YSC cookie is set by Youtube and is used to track the views of embedded videos on Youtube pages.
yt-remote-connected-devices	never	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt-remote-device-id	never	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.