Drill-Down und Roll-Up-Aggregation
Berechnen und Gruppieren von Daten im Detail und Zusammenfassungsberichte
"Die Verwendung von vorsortierten Zusammenfassungen (Aggregaten) ist das effektivste Werkzeug, das der Data-Warehouse-Designer zur Leistungskontrolle einsetzt." "Das Data Warehouse Toolkit" - Dr. Ralph Kimball
Das Problem ist die Geschwindigkeit im Volumen. SQL "group by"-Aggregationen laufen in Datenbanken für Sternschemata und ETL-Operationen ziehen sich mit zunehmendem Datenvolumen.
Lösungen
Das SortCL-Programm im IRI CoSort Paket und der IRI Voracity Plattform berechnet riesige Faktentabellen, Drill-Down und Roll-Up-Aggregate mit außergewöhnlicher Einfachheit und Effizienz. SortCL kombiniert die parallele Zusammenfassung mit hochvolumigen Sortier-, Joint- und Report-Vorgängen im selben Jobskript und I/O-Pass.
Verwenden Sie SortCL um schnell Ausgabewerte zu erzeugen, die aus akkumulierten Detaildatensätzen abgeleitet werden - auf mehreren Halteebenen (einschließlich des endgültigen Aggregats). Die zugehörigen Funktionen sind:
Verdichtung (Summen)
Mittelwertbildung
Maximal
Minimum
Zählen
Multiplikation
Rangliste
Sequenzierung
Standardabweichung
Zeigen Sie Endwerte am Ende einer Datei an, d.h. Rollup-Aggregationen und nutzen Sie SortCL, wenn große und gleichzeitige Sortier- und Gruppierungsarbeiten erforderlich sind.
Gruppieren Sie Daten die auf Booleschen Break-Bedingungen zwischen- und innerhalb eines Datensatzes für die EIS-Zusammenfassung oder Drill-Down-Analysen für viele Arten von numerischen Daten basieren. Dies ist eine großartige Funktion zum Schreiben von Detail- und Zusammenfassungsberichten sowie aggregierten Datensätzen in der Faktentabelle.
Spiegeln Sie Transaktionsaggregate auf der Grundlage verschiedener Feldkombinationen (z.B. Gesamtumsatz nach SKU, Mitarbeiter und Standort) durch Ausgliederung einzelner Umsatzberichte.
Formatieren Sie Summensätze auf jeder Ebene unterschiedlich. Schreiben Sie jede Ebene in eine separate Zieltabelle oder Datei und führen Sie die Unterebenen zu einem strukturierten Bericht zusammen.
Weitere Optionen sind das Ausführen (Akkumulieren) von Aggregaten im Sybase-Stil und Aggregate auf überberechnete Werte. Nutzen Sie diese Funktionen für Ad-hoc-Präsentationen und komplexe Trendanalysen, mit (oder ohne) allen anderen Transformations- und Formatierungsoptionen.