IRI @ Big Data Bootcamp


Daten entdecken, integrieren, migrieren, verwalten und analysieren

Big Data Bootcamp - Tampa, Florida

 

Auf dem Big Data Bootcamp am 9. Dezember, informierte IRI die Teilnehmer über die Entwicklungen seiner neuen End-to-End-Plattform für Big Data Management, Voracity.

Hintergrund zu den Sprechern

 

Seit 1978 hat IRI, The CoSort Company, kontinuierlich in der Datenverarbeitungssoftware innoviert und 2003 den Umgang mit großen Datenmengen angekündigt. David Friedland, VP und COO, kam 1988 zum Unternehmen und hat sich auf die Produktlinie Datenmanagement und das Unternehmenswachstum konzentriert. Ebenfalls anwesend ist Don Purnhagen, CTO des IRI und interner Datenwissenschaftler. Er ist seit etwa 15 Jahren im Unternehmen und ist leitender Entwickler des Hadoop und anderer Big Data-Initiativen, einschließlich IoT und analytischer Plattformintegration.

 

 

Aktuelle verwandte Arbeiten

 

Wir haben die fünf Kernbereiche der IRI Big Data Management Plattform Voracity um Funktionen erweitert. Das sind: Datenentdeckung, Integration, Migration, Governance und Analytik. Darüber hinaus haben wir uns auf das Streaming von Daten aus Webservices, IoT-Geräten und Kafka sowie auf die Kompatibilität von Amazon und Azure mit Quellen und Zielen spezialisiert. Weitere aktuelle Entwicklungen sind weitere Datenschutz-Initiativen mit Datenklassifizierung und Stammdatenmanagement sowie eine neue Firewall, die lokale und Cloud-Datenbanken überwacht, schützt und überprüft.

Top 5 IRI Big Data Anwendungsfälle

1. Kundensegmentierung und -förderung auf der Grundlage von Analysen des IP-(Web)-Verkehrs und/oder CDR-(Anruf-)Protokollen

2. Integrität von Schadensfällen in der Krankenversicherung unter Verwendung unserer Datentransformationsmaschine in einem Data Warehouse zur Betrugserkennung

3. Maskieren und Pseudonymisieren von geschützten Gesundheitsinformationen (PHI) in NoSQL-Dokumenten und RDBMS-Tabellen

4. Generierung umfangreicher Testsets für Cassandra, MongoDB, Teradata und HDFS zur Simulation von Produktionsbedingungen

5. Ertragsoptimierung und Flotteneffizienz im Verkehr durch Abwanderung und Nutzung historischer und operativer Daten

Presentation Takeaways

Die Teilnehmer lernten die Breite und Tiefe des Umfangs von Voracity kennen und bezogen ihn auf ihren eigenen Datenmanagement-Lebenszyklus. Es wurden Fragen zu ihren großen Datenherausforderungen gestellt, auch zu prominenten Themen wie:

Datenentdeckung - wie man Daten in Dateien, Tabellen und Dokumenten sucht, profiliert und klassifiziert.

Datenintegration - wie man schnell Daten zwischen heterogenen Silos extrahiert, transformiert und lädt oder andere ETL-Tools beschleunigt.

Datenmigration - wie man Daten von einem Typ, Dateiformat, Datenbanktabelle oder endianischem Zustand in einen anderen konvertiert.

Data Governance - wie man Daten bereinigt, maskiert und vereinheitlicht sowie Metadaten verwaltet.

Datenanalyse - wie man bei der Transformation oder Vorbereitung von Daten für die Tools R, Splunk und Tableau berichtet.