Big Data
136 Inhalte
Entdecken Sie unser Archiv zu tiefgehenden Inhalte zum Thema Big Data.
Die Datenmodellierung berücksichtigt einerseits technische Belange wie die Gewährleistung der Datenintegrität und die Performance von Schreib- und Leseoperationen. Die Planung und Implementierung des Datenmodells ist ein wesentlicher Teil von BI-Projekten. Für dispositive Abfragen ist das Sternschema etabliert und hat sich über viele Jahre bewährt. Es wird sowohl von Menschen als auch von BI-Werkz..
Sehr oft stehen Daten im Fokus, wenn es darum geht, dass ein Unternehmen dadurch wettbewerbsfähiger wird, dass es durch Daten Vorteile hat, weil es Trends vorhersehen kann, besser vorbereitet ist und/oder flexibler agieren kann. Data-Driven ist das entsprechende Buzzword.

Das Klassifikationsmodell macht immer wieder die gleichen Fehler, das Ergebnis des Clustering ist realitätsfremd, Overfitting macht den Entscheidungsbaum zu breit. Viele dieser Komplikationen lassen sich auf Versäumnisse in der Phase der Datenvorbereitung zurückführen. Das Feature Engineering als Teilprozess der Datenvorbereitung wird zunehmend durch Deep Learning ersetzt. Allerdings funktionieren..

Die Nachvollziehbarkeit von Datenströmen wurde in den letzten Jahren immer wichtiger. Dies liegt zum einen an neuen gesetzlichen und regulatorischen Vorgaben. Aber für Unternehmen ist auch die intrinsische Motivation gestiegen, die Ergebnisse von analytischen Anwendungen erklären zu können, weil damit das Vertrauen in die Korrektheit der Analyseergebnisse wächst. Auch die steigende Komplexität von..

Big Data
Iceberg, Delta Lake, Hudi: Warum sind offene Tabellenformate eine gute Grundlage für Analysen?
Aus offenen Dateiformaten haben sich die offenen Tabellenformate entwickelt. Durch sie wird eine Trennung von Storage und Technologie erreicht, die große Flexibilität und somit Kostenvorteile bringt. Damit steigt die Popularität dieser Formate und deren Unterstützung von vielen Werkzeugen für Datenanalysen und Transformationen.
