Big Data
135 Inhalte
Entdecken Sie unser Archiv zu tiefgehenden Inhalte zum Thema Big Data.
Sehr oft stehen Daten im Fokus, wenn es darum geht, dass ein Unternehmen dadurch wettbewerbsfähiger wird, dass es durch Daten Vorteile hat, weil es Trends vorhersehen kann, besser vorbereitet ist und/oder flexibler agieren kann. Data-Driven ist das entsprechende Buzzword.

Das Klassifikationsmodell macht immer wieder die gleichen Fehler, das Ergebnis des Clustering ist realitätsfremd, Overfitting macht den Entscheidungsbaum zu breit. Viele dieser Komplikationen lassen sich auf Versäumnisse in der Phase der Datenvorbereitung zurückführen. Das Feature Engineering als Teilprozess der Datenvorbereitung wird zunehmend durch Deep Learning ersetzt. Allerdings funktionieren..

Die Nachvollziehbarkeit von Datenströmen wurde in den letzten Jahren immer wichtiger. Dies liegt zum einen an neuen gesetzlichen und regulatorischen Vorgaben. Aber für Unternehmen ist auch die intrinsische Motivation gestiegen, die Ergebnisse von analytischen Anwendungen erklären zu können, weil damit das Vertrauen in die Korrektheit der Analyseergebnisse wächst. Auch die steigende Komplexität von..

Big Data
Iceberg, Delta Lake, Hudi: Warum sind offene Tabellenformate eine gute Grundlage für Analysen?
Aus offenen Dateiformaten haben sich die offenen Tabellenformate entwickelt. Durch sie wird eine Trennung von Storage und Technologie erreicht, die große Flexibilität und somit Kostenvorteile bringt. Damit steigt die Popularität dieser Formate und deren Unterstützung von vielen Werkzeugen für Datenanalysen und Transformationen.

Data-Driven AI nutzt Daten als primären Treiber für KI-Modelle. Daten, strukturiert oder unstrukturiert, bilden die Grundlage für selbstlernende KI-Systeme. Unternehmen müssen die Daten-Lieferkette transparent und qualitativ hochwertig gestalten, um KI erfolgreich einzusetzen.
