Das Wissensportal für IT-Professionals. Entdecke die Tiefe und Breite unseres IT-Contents in exklusiven Themenchannels und Magazinmarken.

heise conferences GmbH

(vormals SIGS DATACOM GmbH)

Lindlaustraße 2c, 53842 Troisdorf

Tel: +49 (0)2241/2341-100

kundenservice@sigs-datacom.de

Big Data

136 Inhalte
Entdecken Sie unser Archiv zu tiefgehenden Inhalte zum Thema Big Data.
Die Datenmodellierung berücksichtigt einerseits technische Belange wie die Gewährleistung der Datenintegrität und die Performance von Schreib- und Leseoperationen. Die Planung und Implementierung des Datenmodells ist ein wesentlicher Teil von BI-Projekten. Für dispositive Abfragen ist das Sternschema etabliert und hat sich über viele Jahre bewährt. Es wird sowohl von Menschen als auch von BI-Werkz..
Macht ChatGPT die Datenmodellierung obsolet?
Sehr oft stehen Daten im Fokus, wenn es darum geht, dass ein Unternehmen dadurch wettbewerbsfähiger wird, dass es durch Daten Vorteile hat, weil es Trends vorhersehen kann, besser vorbereitet ist und/oder flexibler agieren kann. Data-Driven ist das entsprechende Buzzword.
Data Literacy: Von Data-Driven zu Wisdom-Driven
Das Klassifikationsmodell macht immer wieder die gleichen Fehler, das Ergebnis des Clustering ist realitätsfremd, Overfitting macht den Entscheidungsbaum zu breit. Viele dieser Komplikationen lassen sich auf Versäumnisse in der Phase der Datenvorbereitung zurückführen. Das Feature Engineering als Teilprozess der Datenvorbereitung wird zunehmend durch Deep Learning ersetzt. Allerdings funktionieren..
Feature Learning
Die Nachvollziehbarkeit von Datenströmen wurde in den letzten Jahren immer wichtiger. Dies liegt zum einen an neuen gesetzlichen und regulatorischen Vorgaben. Aber für Unternehmen ist auch die intrinsische Motivation gestiegen, die Ergebnisse von analytischen Anwendungen erklären zu können, weil damit das Vertrauen in die Korrektheit der Analyseergebnisse wächst. Auch die steigende Komplexität von..
Datenflüsse besser verstehen: Der (Daten-)Weg ist das Ziel
Aus offenen Dateiformaten haben sich die offenen Tabellenformate entwickelt. Durch sie wird eine Trennung von Storage und Technologie erreicht, die große Flexibilität und somit Kostenvorteile bringt. Damit steigt die Popularität dieser Formate und deren Unterstützung von vielen Werkzeugen für Datenanalysen und Transformationen.
Iceberg, Delta Lake, Hudi: Warum sind offene Tabellenformate eine gute Grundlage für Analysen?