Das Wissensportal für IT-Professionals. Entdecke die Tiefe und Breite unseres IT-Contents in exklusiven Themenchannels und Magazinmarken.

SIGS DATACOM GmbH

Lindlaustraße 2c, 53842 Troisdorf

Tel: +49 (0)2241/2341-100

kundenservice@sigs-datacom.de

„Wer am besten das Potenzial der Daten ausschöpfen kann, hat die Nase vorn und gewinnt das Rennen“

BI-Spektrum sprach mit Nate Spohn, Vice President EMEA von Fivetran, einem auf automatisierte Data Pipelines spezialisierten Anbieter, über die Entwicklungen im Datenintegrationsmarkt und die Idealvorstellung eines „Modern Data Stack“.

Author Image
Christoph Witte

Chefredakteur IT Spektrum und BI-Spektrum

Author Image
Nate Spohn

Author


  • 14.10.2021
  • Lesezeit: 10 Minuten
  • 88 Views

Was sind die größten Herausforderungen im Bereich Datenintegration?

Spohn: Die traditionelle Art der Datenintegration ist für die On-Premises-Welt konzipiert. Es gab eine Menge Einschränkungen zum Beispiel hinsichtlich der Datenmengen, die transportiert oder gespeichert werden konnten. Unserer Ansicht nach ist es heutzutage nicht mehr zeitgemäß, seine Data Pipelines selbst zu bauen. Die manuelle Einrichtung, die kontinuierliche Anpassung sowie die Pflege der Data Pipelines ist komplex und ressourcenintensiv. Unternehmen benötigen für diese Aufgabe auch ein großes Team an Data Engineers. Durch die steigende Anzahl von Cloud-Anwendungen explodiert das Datenvolumen förmlich in den Unternehmen – unabhängig von der Branche. Die eigentliche Herausforderung ist dabei der zuverlässige Zugriff auf aktuelle Daten aus den verschiedenen Anwendungen. Dafür brauchen wir eine moderne Dateninfrastruktur und müssen neue Wege in der Datenintegration gehen. Datenzentrierte Unternehmen müssen zeitnah valide Erkenntnisse aus Datenanalysen gewinnen, um extrem schnell Entscheidungen treffen zu können.


Viele Systeme, die früher nur im Rechenzentrum angesiedelt waren, wurden war in die Cloud gebracht, sind aber nach wie vor für die On-Prem-Welt gestaltet.


Können Sie etwas genauer beschreiben, was die Herausforderungen sind, die speziell Cloud-Anbieter im Bereich Datenintegration noch bewältigen müssen?

Spohn: Eine davon ist es, noch mehr traditionelle Datenquellen wie zum Beispiel SAP zugänglich zu machen, die insbesondere für den deutschen Markt sehr wichtig sind. Fivetran hat bereits einige Konnektoren für SAP und wird auch in Zukunft weiter investieren. Ein anderes Thema ist, den Service auf verschiedenen Cloud-Plattformen bereitzustellen, sodass Anwenderunternehmen frei wählen können, ob sie beispielsweise Azure (Microsoft), AWS (Amazon) oder Google Cloud Platform (GCP) nutzen möchten.

Die Fivetran-Data-Pipelines zapfen aus verschiedenen Quellen Daten an, sei es Salesforce, Microsoft Dynamics oder Google-Analytics, integrieren und normalisieren sie in der Cloud und stellen sie in einem zentralen Daten-Depot in der Cloud zur Verfügung. Ist das sehr grob beschrieben, was Sie tun?

Spohn: Ja. Gehen wir noch einmal zurück zu den Herausforderungen. Vielleicht kann ich das Ganze da besser erklären. Unternehmen in Deutschland haben vor allem das Problem, Zugang zu Daten aus unterschiedlichen Quellen zu bekommen, die sie benötigen, um ihre Analytics-Aufgaben zu bewältigen. Auch wenn sie agiler in ihren Fragestellungen werden möchten, bleibt es schwierig. Der Aufwand bei den traditionellen Datenintegrations-Tools ist enorm, um ein spezifisches Set an Fragen zu beantworten. Wenn Sie diese Fragestellungen kurzfristig ändern wollen, ist das nicht so einfach, weil Sie den gesamten Aufwand für die Integration der dafür notwendigen Daten erneut erbringen müssen. Die Unternehmen benötigen hier deutlich agilere Methoden, als traditionelle Datenintegrationsverfahren sie bieten können. Wenn die Vorbereitung so zeitintensiv ist, dass sie zwei Monate auf die Beantwortung einer Frage warten müssen, hat sich Ihre Konkurrenz schon lange auf die neuen Marktbedingungen eingestellt, während Sie noch mit der Analyse beschäftigt sind. Außerdem sind herkömmliche Tools oft recht langsam und holen die Daten beispielsweise nur einmal pro Tag aus der Quelle. Viele dieser Probleme tauchen erst auf, wenn Anwenderunternehmen stärker datengetrieben arbeiten wollen und häufigere und schnellere Analysen benötigen. Die On-Prem-Integrationswerkzeuge sind dafür einfach nicht geschaffen.

Viele Unternehmen in Deutschland nutzen inzwischen hybride Lösungen, teilweise in der Cloud, teilweise im eigenen Rechenzentrum. Entgehen sie damit den Einschränkungen der On-Prem-Welt?

Spohn: Zum Teil. Viele Systeme, die früher nur im Rechenzentrum angesiedelt waren, wurden zwar in die Cloud gebracht, sind aber nach wie vor für die On-Prem-Welt gestaltet. So können sie viele Vorteile der Cloud nicht nutzen. Der Automatisierungsgrad ist bei weitem nicht so hoch wie bei einer rein Cloud-nativen Lösung.

Übrigens: Wie kam Ihr Unternehmen zu seinem Namen Fivetran?

Spohn: Es ist ein scherzhaftes Wortspiel mit „Fortran“, der objektorientierten Programmiersprache. Als Fivetran 2013 gegründet wurde, galt es gerade als cool, sich einen Firmennamen zu geben, der eine alte Technologie referenzierte.

Was unterscheidet Fivetran von anderen Data-Pipeline-Anbietern?

Spohn: Wir bieten einen fully-managed Service aus der Cloud an. Sie müssen unser Tool nur konfigurieren und dann können Sie sehr schnell loslegen. Kunden müssen sich nicht um die Maintenance kümmern. Wir haben eine Verfügbarkeit von 99,99 Prozent. Es gibt praktisch keine Downtime. Unsere Ingenieure und Techniker sind dafür verantwortlich, dass die Data Pipelines immer verfügbar sind und laufen. Der Fivetran-Nutzer bekommt quasi auf Knopfdruck Zugang zu allen Daten, die er will. In traditionellen Umgebungen würde es Monate oder sogar Jahre dauern, bis man zu allen gewünschten Quellen die richtigen Verbindungen hergestellt hat. Mit Fivetran können Sie das innerhalb von wenigen Minuten bewerkstelligen. Unser europäisches Cloud-Rechenzentrum ist übrigens in Frankfurt. Wir können demnächst aber auch mit Business Critical Fivetran-private Instanzen bereitstellen, die vollkommen von der „Public Cloud“ separiert sind.

Gibt es keine Probleme beim Laden der Daten? Schließlich handelt es sich ja oft um sehr große Volumen.

Spohn: Nein, wir können wirklich große Datenmengen sehr schnell transportieren und verarbeiten. Wir handhaben riesige Datenmengen zum Beispiel auch für deutsche Kunden wie Douglas oder Westwing. International haben wir Kunden wie Autodesk, den Schuhhersteller Asics oder DocuSign.

Wie wird sich das Thema Datenintegration in den nächsten zwölf Monaten im deutschen Markt weiterentwickeln?

Spohn: Wir werden unser Angebot an vorgefertigten Konnektoren kontinuierlich ausbauen. In der Region Dach werden wir den Support für SAP-Daten und deren Integration verstärken. Ende dieses Monats werden wir vollständig auf Microsoft Azure laufen. Deutschland ist einer unser wichtigsten Märkte. Wir möchten hier Vertrauen aufbauen und den Unternehmen hier beweisen, dass mit unseren Sicherheitsstandards die Cloud genauso sicher und DGSVO-compliant ist wie eine On-Premises-Lösung.


Der Unterschied zwischen uns und den Hyperscalern, die Datenintegration in sehr limitierter Weise anbieten, ist der zwischen einem Supermarkt und einem wirklich guten Restaurant.


Apropos Sicherheit – kann Fivetran eigentlich mit verschlüsselten Daten arbeiten?

Spohn: Selbstverständlich. Die Daten werden vollständig verschlüsselt über unsere Pipeline transportiert.

Für welche Use-Cases wird Ihre Plattform normalerweise genutzt?

Spohn: Sie kann natürlich sehr vielfältig eingesetzt werden, aber die häufigsten Use-Cases finden sich im Data-Driven Marketing und im E-Commerce. Gleichzeitig kann Fivetran aber auch eingesetzt werden, um die Performance verschiedener Geschäftsbereiche und Teams zu analysieren und zu optimieren. Auch für detaillierte Analysen von Online-Shops wird Fivetran häufig genutzt. Die Möglichkeiten sind nahezu unbegrenzt mit unserer Lösung.

Werden in den kommenden Monaten neue Use-Cases dazukommen?

Spohn: Sehr wahrscheinlich. Wir haben bisher wie gesagt häufig BI-Use-Cases unterstützt, sehen aber die Machine Learning Cases kräftig zulegen.

Welche Art von Daten können Sie verarbeiten?

Spohn: So gut wie alles an strukturierten und unstrukturierten Daten, mit der Ausnahme von Fotos und Videos.


Das Ideal, das uns antreibt, ist die Vorstellung, dass in einem datengetriebenen Unternehmen jeder jede analytische Frage stellen kann.


Wird Ihr Geschäftsmodell nicht von den Hyperscalern bedroht, die entweder schon Integrationswerkzeuge anbieten (wie Microsoft) oder bald damit herauskommen könnten?

Spohn: Nein. Die Hyperscaler stellen stabile und skalierbare Systeme bereit, die viele Workloads gleichzeitig verarbeiten können. Sie sind hochgradig standardisiert. Wir stellen Zugänge zu Hunderten, wenn nicht Tausenden Datenquellen bereit. Die APIs dazu verändern sich ständig, wir müssen da ständig am Ball bleiben und viel Detailarbeit leisten. Das ist dem Geschäftsmodell der Hyperscaler eigentlich diametral entgegengesetzt. Deshalb habe ich da überhaupt keine Befürchtungen. Der Unterschied zwischen uns und den Hyperscalern, die Datenintegration in sehr limitierter Weise anbieten, ist der zwischen einem Supermarkt und einem wirklich guten Restaurant. Im Supermarkt müssen sich die Kunden alles selbst zusammensuchen, was sie für ihr Abendessen benötigen, und sie müssen es dann auch noch zubereiten können. Im Restaurant nimmt man Platz und bestellt einfach das Menü, das einem am meisten zusagt. In diesem Beispiel sind wir als Managed-Service-Anbieter natürlich das Restaurant.

Also besteht die größte Herausforderung für Fivetran darin, bei den vielen APIs, die Sie unterstützen, ständig auf dem Laufenden zu bleiben und die Veränderungen in den Konnektoren zu berücksichtigen?

Spohn: Richtig. Das bedeutet, dass jeder Nutzer unseres Service sich um die Veränderungen und Anpassungen der Datenquellen keine Gedanken mehr machen muss.

Fivetran spricht häufig vom „Modern Data Stack“. Was hat man sich darunter vorzustellen?

Spohn: Das Ideal, das uns antreibt, ist die Vorstellung, dass in einem datengetriebenen Unternehmen jeder jede analytische Frage stellen kann, und der schnelle Zugang zu hochqualitativen Daten ermöglicht die Beantwortung aller dieser Fragen in Quasi-Echtzeit. Mit Modern Data Stack meinen wir eine cloudbasierte Infrastruktur, die alle benötigten Daten in einer zentralen Datenquelle zusammenfasst, sowie ein darüber liegendes Datenmodell und entsprechende BI-Tools. Letztere erlauben es, die verschiedensten Fragen zu stellen und auf die verschiedensten Daten zuzugreifen.

Im aktuellen Magic Quadrant von Gartner wird Fivetran als Nischenanbieter bewertet. Sind Sie mit diesem Urteil zufrieden?

Spohn: Die Tatsache, dass wir zum zweiten Mal in Folge als Niche Player in den Magic Quadrant aufgenommen wurden, ist für uns ein großer Erfolg. Sie zeigt, dass wir im Markt wahrgenommen werden und dass die Sichtbarkeit für cloudzentrierte Infrastrukturen mit automatisierter Datenintegration zunimmt.

Blöde letzte Frage: Warum sind Daten so wichtig?

Spohn: Wer am besten das Potenzial der Daten ausschöpfen kann, hat die Nase vorn und gewinnt das Rennen. In traditionelleren Wirtschaftssystemen gewannen die Unternehmen mit dem meisten Geld, mit den besten Leuten oder den besten Produkten. Das braucht es heute auch noch, aber den großen Unterschied macht die Fähigkeit, Daten schnell und richtig zu analysieren.

. . .

Author Image

Christoph Witte

Chefredakteur IT Spektrum und BI-Spektrum
Zu Inhalten

Christoph Witte ist Gründer der Wittcomm Agentur für IT, Publishing und Kommunikation. Darüber hinaus ist er Chefredakteur von IT Spektrum sowie BI-Spektrum und wirkt zudem bei dem Magazin JavaSPEKTRUM mit.


Artikel teilen