dogs and a pink wall types of data scientists

Welche Typen von Data Scientists gibt es?

Denken Sie an all die Stärken, die Sie als Data Scientist ausspielen müssen. Sie können einen Background in Statistik haben, da Sie manchmal neue statistische Theorien für große Datenmengen entwickeln. Sie können statistische Modellierung, experimentelles Design, Datenreduktion, Sampling und Clustering, Testen, Modellierung und prognostische Modellierung durchführen. Dann haben Sie einen soliden Hintergrund in Mathematik, der Ihnen hilft, analytische Geschäftsoptimierung durchzuführen. Sie haben auch einen gewissen Geschäftssinn entwickelt, wenn Sie die ROI-Optimierung angehen und sich mit Themen der Decision Science beschäftigen. Und dann noch, Sie können ein Dateningenieur sein, der Architekturen und Datenflows optimiert. Sie würden sich im maschinellen Lernen oder in der Entwicklung von Seriencode zurecht finden. Aber Sie sind auch stark in der Visualisierung und beschäftigen sich mit Themen wie Geodaten und Graphdatenbanken.

Die „Big Three“ in Data Science

Bei Data Science handelt es sich um ein sehr differenziertes Feld, das immer stärker diversifiziert wird. Es gibt derzeit über 10 verschiedene Arten von Data Scientists, und je nach Taxonomie könnte es noch mehr sein. Doch die Klassiker bleiben, und diese können im Big-Three-Modell der Datenwissenschaft erfasst werden: der Datenanalyst, der Dateningenieur und der Data Scientist.

Der Datenanalyst

Ein hervorragender Analyst ist die Voraussetzung für den Erfolg Ihrer gesamten Aktivitäten. Ein solider Hintergrund in der Statistik ist das, was der datengesteuerten Entscheidungsfindung Stringenz verleiht. Ein Datenanalyst untersucht Branchendaten, um geschäftsrelevante Fragen zu beantworten und liefert diese Antworten an die relevanten Teams. Datenanalysten transformieren große Datensätze, bilden Hypothesen und kommunizieren diese an die Entscheidungsträger von Unternehmen. Sie müssen ein ausgeprägtes Gespür für die Prozesse haben, die außerhalb der Daten stattfinden. Komplexe Datenanalysen und Erkenntnisse müssen einem Publikum ohne Vorkenntnisse klar und deutlich vermittelt werden. So untersucht der Datenanalyst die Daten, was eine Bereinigung und statistische Analyse beinhaltet, und visualisiert dann die Daten um die Ergebnisse zu artikulieren. Als Datenanalyst bleiben Sie bei den Fakten: Das bedeutet, sich mit der konkreten Aufgabe zu befassen, Geschäftsfragen zu beantworten und Erkenntnisse aus bestehenden Daten zu gewinnen.

Der Data Scientist

Dies kann alles umfassen, von der Datenanalyse bis hin zum Aufbau von Modellen für das maschinelle Lernen, die die zukünftige Entwicklung auf der Grundlage historischer Daten vorhersagen. Im Gegensatz zu Analysten halten sich Data Scientists nicht ganz an die Fakten und haben mehr Raum, eigene Ideen zu entwickeln oder Strukturen in den Daten zu entdecken. Um diese Muster zu erkennen, analysieren sie große Mengen an komplexen strukturierten und unstrukturierten Daten. Sie würden z.B. komplexe Auswertungen vornehmen sowie ein Modell für maschinelles Lernen aufbauen und trainieren. Neben einem soliden Hintergrund in der Statistik könnte ein Data Scientist auch in beaufsichtigten und unbeaufsichtigten maschinellen Lernmethoden geschult werden.

Der Dateningenieur

Dies ist eine softwareentwicklungsintensive Rolle, die von Programmierkenntnissen und der Fähigkeit lebt, Daten für Data Scientists nutzbar zu machen. Dateningenieure verwalten große Datensätze, übernehmen die Datenbereinigung, Aggregation und ETL-Prozesse, bauen aber auch Datenpipelines auf, um die Daten an die Analysten und Wissenschaftler innerhalb eines Unternehmens weiterzugeben. In dieser Rolle können Sie sich hauptsächlich mit Datenerfassungsaufgaben und der Stapel- oder Echtzeitverarbeitung von gesammelten Daten befassen. In aller Regel sind Sie auch für die Entwicklung, den Aufbau, das Testen und die Wartung der Infrastruktur verantwortlich, die die Speicherung und den Zugriff auf Daten ermöglicht. Außerdem verbessern Sie die Datenqualität und -zuverlässigkeit.

Verzweigung der Data Science

Dies ist jedoch nicht das Gesamtbild. Die Big-Three haben sich in mehrere Spezialfunktionen diversifiziert, von denen einige nicht einmal als Teil des Bereichs der Datenwissenschaft als solches angesehen werden. Schauen wir uns einige von ihnen an:

Die Populärsten

  • Machine Learning Engineer. An der Schnittstelle von Software-Engineering und Data Science beherrschen Machine Learning Engineers eine Vielzahl von Software-Tools und sind versiert in der Bereitstellung praktikabler Software-Lösungen. Ein Machine Learning Engineer nimmt das vom Data Scientist vorgeschlagene theoretische Modell und macht es in einer Produktionsumgebung nutzbar. MLEs erstellen Programme, die Geräte steuern und Algorithmen entwickeln, die Maschinen helfen, Muster in ihren Daten zu identifizieren, Befehle zu verstehen und sogar zu lernen, ihre eigenen Entscheidungen zu treffen.
  • Wissenschaftler für maschinelles Lernen. Im Gegensatz zu Ingenieuren für maschinelles Lernen, die auf den Aufbau von maschinellen Lerninfrastrukturen spezialisiert sind, konzentrieren sich die Wissenschaftler für maschinelles Lernen auf die Erforschung neuer Ansätze und Algorithmen. Die Outputs eines Wissenschaftlers für maschinelles Lernen sind Berichte und Whitepapers.
  • Statistiker. Arbeitet in theoretischen und angewandten Statistiken mit Blick auf die Unternehmensziele. Mit Hilfe mathematischer Techniken analysieren und auswerten Statistiker statistische Informationen und ziehen aus den Daten geschäftsrelevante Schlussfolgerungen.
  • Business Intelligence Entwickler. Mit BI-Tools oder der Erstellung eigener Anwendungen für BI-Analytics arbeiten BI-Entwickler an Strategien, die Unternehmen dabei unterstützen, ihre Entscheidungsprozesse zu verbessern.

Die Architekten

  • Datenarchitekt. Datenarchitekten entwickeln, konstruieren und warten die Datenarchitekturlösung eines Unternehmens und stellen die Hochverfügbarkeit von Unternehmensdaten sicher. Sie erstellen Datenbanken, erarbeiten strukturelle Lösungen sowie Installationslösungen und erstellen Designberichte.
  • (Big Data/Cloud) Infrastruktur-Architekt. Unter Aufsicht der Big Data, Cloud Computing oder der allgemeinen Datenstrategie des Unternehmens überträgt der Infrastrukturarchitekt Geschäftsanforderungen in konkrete Systemanwendungen oder Prozessdesigns für IT-Lösungen. Der Infrastrukturarchitekt stellt sicher, dass die Geschäftssysteme funktionieren. Außerdem stellt er sicher, dass die notwendigen Systemanforderungen erfüllt und in der Lage sind, neue Technologien zu unterstützen.
  • Enterprise-Architekt. Um sicherzustellen, dass ein Unternehmen die richtige Technologie- und Systemarchitektur verwendet, um seine Geschäftsstrategien erfolgreich umzusetzen, gestaltet der Enterprise Architekt das Bild der Strategien und Prozesse eines Unternehmens.
  • Anwendungsarchitekt. Diese Rolle umfasst das Design und die Erstellung neuer Anwendungen sowie die Überwachung des Verhaltens bestehender Anwendungen innerhalb eines Unternehmens. Anwendungsarchitekten entwickeln Produktprototypen, führen Tests durch, schauen sich die Interaktion ihrer Anwendungen mit den Anwendern an und erstellen Anwendungsentwicklungshandbücher.

Da die Methoden der Datenanalyse immer leistungsfähiger werden und das Volumen der gesammelten Daten weiterhin auf ein bisher nicht gekanntes Niveau steigt, werden die Anzahl und Vielfalt der Rollen in Data Science weiterhin rasch zunehmen. Erfahren Sie mehr über unsere Stellenangebote und Trainingsmöglichkeiten.


Abonnieren Sie unser Magazin!
Bleiben Sie auf dem Laufenden mit den neuesten Tipps und Nachrichten aus Data Science und IoT.