Data Science – Make or Buy?

Unternehmen setzen zunehmend auf Data Science und Data Analytics Lösungen, um das Meer an Daten nutzenstiftend für das eigene Geschäft einzusetzen.

Die Frage, die im Zusammenhang mit Data Science gestellt wird, ist daher heute primär nicht mehr eine Frage des Ob, sondern vielmehr des Wie. Das belegen auch die Ergebnisse aktueller Studien: So gehören zu den Hauptgründen, die Unternehmen daran hindern diese fortschrittlichen Technologien einzusetzen, allen voran mangelndes Know-how und fehlendes Personal.

Wer also von den weitreichenden Vorteilen profitieren möchte, steht unweigerlich der grundlegenden Frage gegenüber, wie man denn nun an die dafür benötigen Kompetenzen gelangt. Grundsätzlich gibt es dafür zwei Möglichkeiten: Erstens, der interne Aufbau von Data Science Ressourcen (make) oder zweitens, der Einkauf externer Data Science Dienstleistungen (buy). Keine leichte Entscheidung. Mit folgendem Artikel möchten wir die beiden Optionen näher beleuchten und dabei insbesondere auf die Vorteile und Herausforderungen eingehen.

OPTION 1: MAKE

Die Make Entscheidung bedeutet, die benötigten Data Science Fähigkeiten intern zu entwickeln. Dies kann entweder durch die Weiterbildung der vorhandenen Mitarbeiter oder durch die Einstellung von Datenexperten erfolgen. Ganz bewusst wird hier beim Wort Datenexperte der Plural verwendet. Denn bedingt durch die Komplexität von Data Science Initiativen arbeitet in einem solchen Projekt häufig ein Team an Spezialisten zusammen. Dazu gehören neben dem Data Scientist beispielsweise der Data Engineer, der Machine Learning Engineer sowie der Softwareentwickler.

MAKE-ENTSCHEIDUNG: WAS SPRICHT DAFÜR?

Der Aufbau interner Data Science Ressourcen bringt klare Vorteile mit sich. Zu den Hauptgründen gehören u.a. die folgenden:

INTERNER KOMPETENZAUFBAU

Es werden langfristig Kompetenzen im Unternehmen aufgebaut, die nahezu jederzeit abgerufen werden können. Data Science Kompetenzen können so in allen Unternehmensbereichen und, ein gutes Firmennetzwerk vorausgesetzt, auch übergreifend eingesetzt werden.

BUSINESS KNOW-HOW

Die eigenen Mitarbeiter kennen das Business so gut, wie es ein Externer selten können wird. Das ist insbesondere bei der Umsetzung von Anwendungsfällen, die sehr spezifisches Domänenwissen voraussetzen, von Vorteil.

STRATEGISCHE VERANKERUNG

Da Data Science Ressourcen oftmals knapp sind, ist es sinnvoll einen Datenstrategen im Unternehmen zu haben, der die internen Bedarfe und den verbundenen Ressourceneinsatz gezielt gemäß der Datenstrategie priorisieren kann. Das fängt bei Fragen nach den wichtigsten Datenquellen im Unternehmen an und reicht bis zur Priorisierung konkreter umzusetzender Use Cases. Hinzu kommt, um mit Data Science richtig durchzustarten, braucht es das richtige Werkzeug (sowohl an IT-Infrastruktur als auch Technologie-Stack). Auch hier ist es von Vorteil, wenn die Auswahl der richtigen Tools strategisch von einem Verantwortlichen erfolgt.

Ungeachtet der Vorteile bringt der interne Aufbau von Data Science Kapazitäten allerdings auch gewisse Herausforderungen mit sich.

MAKE-ENTSCHEIDUNG: WAS MACHT DEN AUFBAU EINES DATA SCIENCES TEAMS SO SCHWER?

Um den erhofften Wert eines eigenen Data Science Teams zu erreichen, gilt es einige Hürden zu meistern, die wir im Folgenden kurz anreißen möchten.

MANGEL AN FACHKRÄFTEN UND WENIG ERFAHRENES PERSONAL

Das Einstellen von Datenexperten und der Aufbau eigener Data Science Ressourcen ist angesichts des Mangels an Fachkräften kein einfaches Unterfangen. So knackte die Zahl der offenen Stellen für IT-Fachkräfte 2019 eine neue Rekordmarke mit mehr als 124.000 offenen Stellen. Zu den Fachkräften gehören allen voran Softwareentwickler und auch Data Scientisten. Wer also eigene Data Science Kapazitäten aufbauen möchte, steht in einem Kampf um Talente.

Noch schwieriger ist es, erfahrende Datenexperten mit mehrjähriger Berufserfahrung zu rekrutieren. Der Grund? Die Berufsbilder sind schlichtweg noch relativ neu und Universitäten und Hochschulen beginnen größtenteils erst jetzt Data Scientisten auszubilden.

Dahingegen bieten das Training und Fortbildung bestehender Mitarbeiter eine Alternative, die zwar eine zeitliche Investition, aber nicht zwingend eine große finanzielle Aufwendung bedeuten muss. In dem Zusammenhang fällt oftmals der von Gartner geprägte Begriff der Entwicklung von Fachexperten hin zum sogenannten Citizen Data Scientist. Der Begriff beschreibt Personen, die über ein Grundverständnis für die Arbeit mit Daten sowie über ein gewisses statistisches und mathematisches Wissen verfügen, und damit in der Lage sind bestimmte analytische Aufgaben des Data Scientist zu übernehmen. Citizen Data Scientists ersetzen die Data Scientists zwar nicht, können aber eine ergänzende Rolle einnehmen und vor allem produktiver mit den Datenexperten zusammenarbeiten.

RICHTIGE TEAM ZUSAMMENSTELLUNG

Beim Aufbau und Zusammenstellung Eurer Data Science Ressourcen solltet ihr zudem beachten, wie es um die vorhandene IT-Infrastruktur und die bereits geschaffenen Rahmenbedingungen in Eurem Unternehmen steht. Denn all diese Dinge wirken sich auf die benötigten Rollen und die Größe des Teams aus.

Besitzt Euer Unternehmen beispielsweise bereits ein ausgereiftes Datenmanagement und ihr habt schon ein gepflegtes Data Warehouse aufgebaut, wurden die Grundvoraussetzungen und die Ausgangsbasis für die Arbeit eines Data Scientisten schon geschaffen. Ist das nicht der Fall, befinden sich die Daten oft noch dezentral in den jeweiligen Quellsystemen. Bevor ein Data Scientist also loslegen kann, müssen in dem Fall erst noch die entsprechenden Rahmenbedingungen geschaffen werden. Diese Aufgabe bedarf entsprechender Experten, die ihr natürlich anstellen könnt, was allerdings wiederum die Größe des Teams und somit die Kosten erhöht.

INTEGRATION DES DATA SCIENCE TEAMS IM UNTERNEHMEN

Wer sich für den Aufbau eines eigenen Data Science Teams entscheidet, steht zudem der Frage gegenüber, wie das Team im Unternehmen integriert werden soll. Hierfür gibt es eine Reihe an Möglichkeiten, die von der vollständig dezentralen Integration der Experten in der jeweiligen Fachabteilung bis hin zum Aufbau einer zentralen Einheit beispielsweise in Form eines Center of Excellence (CoE) reichen. Ob nun eine zentrale oder dezentrale Integration die richtige Option ist, hängt von verschiedenen Faktoren ab. Die Empfehlungen gehen hier oftmals auseinander und es gilt hier individuell für Euer Unternehmen die Vor- und Nachteile der verschiedenen Vorgehensweisen abzuwägen.

Die Entscheidung eigene Data Science Ressourcen aufzubauen ist vor allem eine strategische. Daher hängt die Art der Integration und die benötigte Fachkompetenz in Form der verschiedenen Datenexperten letztlich maßgeblich von dem verfolgten Ziel, heißt der Datenstrategie Eures gesamten Unternehmens ab.

OPTION 2: BUY

Die Alternative zu einer eigenen Abteilung ist der Einkauf externer Dienstleistungen. Die Möglichkeiten reichen hier vom Einkauf einer Standardsoftware als fertiges Produkt bis hin zur Individualsoftware, die maßgeschneidert gemäß Euren Bedürfnissen entwickelt wird. Dazu gehören natürlich aber auch Beratungs- und Data Science Projekte, die einmalig durchgeführt werden, um eine bestimmte Fragestellung zu beantworten.

BUY-ENTSCHEIDUNG: WAS SPRICHT DAFÜR?

Der Einkauf externer Dienstleistungen gewährt schnellen Zugang zu den weitreichenden Vorteilen von Data Science Lösungen und das zumeist zu einem Bruchteil der Kosten und vor allem Zeit, die eine Eigenentwicklung beanspruchen würde. Die Gründe, die für den buy Ansatz sprechen sind aber weitaus vielseitiger. Wir haben die wichtigsten kurz und knapp zusammengefasst:

EXPERTISE UND ERFAHRUNG

Ein großer Vorteil besteht zunächst ganz klar darin, dass externe Dienstleister über die begehrten Datenexperten verfügen und für jedes Projekt das optimale Team und damit die richtige Mischung an benötigten Kompetenzen mitbringen können. Hinzu kommt, dass externe Dienstleister zumeist auf langjährige Projekterfahrung mit diversen Kunden zurückgreifen können und so über eine Reihe an Best Practices verfügen.

LERNEN VON EXPERTEN

Durch die Zusammenarbeit mit externen Experten könnt ihr sowohl auf fachlicher als auch methodischer Ebene einiges lernen, beispielsweise bezüglich der Erarbeitung und Bewertung von Use Cases oder auch der Moderation von Data Workshops.

SPORADISCHER BEDARF

Oftmals werden bestimmte, zumeist sehr spezifische Kompetenzen, wie  z. B. zum Aufsetzen eines Data Lakes oder auch im Bereich des Deep Learning, nur sporadisch benötigt. Anstatt diese Kompetenzen aufwändig intern aufzubauen, ist es wirtschaftlicher, diese extern dazuzukaufen.

ZEIT BIS ZUR NUTZUNG

Ein weiterer Vorteil der buy Option liegt in der sehr kurzen Anlaufzeit. Projekte können quasi direkt starten und der Onboarding-Prozess bei der Implementierung standardisierter Lösungen erfolgt oftmals innerhalb weniger Wochen.

SCHNELLERER ROI DURCH SKALIERUNG

Gerade beim Einstieg in Data Science, sind oftmals initiale Aufwände nötig, wie z. B. für das Aufsetzen eines Data Warehouse oder Data Lake, bevor mit der wertschöpfenden Umsetzung von Data Science Use Cases begonnen werden kann. Um einen schnelleren ROI zu erzielen, kann die Use Case Umsetzung mit einem externen Dienstleister skaliert werden, sodass beispielsweise ein Use Case intern und einer oder direkt mehrere parallel extern umgesetzt werden.

GERINGERES INVESTITIONSRISIKO

Im Gegensatz zur make Option besteht beim buy Ansatz eine deutlich geringere Kapitalbindung, da keine größere Investition in Personal, Tech-Stack und Infrastruktur von Nöten ist.

Gerade für den Einstieg und einen ersten Kontakt mit Data Science sind externe Dienstleister die optimale Möglichkeit. Mithilfe der Dienstleister können schnell Use Cases herausgearbeitet und gewisse Strukturen aufgebaut werden. Durch die Umsetzung von zu Beginn oftmals kleinen und übersichtlichen Projekten kann so Erfahrung und Vertrauen aufgebaut und Akzeptanz für die Thematik in Eurem Unternehmen geschaffen werden. Wie diese Projekte dann im Unternehmen gemeistert werden, erfahrt ihr hier:

Blogeintrag zum Thema Data Science Projekte ➞

BUY-ENTSCHEIDUNG: WELCHE HERAUSFORDERUNGEN GIBT ES ZU BEACHTEN?

Auch der buy Ansatz bringt gewisse Herausforderungen mit sich, die nicht außer Acht gelassen werden dürfen. Konkret sind hier die folgenden zwei Faktoren maßgeblich:

DEN RICHTIGEN PARTNER WÄHLEN

Die Wahl des richtigen Data Science Dienstleisters ist die größte und wichtigste Entscheidung und daher eine herausfordernde Aufgabe. Ein Dienstleister oder Anbieter sollte nicht nur über exzellente Data Science Kompetenzen verfügen, sondern bestenfalls auch umfassende Branchen- und Fachexpertise mitbringen. Es empfiehlt sich daher nach Referenzprojekten zu Fragen, um zu erfahren mit wem der Dienstleister in der Vergangenheit zusammengearbeitet hat, welche konkreten Herausforderungen dabei gelöst und welche Resultate erzielt wurden.

Beim Einkauf externer Data Science Dienstleistungen gilt zudem immer: Je besser der Dienstleister Euer Unternehmen, Eure strategischen Ziele, Eure internen Prozesse, etc. kennt, desto besser die Erfolgsaussichten. Ein guter Dienstleister nimmt sich daher Zeit für den gegenseitigen Austausch und hört gut zu, um Eure Wünsche und Vorstellungen bestmöglich umzusetzen.

NUR BEDINGTER KOMPETENZAUFBAU

Ein Nachteil des buy Ansatzes besteht darin, dass der eigene Kompetenzaufbau im Unternehmen natürlich geringer ausfällt und daher eine gewisse Abhängigkeit von externen Partnern besteht. Hier sei jedoch angemerkt, dass gute Dienstleister großes Augenmerk auf den Knowledge Transfer legen und durch eine gezielte Betreuung den Wissensaufbau fördern.

FAZIT

Wie bei so vielem gibt es auch für die make or buy Frage keine allgemeingültige Antwort. Die einfache Antwort lautet: Spielt Data Science eine zentrale Rolle in der Unternehmensstrategie und ist Bestandteil des Kerngeschäfts, dann ist make der richtige Weg. In den meisten Fällen geht es allerdings darum, Lösungen umzusetzen, die der Verbesserung der internen Geschäftsprozesse dienen oder die nicht zum Kerngeschäft gehörenden Aktivitäten unterstützen. In diesen Fällen ist buy und der Einsatz von bereits bewährten Produkten zumeist die bessere Option.

Die lange Antwort auf die Frage lautet: Beim Weg zur richtigen Lösung kommt es maßgeblich auf Eure strategischen Ziele, Eure Anforderungen sowie Eure Einschränkungen in Form von Zeit und Budget an. Um die beste Option für euer Unternehmen zu bestimmen, solltet ihr daher u.a. die folgenden Faktoren berücksichtigen:

  • Euer zu lösendes Geschäftsproblem
  • Der analytische Reifegrad Eures Unternehmens
  • Eure Verfügbarkeit von Mitarbeitern mit entsprechenden Kenntnissen
  • Die Dringlichkeit bis zur Lösungsimplementierung
  • Euer zur Verfügung stehendes Budget

Und unsere abschließende Empfehlung? Es muss sich nicht immer um eine make ODER buy Entscheidung handeln. Unsere Erfahrung hat gezeigt, dass sich der make UND buy Weg oftmals als erfolgversprechend erweist: Heißt also interne Kompetenzen aufzubauen, die den täglichen Bedarf unterstützen und auf externe Unterstützung für komplexere Data Science Projekte zurückzugreifen.