Da mir mein alter Job immer weniger Spaß gemacht hat und ich zudem das Thema KI so unfassbar spannend fand, habe ich beschlossen mich komplett umzuorientieren und nochmal etwas komplett Neues zu machen. Das ich in irgendeiner Art und Weise mit KI arbeiten wollte war mir klar, aber welche Berufe gibt es dafür aktuell überhaupt?
Welche Berufsfelder gibt es im Bereich KI überhaupt?
Also als erstes Mal Freund Google befragen. Allerdings hilft das in diesem Fall auch nur bedingt weiter, man kommt schnell zum Prompt Engineer und der Entwicklung neuronaler Netze etc., aber das erste war mir zu wenig und die Entwicklung neuronaler Netze bzw. KI allgemein überlasse ich dann doch lieber Leuten die klüger sind als ich. KI-Beratung in dem Sinne dass man Firmen berät welche Möglichkeiten man hat diese einzusetzen, welche Ersparnisse damit möglich sind und das Ganze dann im Idealfall auch noch implementieren zu können und die Mitarbeiter in der Nutzung schulen, da wurde es dann schon dünn.

Klar, die Big Four haben das alle im Portfolio, aber wenn man sich auf deren Seiten informieren will ist das Angebot schon recht dünn. Bei der Recherche dazu findet man dann heraus dass alle furchtbar viel Geld da rein stecken wollen, wenn man auf die Job-Pages der Firmen schaut kann man sich schnell einen Reim darauf machen warum: Alle suchen händeringend Leute die Erfahrung in dem Bereich haben oder sich damit beschäftigen. Erfahrung im Bereich künstlicher Intelligenz ist allein schon aufgrund des Alters der aktuellen Technologie natürlich eher schwierig zu finden. Das hält aber die großen Unternehmensberatungen nicht davon ab, Leute zu suchen die 10 Jahre oder mehr mit der Technologie gearbeitet haben. Realitätsferne war für sie noch nie ein Problem (Bitte entschuldigt dass ich da so ein bisschen über die ganzen Beratungen herziehe, ich habe die letzten Jahre in der Personalberatung gearbeitet und dabei auch mit den großen Unternehmensberatungen zusammen, deshalb weiß ich um deren vollkommen überzogene Vorstellungen von Berufserfahrung und dem dann dazu gehörenden Gehalt.)
Also tiefer in die Materie rein und prüfen was es da noch so gibt. Sehr viele „Berufe“ entstehen gerade erst, es gibt zu den meisten bisher keine Ausbildung oder nur Angebote die eher fragwürdig sind und auch bei den Bezeichnungen herrscht Chaos. Nichts was ich dazu gefunden habe hat mir zugesagt. Meine Lösung war. mir zu überlegen was ist denn die Basis Künstlicher Intelligenz? Ich habe also nicht beim Ergebnis angefangen sondern mir die Ausgangslage angeschaut. Und da kommt man dann sehr schnell zum Berufsbild des Data Scientist. Aber was macht der Data Scientist überhaupt und wie kommt der Connect zur Künstlichen Intelligenz?
Der Data Scientist

Ein Data Scientist ist ein Experte, der komplexe Datenmengen analysiert, interpretiert und daraus Erkenntnisse ableitet, um informierte Geschäftsentscheidungen zu unterstützen. Der Arbeitsbereich eines Data Scientists umfasst verschiedene Schritte im Datenanalyseprozess. Hier sind einige Hauptaufgaben:
- Datenbeschaffung und -bereinigung: Data Scientists sammeln Daten aus verschiedenen Quellen, bereinigen sie von Unregelmäßigkeiten, fehlenden Werten oder Ausreißern und bringen sie in eine geeignete Form für die Analyse.
- Explorative Datenanalyse (EDA): Durch die Anwendung statistischer Methoden und Visualisierungstechniken erkunden Data Scientists die Daten, um Muster, Trends oder Abhängigkeiten zu identifizieren. Dieser Schritt hilft, ein besseres Verständnis für die Daten zu entwickeln.
- Feature Engineering: Data Scientists entwickeln neue Merkmale (Features) oder transformieren bestehende, um die Qualität der Daten für die Modellbildung zu verbessern. Dies kann das Hinzufügen von neuen Variablen, die Umwandlung von Datentypen oder die Anpassung von Skalen umfassen.
- Modellbildung: Data Scientists entwickeln statistische Modelle und Machine-Learning-Algorithmen, um Vorhersagen oder Muster in den Daten zu identifizieren. Dies kann Klassifikation, Regression, Clustering oder andere Techniken umfassen, je nach den Zielen der Analyse.
- Modellvalidierung und -optimierung: Die erstellten Modelle werden auf ihre Leistung überprüft, um sicherzustellen, dass sie zuverlässige und genaue Ergebnisse liefern. Bei Bedarf werden Modelle optimiert, um ihre Vorhersagekraft zu verbessern.
- Implementierung: Data Scientists unterstützen die Integration von Analyseergebnissen in Geschäftsprozesse. Dies kann die Entwicklung von Dashboards, Berichten oder anderen Tools umfassen, um die Erkenntnisse für nicht-technische Stakeholder zugänglich zu machen.
- Kommunikation: Ein wichtiger Aspekt der Arbeit eines Data Scientists ist die Fähigkeit, komplexe technische Ergebnisse in verständliche Informationen für Entscheidungsträger zu übersetzen. Dies beinhaltet die Erstellung von Berichten, Präsentationen und anderen Kommunikationsformen.
- Fortlaufende Überwachung und Anpassung: Data Scientists überwachen die Leistung von Modellen im Zeitverlauf und passen diese an, um sicherzustellen, dass sie aktuell und relevant bleiben.
Data Scientists verwenden oft Programmier- und Datenanalysewerkzeuge wie Python, R, SQL und spezialisierte Bibliotheken oder Frameworks. Ihr Fachwissen erstreckt sich über Statistik, Mathematik, Informatik und domänenspezifische Kenntnisse, je nach der Branche, in der sie arbeiten.
Die Basis aller Künstlichen Intelligenz sind gewaltige Datenmengen aus denen sie lernt. Und genau da setzt auch der Data Scientist an. Hier wird auch direkt mit Machine Learning gearbeitet um Modelle und Vorhersagen zu entwickeln die dann datenbasierte Entscheidungen stützen. Damit war schon einmal das Ziel gefunden. Jetzt fehlte nur noch der Weg.
Und wie werde ich das jetzt?
Und da tauchte schon das nächste Problem auf: Ich hatte keinerlei Vorkenntnisse in irgendeiner Programmiersprache. Bei den meisten Anbietern ist genau das aber die Voraussetzung um diese Kurse überhaupt belegen zu können. Mathematik und Statistik sind ebenfalls ein großer Teil, das war aber das kleinere Problem. Das hatte mein Studium zum Glück alles abgedeckt. Einen Nachmittag sich damit auseinandersetzen, schon saß das wieder. Als nächstes musste die Python-Problematik gelöst werden (zum Verständnis: Python ist eine Programmiersprache die im Bereich Künstliche Intelligenz und Data Science/Analytics genutzt wird). Der erste Versuch war das im Selbststudium zu probieren. Youtube, diverse Foren, kostenlose Online-Kurse, alles direkt ausprobiert. Aber ohne Aufgaben war das irgendwie nicht wirklich machbar. Es blieb also nichts anderes übrig als einen Anbieter zu finden der auch das in seine Kurse integriert hat.
Viele Termine und Telefonate später hatte ich dann einen gefunden der mich angesprochen hat. Die Kurse sind komplett auf Englisch, das ist aber bei nahezu allen Anbietern der Fall. Das liegt auch daran dass Englisch in der IT die einzig interessante Sprache ist und somit ohnehin obsolet. Zudem bietet fast niemand Kurse mit Präsenz-Unterricht an, spätestens seit Corona ist das auch vom Tisch. Was macht nun den Unterschied aus? Zum Einen habe ich in dem Kurs die Möglichkeit extrem flexibel zu lernen, das bedeutet zum Einen zwar dass man sehr diszipliniert sein muss, zum Anderen bietet mir das aber auch viele Freiheiten die ich, insbesondere wegen meiner zwei Kinder, dankend annehme. Es gibt drei Veranstaltungen jede Woche die live sind und in denen auf die Themen des aktuellen Sprints eingegangen wird. Außerdem gibt es nach jedem Sprint (der meistens ca. eine Woche dauert) eine Prüfung zu dem jeweiligen Thema. Das sorgt zwar für ein wenig Druck, hilft einem aber dabei bei der Stange zu bleiben. Weiterhin gibt es ein Projekt, das man mit anderen „Studenten“ bearbeitet, das fängt hier (im Gegensatz zu allen anderen Anbietern) bereits in der dritten Woche an und baut sich dann analog zu den gelernten Themen weiter auf. Und was mich am Ende dann ebenfalls überzeugt hat, ist die Möglichkeit im gleichen Bootcamp direkt noch den Machine Learning Ops dran zu hängen.

Machine Learning Ops
Machine Learning Operations (ML Ops) beziehen sich auf die Praktiken und Prozesse, die darauf abzielen, den Lebenszyklus von Machine-Learning-Modellen zu verwalten und zu optimieren. Ein Machine Learning Ops Engineer oder Specialist ist für die Implementierung und Verwaltung von ML-Systemen in einer produktiven Umgebung verantwortlich. Dabei hat er unter anderem die folgenden Aufgaben:
- Modellbereitstellung: ML Ops-Teams sind dafür verantwortlich, Modelle in produktiven Umgebungen zu implementieren. Das umfasst die Integration von Modellen in Softwareanwendungen, Cloud-Services oder andere Plattformen, auf denen die Modelle in Echtzeit arbeiten können.
- Infrastruktur-Management: ML Ops beinhaltet die Einrichtung und Verwaltung der Infrastruktur, die für das Training und die Ausführung von Machine-Learning-Modellen erforderlich ist. Das kann die Skalierung von Ressourcen in der Cloud, das Management von Container-Orchestrierungssystemen oder die Konfiguration von Servern umfassen.
- Automatisierung: Um den Machine-Learning-Lebenszyklus effizient zu verwalten, setzt ML Ops auf Automatisierung. Das beinhaltet die Automatisierung von Modelltraining, -auswertung und -bereitstellung, um den Prozess zu beschleunigen und menschliche Fehler zu minimieren.
- Monitoring und Wartung: ML Ops-Experten überwachen kontinuierlich die Leistung von Machine-Learning-Modellen in der Produktionsumgebung. Sie identifizieren und lösen Probleme, die auftreten können, wenn sich Datenverteilungen ändern oder wenn Modelle mit neuen Daten trainiert werden müssen.
- Sicherheit: ML Ops-Teams kümmern sich um die Sicherheit von Machine-Learning-Systemen. Das schließt den Schutz von Daten, die Sicherstellung der Integrität von Modellen und die Implementierung von Sicherheitsmaßnahmen für die gesamte ML-Infrastruktur ein.
- Zusammenarbeit mit anderen Teams: ML Ops-Experten arbeiten eng mit Datenwissenschaftlern, Softwareentwicklern, IT-Teams und anderen relevanten Abteilungen zusammen. Eine gute Zusammenarbeit ist entscheidend, um sicherzustellen, dass Modelle effektiv in die Geschäftsprozesse integriert werden.
- Skalierung: ML Ops befasst sich mit der Herausforderung, Machine-Learning-Modelle zu skalieren, um den steigenden Anforderungen und Datenvolumina gerecht zu werden. Das kann den Einsatz von skalierbaren Cloud-Ressourcen, verteilten Systemen und anderen Technologien umfassen.
- Versionskontrolle und Rückverfolgbarkeit: ML Ops stellt sicher, dass alle Schritte im Lebenszyklus eines Machine-Learning-Modells rückverfolgbar und reproduzierbar sind. Dies beinhaltet die Versionierung von Modellen, Trainingsdaten und Code.
Zusammenfassend ist ML Ops entscheidend, um sicherzustellen, dass Machine-Learning-Modelle effektiv und effizient in produktiven Umgebungen eingesetzt werden können, indem sie den gesamten Lebenszyklus der Modelle verwalten und optimieren.
Und damit wäre ich, zumindest in der Theorie, ziemlich genau da wo ich hin möchte: Man kann so wohl die großen Datenmengen verstehen und interpretieren sowie Modelle entwerfen um Vorhersagen zu treffen, man hat aber auch die technische Komponente die es einem möglich macht den technischen Aufwand dahinter zu verstehen und zu skalieren. Zudem kann man die Komponenten in produktive Systeme implementieren und somit nicht nur beraten sondern auch aktiv die Programme einbringen.
Die ersten zwei Wochen sind bereits rum, ich werde euch in den nächsten Tagen ein Update zu meinen Erfahrungen geben….