David Kaumanns

Dr. David Kaumanns

  • AI & Machine Learning Engineer
  • Software Architect
  • Computational Linguist
Freelancer
Verfügbar ab 10.12.2025
David Kaumanns

Über mich

Machine Learning · Software Engineering · Linguistics & Biology

Seit über 14 Jahren baue ich Softwaresysteme rund um Textanalyse, Sprachverarbeitung und KI-gestützte Anwendungen. Seit 3 Jahren führe ich deren Entwicklung, Integration & Release als technischer Leiter. Ich habe sowohl Backend-Komponenten als auch vollständige Endnutzer-Produkte erfolgreich in Produktion gebracht.

Seit 2025 bin ich Freiberufler. Ich kombiniere akademische Kreativität und präzises Ingenieurshandwerk mit statistischen Modellen und generativen KI-Services, um Softwarelösungen auch in diejenigen Domänen zu bringen, die nie ein Techniker zuvor gesehen hat 🚀.

  • Professionelle Anforderungsanalyse & transparente Projektplanung, auch unter änderungsfreudigen Bedingungen und mit Domänenexperten ohne Technikhintergrund. Als ehemaliger Universitätsdozent kommuniziere ich zwischen den Welten und entmystifiziere die Technologie, damit Sie laufend bestens informierte Strategieentscheidungen treffen können.
  • Saubere objektorientierte & funktionale Softwarearchitekturen nach bewährten Design Patterns. Ich liefere übergabefertigen Code und saubere Dokumentation, damit das Know-How in Ihrer Firma bleibt.
  • Tests, Evaluierungen & messbare Ergebnisse, denn jede Software ist nur eine Hypothese, bis sie belegt ist. Ich liefere stabile Arbeit, damit Sie sich darauf verlassen können. Reproduzierbarkeit und Evaluierbarkeit sind die Grundlagen meiner Qualitätssicherungen, selbst und insbesondere wenn statistische Modelle im Spiel sind.

Ich freue mich auf unsere Zusammenarbeit!

Technische Fähigkeiten

AI & Machine Learning
Agentic AI Systems Natural Language Processing Machine Learning Generative Models Edge AI
Development & Tools
Object-Oriented & Functional Programming Relational & Non-Relational Databases Asynchronous Event Streams Container Orchestration Cloud Platforms APIs & Web Services
Concepts & Theory
Software Architecture Neural Networks Statistical Methods Formal & Vector Semantics Evolutionary Game Theory

Sprachen

Deutsch
Englisch
Norwegisch
Altnordisch

Weitere Merkmale

Arbeitserlaubnis: EU/EEA ✅ Berufshaftpflichtversicherung ✅ Reisebereitschaft innerhalb DACH ✅

Projekte & Stationen

Principal AI Engineer

Softmax AI GmbH in Landshut
06/2025 09/2025
Architektur, Entwicklung und Ausrollung von Cognicare Camera & Cognicare AI Assistant, zwei innovative Edge-AI-Produkte für Pflegeheime und Betreutes Wohnen.

Entwicklung der Produktinfrastruktur und der Endgeräte-Software von Cognicare, einem Projekt der Softmax AI GmbH zur Entwicklung von datensensiblen Hardwareprodukten mit modernster KI-Technologie für Pflegeheime und Betreutes Wohnen.

Cognicare Camera ist eine DSGVO-konforme AI-Kamera zur automatisierten Personenkontrolle im Eingangsbereich mittels Gesichtserkennung und Gesichtsverarbeitung auf lokaler KI-beschleunigter Hardware. Zum Produkt gehört das Edge-AI-Gerät mit Kamera sowie das Server-Backend mit Datenbank und eine nutzerfreundliche Verwaltungs-Applikation für Pfleger.

Cognicare AI Assistant ist ein personalisierter Conversational-AI-Assistent mit speziellen Funktionen für den Pflegebereich. Zum Produkt gehört das Edge-AI-Gerät mit Mikrofon und Lautsprecher sowie das Server-Backend mit Unterstützung für die pflegespezifischen Funktionen, wie Datenanbindung, Notfall-Benachrichtigungen und Sicherheitsfunktionen für Pflegeheim-Betreuer.

Modernste Technologien unterstützen die Pflegekräfte, verbessern messbar die Betreuungsqualität und Sicherheit, und steigern so die Zufriedenheit der Pflegebedürftigen und ihrer Angehörigen.

Verantwortungen:

  • Anforderungsanalysen mit Pflegern und Einrichtungsleitern vor Ort
  • Projektplanung mit Anforderungskriterien, Systemarchitektur und Datenmodellierung für MVP/MMP
  • Entwicklung der Backend- und Frontend-Software, UI/UX-Design in regelmäßiger Rücksprache mit Stakeholdern
  • Live-Testen in der Beta-Phase und schließlich Deployment in den Pflegebetrieb
Edge AI/ Internet of Things (IoT) Natural Language Processing Face Recognition Face Processing PostgreSQL Svelte/SvelteKit Websockets/SocketIO Hailo AI Accelerator Raspberry Pi CI/CD Docker Git Dokploy Linux Server Supabase balenaOS/balenaCloud Bash/Make Python/Jupyter Product Design Software Architecture

Technischer Leiter

Ippen Digital GmbH & Co. KG in München
03/2023 - 01/2025
Technische Leitung der Entwicklung von Machine-Learning-basierten Produkten zur Leseranalyse sowie von LLM-gestützten Redaktionswerkzeugen in verschiedenen Projekten.
Forschung und Entwicklung von innovativen Traffic-Analysewerkzeugen, Redaktionswerkzeugen sowie Endkundenprodukten auf der Basis von eigens trainierten Deep-Learning-Modellen und agentischen KI-Systemen. Das Team verwendete hierzu moderneste AI/ML-Technologien (s. unten) Hierdurch werden die Produktionskosten für Online-Inhalte gesenkt, die Qualität der Inhalte verbessert und die Kundenbindung durch innovative Produkte gestärkt.

Verantwortungen:

  • Koordination des KI-Entwicklerteams mit den Infrastrukturteams im Unternehmen
  • Entwurf der teameigenen MLOps-Workflows und Integration innerhalb der Data Engineering/DevOps-Infrastruktur des Unternehmens
  • Produktleitung & technische Führung zur Forschung & Entwicklung neuer Produkte für Redakteure & Leser durch Einsatz von agentischer KI
  • Anforderungsanalysen & Projektplanung mit internen und externen Stakeholdern
  • Kommunikation an Geschäftsführung
  • Präsentationen und Vorträge für Kundenworkshops
  • Einzelne Teamleiter-Aufgaben (Coaching, Evaluationen, Einstellungsgespräche, Konfliktresolution)
Agentic AI Natural Language Processing Elasticsearch Milvus MongoDB PostgreSQL Redis FastAPI Langchain/Langgraph PyTorch Streamlit CI/CD Docker Git Kubernetes Apache Kafka AWS AWS Sagemaker Linux Server NixOS Weights & Biases Bash/Make Python/Jupyter Software Architecture

Leitender Entwickler

Schwarz IT KG in Neckarsulm
07/2022 - 02/2023
Konzeption & Entwicklung eines Deep-Learning-gestützten Chatbot-Backends für Endkunden im Einzelhandel.
Das Backend beantwortet mittels vektorbasierten Information Retrievals die natürlichsprachigen Suchanfragen von Kunden nach Produktinformationen mit relevanten Auszügen, Bildern und Quellenlinks zu den Produktinformationen aus der Unternehmensdatenbank. Hierdurch werden Supportanfragen reduziert und die Kundenzufriedenheit gesteigert.

Verantwortungen:

  • Anforderungsanalyse mit Stakeholdern & Fachpersonal
  • Erstellung und laufende Aktualisierung des Projektplans nach wechselnden Kundenbedürfnissen
  • Reproduzierbare Vorverarbeitung qualitativ unterschiedlicher Quelldokumente
  • Entwicklung unter regelmäßigen Rückmeldungen und Rücksprachen
  • Integration des Produkts mit allen Abhängigkeiten auf lokalen Servern
  • Tests und Evaluierungen nach vereinbarten Metriken
  • Dokumentation und Übergabe an Kunden & nachfolgende Entwickler
Information Retrieval Natural Language Processing Elasticsearch PostgreSQL Deepset Haystack FastAPI Streamlit Docker Git Linux Server Microsoft Azure Bash/Make Python/Jupyter Software Architecture Vector Semantics

Leitender Entwickler

Lufthansa Cargo AG in Frankfurt am Main
03/2022 - 06/2023
Konzeption und Entwicklung eines Prototypen zur Teilautomatisierung des Kundensupports.
Kundenanfragen werden mittels schneller und ressourcensparender NLP-Methoden in Themenbereiche klassifiziert und zusammen mit den extrahierte Informationen (z.B. Datum, Flughäfen und Frachtmaße) in die passenden Prozessformulare eingetragen. Dies steigert die Effizienz der Support-Mitarbeiter, verkürzt die Bearbeitungszeiten und erhöht so die Kundenzufriedenheit.

Verantwortungen:

  • Anforderungsanalyse mit Fachpersonal
  • Entwicklung des lauffähigen Prototypen
  • Demonstration & Übergabe an den Kunden
Information Extraction Natural Language Processing FastAPI Docker Git Microsoft Azure Bash/Make Python/Jupyter Software Architecture

Machine Learning Engineer

NLP-Dienstleister in München
09/2021 - 02/2022
Entwicklung von parallelisierter Textverarbeitung zur semantischen Analyse unstrukturierter Textdaten.
Data Engineering mit parallelisierten Datenverarbeitungs-Pipelines mit Apache Spark zur Extraktion, Anreicherung und Integration von Textmerkmalen in Elasticsearch für performante Suche und Analyse. Dies ermöglicht eine reproduzierbare und testbare Verarbeitung großer Textmengen für nachgelagerte KI-Anwendungen.

Verantwortungen:

  • Programmierung von verteilten Datenverarbeitungs-Pipelines mit Apache Spark.
  • Extraktion und Anreicherung von Merkmalen aus Textdaten mittels NLP-Bibliotheken wie SpaCy.
  • Integration der aufbereiteten Daten in Elasticsearch zur performanten Suche und Analyse.
  • Containerisierung der Services mit Docker für eine robuste und skalierbare Architektur.
Information Extraction Named Entity Recognition Natural Language Processing Elasticsearch PostgreSQL Apache Spark & PySpark Scikit-learn SpaCy Docker Git Linux Server Python/Jupyter Statistical Methods

Machine Learning Research Engineer

Apple Inc. in Cupertino, CA
03/2017 - 04/2019
Training von Deep-Learning-Modellen und Entwicklung darauf basierender Backend-Software für NLP-Anwendungen (Siri, virtuelle Tastaturen) auf iOS & macOS.
Entwicklung von lokalen, effizienten und batterieschonenden Deep-Learning-Sprachmodellen zur Verarbeitung und Generierung von Sätzen in morphologisch komplexen Sprachen mit dem Ziel der Unterstützung von Texteingabehilfen in iOS und macOS. Die implementierte Lösung war meine Idee und wurde mir in der Hauptverantwortung als Entwickler übertragen. Zu dem Projekt gehörten Datenvorverarbeitung, Trainung und Evaluation der Modelle (Long-Short-Term-Memory Neural Networks), Koordination mit Entwicklerteams der betroffenen Ebenen des Tech Stacks, sowie Qualitity Assessment des darauf basierenden finalen Produktes mit iterativen Optimierungszyklen. Die entwickelte Lösung war über viele Jahre auf Millionen von iOS- und macOS-Geräten im Einsatz und verbesserte die Benutzererfahrung bei der Texteingabe nachhaltig.

Verantwortungen:

  • Eigene Konzeption und Entwicklung der Lösung, die dann final auch in Produktion gegangen ist und viele Jahre auf iOS und macOS im Einsatz war.
  • Primärer Entwickler im Projekt
  • Erstellung von Evaluierungsmetriken und kontinuierliche Regressionstest
  • Laufende Integration in Alpha-Versionen von iOS und macOS zum Testen durch die QA Engineers
  • Koordination mit Teams anderer Software-Ebenen im Stack
  • Projektpräsentationen vor Vorgesetzten und final vor den Executives (Apple Machine Learning Summit 2018)
Apple internal Deep Learning Framework Deep Learning Edge AI Generative Models Machine Learning Natural Language Processing Git Linux Server macOS/iOS Bash/Make C++ Perl Python/Jupyter Neural Networks Software Architecture Statistical Methods

NLP Engineer

Sprachtechnologie-Unternehmen in München
01/2011 - 03/2012
Entwicklung einer Wörterbuch-Suchmaschine und eines Webcrawlers für Machine-Translation-Modelle.
Entwicklung einer Endkunden-Anwendung für ein phrasenvergleichendes Fremdwörterlexikon, das Wörter mit ihren Übersetzungen in realen Phrasenkontexten zur korrekten Verwendung zeigt. Programmierung eines bilingualen Webcrawlers zur Sammlung von vielfältigen und hochwertigen Trainingsdaten für statistische Modelle zur maschinellen Übersetzung. Dadurch konnten weitere Kunden für ein neues Produkt erschlossen und bestehende Hausprodukte verbessert werden.

Verantwortungen:

  • Eigenständige Entwicklung von Web-Anwendungen mit Java Server Applets
  • Programmierung von Webcrawlern und Scrapern
Information Retrieval Natural Language Processing Java Server Applets Java Swing Linux Server Perl

Forschung & Entwicklung

Dr. phil. Computational Linguistics
magna cum laude

Centrum für Informations- und Sprachverarbeitung (CIS) der Ludwig-Maximilians-Universität (LMU) in München · 2016

Assessment and Analysis of the Applicability of Recurrent Neural Networks to Natural Language Understanding with a Focus on the Problem of Coreference Resolution

Dissertationsforschung zur Anwendbarkeit rekurrenter neuronaler Netze in der maschinellen Sprachverarbeitung mit Schwerpunkt auf Koreferenzauflösung.
Generative Models Machine Learning Natural Language Processing Lua Torch Git Bash/Make Perl Computational Linguistics Formal & Vector Semantics Neural Networks Statistical Methods

Forschungspraktika

Apple Inc. in Cupertino, CA

Machine Learning Research Engineer

06/2015 - 09/2015
Training und Evaluierung von generativen Deep-Learning-Modellen (Recurrent Neural Networks in Tensorflow) für NLP-Anwendungen zur Verbesserung der statistischen Sprachmodellierung für Endkundenprodukte in iOS/macOS.

Machine Learning Research Engineer

07/2014 - 10/2014
Training und Evaluierung von generativen Deep-Learning-Modellen (Long Short-Term Memory Networks in Tensorflow) für NLP-Anwendungen zur Verbesserung der statistischen Sprachmodellierung für verschiedene Endkundenprodukte in iOS/macOS.

Language Engineer

05/2012 - 02/2013
Implementierung von computerlinguistischen Modulen in Java und Perl für die syntaktische Analyse von Spracheingaben des deutschen Siri-Assistenten.
Deep Learning Generative Models Machine Learning Natural Language Processing Tensorflow Linux Server Bash/Make C++ Java Perl Python/Jupyter Computational Linguistics Neural Networks Statistical Methods

Universitätsdozent

Centrum für Informations- und Sprachverarbeitung (CIS) der LMU in München
10/2009 - 09/2016
Universität in Paderborn & Bundeswehruniversität in München
09/2019 - 09/2020
Lehre und Forschung in den Grundlagen der Computerlinguistik und künstlichen Intelligenz.
Entwicklung und Durchführung von Lehrveranstaltungen zu den theoretischen und praktischen Grundlagen der maschinellen Sprachverarbeitung. Forschung zu grundlegenden linguistischen und kognitiven Annahmen in KI-Modellen. Dies vermittelt zukünftigen Fachkräften ein tiefes Verständnis der theoretischen Grundlagen und fördert eine kritische Auseinandersetzung mit KI-Technologien.

Verantwortungen:

  • Konzeption und Durchführung von Vorlesungen, Seminaren und Übungen
  • Erstellung von Lehrmaterialien und Prüfungsformaten
  • Betreuung von Studenten und Abschlussarbeiten
  • Forschung in formaler Semantik, Metapherntheorie und Sprachphilosophie
  • Entwicklung von NLP-Anwendungen für die Lehre
Generative Models Machine Learning Natural Language Processing PROLOG NLTK Scikit-learn Bash/Make Perl Python/Jupyter Computational Linguistics Neural Networks Statistical Methods

Student

Fakultät für Biologie der LMU in München
10/2020 - 08/2021
Ergänzendes Studium der Biologie zur Inspiration für neue KI-Algorithmen.
Studium zu meiner freien Forschung an (evolutions-)biologisch inspirierten Algorithmen zur maschinellen Sprachverarbeitung. Die hier gewonnenen interdisziplinären Einblicke bilden bis heute die Grundlage für meinen Perspektive auf moderne Sprachverarbeitungsalgorithmen und KI-Architekturen.

Verantwortungen:

  • Studium der Evolutionären Biologie
  • Studium der Molekular- & Zellbiologie
  • Studium der Ökologie
Ecology Evolutionary Biology Molecular & Cell Biology

Kontakt

Telefon / Signal

Standort

München, Deutschland

Vermittlungsplattformen

Kontaktkarte