Projekt Portfolio

  • Python Entwickler, Frontend und Backend
    2023 Universität Köln (CECAD Imaging Facility)

    Entwicklung eines Exporters für OMERO, eine Datenbank für biomedizinische Bilddaten

    Aufgaben:
    • Erweiterung des Open Source Kommandozeilentools omero-cli-transfer, um Forschungsdaten aus der OMERO Datenbank in ARC Repositories zu übertragen.
    • Entwicklung einer Mapping-Spezifikation für die Übertragung von OMERO-Projekten in ARC-Repositorien.
    • Erweiterung des Web Frontends von OMERO, um ARC Metadaten anzuzeigen und Datenexport zu steuern.
    • Dokumentation

    Werkzeuge:
    PythonOMEROPostgresDjangoGitGithub ActionsDockerPytest

  • Python Entwickler, ML Engineer, KI Experte (Bildanalyse, Computer Vision)
    2023 DZNE

    Automatisierte Detektion von Nervenzellen in Mikroskopischen Bildern mit künstlicher Intelligenz.

    Aufgaben:
    • Entwicklung eines Kommandozeilentools zur Deep Learning basierten Erkennung von Zellobjekten in großen Bilddateien (>10GB)
    • Entwicklung eines Workflows für die Nutzer zum Training eines individuellen Deep Learning Modells und zur Qualitätskontrolle
    • Beratung zur Optimierung der Datenmessung (Konfokale Mikroskopie).
    • Dokumentation

    Werkzeuge:
    PythonTensorflowScikit-Imageaicsimageiocellpose

  • Data Scientist
    2023 Metallverarbeitende Industrie

    Feature Ranking Analyse für eine industrielle Fertigungsanlage.

    Aufgaben:
    • Datenimport
    • Datenbereinigung
    • Explorative Datenanalyse
    • Featureanalyse
    • Training von überwachten Machine Learning Modellen
    • Feature Ranking Analyse mit SHAP
    • Dokumentation

    Werkzeuge:
    PythonPandasScikit-LearnMachine Learning

  • Python Entwickler / Data Engineer
    2023 DekaBank

    Frontend und Backend Entwicklung einer Web Applikation für Portfolio Management.

    Aufgaben:
    • Frontend und Backend Entwicklung mit Python und Javascript
    • Design und Implementierung einer klassenbasierten Softwarearchitektur im Backend
    • Design des Datemodells (hybrider Ansatz, relational und Json basiert), Implementierung von Test-, Staging- and Produktionsdatenbank
    • Dokumentation
    • Setup einer Continuous Integration Pipeline (Paketinstallation, Unit Tests, Pep8 checks, automatisierter Build der Dokumnetation)
    • Arbeit innerhalb eines interdisziplinären Teams aus Finanzexperten, Softwareentwicklern und Analysten

    Werkzeuge:
    PythonPlotly DashPydanticMypySphinxGitlabPandasMssqlPytestJavascript

  • Python Entwickler / Data Engineer
    2022 DekaBank

    Frontend und Backend Entwicklung einr Business Intelligence Web App.

    Aufgaben:
    • Frontend und Backend Entwicklung
    • Entwicklung von Lösungen zum Zwischenspeichern von Daten zur schnellen Bereitstellung einer fragmentierten Datenbasis.
    • Handling und effektive Bereitstellung von Tabellen im Big Data Umfeld.
    • Entwicklung einer Business Intelligence Web App
    • Weiterentwicklung und Refaktorierung von Prototyp Skripten zu Produktionscode (Unit Tests, Continuous Integration...)
    • Arbeit innerhalb eines interdisziplinären Teams aus Finanzexperten, Softwareentwicklern und Analysten

    Werkzeuge:
    PythonGitlabPydanticMypyPlotly DashFlaskPandasMssqlMLflowPytestParquetJavascript

  • Data Scientist and Data Engineer
    2021 Mitteständisches Großhandels- und Logistikunternehmen

    Entwicklung von KI basierten Vorhersagemodellen

    Design und Implementierung eines KI basierten Modells zur Vorhersage von Verkaufszahlen und Produktprovisionierung.

    Aufgaben:
    • Konzeption eines Deep Learning Modells zur Vorhersage von Verkaufszahlen
    • Entwicklung von Datenmodellen und ETL Prozessen zur Vorverarbeitung der Rohdaten
    • Implementierung eines automatisierten Vorhersage Service basierend auf KI Modellen

    Werkzeuge:
    TensorflowPostgresMS SQL ServerPythonSqlalchemyAlembicDockerdocker-composegit

  • Data Engineer / Projektleitung
    2020 Forschungseinrichtung

    Konzeption und Implementierung einer Postgres Datenbank zum Datenmanagement einer Automationsanlage

    Eine Automationsanlage produziert Sensordaten verschiedener Art, die zusammen mit diversen Metadaten in mathematische Vorhersagemodelle eingespeist werden. Messdaten und Metadaten sollen zentral in einer SQL Datenbank gespeichert werden. Das Projekt erfordert engen Austausch mit Mitarbeitern die die Automationsanlage betreiben und die Daten auswerten. Das interdiszipläre Team besteht aus Biologen, Chemikern, Technikern und Datenanalysten und Softwareentwicklern.

    Aufgaben:
    • Projektmanagement
    • Entwicklung des Datenmodells in zahlreichen Workshops.
    • Erarbeitung der Import Spezifikationen in enger Zusammenarbeit mit den künftigen Nutzern.
    • Implementierung des Modells in Python/Sqlalchemy
    • Aufsetzen einer Postgres Testdatenbank mit docker-compose und Gitlab-CI
    • mplementierung von Importer Tools in Python.

    Werkzeuge:
    PostgresPythonSqlalchemyDockerdocker-composeGitlab-CI

  • Data Scientist / Python Entwickler
    2019

    Entwicklung einer Machine Learning Applikation zur Auswertung von Sensordaten.

    Über einen Sensor innerhalb einer Messapparatur werden stark verrauschte Zeitreihendaten aufgezeichnet. In diesen Zeitreihen sollen sporadisch auftretende Events automatisch detektiert und charakterisiert werden. Zu diesem Zweck wurde eine Machine Learning Software mit MVC Architektur in Python implementiert. Die Software umfasst folgende Funktionalität: Filtern und Normalisieren der Rohdaten, Berechnung robuster Kennzahlen auf Grundlage der vorprozessierten Daten, Bereitstellung einer grafischen Benutzeroberfläche zur Darstellung der Daten und zur interaktiven Erstellung von Trainingsdatensätzen, Automatische Detektion der Events mit einem überwachten Machine Learning Verfahren, Export der Ergebnisdaten.

    Werkzeuge:
    PythonTkinterScikit-Learngit

  • Python Entwickler / Projektleitung / Experte Bildverarbeitung
    2016

    Entwicklung von YAPiC einer Open Source Software zur Analyse von biomedizinischen Bilddaten mit Hilfe von Deep Learning.

    Aufgaben:
    • Projektmanagement
    • Konzeption und Algorithmenentwicklung
    • Präsentation der Software auf internationalen Tagungen
    • Deployment, Entwicklung von CI/CD Pipelines
    • Management der Weiterentwicklung des Tools durch die Open Source Community

    Werkzeuge:
    PythonTensorFlowTravis-CIGitHub

    YAPiC Website
  • Data Scientist / Experte Bildverarbeitung
    2017

    Automatisierte Charakterisierung von Gewebeproben mittels Deep Learning

    Im Rahmen eines medizinischen Forschungsprojektes wurden Gewebeproben mit einem automatisierten Mikroskop fotografiert. Auf Basis von Python und Tensorflow wurde eine Software entwickelt, um spezifische Zelltypen im Gewebe zu identifizieren und zu klassifizieren. Auf diese Weise konnten unterschiedliche Zelltypen für benutzerdefinierte Gewebe-Regionen automatisiert ausgezählt werden.

    Werkzeuge:
    PythonTensorFlowgit

  • Python Entwickler, DevOps
    2018

    Entwicklung einer parallelisierten Bildanalyse-Pipeline zur Verarbeitung massiver Bilddaten eines automatisierten Mikroskops.

    Eine Automationsanlage innerhalb eines pharmazeutischen Labors produziert täglich Bilddaten im Terabyte Bereich. Auf Gundlage der CellProfiler software wurde eine Objekterkennung und Feature Berechnung implementiert, um strukturierte Daten aus den rohen Bilddaten zu gewinnen. Zum robusten Deployment auf einem in-house betriebenen CPU cluster wurde die Anwendung mit Docker containerisiert und mit SLURM orchestriert.

    Aufgaben:
    • Definition der Spezifikationen in Zusammenarbeit mit den Domänen Experten
    • Planung und Anschaffung erforderlicher Hardware
    • Konzeption und Implementierung
    • Big Data handling

    Werkzeuge:
    PythonCellProfilerDockerSLURM

  • Data Scientist Wirkstoffforschung
    2014

    Medikamenten-Screening-Analyse einschließlich Feature Engineering, Clustering und Ranking-Analyse

    Aufgaben:
    • Aufbau und Ausführung einer Bildanalyse-Pipeline zur automatischen Objekterkennung von bildbasierten Screening-Daten.
    • Verarbeitung und Auswahl von Features
    • Clustering-Analysen zur Identifizierung von Wirkstoffkandidatengruppen
    • Entwicklung von Ranking-Algorithmen zur Identifizierung von Medikamenten mit hohem Potenzial und geringer Toxizität
    • Big Data processing

    Werkzeuge:
    PythonCellProfilerPandasNumpyScipyScikitLearnApache Spark