Projekt Portfolio

Python Entwickler, Frontend und Backend

2023 Universität Köln (CECAD Imaging Facility)

Entwicklung eines Exporters für OMERO, eine Datenbank für biomedizinische Bilddaten

Aufgaben:

Erweiterung des Open Source Kommandozeilentools omero-cli-transfer, um Forschungsdaten aus der OMERO Datenbank in ARC Repositories zu übertragen.
Entwicklung einer Mapping-Spezifikation für die Übertragung von OMERO-Projekten in ARC-Repositorien.
Erweiterung des Web Frontends von OMERO, um ARC Metadaten anzuzeigen und Datenexport zu steuern.
Dokumentation

Werkzeuge:

PythonOMEROPostgresDjangoGitGithub ActionsDockerPytest

Python Entwickler, ML Engineer, KI Experte (Bildanalyse, Computer Vision)

2023 DZNE

Automatisierte Detektion von Nervenzellen in Mikroskopischen Bildern mit künstlicher Intelligenz.

Aufgaben:

Entwicklung eines Kommandozeilentools zur Deep Learning basierten Erkennung von Zellobjekten in großen Bilddateien (>10GB)
Entwicklung eines Workflows für die Nutzer zum Training eines individuellen Deep Learning Modells und zur Qualitätskontrolle
Beratung zur Optimierung der Datenmessung (Konfokale Mikroskopie).
Dokumentation

Werkzeuge:

PythonTensorflowScikit-Imageaicsimageiocellpose

Data Scientist

2023 Metallverarbeitende Industrie

Feature Ranking Analyse für eine industrielle Fertigungsanlage.

Aufgaben:

Datenimport
Datenbereinigung
Explorative Datenanalyse
Featureanalyse
Training von überwachten Machine Learning Modellen
Feature Ranking Analyse mit SHAP
Dokumentation

Werkzeuge:

PythonPandasScikit-LearnMachine Learning

Python Entwickler / Data Engineer

2023 DekaBank

Frontend und Backend Entwicklung einer Web Applikation für Portfolio Management.

Aufgaben:

Frontend und Backend Entwicklung mit Python und Javascript
Design und Implementierung einer klassenbasierten Softwarearchitektur im Backend
Design des Datemodells (hybrider Ansatz, relational und Json basiert), Implementierung von Test-, Staging- and Produktionsdatenbank
Dokumentation
Setup einer Continuous Integration Pipeline (Paketinstallation, Unit Tests, Pep8 checks, automatisierter Build der Dokumnetation)
Arbeit innerhalb eines interdisziplinären Teams aus Finanzexperten, Softwareentwicklern und Analysten

Werkzeuge:

PythonPlotly DashPydanticMypySphinxGitlabPandasMssqlPytestJavascript

Python Entwickler / Data Engineer

2022 DekaBank

Frontend und Backend Entwicklung einr Business Intelligence Web App.

Aufgaben:

Frontend und Backend Entwicklung
Entwicklung von Lösungen zum Zwischenspeichern von Daten zur schnellen Bereitstellung einer fragmentierten Datenbasis.
Handling und effektive Bereitstellung von Tabellen im Big Data Umfeld.
Entwicklung einer Business Intelligence Web App
Weiterentwicklung und Refaktorierung von Prototyp Skripten zu Produktionscode (Unit Tests, Continuous Integration...)
Arbeit innerhalb eines interdisziplinären Teams aus Finanzexperten, Softwareentwicklern und Analysten

Werkzeuge:

PythonGitlabPydanticMypyPlotly DashFlaskPandasMssqlMLflowPytestParquetJavascript

Data Scientist and Data Engineer

2021 Mitteständisches Großhandels- und Logistikunternehmen

Entwicklung von KI basierten Vorhersagemodellen

Design und Implementierung eines KI basierten Modells zur Vorhersage von Verkaufszahlen und Produktprovisionierung.

Aufgaben:

Konzeption eines Deep Learning Modells zur Vorhersage von Verkaufszahlen
Entwicklung von Datenmodellen und ETL Prozessen zur Vorverarbeitung der Rohdaten
Implementierung eines automatisierten Vorhersage Service basierend auf KI Modellen

Werkzeuge:

TensorflowPostgresMS SQL ServerPythonSqlalchemyAlembicDockerdocker-composegit

Data Engineer / Projektleitung

2020 Forschungseinrichtung

Konzeption und Implementierung einer Postgres Datenbank zum Datenmanagement einer Automationsanlage

Eine Automationsanlage produziert Sensordaten verschiedener Art, die zusammen mit diversen Metadaten in mathematische Vorhersagemodelle eingespeist werden. Messdaten und Metadaten sollen zentral in einer SQL Datenbank gespeichert werden. Das Projekt erfordert engen Austausch mit Mitarbeitern die die Automationsanlage betreiben und die Daten auswerten. Das interdiszipläre Team besteht aus Biologen, Chemikern, Technikern und Datenanalysten und Softwareentwicklern.

Aufgaben:

Projektmanagement
Entwicklung des Datenmodells in zahlreichen Workshops.
Erarbeitung der Import Spezifikationen in enger Zusammenarbeit mit den künftigen Nutzern.
Implementierung des Modells in Python/Sqlalchemy
Aufsetzen einer Postgres Testdatenbank mit docker-compose und Gitlab-CI
mplementierung von Importer Tools in Python.

Werkzeuge:

PostgresPythonSqlalchemyDockerdocker-composeGitlab-CI

Data Scientist / Python Entwickler

2019

Entwicklung einer Machine Learning Applikation zur Auswertung von Sensordaten.

Über einen Sensor innerhalb einer Messapparatur werden stark verrauschte Zeitreihendaten aufgezeichnet. In diesen Zeitreihen sollen sporadisch auftretende Events automatisch detektiert und charakterisiert werden. Zu diesem Zweck wurde eine Machine Learning Software mit MVC Architektur in Python implementiert. Die Software umfasst folgende Funktionalität: Filtern und Normalisieren der Rohdaten, Berechnung robuster Kennzahlen auf Grundlage der vorprozessierten Daten, Bereitstellung einer grafischen Benutzeroberfläche zur Darstellung der Daten und zur interaktiven Erstellung von Trainingsdatensätzen, Automatische Detektion der Events mit einem überwachten Machine Learning Verfahren, Export der Ergebnisdaten.

Werkzeuge:

PythonTkinterScikit-Learngit

Python Entwickler / Projektleitung / Experte Bildverarbeitung

2016

Entwicklung von YAPiC einer Open Source Software zur Analyse von biomedizinischen Bilddaten mit Hilfe von Deep Learning.

Aufgaben:

Projektmanagement
Konzeption und Algorithmenentwicklung
Präsentation der Software auf internationalen Tagungen
Deployment, Entwicklung von CI/CD Pipelines
Management der Weiterentwicklung des Tools durch die Open Source Community

Werkzeuge:

PythonTensorFlowTravis-CIGitHub

YAPiC Website

Data Scientist / Experte Bildverarbeitung

2017

Automatisierte Charakterisierung von Gewebeproben mittels Deep Learning

Im Rahmen eines medizinischen Forschungsprojektes wurden Gewebeproben mit einem automatisierten Mikroskop fotografiert. Auf Basis von Python und Tensorflow wurde eine Software entwickelt, um spezifische Zelltypen im Gewebe zu identifizieren und zu klassifizieren. Auf diese Weise konnten unterschiedliche Zelltypen für benutzerdefinierte Gewebe-Regionen automatisiert ausgezählt werden.

Werkzeuge:

PythonTensorFlowgit

Python Entwickler, DevOps

2018

Entwicklung einer parallelisierten Bildanalyse-Pipeline zur Verarbeitung massiver Bilddaten eines automatisierten Mikroskops.

Eine Automationsanlage innerhalb eines pharmazeutischen Labors produziert täglich Bilddaten im Terabyte Bereich. Auf Gundlage der CellProfiler software wurde eine Objekterkennung und Feature Berechnung implementiert, um strukturierte Daten aus den rohen Bilddaten zu gewinnen. Zum robusten Deployment auf einem in-house betriebenen CPU cluster wurde die Anwendung mit Docker containerisiert und mit SLURM orchestriert.

Aufgaben:

Definition der Spezifikationen in Zusammenarbeit mit den Domänen Experten
Planung und Anschaffung erforderlicher Hardware
Konzeption und Implementierung
Big Data handling

Werkzeuge:

PythonCellProfilerDockerSLURM

Data Scientist Wirkstoffforschung

2014

Medikamenten-Screening-Analyse einschließlich Feature Engineering, Clustering und Ranking-Analyse

Aufgaben:

Aufbau und Ausführung einer Bildanalyse-Pipeline zur automatischen Objekterkennung von bildbasierten Screening-Daten.
Verarbeitung und Auswahl von Features
Clustering-Analysen zur Identifizierung von Wirkstoffkandidatengruppen
Entwicklung von Ranking-Algorithmen zur Identifizierung von Medikamenten mit hohem Potenzial und geringer Toxizität
Big Data processing

Werkzeuge:

PythonCellProfilerPandasNumpyScipyScikitLearnApache Spark