Data Science

  • Datenbereinigung
  • Normalisierung
  • Visalisierung
  • Statistische Analysen
  • Clustering
  • Überwachte Klassifizierung
  • Regression
  • Feature Engineering

Projekte aus diesem Bereich

  • Python Entwickler, ML Engineer, KI Experte (Bildanalyse, Computer Vision)
    2023 DZNE

    Automatisierte Detektion von Nervenzellen in Mikroskopischen Bildern mit künstlicher Intelligenz.

    Aufgaben:
    • Entwicklung eines Kommandozeilentools zur Deep Learning basierten Erkennung von Zellobjekten in großen Bilddateien (>10GB)
    • Entwicklung eines Workflows für die Nutzer zum Training eines individuellen Deep Learning Modells und zur Qualitätskontrolle
    • Beratung zur Optimierung der Datenmessung (Konfokale Mikroskopie).
    • Dokumentation

    Werkzeuge:
    PythonTensorflowScikit-Imageaicsimageiocellpose

  • Data Scientist
    2023 Metallverarbeitende Industrie

    Feature Ranking Analyse für eine industrielle Fertigungsanlage.

    Aufgaben:
    • Datenimport
    • Datenbereinigung
    • Explorative Datenanalyse
    • Featureanalyse
    • Training von überwachten Machine Learning Modellen
    • Feature Ranking Analyse mit SHAP
    • Dokumentation

    Werkzeuge:
    PythonPandasScikit-LearnMachine Learning

  • Data Scientist and Data Engineer
    2021 Mitteständisches Großhandels- und Logistikunternehmen

    Entwicklung von KI basierten Vorhersagemodellen

    Design und Implementierung eines KI basierten Modells zur Vorhersage von Verkaufszahlen und Produktprovisionierung.

    Aufgaben:
    • Konzeption eines Deep Learning Modells zur Vorhersage von Verkaufszahlen
    • Entwicklung von Datenmodellen und ETL Prozessen zur Vorverarbeitung der Rohdaten
    • Implementierung eines automatisierten Vorhersage Service basierend auf KI Modellen

    Werkzeuge:
    TensorflowPostgresMS SQL ServerPythonSqlalchemyAlembicDockerdocker-composegit

  • Python Entwickler / Projektleitung / Experte Bildverarbeitung
    2016

    Entwicklung von YAPiC einer Open Source Software zur Analyse von biomedizinischen Bilddaten mit Hilfe von Deep Learning.

    Aufgaben:
    • Projektmanagement
    • Konzeption und Algorithmenentwicklung
    • Präsentation der Software auf internationalen Tagungen
    • Deployment, Entwicklung von CI/CD Pipelines
    • Management der Weiterentwicklung des Tools durch die Open Source Community

    Werkzeuge:
    PythonTensorFlowTravis-CIGitHub

    YAPiC Website
  • Data Scientist / Experte Bildverarbeitung
    2017

    Automatisierte Charakterisierung von Gewebeproben mittels Deep Learning

    Im Rahmen eines medizinischen Forschungsprojektes wurden Gewebeproben mit einem automatisierten Mikroskop fotografiert. Auf Basis von Python und Tensorflow wurde eine Software entwickelt, um spezifische Zelltypen im Gewebe zu identifizieren und zu klassifizieren. Auf diese Weise konnten unterschiedliche Zelltypen für benutzerdefinierte Gewebe-Regionen automatisiert ausgezählt werden.

    Werkzeuge:
    PythonTensorFlowgit

  • Data Scientist Wirkstoffforschung
    2014

    Medikamenten-Screening-Analyse einschließlich Feature Engineering, Clustering und Ranking-Analyse

    Aufgaben:
    • Aufbau und Ausführung einer Bildanalyse-Pipeline zur automatischen Objekterkennung von bildbasierten Screening-Daten.
    • Verarbeitung und Auswahl von Features
    • Clustering-Analysen zur Identifizierung von Wirkstoffkandidatengruppen
    • Entwicklung von Ranking-Algorithmen zur Identifizierung von Medikamenten mit hohem Potenzial und geringer Toxizität
    • Big Data processing

    Werkzeuge:
    PythonCellProfilerPandasNumpyScipyScikitLearnApache Spark