Einführung in Unittesting mit Python für Data Scientists
Wer selbst Code schreibt, weiß, dass es sehr einfach ist, (unbeabsichtigte) Fehler in seinen Code einzubauen. Damit diese Fehler bestenfalls in keinem Produktivsystem landen oder Analyse-Ergebnisse verfälschen, ist es in der Softwareentwicklung üblich, Fehler bestmöglich durch Unittests abzufangen. Aus unserer praktischen Erfahrung heraus können wir bestätigen, dass Unittests auch in der Data Science sinnvoll sind, um eine hohe Codequalität bei Anwendungen zu erreichen.
Daher haben wir ein Tutorial geschrieben, welches den Einstieg in das Unittesten mit Python, besonders für Data Scientists, erleichtern soll:
In diesem Artikel geht es vor allem um folgende Themen:
- Warum und wann Unittests im Data Science-Kontext eingesetzt werden sollten
- Verschiedene Unittesting-Prinzipien im Detail, jeweils mit konkreten Codebeispielen aus der Datenverarbeitung
- Best Practices aus unseren eigenen Projekterfahrungen
Weiterhin enthält der Artikel viele weitere Links zur Vertiefung von bestimmten Themen.
Die Autorinnen
Alina Dallmann, Florence Lopez und Lena Trautmann