Mit scikit-learn Modelle erstellen
Es gibt eine Fülle von Python-Bibliotheken, die speziell für den Einsatz im Bereich Machine Learning entwickelt wurden. Eine Bibliothek, die besonders für Einsteiger:innen gut geeignet ist, ist scikit-learn. Durch seine umfangreiche Sammlung von Funktionen und Algorithmen bietet scikit-learn eine solide Grundlage für das Anwenden verschiedener Datenverarbeitungsmethoden und Algorithmen. Die Bibliothek ist insbesondere eine gute Wahl für die Bearbeitung von Klassifikations- und Regressionsproblemen mit tabellarischen Daten.
In unseren Projekten wird und wurde scikit-learn bereits an vielen Stellen eingesetzt. Um Einsteiger:innen einen Überblick über die Möglichkeiten von scikit-learn zu geben, habe ich im kürzlichen erschienenen iX-Sonderheft „Künstliche Intelligenz“ einen Artikel zum Thema „Mit scikit-learn Modelle erstellen“ veröffentlicht. Das zugehörige Github-Repository zeigt am Beispiel einer Preisprognose von Gebrauchtfahrzeugen beispielhaft verschiedene Elemente von scikit-learn. Durch die Verwendung solcher Codeschnipsel und dem eventuellen Zusammenspiel mit einem generativen Sprachmodell, wie ChatGPT, können Interessierte einfach ihre ersten eigenen Machine Learning – Modelle entwickeln.
Alina Dallmann – Data Scientist