scieneers blog

PyData 2025

5. September 2025

Drei Tage voller Talks, Tutorials und Tech-Community-Spirit – das war die PyData Berlin 2025 im bcc Berlin Congress Center. Im Fokus standen Open-Source-Tools, Agentic AI und die Frage: Wie lassen sich LLMs produktiv und kontrolliert einsetzen? Wir von scieneers waren mit einem Vortrag zu LiteLLM vertreten – „One API to Rule Them All? LiteLLM in Production“.

Machine Learning Workflow zur Bewertung genetischer Varianten auf Basis von Proteinstruktur Embeddings

5. August 2025

Missense-Varianten, also einzelne Aminosäureaustausche im Protein, sind oft schwer zu bewerten. Unser Machine-Learning-Workflow nutzt proteinstrukturbasierte Graph-Embeddings, um die Pathogenität solcher Varianten vorherzusagen. Dabei verbessern die strukturellen Informationen bestehende Ansätze wie den CADD-Score und bieten neue Einblicke für die genommedizinische Diagnostik.

Rückblick auf unser Frühlingsevent 2025

4. Juni 2025

Zwei Tage lang haben sich die meisten Kolleginnen und Kollegen aus Karlsruhe, Köln und Hamburg in Hamburg getroffen, um sich über fachliche und interne Themen auszutauschen, neue Impulse zu erhalten und gemeinsame Erlebnisse zu teilen.

Microsoft Fabric: Mit Eventstreams Echtzeitdaten verarbeiten

3. Juni 2025

Wir geben einen Überblick zur Verarbeitung von Echtzeitdaten mit Eventstreams in Microsoft Fabric.

Real-Time Intelligence: Echtzeitdaten in Microsoft Fabric

23. Mai 2025

Mit Real-Time Intelligence in Microsoft Fabric lassen sich Datenströme blitzschnell auswerten. Wir geben einen kompakten Überblick und erklären, was dahintersteckt.

M3 2025

21. Mai 2025

Auf der diesjährigen Minds Mastering Machines (M3) Konferenz in Karlsruhe standen neben Best Practices zu GenAI, RAG-Systemen auch Praxisberichte aus verschiedenen Branchen, Agentensysteme und LLM sowie rechtliche Aspekte von ML im Fokus. Wir haben drei Vorträge zu unseren Projekten gehalten.

Wärmebedarf prognostizieren mit Temporal Fusion Transformern

7. Mai 2025

Globale Modelle wie TFT und TimesFM revolutionieren die Fernwärmeprognose, indem sie präzisere Vorhersagen ermöglichen, Synergien zwischen Systemen nutzen und das Cold-Start-Problem effektiv lösen.

Kleinere Docker Images mit uv

2. April 2025

Die Größe von Docker-Images durch intelligentes Abhängigkeitsmanagement und Optimierungstechniken reduzieren, wie z. B. die Verwendung von deptry", um unbenutzte Bibliotheken zu bereinigen, die Verwendung alternativer Indizes für reine CPU-Pakete und die Erstellung effizienter Docker-Dateien mit uv"-Beispielen. Außerdem gibt es einen Tipp für Azure WebApp-Deployments.

Microsoft Fabric Webinar 2025

10. März 2025

In unseren Webinaren: Microsoft Fabric Einführung und Microsoft Fabric - Echtzeit-Dashboards mit KQL-Terminen lernen Sie Fabric kennen.

Mit Scrum erfolgreich sein in Forschung und Entwicklung

7. März 2025

Erfolg in Forschung und Entwicklung (F&E) mit Scrum hängt von effektiver Wissensgewinnung und -verwertung ab. Spikes als Methode zur Risikominimierung in Scrum spielen dabei eine zentrale Rolle. Der Artikel diskutiert, wie Spikes effizient eingesetzt, priorisiert und dokumentiert werden können, und präsentiert bewährte Praktiken aus einem R&D-Projekt, darunter regelmäßige Spike-Pflegetermine und ein Laborbuch für Erkenntnisse, ergänzt durch angepasste Definitionen von Ready und Done.

Microsoft Fabric Deployment

26. Februar 2025

Microsoft Fabric ist eine dynamische Plattform für Datenanalyse und -entwicklung, die sowohl für Power-BI-Nutzer als auch für IT-Experten maßgeschneiderte Lösungen bietet. Dieser Blogpost diskutiert Entwicklungsmöglichkeiten, Kollaborationswerkzeuge und Deployment-Szenarien, inklusive der Nutzung von Fabric's GUI, lokalen Client-Tools und Git-Integrationen. Es werden außerdem verschiedene Deployment-Strategien erläutert, die von einfachen Fabric Deployment Pipelines bis hin zu komplexeren branch-basierten Deployments reichen, um den Anforderungen verschiedenster Workloads gerecht zu werden.

DesinfoNavigator

21. Februar 2025

DesinfoNavigator ist ein Online-Tool, das Nutzer beim Erkennen von Desinformation unterstützt, indem es Texte auf irreführende rhetorische Strategien untersucht. Es basiert auf dem PLURV-Framework und verwendet ein großes Sprachmodell, um Indizien für Desinformation zu identifizieren und Handlungsanweisungen zur Überprüfung zu generieren. Es ergänzt Faktenchecks, ist kostenlos und fördert kritisches Denken im Umgang mit Informationen.

Benefits bei scieneers

31. Januar 2025

Scieneers bietet ein attraktives Arbeitsumfeld mit flexiblen Arbeitszeiten, Home-Office, Kita-Zuschuss, Mitarbeiter-Events, Weiterbildungsbudgets, Mitarbeiterbeteiligung, betrieblicher Altersvorsorge und moderner Technik. Inklusion, Transparenz und Nachhaltigkeit prägen die Firmenkultur, die Diversität und Teamgeist fördert.

KI trifft Datenschutz: Unsere ChatGPT-Lösung für Unternehmenswissen

18. Dezember 2024

Unsere ChatGPT-Lösung ermöglicht es Unternehmen, firmeninternes Wissen sicher und datenschutzkonform zu nutzen. Mittels eines modularen Systems, das auf unternehmensspezifische Datenquellen wie SharePoint und OneDrive zugreift, können Mitarbeiter schnell und einfach auf Informationen zugreifen. Die Lösung bietet personalisierte Budgetverwaltung, sichere Authentifizierung und eine anpassbare Benutzeroberfläche, inklusive Feedback-Mechanismen für kontinuierliche Verbesserungen.

Wie Studierende von LLMs und Chatbots profitieren können

8. November 2024

In der Hochschulbildung revolutionieren Large Language Models (LLMs) und Retrieval Augmented Generation (RAG) das Lernen. Ein Projekt der Universität Leipzig zeigt den Erfolg von KI-Tutoren im Jura-Studium, die personalisierte Antworten bieten und auf Ressourcen verweisen. Vorteile für Studierende und Lehrende sind maßgeschneiderte Unterstützung und effiziente Lehrmaterialentwicklung, trotz Herausforderungen wie Ressourcenbedarf und Antwortqualität. Azure und OpenAI unterstützen mit sicherer Infrastruktur.

KI für das Gemeinwohl auf dem Digital-Gipfel 2024

31. Oktober 2024

Wir durften unser durch den Civic Coding-Accelerator gefördertes LLM-Projekt StaatKlar an Tag 2 des Digital-Gipfels 2024 vorstellen. Für alle Neugierigen hier eine kurze Zusammenfassung unseres Projekts und des Gipfels.

Der Einsatz von VideoRAG für den Wissenstransfer im Unternehmen

23. Oktober 2024

VideoRAG bietet einen innovativen Ansatz zur Überbrückung von Wissenslücken in Unternehmen, indem Video- und Textdaten mit Hilfe von generativer KI und Retrieval-Augmentation in eine durchsuchbare Wissensdatenbank umgewandelt werden. Es gewährleistet einen effizienten Transfer von nuanciertem Wissen, einschließlich des impliziten Wissens erfahrener Mitarbeiter, über KI-basierte Chatbots und macht es so auch jüngeren Generationen innerhalb der Belegschaft zugänglich.

Data Factory in Fabric – the good, the bad and the ugly

14. Oktober 2024

Data Factory in Fabric – das Gute, das Schlechte und das Hässliche: Vorträge auf SQL Konferenzen zeigen Entwicklungen der Microsoft Fabric Data Factory auf. Vorteile wie erweiterte Features und einfache Migration werden ebenso besprochen wie Herausforderungen, darunter mangelnde Effizienz bei kleinen Projekten und technische Mängel. Microsoft arbeitet an Verbesserungen dieser vielversprechenden Technologie.

Multi-Agenten LLM auf der Data2Day

24. September 2024

Auf der Data2Day Konferenz durften wir dieses Jahr zusammen mit Bertelsmann unser Multi-Agenten-LLM Projekt vorstellen. Für alle die nicht dabei waren, hier eine kleine Zusammenfassung unseres Vortrags und der sonstigen Konferenz-Highlights.

Logic App API Connections – Herausforderungen und Lösungswege in der Verwaltung

20. September 2024

API-Connections sind entscheidend für Azure Logic Apps, um externe Dienste zu integrieren. Die Erstellung kann Verwaltungsherausforderungen mit unklaren Ressourcennamen mit sich bringen. Lösungswege umfassen manuelles Umbenennen über ARM-Templates und Automatisierung mit PowerShell, um die Verwaltung effizienter zu gestalten und die Einbindung in CI/CD-Prozesse zu erleichtern.

Diversity als Chance ➯ scieneers & Charta der Vielfalt

12. September 2024

Wir, bei scieneers GmbH, verstehen die Rolle, die Diversity in der Arbeitswelt spielt und haben entsprechend die Charta der Vielfalt unterzeichnet.

European Society of Human Genetics

Einblicke in die European Society of Human Genetics Konferenz 2024

11. Juni 2024

Einblicke in die European Society of Human Genetics (ESHG) 2024 - eine beeindruckende, hybriden Veranstaltung, die Tausende von Besuchern aus aller Welt anlockte.

Man sieht ein Bild des gesamten scieneers-Teams. Menschen stehen auf einer großen, ausladenden Treppe und schauen alle in die Kamera.

Diversität bei scieneers

28. Mai 2024

Am 28.05. ist der Deutsche Diversity Tag, der von dem Charta der Vielfalt e.V. initiiert wurde. Für uns scieneers hat Vielfalt einen sehr hohen Stellenwert und bildet das Fundament für den Umgang untereinander und mit unseren Kund:innen. Deswegen haben wir uns dazu entschieden, die Charta der Vielfalt zu unterschreiben und damit unsere Diversitätsstrategie weiter auszubauen.

dpunkt.verlag GmbH

M3 2024

26. April 2024

Auf der diesjährigen Minds Mastering Machines (M3) Konferenz in Köln standen neben den neuesten Trends im Bereich Machine Learning besonders Sprachmodelle (LLM), aber auch der AI Act, AI Fairness und automatische Datenintegration im Fokus. Wir waren mit zwei talks zu unseren Projekten beteiligt.

NextGeneration:AI – Innovation trifft Datenschutz

23. April 2024

Zusammen mit der Carl Remigius Fresenius Education Group (CRFE) entwickelten wir NextGeneration:AI. Dabei handelt es sich um eine datenschutzkonforme Plattform zur Nutzung von Sprachmodellen für alle Studierende und Mitarbeitende der CRFE. Das besondere an NextGeneration:AI ist die Authentifizierung über das Learning Management System Ilias mit Hilfe einer LTI-Schnittstelle, sowie die umfassende Personalisierbarkeit, die Nutzer:innen geboten wird. Im Blogartikel gehen wir auf die Details der Implementierung ein.

Multi-Agenten-LLM-Systeme kontrollieren mit LangGraph

28. März 2024

Im zweiten Teil der Reihe zu Multi-Agenten-Systemen werfen wir einen Blick auf LangGraph auf dem LangChain Ökosystem. LangGraph ermöglicht eine dynamische Kommunikation der Agenten die Mittels eines Graphen modelliert wird. Der Artikel vergleicht außerdem LangGraph mit AutoGen mit Blick auf Projektstatus, Nachrichtenfluss, Usability und Produktreife.

Eine Einführung in Multi-Agent-AI mit AutoGen

24. März 2024

Der Blogpost diskutiert die Anwendung von Multi-Agenten-Systemen in der Künstlichen Intelligenz und ihre Implementierung mit Autogen, einem Framework für solche Systeme. Es werden die Bausteine von Multi-Agenten-Systemen erläutert und der Nutzen von mehreren, spezialisierten Agenten in bestimmten Aufgabenbereichen aufgezeigt. Das Konzept und die Verwendung von Autogen werden im Detail beleuchtet. Ebenfalls thematisiert werden die Herausforderungen bei der Steuerung von Informationsflüssen und die Notwendigkeit von spezialisierten Tools.

Power BI Sicherheit: Wie Power Apps die Verwaltung von Row-Level-Security auf das nächste Level hebt

19. März 2024

Das Konzept der Row-Level-Security (RLS) in Power BI ermöglicht die Kontrolle des Datenzugriffs auf Zeilenebene. Dieser Artikel erklärt die Implementierung von RLS und die damit verbundenen Herausforderungen. Es wird eine Lösung durch die Entwicklung von Security-Tabellen und die Pflege über eine grafische Oberfläche wie Power Apps vorgestellt, die eine effiziente und fehlerfreie Verwaltung von Zugriffsrechten ermöglicht.

Die fünf Schritte des Power BI-Workflows: Ein praktischer Leitfaden mit Tipps

6. März 2024

In einer datengetriebenen Welt, in der die Entscheidungsfindung auf der Analyse von Daten beruht, ist das Konzept der Self-Service-Business Intelligence (BI) sehr wertvoll. Mit der Fülle an Informationen, die Unternehmen täglich sammeln, ist es ein entscheidender Vorteil für Mitarbeitende, selbstständig und auf einfache Art datengestützte Einsichten zu generieren. Hier kommt Power BI ins Spiel, ein leistungsstarkes Business Intelligence -Tool von Microsoft. Dieser Blog-Artikel stellt den typischen Power BI-Workflow in fünf Schritten vor, beschreibt die Umsetzung im Detail und gibt Tipps für jeden Schritt.

Erforschung des Dark Genome mit Machine Learning zur Entwicklung neuartiger Krankheitsinterventionen

29. Februar 2024

350 Millionen, fast 5% der Weltbevölkerung leben mit einer seltenen Erkrankung. Etwa 75% der seltenen Erkrankungen betreffen Kinder. 80% dieser Erkrankungen entstehen durch eine einzige genetische Veränderung und können durch eine Genomanalyse diagnostiziert werden. Das menschliche Genom besteht aus etwa 3.3 Milliarden Bausteinen und jeder Mensch trägt etwa 3.5 Millionen Varianten. Die Suche nach der einen, pathogenen Variante, als Ursache der Krankheit, gleicht der Suche nach der Nadel im Heuhaufen.

Personalisierte Stellenausschreibungen durch LLMs auf Grundlage einer Personenbeschreibung

5. Februar 2024

In unserem Blogartikel zur Individualisierung von Konferenz-Programmen durch LLMs zeigen wir bereits einen Anwendungsfall von Textpersonalisierung durch den Einsatz von LLMs. Neben dem Individualisieren von Konferenz-Programmen anhand gegebener Interessen und Kenntnisse existieren weitere Anwendungsfälle im Bereich der personalisierten Generierung von Text. Daher haben wir die Personalisierung von Stellenausschreibungen durch LLMs anhand einer kurzen Personenbeschreibung getestet.

IT-Tage 2023

23. Januar 2024

Erstmals durften wir bei den IT-Tagen 2023 im Dezember in Frankfurt dabei sein. Die Konferenz bietet einen vielfältigen Einblick in die IT-Welt, von Software-Architektur über Agile-Praktikten bis zum zu großen Sprachmodellen. Wir trugen mit zwei Vorträgen zu Unit-Testing und Personalisierung mit LLMs spannende Themen für Data Scientists bei.

User sitting in front of a pc with privacy shield

rwthGPT – Eine datenschutzkonforme Plattform für OpenAI-Modelle

2. Dezember 2023

Zusammen mit der RWTH Aachen University haben wir rwthGPT entwickelt: Eine datenschutzkonforme Plattform zur Nutzung von OpenAI-Modellen für Studierende und Mitarbeitende. Ergänzt wird rwthGPT durch ein dediziertes User-Management mit Kostenzuordnung, das Speichern von Chat-Verläufen und Talk to your Data. Wir werfen einen detaillierten Blick auf die Datenschutz-relevanten Aspekte.

data2day 2023

2. Dezember 2023

Auf der data2day 2023 im Oktober in Karlsruhe wurden die neuesten Datenanalyse-Technologien anhand von Datenprojekten diskutiert. Neben Data Mesh und großen Sprachmodellen (LLMs) stellten Martin Danner und Jan Höllmer scieneers-Projekte mit Temporal Fusion Transformer (TFT) zu Prognose und Anomalie-Erkennung bei Iqony vor.

Data Platform auf Azure – aber bitte sicher!

15. November 2023

Viele Unternehmen nutzen inzwischen die Azure Data Services für Data Management und Analytics Aufgaben oder planen den Umstieg auf Microsofts Cloud Platform. Viele Gründe wie Betriebskosten und Skalierbarkeit sprechen dafür, aber wie ist es um die Sicherheit bestellt? In dem Vortrag schauen wir uns an, welche Mechanismen auf Azure zum sicheren Datenaustausch genutzt werden können. wie der Datenzugriff von Dienste- bis bis auf Datenebene für Endbenutzer konfiguriert werden kann und welche Möglichkeiten es gibt, die Services netzwerktechnisch sicher zu verbinden und gleichzeitig vor unerwünschten Besuchern abzuschotten.

Optimize an AI Powered Recommendation Engine

29. September 2023

scieneers, Intel Corporation, and Von Rundstedt joined forces to optimize an AI powered recommendation engine solution that leverages the Intel® AI Analytics Toolkit and 4th Generation Intel® Xeon® Scalable Processors. In this brief experience report we demonstrate how we managed to achieve up to 9.3X speedup when running on 4th Generation Intel® Xeon® Scalable Processors compared to the baseline configuration. This means that the solution can process more data faster, generate more accurate recommendations, and serve more users with lower latency and cost.

House containing multiple shops connected by an information line

LLMs und Cloud-Technologien zur Vernetzung von Onlineshops der Otto-Gruppe

16. September 2023

Large Language Models (LLMs) sind wegen ihrer vielfältigen Anwendungen in aller Munde. Auch im E-Commerce Bereich ist diese Technologie sehr nützlich. Zusammen mit der data.works GmbH haben wir sogenannte Embedding-Modelle aus dem LLM-Bereich mit der Vertex AI Matching Engine in der Google Cloud für mehrere Onlineshops der Otto-Gruppe eingesetzt, um kundenspezifische Produktempfehlungen aus einem Shop auf viele andere Shops übertragen zu können. Und das, obwohl sich die Sortimente und Kataloge dieser Shops stark unterscheiden.

Drawing of a district heating plant

Wärmebedarf prognostizieren mit Temporal Fusion Transformern

30. August 2023

Zusammen mit Iqony haben wir den Einsatz von Temporal Fusion Transformern zur Bedarfsprognose in der Fernwärme getestet. Durch Data Fusion können die Vorhersagen von mehreren Standorten in einem Modell vereint und vor allem die Vorhersagegenauigkeit von Standorten mit wenig Daten gesteigert werden. Die Quantisierung von Vorhersageunsicherheiten und die Interpretierbarkeit des Modells schaffen Vertrauen und unterstützen die Entscheidungsfindung.

Girl standing in front of a big shelf full of books

Moodle Chatbot – KI als persönlicher Uni-Dozent

17. August 2023

Zusammen mit der RWTH Aachen haben wir einen Chatbot entwickelt, der einen nahtlosen Zugang zu Vorlesungsinhalten für Studierende und Mitarbeitende direkt in der Lernplattform Moodle ermöglicht. Somit können themenspezifische Fragen mit Inhalten aus einer Vorlesung beantwortet werden. Eine zusätzliche Quellenangabe erlaubt außerdem das schnelle Finden der relevanten Vorlesungsinhalte in den Unterlagen.

KI-basierte Textanalyse für die Energiewirtschaft

14. August 2023

Künstliche Intelligenz (KI) erfährt durch ChatGPT derzeit enorme Aufmerksamkeit. Abseits vom Hype haben die aktuellsten Entwicklungen die Verarbeitung von Sprache und Texten auf ein neues Niveau gehoben. In diesem Artikel wollen wir Ihnen zeigen, was ChatGPT & Co. im Kontext der Energiewirtschaft wirklich leisten können, was das Neue daran ist und wie man diese Tools in der Praxis einsetzen kann.

Offshore windpark

Anomalieerkennung bei Windkraftanlagen mit Temporal Fusion Transformern für Iqony

10. August 2023

Transformer-Architekturen haben sich als bahnbrechend im Bereich des Natural Language Processing erwiesen. Temporal Fusion Transformer nutzen diese Architektur für die Prognose von Zeitreihen und bieten dabei gegenüber klassischen Modellen Vorteile wie z.B. hohe Interpretierbarkeit und Data Fusion. Mit iqony hatten wir nun die Möglichkeit dieses Modell in der Praxis für die Anomalieerkennung bei Windkraftanlagen zu testen.

Mit scikit-learn Modelle erstellen

28. Juni 2023

Um Einsteiger:innen einen Überblick über die Möglichkeiten von scikit-learn zu geben, haben wir im kürzlichen erschienenen ix-Sonderheft "Künstliche Intelligenz" einen Artikel zum Thema "Mit scikit-learn Modelle erstellen" veröffentlicht.

Minds Mastering Machines 2023

8. Juni 2023

Auf der diesjährigen M3-Konferenz haben wir in drei Vorträgen unsere Erkenntnisse und Erfahrungen präsentiert: Polars, eine alternative Datenbearbeitungs-Bibliothek zur bekannten Pandas-Bibliothek, sowie Einblicke, in die Realisierung präziser Wärmebedarfsprognosen mit Transformer-Modellen und die Optimierung Neuronaler Netze mit Open-Source-Bibliotheken.

scieneers at PyCon DE & PyData Berlin 2023

10. Mai 2023

At this year’s PyCon DE & PyData Berlin, we presented our learnings and experiences in two talks: Polars, an alternative data-wrangling library to the well-known Pandas library and in a second talk insights we gained from building an internal QA-Chat system, even before ChatGPT and it's buzz started.

Einführung in Microsofts Power BI Plattform

4. April 2023

Power BI ist ein fester Bestandteil unseres Technologiestacks, weshalb wir in diesem Artikel eine kurze Power BI Einführung geben wollen.

Kooperation SCHOTT AG – scieneers: MIP Reporting mit Power BI

28. März 2023

Kooperation Schott AG mit scieneers shopfloor Daten Reporting in Power BI auf Basis der MIP Platform von MPDV

Wie implementiere ich einen “Question Answering”-Bot für Slack in Python?

22. Februar 2023

Basierend auf unseren internen Dokumenten und Chat-Gesprächen haben wir mit open-source Technologien ein System gebaut, welches den Zugriff auf internes Wissen vereinfacht. Hier geben wir einen detailierten Einblick im die Implementierung.

Einführung in Unittesting mit Python für Data Scientists

20. Januar 2023

Unittests können in Data-Science-Projekten sehr sinnvoll sein, um eine hohe Codequalität sicherzustellen. Um den Einstieg in das Unittesten mit Python für Data Scientists zu erleichtern, haben wir einen Artikel zu diesem Thema geschrieben, der auf Informatik Aktuell veröffentlicht wurde.

Explorative Geodaten-Analyse mit Power BI bei Ämtern und Behörden

11. Januar 2023

Gemeinsame Entwicklung eines vollständig nutzbaren Prototypen zur ansprechenden Visualisierung von Daten aus verschiedenen Fachverfahren des öffentlichen Dienstes auf Landkarten. Die Dashboards ermöglichen es, schnell und interaktiv Zusammenhänge zu erkennen, aus denen sich mögliche Maßnahmen daten- und faktenbasiert ableiten und begründen lassen.

Entwicklung nach SCRUM und CRISP-DM am Fallbeispiel Wärmeprognose bei STEAG New Energies

14. Dezember 2022

Am Fallbeispiel der Wärmeprognose bei STEAG New Energies wird die Entwicklung und das Projektvorgehen nach SCRUM und CRISP-DM skizziert. Neben der detaillierten Beschreibung der einzelnen Schritte einer Entwicklungsiteration, liegt ein weiterer Fokus des Blog-Artikels auf dem im Einsatz befindlichen Technologie-Stack.

Free for commercial use, photo by Kevin Ku on Unsplash

Effektive Code Reviews für Data-Science-Projekte

30. November 2022

Code Reviews sind eine gängige Praxis in der Softwareentwicklung, doch sie sind auch in Data-Science-Projekten relevant und sinnvoll. Der Artikel beleuchtet die Gründe dafür und gibt Hinweise darauf, wie Code Reviews in Data-Science-Projekten effektiv gestaltet werden können.

SQLDays – Vortrag Azure Data Factory 2022 – whats new?

2. November 2022

SQLDays 2022 - Folien zum Vortrag von Stefan Kirner zu Neuigikeiten in der Azure Data Factory und Synapse Pipelines und ein Vergleich der Technologien.

Kooperation mit Intel®: Quantisierung von ML-Modellen und Performance-Boost im Pre-Processing

27. Oktober 2022

scieneers sind AI Specialist Partner des Halbleiterhersteller Intel®. Wir erproben in realen Einsatzszenarien, wie durch Intels neueste Technologien und Tools die Performance analytischer Modelle und Berechnungen auf großen Datenmengen weiter gesteigert werden können

Tipps & Tricks bei der Entwicklung eines Dashboards mit Streamlit & Plotly

17. Oktober 2022

Wir haben mit Streamlit und plotly.express ein web-basiertes Dashboard für die Übersicht über CO2-Emissionen gebaut. Dieser Blogeintrag zeigt einige Tipps und Tricks, die wir bei der Implementierung und dem Deployment des Dashboards gelernt haben.

ifbw22

informatica feminale Baden-Württemberg 2022 – ein Rückblick

29. September 2022

Dieses Jahr fand die informatica feminale Baden-Württemberg an der technischen Fakultät der Universität in Freiburg statt, und wir scieneers durften dort mit einem Kurs zum Thema "Visualisierungsframeworks in Python" das Angebot für die Teilnehmerinnen mitgestalten.

Konferenz-Rückblick: DataLift Summit

3. August 2022

Rückblick zur Konferenz DataLift Summit und Informationen zum dort gehaltenen Workshop zu visueller Datenexploration mit Python

Partnerschaft MPDV – scieneers: MIP smart factory Daten in Power BI

20. Juli 2022

Wir ergänzen die smart factory Plattform MIP unseres Partners MPDV um ein Basis-Lösungspaket in Power BI und der Expertise, auch kundenspezfische Anforderungen sehr schnell in KPIs und Visuals umzusetzen.

Gruppenfoto_PASS_Camp

PASS Camp 2022 – Ein Einblick

15. Juli 2022

Das PASS Camp fand nach zweijähriger Corona-Pause endlich wieder statt und auch wir waren dabei. In unserem Blog geben wir Euch einen kurzen Einblick.

Steag New Energies GmbH

Voll auf Kurs: optimierte Energieerzeugung dank KI

7. Juli 2022

Datenoptimierte Wärmeprognosen und Fahrplanerzeugung bei KWK-Anlagen - unser spannendes Azure-Daten-Projekt mit Steag New Energies wird hier vorgestellt

Frühlingserwachen 2022

22. Juni 2022

Zwei Tage lang haben wir uns in unserem Kölner Office zusammengefunden, um uns in vier Formaten über fachliche und persönliche Themen auszutauschen und das bisher Erreichte bis in die Abendstunden zu feiern.

BI Consultant Getting Started mit PySpark Notebooks

1. Juni 2022

First steps um als BI Consultant Python zu lernen und in die Ladeprozesse zu integrieren am Beispiel Azure Synapse

Photo courtesy of Lwala Community Alliance

Good data quality can save lives

25. Mai 2022

In a pro-bono project facilitated by DataKind we had the great opportunity to join a team of volunteer data scientists to enable the Lwala Community Alliance to monitor the quality of their data.

Our talks at PyCon DE/PyData Berlin

18. Mai 2022

At this year’s PyCon DE & PyData Berlin, we presented our learnings and experiences in two talks. These covered very different aspects of data work: On the one hand, we showcased predictive modeling applications in wind turbine maintenance and the challenges of anomaly detection. In a different presentation, we explained why code reviews are still important for data science tasks and how we can apply them to benefit from the effort.

Live Demo: MIP Daten in Power BI

11. März 2022

Live-Demo mit smart factory Shopfloor-Daten verschiedener Maschinen die über die Integrationsplattform MIS von mpdv nach Power BI

Review 2021

23. Dezember 2021

Wieder ein Jahr mit Corona. Aber auch wieder ein Jahr, in dem wir große Erfolge feiern durften.

Power BI Solution Deutsch

16. November 2021

Die Power BI Plattform ist ein zentraler Bestandteil unseres Technologiestacks, wenn es darum geht relevante Informationen effizient, aktuell und verständlich aufzuarbeiten und zu visualisieren. Nutzen Sie diesen Solutions-Showcase, um die Möglichkeiten der Plattform näher kennenzulernen und sich von unseren Lösungskompetenzen zu überzeugen.

Reicht auch Power BI only für mein Projekt?

20. Oktober 2021

Fragt sich so mancher Entwickler angesichts immer mehr Funktionsumfang und Enterprise Readyness auf Seiten Microsoft Power BI. Normalerweise beinhalten BI Projekte spezialisierten Komponenten wie zur Persistenz (Datenbanken, Data Lake & co.) oder für ETL. Power BI deckt den kompletten Bereich einer BI Lösung ab. Aber gibt es Dinge die gar nicht gehen in Power BI, wo sind Schwächen und gibt es das typische Power BI Projekt? Dieses spannende Thema wird in der Session diskutiert!

User Behavior in iNaturalist’s City Nature Challenges

12. Oktober 2021

At scieneers, social engagement is an important goal that we pursue with value-creating and sustainable projects. We are particularly interested in using our knowledge of data and our technical skills for "data for good" projects and sharing them with others. The following project from the CorrelAid network aims to investigate the internal dynamics of citizen science communities, in particular how users of such communities behave and what roles they take.

Wie finde ich eine zu mir passende Stelle?

27. September 2021

Du weißt, dass du im IT Bereich arbeiten möchtest, fragst dich aber, wie du eine Stelle findest, bei der du glücklich wirst? Genau diese Frage hat mich vor einem Jahr beschäftigt. Nach einem Quereinstieg als Software Entwicklerin stellte ich nach einem guten Jahr Berufserfahrung Unzufriedenheit fest. Um der Ursache auf den Grund zu gehen, befasste ich mich damit, was mir in meinem Job eigentlich wichtig ist -- basierend auf meinen bisherigen Erfahrungen in Studium, Praktika und Beruf.

Realtime Data Integration mit Azure Service Bus & Azure Logic Apps & Dataverse

18. Juni 2021

Realtime Data Integration mit Azure Service us & Azure Logic Apps & Dataverse

Application Lifecycle Management in der Azure Data Factory

11. Juni 2021

Vorstellung von Methoden, Technologien und Best Practices wie man in der Azure Data Factory strukturiert und sicher entwickeln kann, in dem man die Integration und Dienste von Azure DevOps nutzt

Künstliche Intelligenz in der Betriebsoptimierung von erneuerbaren Erzeugungsanlagen bei der EnBW

3. März 2021

Die Künstliche Intelligenz und das Maschinelle Lernen wird immer mehr zu einem alltäglichen Begleiter und hält somit auch Einzug in die Energie-Branche. Im Rahmen eines Projekts bei der EnBW stellten wir Untersuchungen zu dem bereits implementiertem Predictive Maintenance System, das Schäden in Erzeugungsanlagen rechtzeitig erkennen soll, an und testeten zusätzlich neuere Algorithmen zur rechtzeitigen Schadenserkennung in Windkraftanlagen.

Advanced security of PaaS based Azure data applications – from setup to ALM

9. Februar 2021

I want to share my experience from my projects of creating data applications from a security perspective, covering cloud infrastructure and application parts, as well as application lifecycle challenges during CI/CD. We‘ll go through examples how to handle secrets savely and manageable and configure Azure resources with diverse security concepts.

Data engineering pattern in der Azure Data Factory

9. Februar 2021

In dem Vortrag werden die typischen Muster für Datenverarbeitung in der Azure Data Factory aufgezeigt und verglichen. Das wird abgerundet mit best practices zum Application Lifecylce Management.

Microsoft Certified Data Monster

9. Februar 2021

In der Aufzeichnung sprechen MVP Frank Geisler und Stefan Kirner über Microsoft Zertifizierungen im Allgemeinen und insbesondere für die Data Platform. Warum sollte ich mich damit beschäftigen? Was gibt es für Zertifizierungen von MS im Data Bereich? Wie geht das mit der Anmeldung? Wie bereite ich mich darauf vor? Wie läuft so eine Prüfung ab?

Professionelles Arbeiten mit Jupyter Notebooks/Lab

9. Februar 2021

Materialien zum Vortrag Professionelles Arbeiten mit Jupyter Notebooks/Lab von Nico Kreiling

Five shades of dataflow

9. Februar 2021

Talk is an overview of the "shades" of data flows in Power Platform and Azure Data Factory, their purpose and of course the technologies

Daten-Grundlagenarbeit in Python

3. Februar 2021

Die erfolgreiche Umsetzung von Daten-Projekten erfodert einen gekonnten Umgang mit den elementaren Werkzeugen. Für das Heise Machine Learning Sonderheft haben wir eine Einführung in PyData Tools wie NumPy, Pandas und Scikit-Learn geschrieben.

Ein kurzer Blick zurück

21. Dezember 2020

Ein turbulentes Jahr neigt sich dem Ende entgegen. Ein Jahr, in dem Corona praktisch alles überschattet hat. Dennoch können wir voller Dankbarkeit auf ein sehr erfolgreiches erstes Geschäftsjahr zurückblicken.

The political discourse on discrimination – how to use natural language processing for good

11. Dezember 2020

At this year’s CorrelCon, we presented our work in the OpenDiscourse project. Leveraging techniques from natural language processing, we analyzed the speeches held in the Bundestag.

AutoML – A Comparison of cloud offerings

19. August 2020

AutoML is the process of automatically applying machine learning to real world problems, which includes the data preparation steps such as missing value imputation, feature encoding and feature generation, model selection and hyper parameter tuning. Even though the research field on AutoML exists at least since its first dedicated workshop at ICML in 2014, real world usage just got applicable recently. This blog post compares the AutoML offerings of AWS, Google and Microsoft in a qualitative fashion.

Die scieneers community wächst!

15. Juli 2020

Wir freuen uns sehr, dass sich die ersten Kolleginnen und Kollegen für die scieneers begeistern konnten. Mit diesem Team stellen wir uns gerne jeder Herausforderung, die das Daten-Business für uns bereit hält! Wo ihre Schwerpunkte liegen und was sie antreibt können sie selbst am besten beschreiben:

Was ist die Microsoft Data Platform?

13. Mai 2020

Der Begriff steht im Allgemeinen für das Angebot an Data Management und Analytics Lösungen, die Microsoft klassisch für das Rechenzentrum des Kunden und in der Azure Cloud anbietet. Aber was beinhaltet das genau? Welche Tools sind gemeint und was gehört zusammen? Im Folgenden werden diese Möglichkeiten in drei verschiedene technologische Bereiche eingeteilt, inhaltlich beschrieben und grob abgegrenzt.

Der Anfang ist gemacht.

28. April 2020

Nach den ersten Wochen am Markt ziehen wir schon mal ein erstes positives Fazit: Die ersten Kunden und Partner konnten wir für uns gewinnen.

Hello World, wir sind die scieneers! Wir sind “driven by data”.

30. März 2020

Zugegeben, es ist nicht die beste Zeit, um mit einem neu gegründeten Unternehmen an den Markt zu gehen. Wir haben uns entschieden es trotzdem zu tun. Warum wir überzeugt sind, dass es trotz oder gerade wegen Corona der richtige Schritt ist, möchten wir Euch mit diesem Blogpost kurz erklären.