Was ist die Microsoft Data Platform?
13.05.2020 – ca. 8 Min. Lesezeit – Zurück zur Startseite – Alle Blog-Artikel
Der Begriff steht im Allgemeinen für das Angebot an Data Management und Analytics Lösungen, die Microsoft klassisch für das Rechenzentrum des Kunden und in der Azure Cloud anbietet. Aber was beinhaltet das genau? Welche Tools sind gemeint und was gehört zusammen? Im Folgenden werden diese Möglichkeiten in drei verschiedene technologische Bereiche eingeteilt, inhaltlich beschrieben und grob abgegrenzt.
Der Bedarf an Business Intelligence Lösungen ist weiterhin ungebrochen. Neben technologischen Notwendigkeiten wie höhere Anforderungen an zu verarbeitende Datenmengen, komplexeren Datenstrukturen oder die Verarbeitung in Echtzeit verändern sich auch die Geschäftsprozesse der Unternehmen laufend, was wiederum ein hohes Maß an Flexibilität und Erweiterbarkeit der bestehenden Lösungen einfordert.
Microsoft hat dazu schon lange mehr als nur eine Antwort parat. Auch deshalb ist der Hersteller nicht erst seit 2020 im Gartner Magic Quadranten für Analytics & Business Intelligence Platforms mit Abstand führend bei „Completeness of Vision“ und „Ability to Execute“.
Im Folgenden werden die drei Bereiche vorgestellt, die sich als unterschiedliche Technologie-Plattformen von Microsoft für die Arbeit mit Daten einstufen lassen.
SQL Server & die SQL Server Data Tools
Die Datenbank von Microsoft ist eines der bekanntesten Server Produkte und hat spätestens seit der Version 2000 eine hohe Verbreitung in den Rechenzentren der Kunden erlangt. Als Teil des SQL Servers wird auch ein ganzes Paket an Diensten für die analytische Datenverarbeitung und Präsentation mitgeliefert. Diese bestehen aus den Integration Services für Extraktions-, Transformations- und Lade- (ETL- )Prozesse (SSIS), Analysis Services für OLAP und In-Memory Datenmodelle (SSAS) sowie dem Power BI Report Server für die Präsentation von Daten als Report oder Interaktives Dashboard. Daneben gibt es ergänzend weitere Dienste zum Stammdaten-Management (Master Data Services), für Data Science (Machine Learning Server) und zur Verbesserung der Datenqualität (Data Quality Services).
Seit der Version 2019 gibt es auch die Option des SQL Server Big Data Clusters für das container-basierte Scale-out der Datenhaltung- und Verarbeitung über HDFS und Spark.
Insgesamt zeichnet sich der Stack durch eine hohe Reife aus. Die Komponenten sind erprobt und weitgehend ausgereift, was sich auch in einem großen Markt an Drittanbieter-Tools widerspiegelt, die Funktionalitäten ergänzen. Der Application Lifecycle wird unterstützt durch die Visual Studio Integration und durchdachte Konzepte für unterschiedliche Umgebungen.
Azure Data Services
Seit ungefähr 10 Jahren ist Microsofts Cloud nun am Markt und enthält inzwischen unter anderem sehr viele Dienste für das Verarbeiten und Speichern von Daten für analytische Zwecke. Die Azure Data Factory dient der Datenaufbereitung, Azure Analysis Services ist das Pendant zum on-premises Produkt. Für die Datenspeicherung gibt es neben SQL Azure auch hochskalierende Optionen wie den Azure Data Lake (Web-HDFS) und Azure Synapse (aka SQL DW). Ergänzt wird das analytische Angebot durch die Azure Machine Learning Services (das Data Science Framework), Azure Stream Analytics (Echtzeit-Verarbeitung) oder Azure Databricks (Spark-basierte Verarbeitung). Microsoft spricht in diesem Zusammenhang auch oft vom Modern Data Warehouse Konzept. Dieses stellt eine Kombination einiger der genannten Komponenten dar, welche besonders den Scale-out Aspekt einer batch-orientierten Datenlösung berücksichtigt.
Der große Vorteil aller genannten Services gegenüber den on-premises Pendants auf dem SQL Server ist, dass diese von Microsoft gemanaged werden (Platform-as-a-Service). Der technische Betrieb in Form von Patches, Backup und Überwachung ist sichergestellt. Der Nutzer beschäftigt sich lediglich mit Leistungsparametern in abstrahierter Form (“Schieberegler”). Das ermöglicht den Schnellstart bei Datenprojekten in sehr kurzer Zeit und mit niedrigen Investitionskosten. Die Anbindung von Datenquellen im Rechenzentrum des Kunden erfolgt verschlüsselt über VPN Technologien oder über spezialisierte Gateways von Microsoft.
Power BI
Einen leichtgewichtigen Einstieg für Jedermann im Unternehmen bietet die Software-as-a-Service Suite Power BI. Ursprünglich als reines Self-Service Tool konzipiert mit Plugins in Excel hat sich die Software inzwischen zu einer vielseitig nutzbaren BI-Suite entwickelt, inklusive Nutzung des Common Data Models und Möglichkeiten für das Corporate Reporting.
Das Design der Lösungen wird zum größten Teil innerhalb des Power BI Desktops vorgenommen. Also sowohl das Zusammenführen und Harmonisieren von Daten aus unterschiedlichen Systemen als auch das Erstellen des analytischen Datenmodells und die Gestaltung von interaktiven Dashboards. Danach können diese auf PowerBI.com veröffentlicht werden um sie mit Kollegen zu teilen. Dort wird auf Wunsch auch eingestellt, wann Daten aktualisiert werden. Die Anbindung von on-premises Datenquellen erfolgt auch hier sicher verschlüsselt über ein Gateway von Microsoft.
Auch Echtzeit Dashboards sind in Power BI möglich und zwar über Rest-APIs, die wiederum sehr gut in den Azure Data Services Stack integriert sind. In einem größeren Zusammenhang spricht Microsoft über die “Power Platform”, was eine ganze Sammlung von Low Code Tools wie Power Apps für die Interaktion mit Daten und Power Automation (aka Flow) im Universum von Office 365 darstellt.
Hybride Architekturen
Alle drei angeführten Technologie-Stacks sind dabei keine monolithisch abgegrenzten Systeme, sondern bieten gute Integrationen und Verbindungen. So gibt es eine Version von Power BI für on-premises und die Integration Services können auch in der Azure Data Factory genutzt werden um nur zwei Beispiele zu nennen.
Fazit
Microsofts Investitionen in alle Tools, mit denen Mehrwert aus Daten generiert wird, unterstreichen die Wichtigkeit des Themas und schaffen Investitionssicherheit für die Kunden. Bei Power BI gibt es monatlich neue Features, die hier ausführlich vorgestellt werden. Aber auch die anderen Stacks werden Stück für Stück erweitert, wie es der Einzug von Spark in Azure Synapse und im SQL Server Big Data Cluster zeigt. Abgerundet wird das Toolset durch Möglichkeiten zur Professionalisierung von Deployments und Operations auf Basis der Azure DevOps Services.
Wer mit mit welchen Mitteln am effektivsten zu einer konsistenten, performanten und sicheren Data Platform kommt, hängt von technischen Voraussetzungen, dem Skillsets des Teams aber auch und natürlich von der passenden funktionalen Konzeption ab.
Stefan Kirner
Director Business Intelligence