PDW aka APS – Extended Support bis 2026 verlängert
This post might contain affiliate links. We may earn a commission if you click and make a purchase. Your support is appreciated!
Vor ein paar Jahren durfte ich bei einem deutschen Mobilfunk-Anbieter die Migration von Oracle auf ein PDW (damals noch Parallel Data Warehouse) aus Infrastruktursicht begleiten. Das war ganz schön spannend, wenn man aus der „einfachen“ SQL Server Welt kommt, und plötzlich hat man so einen „Oschi“ vor sich… in der zwischenzeit wurde aus dem PDW, dann (wahrscheinlich aus Marketing-technischen Gründen) ein APS (Analytics Platform System). Schon damals basierte das System aus mehreren SQL Servern, die nach bestimmten Vorgaben miteinander verbunden waren und sich die Workload entsprechend von Quellcode und Datenstruktur aufteilen konnte und somit zu einer immensen Beschleunigung der Verarbeitung im Data Warehouse Umfeld beitragen konnte. Mein Kunde damals, hatte eine Umgebung mit 60 TB an Daten im Data Warehouse, die für die entsprechenden Marts, Abteilungen und Berichte optimiert worden war und so schneller dem Unternehmen Auskunft erteilen konnte. Das System bestand aus einem (oder mehreren – wegen der Hochverfügbarkeit) Eingangsknoten, die die eingehende Workload analysiert und weiterverteilt auf die 4-12 Compute-Nodes verteilte, diese hochperformante SQL Server Umgebung basiert(e) allerdings auf SQL Server 2012 und wurde auch nicht mehr weiterentwickelt, also zumindest für spätere SQL Server Versionen.
Aber was ist eigentlich ein PDW?
Aus der Microsoft Dokumentation ist folgendes zu entnehmen:
Microsoft Analytics Platform System (APS) ist eine Datenplattform, die für Data Warehousing und Big Data-Analysen entwickelt wurde. Sie bietet nahtlose Datenintegration, schnelle Abfrageverarbeitung, hochgradig skalierbaren Speicher sowie eine unkomplizierte Wartung für End-to-End-Lösungen für Business Intelligence.
APS hostet SQL Server Parallel Data Warehouse (PDW). Dabei handelt es sich um eine Software, die ein MPP-Data Warehouse (Massively Parallel Processing) ausführt.
Die PolyBase-Technologie kombiniert relationale PDW-Daten mit Hadoop-Daten aus mehreren Quellen, einschließlich Hortonworks auf Windows Server, Hortonworks unter Linux, Cloudera unter Linux und Azure Blob Storage von HDInsight. Durch diese erweiterten Datenintegrationsfunktionen und die nahtlose Integration in Business Intelligence-Tools kann Analytics Platform System integrierte Analysen zurückgeben, mit denen Entscheidungsträger Ihres Unternehmens bessere und informiertere Unternehmensentscheidungen treffen können.
Analytics Platform System wird als Appliance mit Hardware und vorinstallierter Software in Ihr Rechenzentrum geliefert, und ist so konfiguriert, dass es mehrere Workloads ausführen kann. Wenn Sie Analytics Platform System erwerben, kaufen Sie auch Computeknoten für PDW entsprechend Ihren Geschäftsanforderungen.
https://docs.microsoft.com/de-de/sql/analytics-platform-system/home-analytics-platform-system-aps-pdw
Aus meiner Sicht eigentlich ein guter Ansatz und eine gute Möglichkeit für größere Unternehmen, aber gleichzeitig auch schon wieder ein totaler Overkill… wenn man bedenkt, was man alles in Sachen Infrastruktur, Datenmodellierung und -prozessierung anpassen muss, entstehen weitere zusätzliche Kosten nicht nur für die Hardware sondern auch für die Entwicklungsarbeit. Vielleicht haben sich aus diesen Gründen nicht so viele Kunden für dieses System entschieden, und Microsoft verabschiedet sich langsam aber sicher von diesen Hardware-Systemen.
Alternativen zum eigenen APS?
Da Microsoft sehr viele Services in die Cloud verschiebt bzw mittlerweile aus der Cloud anbietet, was für den Kunden effektiver und kostengünstiger ist, wurden die Möglichkeiten einer „Massive Parallel Processing“-Infrastruktur initial als Azure Data Warehouse angeboten. Hier konnte man sich die Leistung und Technolgie eines Analytics Platform Systems aus der Cloud mieten und musste nicht erst teure (bestimmte/besondere) Hardware kaufen und ins Rechenzentrum integrieren.
Mittlerweile ist aus dem ursprünglichen Azure Data Warehouse die viele Services umfassende Synapse Analytics Platform geworden, hier werden mehrere Lösungen und Ansätze kombiniert und aus einem Service heraus angeboten. Microsoft verfolgt damit den ganzheitlicheren Ansatz und möchten seinen Kunden EINE Plattform für alle Business Intelligence (BI) Entscheidungen anbieten. Mit Azure Synapse werden nicht nur ETL oder ELT Prozesse dargestellt, sondern bietet auch eine „Datensenke“ aka SQL Pools zur Speicherung aller relevanten Daten, zusätzlich können viele automatisierte Workflow-Szenarien mit Azure Synapse abgebildet werden.
Main Stream und Extended Support für das APS
Wie bei den meisten (oder allen) Produkten von Microsoft wird unterschieden zwischen Main-Stream und Extended Support, dieser Support endet zu bestimmten Terminen, beim SQL Server zum Beispiel ist es in der Regel so, dass der Mainstream Support nach 5 Jahren nach der General Availibility des Produktes ausläuft und der Extended Support noch einmal 5 Jahre läuft, somit gewährt Microsoft in der Regel 10 Jahre Support für seinen SQL Server.
So nun auch beim PDW/APS… Das PDW wurde damals erstmalig offiziel in Betrieb genommen im Juli 2013, somit hätte der Mainstream Support bis Juli 2018 laufen müssen, allerdings hat Microsoft bereits hier den Zeitraum verlängert und der Mainstream Support lief bereits bis Oktober 2019. Heißt der Extended Support hätte eigentlich bis Oktober 2024 laufen sollen, sehr wahrscheinlich aufgrund der Pandemie (und weiteren Gründen) wurde dieser Zeit verlängert, so dass Kunden nun mehr Zeit haben Ihre Investionen zu sichern bzw voranzutreiben um neue Lösungen für Ihren Betrieb des Parallel Data Warehouse zu finden bzw die Migrationen voran zu treiben.
Als neues Ende-Datum für den Extended Support von Microsoft für das Analytics Platform System (APS) wurde der 31. März 2026 definiert, also wer ein solches „Gerät“ betreibt, sollte sich auch hier bei der Migration nicht allzu viel Zeit lassen und die Umstellung entsprechend vorbereiten.
This post might contain affiliate links. We may earn a commission if you click and make a purchase. Your support is appreciated!
Björn arbeitet auch weiterhin aus Mexiko als Senior Consultant – Microsoft Data Platform und Cloud für die Kramer&Crew in Köln. Auch der Community bleibt er aus der neuen Heimat treu, er engagiert sich auf Data Saturdays oder in unterschiedlichen Foren. Er interessiert sich neben den Themen rund um den SQL Server, Powershell und Azure SQL für Science-Fiction, Backen 😉 und Radfahren.
Amazon.com Empfehlungen
Damit ich auch meine Kosten für den Blog ein wenig senken kann, verwende ich auf diese Seite das Amazon.com Affiliate Programm, so bekomme ich - falls ihr ein Produkt über meinen Link kauft, eine kleine Provision (ohne zusätzliche Kosten für euch!).
Auto Amazon Links: Keine Produkte gefunden.