SAP-HANA- SAP HANA

SAP HANA
SAP SE-Logo
Entwickler SAP SE
Erstveröffentlichung 2010 ( 2010 )
Stabile Version 2.0 SPS05 (26. Juni 2020 ; vor 12 Monaten ) [±] ( 2020-06-26 )
Geschrieben in C , C++
Betriebssystem Linux
Verfügbar in Englisch
Art Datenbank mit mehreren Modellen
Lizenz Proprietäre kommerzielle Software
Webseite www .sap .com / produkte /hana .html

SAP HANA (High-Performance Analytic Appliance) ist ein In-Memory , spaltenorientiertes , relationales Datenbankmanagementsystem, das von der SAP SE entwickelt und vertrieben wird . Seine Hauptfunktion als Software, auf der ein Datenbankserver ausgeführt wird, besteht darin, Daten zu speichern und abzurufen, wie von den Anwendungen angefordert. Darüber hinaus führt es erweiterte Analysen durch ( Vorhersageanalysen , räumliche Datenverarbeitung , Textanalyse, Textsuche, Streaminganalyse , Graphdatenverarbeitung ) und umfasst Funktionen zum Extrahieren, Transformieren, Laden (ETL) sowie einen Anwendungsserver .

Geschichte

Während der frühen Entwicklung von SAP HANA wurden eine Reihe von Technologien von der SAP SE entwickelt oder erworben . Dazu gehörten die TREX-Suchmaschine ( In-Memory- Spalten-orientierte Suchmaschine ), P*TIME (In-Memory- Online-Transaktionsverarbeitungs- (OLTP)-Plattform von SAP im Jahr 2005) und MaxDB mit seiner In-Memory-LiveCache-Engine.

Die erste große Demonstration der Plattform fand 2008 statt: Teams der SAP SE , des Hasso-Plattner-Instituts und der Stanford University demonstrierten eine Anwendungsarchitektur für Echtzeitanalysen und -aggregation namens HYRISE. Der ehemalige Vorstand der SAP SE, Vishal Sikka , bezeichnete diese Architektur als "Hassos neue Architektur". Bevor sich der Name "HANA" stabilisierte, bezeichneten die Leute dieses Produkt als "Neue Datenbank". Die Software hieß zuvor "SAP High-Performance Analytic Appliance".

Ein erstes Forschungspapier zu HYRISE wurde im November 2010 veröffentlicht. Die Forschungs-Engine wird später 2013 als Open Source veröffentlicht und 2016 zu HYRISE2 im Jahr 2017 überarbeitet.

Das erste Produkt wurde Ende November 2010 ausgeliefert. Mitte 2011 hatte die Technologie Interesse geweckt, aber erfahrenere Geschäftskunden hielten sie für "in den Anfängen". Die HANA-Unterstützung für SAP NetWeaver Business Warehouse wurde im September 2011 angekündigt und soll im November verfügbar sein.

Im Jahr 2012 förderte SAP Aspekte des Cloud Computing . Im Oktober 2012 kündigte SAP ein Platform-as-a-Service- Angebot namens SAP HANA Cloud Platform und eine Variante namens SAP HANA One an, die eine geringere Speichermenge verwendet.

Im Mai 2013 wurde ein Managed Private Cloud- Angebot namens HANA Enterprise Cloud Service angekündigt.

Im Mai 2013 wurde die Business Suite on HANA verfügbar, mit der Kunden SAP Enterprise Resource Planning- Funktionen auf der HANA-Plattform ausführen können.

S/4HANA , das 2015 veröffentlicht wurde und speziell für die HANA-Plattform geschrieben wurde, kombiniert Funktionen für ERP , CRM , SRM und andere in einem einzigen HANA-System. S/4HANA soll eine vereinfachte Business Suite sein, die ERP- Systeme früherer Generationen ersetzt. Obwohl es wahrscheinlich ist, dass SAP seine Innovationen auf S/4HANA konzentrieren wird, haben einige Kunden, die Nicht-HANA-Systeme verwenden, Bedenken geäußert, an SAP-Produkte gebunden zu sein. Da für S/4HANA ein SAP-HANA-System erforderlich ist, müssen Kunden, die SAP-Business-Suite-Anwendungen auf nicht von SAP zertifizierter Hardware ausführen, auf eine SAP-zertifizierte HANA-Datenbank migrieren, wenn sie sich für die von S/4HANA angebotenen Funktionen entscheiden.

Anstelle der Versionierung verwendet die Software Service Packs , die als Support Package Stacks (SPS) bezeichnet werden, für Updates. Support Package Stacks werden alle 6 Monate veröffentlicht.

Im November 2016 kündigte SAP SAP HANA 2 an, das Erweiterungen in mehreren Bereichen wie Datenbankmanagement und Anwendungsmanagement bietet und zwei neue Cloud-Dienste umfasst: Text Analysis und Earth Observation Analysis. HANA-Kunden können ab SPS10 auf HANA 2 upgraden. Kunden mit SPS9 und niedriger müssen zuerst auf SPS12 aktualisieren, bevor sie auf HANA 2 SPS01 aktualisieren.

Die Architektur

Überblick

Die wesentlichen Unterschiede zwischen HANA und vorherigen Generation SAP - Systeme sind , dass es sich um eine spaltenorientierte , In-Memory - Datenbank , und verbindet OLAP und OLTP - Operationen in einem einzigen System; somit ist SAP HANA im Allgemeinen ein OLTAP-System. Das Speichern von Daten im Hauptspeicher statt auf der Festplatte bietet einen schnelleren Datenzugriff und damit auch eine schnellere Abfrage und Verarbeitung. Die Speicherung von Daten im Arbeitsspeicher bietet zwar Leistungsvorteile, ist jedoch eine kostspieligere Form der Datenspeicherung. Unter Beachtung der Datenzugriffsmuster kann auf bis zu 85 % der Daten in einem Unternehmenssystem selten zugegriffen werden, daher kann es kostengünstig sein, häufig aufgerufene oder „heiße“ Daten im Speicher zu speichern, während die weniger häufig abgerufenen „warmen“ Daten auf Festplatte gespeichert, ein Ansatz, den SAP als "Dynamic Tiering" bezeichnet hat.

Spaltenorientierte Systeme speichern alle Daten für eine einzelne Spalte an derselben Stelle, anstatt alle Daten für eine einzelne Zeile an derselben Stelle zu speichern (zeilenorientierte Systeme). Dies kann Leistungsverbesserungen für OLAP- Abfragen in großen Datasets ermöglichen und ermöglicht eine stärkere vertikale Komprimierung ähnlicher Datentypen in einer einzigen Spalte. Wenn die Lesezeiten für in Spalten gespeicherte Daten schnell genug sind, können konsolidierte Ansichten der Daten im laufenden Betrieb durchgeführt werden , wodurch die Pflege von aggregierten Ansichten und der damit verbundenen Datenredundanz entfällt .

Obwohl zeilenorientierte Systeme traditionell für OLTP bevorzugt wurden , eröffnet In-Memory-Speicher Techniken zur Entwicklung hybrider Systeme, die sowohl für OLAP- als auch für OLTP- Funktionen geeignet sind , wodurch die Notwendigkeit entfällt, separate Systeme für OLTP- und OLAP-Operationen zu unterhalten.

Indexer-Komponenten

Der Indexserver führt Sitzungsverwaltung, Autorisierung, Transaktionsverwaltung und Befehlsverarbeitung durch. Die Datenbank hat sowohl einen Zeilenspeicher als auch einen Spaltenspeicher. Benutzer können Tabellen mit beiden Speichern erstellen, aber der Spaltenspeicher bietet mehr Funktionen und wird am häufigsten verwendet. Der Indexserver verwaltet auch die Persistenz zwischen zwischengespeicherten Speicherabbildern von Datenbankobjekten, Protokolldateien und permanenten Speicherdateien. Die XS-Engine ermöglicht die Erstellung von Webanwendungen.

SAP HANA Information Modeling (auch bekannt als SAP HANA Data Modeling) ist ein Teil der HANA-Anwendungsentwicklung. Modellierung ist die Methode, um dem Endbenutzer Betriebsdaten bereitzustellen. Im Modellierungsprozess werden wiederverwendbare virtuelle Objekte (benannte Berechnungsansichten) verwendet.

MVCC

SAP HANA verwaltet die Parallelität durch die Verwendung von Multiversion Concurrency Control (MVCC), die jeder Transaktion zu einem bestimmten Zeitpunkt eine Momentaufnahme der Datenbank zur Verfügung stellt. Wenn eine MVCC-Datenbank ein Datenelement aktualisieren muss, überschreibt sie die alten Daten nicht mit neuen Daten, sondern markiert stattdessen die alten Daten als veraltet und fügt die neuere Version hinzu.

Große Daten

In einer Scale-out- Umgebung kann HANA Datenmengen von bis zu einem Petabyte im Arbeitsspeicher halten, während Abfrageergebnisse in weniger als einer Sekunde zurückgegeben werden. Allerdings ist RAM immer noch viel teurer als Festplattenspeicher, sodass der Scale-out-Ansatz nur für bestimmte zeitkritische Anwendungsfälle praktikabel ist.

Analytik

SAP HANA enthält eine Reihe von Analyse-Engines für verschiedene Arten der Datenverarbeitung. Die Business Function Library enthält eine Reihe von Algorithmen zur Adresse gemeinsamer Geschäftsdaten zur Verfügung gestellt Verarbeitungsalgorithmen wie Asset - Abschreibungen , Prognose rollen und gleitenden Durchschnitt . Die Predictive Analytics Library enthält native Algorithmen zur Berechnung allgemeiner statistischer Maße in Bereichen wie Clustering , Klassifizierung und Zeitreihenanalyse .

HANA integriert die statistische Open-Source-Programmiersprache R als unterstützte Sprache in Stored Procedures .

Die Column-Store-Datenbank bietet Graphdatenbankfunktionen . Die Graph-Engine verarbeitet die Cypher Query Language und verfügt auch über eine visuelle Graph-Manipulation über ein Tool namens Graph Viewer. Diagrammdatenstrukturen werden direkt in relationalen Tabellen im Spaltenspeicher von HANA gespeichert. Vorgefertigte Algorithmen in der Graph-Engine umfassen Mustervergleich, Nachbarschaftssuche, einzelne kürzeste Pfade und stark verbundene Komponenten. Typische Anwendungssituationen für die Graph Engine sind Beispiele wie die Rückverfolgbarkeit der Lieferkette, Betrugserkennung sowie Logistik und Routenplanung.

HANA enthält auch eine Spatial-Datenbank- Engine, die Spatial-Datentypen und SQL-Erweiterungen für CRUD- Operationen für Spatial-Daten implementiert . HANA ist vom Open Geospatial Consortium zertifiziert und in das geografische Informationssystem ArcGIS von ESRI integriert .

Neben numerischen und statistischen Algorithmen kann HANA Textanalysen und Unternehmenstextsuche durchführen. Die Suchfunktion von HANA basiert auf einer „unscharfen“ fehlertoleranten Suche, ähnlich wie moderne webbasierte Suchmaschinen. Die Ergebnisse umfassen ein statistisches Maß dafür, wie relevant Suchergebnisse sind, und Suchkriterien können einen Genauigkeitsschwellenwert für Ergebnisse umfassen. Zu den verfügbaren Analysen gehören die Identifizierung von Entitäten wie Personen, Daten, Orte, Organisationen, Anfragen, Probleme und mehr. Eine solche Entitätsextraktion kann auf spezifische Anwendungsfälle zugeschnitten werden, wie z. B. Stimme des Kunden (Vorlieben und Erwartungen des Kunden ), Unternehmen (dh Fusionen und Übernahmen, Produkte, Organisationen) und öffentlicher Sektor (öffentliche Personen, Veranstaltungen, Organisationen). Benutzerdefinierte Extraktion und Wörterbücher können ebenfalls implementiert werden.

Anwendungsentwicklung

Neben den Datenbank- und Datenanalysefunktionen ist SAP HANA ein webbasierter Anwendungsserver , der benutzerorientierte Anwendungen hostet , die eng in die Datenbank- und Analyse-Engines von HANA integriert sind. Die "XS Advanced Engine" (XSA) arbeitet nativ mit Node.js und JavaEE Sprachen und Laufzeiten. XSA basiert auf der Cloud Foundry- Architektur und unterstützt somit das Konzept von „Bring Your Own Language“, das es Entwicklern ermöglicht, Anwendungen zu entwickeln und bereitzustellen, die in anderen Sprachen und Laufzeiten als den von XSA nativ implementierten geschrieben sind, sowie Anwendungen als Microservices bereitzustellen . XSA erlaubt auch serverseitiges JavaScript (XSJS).

Der Anwendungsserver wird von einer Reihe von Tools für das Anwendungslebenszyklus-Management unterstützt, die die Bereitstellung und Überwachung von benutzerorientierten Anwendungen durch die Entwicklung ermöglichen.

Einsatz

HANA kann lokal oder in der Cloud von einer Reihe von Cloud-Dienstanbietern bereitgestellt werden .

HANA kann lokal als neue Appliance von einem zertifizierten Hardwareanbieter bereitgestellt werden. Alternativ können im Rahmen der Implementierung vorhandene Hardwarekomponenten wie Storage und Netzwerk verwendet werden, ein Ansatz, den SAP „Tailored Data Center Integration (TDI)“ nennt. HANA ist für die Ausführung auf mehreren Betriebssystemen zertifiziert, darunter SUSE Linux Enterprise Server und Red Hat Enterprise Linux . Zu den unterstützten Hardwareplattformen für die Vor-Ort-Bereitstellung gehören Intel 64- und POWER-Systeme . Das System unterstützt sowohl die horizontale als auch die vertikale Skalierung .

Mehrere Cloud-Anbieter bieten SAP HANA auf Infrastructure as a Service- Basis an, darunter:

SAP bietet auch eigene Cloud-Services in Form von:

Editionen

Die SAP HANA-Lizenzierung wird hauptsächlich in zwei Kategorien unterteilt.

Laufzeitlizenz:

Wird zum Ausführen von SAP-Anwendungen wie SAP Business Warehouse powered by SAP HANA und SAP S/4HANA verwendet .

Volle Nutzungslizenz:

Wird verwendet, um sowohl SAP- als auch Nicht-SAP-Anwendungen auszuführen. Diese Lizenzierung kann verwendet werden, um benutzerdefinierte Anwendungen zu erstellen.

Als Teil der Volllizenz werden die Funktionen als Editionen gruppiert, die auf verschiedene Anwendungsfälle ausgerichtet sind.

  • Base Edition: Bietet grundlegende Datenbankfunktionen und Entwicklungstools, unterstützt jedoch keine SAP-Anwendungen.
  • Platform Edition: Basisedition plus räumliche, prädiktive, R-Server-Integration, Suche, Text, Analyse, Graph-Engines und zusätzliche gepackte Geschäftsbibliotheken.
  • Enterprise Edition: Platform Edition plus zusätzliche gebündelte Komponenten für einige der Datenladefunktionen und das Regel-Framework.

Darüber hinaus werden Funktionen wie Streaming und ETL als zusätzliche Optionen lizenziert.

Ab dem 9. März 2017 ist SAP HANA in einer Express-Edition verfügbar ; eine optimierte Version, die auf Laptops und anderen Umgebungen mit eingeschränkten Ressourcen ausgeführt werden kann. Die Lizenz für SAP HANA, Express Edition ist kostenlos, auch für den produktiven Einsatz bis 32 GB RAM. Zusätzliche Kapazitätserhöhungen können erworben werden.

Siehe auch

Verweise

Externe Links