UltraSPARC T1 - UltraSPARC T1

UltraSPARC T1
Ultrasparc t1 Schliffbild.JPG
Sun UltraSPARC T1 (Niagara 8 Core)
Allgemeine Information
Gestartet 2005
Entworfen von Sonne Mikrosysteme
Gängige Hersteller
Performance
max. CPU- Taktrate 1,0 GHz bis 1,4 GHz
Architektur und Klassifizierung
Befehlssatz SPARC V9
Physikalische Spezifikationen
Kerne
Produkte, Modelle, Varianten
Kernname(n)
Geschichte
Nachfolger UltraSPARC T2
UltraSPARC T1-Prozessor

Sun Microsystems ' Ultrasparc T1 - Mikroprozessor , bekannt , bis seine 14. November 2005 Ankündigung von seiner Entwicklung CodenameNiagara ‘, ist ein Multi - Threading , Multi - Core - CPU . Entwickelt , um den Energieverbrauch zu senken Server - Computer , die CPU verwendet in der Regel 72 W Leistung bei 1,4 GHz.

Afara Websystems hat ein radikales, threadlastiges SPARC-Design entwickelt. Das Unternehmen wurde von Sun gekauft und das geistige Eigentum wurde zur Grundlage der CoolThreads-Prozessorlinie, beginnend mit dem T1. Der T1 ist eine von Grund auf neu entwickelte SPARC- Mikroprozessorimplementierung, die der UltraSPARC Architecture 2005-Spezifikation entspricht und den vollständigen SPARC V9- Befehlssatz ausführt . Sun hat zwei frühere Multicore-Prozessoren ( UltraSPARC IV und IV+) produziert, aber UltraSPARC T1 war sein erster Mikroprozessor, der sowohl Multicore- als auch Multithreaded- Prozessoren ist . Die Sicherheit war von der allerersten Version auf Silizium integriert, mit Hardware-Kryptografieeinheiten im T1, im Gegensatz zu Universalprozessoren von konkurrierenden Anbietern der Zeit. Der Prozessor ist mit vier, sechs oder acht CPU-Kernen erhältlich, wobei jeder Kern vier Threads gleichzeitig verarbeiten kann. Somit ist der Prozessor in der Lage, bis zu 32 Threads gleichzeitig zu verarbeiten.

Der UltraSPARC T1 kann ähnlich wie High-End- SMP- Systeme von Sun partitioniert werden. Somit können mehrere Kerne zum Ausführen eines einzelnen oder einer Gruppe von Prozessen und/oder Threads partitioniert werden, während die anderen Kerne den Rest der Prozesse auf dem System übernehmen.

Kerne

Grundriss des Mikroprozessors T1
Die Pipeline des UltraSPARC T1

Der UltraSPARC T1 wurde von Grund auf als Multi-Threaded-Spezialprozessor entwickelt und führte damit eine völlig neue Architektur zur Erzielung von Leistung ein. Anstatt zu versuchen, jeden Kern so intelligent und optimiert wie möglich zu machen, war es das Ziel von Sun, so viele gleichzeitige Threads wie möglich auszuführen und die Auslastung der Pipeline jedes Kerns zu maximieren. Die Kerne des T1 sind weniger komplex als die der konkurrierenden Prozessoren, damit 8 Kerne auf den gleichen Die passen. Die Kerne verfügen nicht über eine ungeordnete Ausführung oder eine beträchtliche Menge an Cache .

Single-Thread-Prozessoren sind hinsichtlich ihrer Leistung stark von großen Caches abhängig, da Cache-Misses zu einer Wartezeit führen, während die Daten aus dem Hauptspeicher geholt werden. Durch Vergrößern des Caches wird die Wahrscheinlichkeit eines Cache-Fehltreffers verringert, aber die Auswirkung eines Fehlschlags ist immer noch dieselbe.

Die T1-Kerne umgehen das Problem der Cache-Fehltreffer durch Multithreading weitgehend. Jeder Kern ist ein Barrel-Prozessor , d. h. er wechselt in jedem Zyklus zwischen verfügbaren Threads. Wenn ein Ereignis mit langer Latenzzeit auftritt, z. B. ein Cache-Miss, wird der Thread aus der Rotation genommen, während die Daten im Hintergrund in den Cache geholt werden. Sobald das Ereignis mit langer Latenz abgeschlossen ist, wird der Thread wieder für die Ausführung verfügbar gemacht. Die gemeinsame Nutzung der Pipeline durch mehrere Threads kann jeden Thread langsamer machen, aber der Gesamtdurchsatz (und die Auslastung) jedes Kerns ist viel höher. Dies bedeutet auch, dass die Auswirkungen von Cache-Fehlschlägen stark reduziert werden und der T1 einen hohen Durchsatz mit einer geringeren Cache-Menge aufrechterhalten kann. Der Cache muss nicht mehr groß genug sein, um den gesamten oder den größten Teil des "Arbeitssatzes" aufzunehmen, nur die letzten Cache-Fehltreffer jedes Threads.

Benchmarks zeigen, dass dieser Ansatz bei kommerziellen (integer) Multithread-Workloads wie Java- Anwendungsservern, ERP-Anwendungsservern ( Enterprise Resource Planning ), E-Mail-Servern (wie Lotus Domino ) und Webservern sehr gut funktioniert hat . Diese Benchmarks deuten darauf hin, dass jeder Kern des UltraSPARC T1 leistungsstärker ist als der Single-Core-Single-Thread-UltraSPARC III aus dem Jahr 2001 und bei einem Chip-zu-Chip-Vergleich andere Prozessoren bei Multithread-Integer-Workloads deutlich übertrifft.

Physikalische Eigenschaften

Der UltraSPARC T1 enthält 279 Millionen Transistoren und hat eine Fläche von 378 mm 2 . Es wurde von Texas Instruments (TI) in ihrem 90-nm- Komplementär-Metall-Oxid-Halbleiter- (CMOS)-Prozess mit neun Ebenen von Kupferverbindungen hergestellt . Jeder Kern verfügt über einen L1 16kB Instruktionscache und einen 8KB Datencache. Der L2-Cache ist 3 MB groß und es gibt keinen L3-Cache.

Systeme

Sun Fire T1000-Server

Der T1-Prozessor ist in folgenden Produkten von Sun und Fujitsu Computer Systems zu finden :

Zielmarkt

Der Mikroprozessor UltraSPARC T1 ist einzigartig in seinen Stärken und Schwächen und als solcher auf bestimmte Märkte ausgerichtet. Anstatt verwendeten High-End - Zahl-Knirschen und ultra-Hochleistungsanwendungen wird der Chip an netzseitigen High-Demand - Server gezielt, wie stark frequentierten Webservern und Mid-Tier - Java, ERP- und CRM - Anwendung Server, die oft eine große Anzahl separater Threads verwenden. Eine der Einschränkungen des T1-Designs besteht darin, dass eine einzelne Gleitkommaeinheit (FPU) von allen 8 Kernen geteilt wird, was den T1 für Anwendungen mit viel Gleitkomma-Mathematik ungeeignet macht. Da die beabsichtigten Märkte des Prozessors jedoch in der Regel nicht viel von Gleitkomma-Operationen Gebrauch machen, erwartete Sun kein Problem. Sun bietet ein Tool zum Analysieren des Parallelitätsgrads einer Anwendung und zur Verwendung von Gleitkommaanweisungen, um festzustellen, ob sie für die Verwendung auf einer T1- oder T2-Plattform geeignet ist.

Neben der Verarbeitung auf Web- und Anwendungsebene eignet sich UltraSPARC T1 möglicherweise gut für kleinere Datenbankanwendungen mit einer großen Anzahl von Benutzern. Ein Kunde hat Ergebnisse veröffentlicht, die zeigen, dass eine MySQL- Anwendung, die auf einem UltraSPARC T1-Server ausgeführt wird, 13,5-mal schneller lief als auf einem AMD Opteron-Server.

Virtualisierung

T1 ist der erste SPARC-Prozessor, der den Ausführungsmodus Hyper-Privileged unterstützt. Der SPARC-Hypervisor wird in diesem Modus ausgeführt und kann ein T1-System in 32 logische Domänen unterteilen , von denen jede eine Betriebssysteminstanz ausführen kann.

Derzeit werden Solaris , Linux , NetBSD und OpenBSD unterstützt.

Probleme mit der Softwarelizenzierung

Traditionell berechnen kommerzielle Software-Suiten wie Oracle Database ihren Kunden basierend auf der Anzahl der Prozessoren, auf denen die Software ausgeführt wird. Anfang 2006 hat Oracle das Lizenzmodell durch die Einführung des Prozessorfaktors geändert . Bei einem Prozessorfaktor von 0,25 für den T1 benötigt ein 8-Core-T2000 nur eine 2-CPU-Lizenz.

Die "Oracle Processor Core Factor Table" wird seitdem regelmäßig aktualisiert, wenn neue CPUs auf den Markt kommen.

Im dritten Quartal 2006 führte IBM das Konzept des Value-Unit-Preises (VU) ein. Jeder Kern von T1 hat 30 PVUs (jeder T2-Kern hat 50 PVUs und T3 hat 70 PVUs) anstelle des Standardwerts von 100 PVUs pro Kern.

Schwächen

Der T1 bot nur eine einzelne Gleitkommaeinheit, die von den 8 Kernen geteilt wurde, was die Nutzung in HPC-Umgebungen einschränkte. Diese Schwäche wurde mit dem Nachfolgeprozessor UltraSPARC T2 gemildert , der 8 Gleitkommaeinheiten sowie weitere zusätzliche Funktionen enthielt.

Darüber hinaus war der T1 nur in Einprozessorsystemen verfügbar, was die vertikale Skalierbarkeit in großen Unternehmensumgebungen einschränkte. Diese Schwäche wurde mit dem Nachfolger „ UltraSPARC T2 Plus “ sowie der nächsten Generation SPARC T3 und SPARC T4 abgemildert . Die UltraSPARC T2+, SPARC T3 und SPARC T4 bieten alle Single-, Dual- und Quad-Socket-Konfigurationen.

Der T1 hatte einen hervorragenden Durchsatz mit einer enormen Anzahl von Threads, die vom Prozessor unterstützt wurden, aber ältere Anwendungen, die mit Single-Thread-Engpässen belastet waren, zeigten gelegentlich eine schlechte Gesamtleistung. Single-Thread-Anwendungsschwäche wurde mit dem nachfolgenden SPARC T4- Prozessor gemildert . Die T4-Kernanzahl wurde auf 8 reduziert (von 16 beim T3), die Kerne wurden komplexer, die Taktrate wurde fast verdoppelt – alles trug zu einer schnelleren Single-Thread-Leistung bei (von 300% auf 500% Steigerung gegenüber früheren Generationen). Zusätzliche Anstrengungen wurden unternommen, um die "kritische Thread-API" hinzuzufügen, bei der das Betriebssystem einen Engpass erkennt und vorübergehend die Ressourcen eines gesamten Kerns anstelle von 1 (von 8) Threads den Zielanwendungsprozessen mit Single-Threaded-CPU zuweist Dies ermöglichte es dem T4, Single-Thread-Engpässe auf einzigartige Weise zu mildern, ohne Kompromisse bei der Gesamtarchitektur eingehen zu müssen, um einen massiven Multi-Thread-Durchsatz zu erzielen.

Anwendungstuning

Die Nutzung der enormen Menge an Parallelität auf Thread-Ebene (TLP), die auf der CoolThreads-Plattform verfügbar ist, kann andere Anwendungsentwicklungstechniken erfordern als für herkömmliche Serverplattformen. Die Verwendung von TLP in Anwendungen ist der Schlüssel zu einer guten Leistung. Sun hat eine Reihe von Sun BluePrints veröffentlicht , um Anwendungsprogrammierer bei der Entwicklung und Bereitstellung von Software auf T1- oder T2-basierten CoolThreads-Servern zu unterstützen. Der Hauptartikel Tuning Applications on UltraSPARC T1 Chip Multithreading Systems befasst sich mit Problemen für allgemeine Anwendungsprogrammierer. Es gibt auch einen BluePrints-Artikel zur Verwendung der Cryptographic Accelerator Units auf den T1- und T2-Prozessoren.

Fallstudien

Auf der CoolThreads-Plattform wurden zahlreiche Anwendungen optimiert, darunter Symantec Brightmail AntiSpam, Siebel- Anwendungen von Oracle und der Sun Java System Web Proxy Server . Sun hat auch seine Erfahrungen mit der Verlagerung seines eigenen Online-Shops auf einen T2000-Server-Cluster dokumentiert und zwei Artikel zur Webkonsolidierung auf CoolThreads mit Solaris Containern veröffentlicht .

Sun hatte eine Seite zur Optimierung der Anwendungsleistung für eine Reihe von Open-Source- Anwendungen, darunter MySQL , PHP , gzip und ImageMagick . Die richtige Optimierung für CoolThreads-Systeme kann zu erheblichen Vorteilen führen: Wenn der Sun Studio-Compiler mit den empfohlenen Optimierungseinstellungen verwendet wird, verbessert sich die MySQL-Leistung um 268 % im Vergleich zur alleinigen Verwendung des Flags -O3 .

Zeitgenössische und nachfolgende Designs

Die "Coolthreads(TM)"-Architektur, beginnend mit dem UltraSPARC T1 (mit ihren positiven und negativen Aspekten), war sicherlich einflussreich in den gleichzeitigen und zukünftigen Designs von SPARC-Prozessoren.

"Felsen"

Der ursprüngliche UltraSPARC T1 wurde nur für Single-CPU-Systeme entwickelt und ist nicht SMP-fähig. "Rock" war ein ehrgeizigeres Projekt, das Multi-Chip-Serverarchitekturen unterstützen sollte und auf traditionelle datenorientierte Workloads wie Datenbanken abzielte. Es wurde eher als Nachfolger von Suns SMP-Prozessoren wie UltraSPARC IV und nicht als Ersatz für UltraSPARC T1 oder T2 angesehen, wurde jedoch im Zeitrahmen der Übernahme von Sun durch Oracle eingestellt .

UltraSPARC T2

Früher bekannt unter dem Codenamen Niagara 2 , dem Nachfolger des UltraSPARC T1, bietet der T2 acht Kerne. Im Gegensatz zum T1 unterstützt jeder Kern 8 Threads pro Kern, eine FPU pro Kern, eine erweiterte kryptografische Einheit pro Kern und in die CPU eingebettete 10-Gigabit-Ethernet-Netzwerkcontroller.

UltraSPARC T2 Plus

Im Februar 2007 kündigte Sun auf seiner jährlichen Analysten - Gipfel , dass die dritte Generation seines simultanes Multithreading - Design, Code-Namen Victoria Falls , wurde abgeklebt aus 2006. Eine im Oktober zwei Socket - Server (2 RU ) werden 128 Threads, 16 Kerne, und eine 65-fache Leistungsverbesserung gegenüber UltraSPARC III.

Auf der Hot Chips 19-Konferenz kündigte Sun an, dass Victoria Falls auf Zwei- und Vier-Wege-Servern sein wird. Somit unterstützt ein einzelner 4-Wege-SMP-Server 256 gleichzeitige Hardware-Threads.

Im April 2008 veröffentlichte Sun die 2-Wege-UltraSPARC T2 Plus-Server, die SPARC Enterprise T5140 und T5240.

Im Oktober 2008 hat Sun den 4-Wege-UltraSPARC T2 Plus SPARC Enterprise T5440 Server veröffentlicht.

SPARC T3

Im Oktober 2006 gab Sun bekannt, dass Niagara 3 mit einem 45-nm-Prozess gebaut wird. The Register berichtete im Juni 2008, dass der Mikroprozessor 16 Kerne haben wird, und deutete fälschlicherweise an, dass jeder Kern 16 Threads haben würde. Während der Hot Chips 21-Konferenz enthüllte Sun, dass der Chip über insgesamt 16 Kerne und 128 Threads verfügt. Laut der ISSCC 2010-Präsentation:

„Ein 16-Kern-SPARC-SoC-Prozessor ermöglicht bis zu 512 Threads in einem 4-Wege-glueless-System, um den Durchsatz zu maximieren. Der 6-MB-L2-Cache von 461 GB/s und der 308-Pin-SerDes-I/O von 2,4 TB/s unterstützen die erforderliche Bandbreite . Sechs Takt- und vier Spannungsdomänen sowie Energieverwaltungs- und Schaltungstechniken optimieren Leistung, Leistung, Variabilität und Ertragskompromisse über den 377 mm 2 Die.“

SPARC T4

Die T4-CPU wurde Ende 2011 veröffentlicht. Die neue T4-CPU wird von 16 Kernen (beim T3) auf 8 Kerne (wie sie bei T1, T2 und T2+ verwendet werden) fallen. Das neue T4-Core-Design (genannt "S3") zeichnet sich durch eine verbesserte Leistung pro Thread aufgrund der Einführung von Out-of-Order-Execution sowie eine zusätzliche verbesserte Leistung für Single-Thread-Programme aus.

2010 gab Larry Ellison bekannt, dass Oracle Oracle Linux auf der UltraSPARC-Plattform anbieten wird , und die Portierung sollte im Zeitrahmen T4 und T5 verfügbar sein.

John Fowler, Executive Vice President Systems Oracle, sagte auf der Openworld 2014, dass Linux irgendwann auf Sparc laufen kann.

SPARC T5

Die neue T5-CPU verfügt über 128 Threads auf 16 Kernen und wird mit einer 28-Nanometer-Technologie gefertigt.

Offenes Design

Am 21. März 2006 stellte Sun das UltraSPARC T1-Prozessordesign unter der GNU General Public License über das OpenSPARC- Projekt zur Verfügung. Die veröffentlichten Informationen umfassen:

  • Verilog- Quellcode des UltraSPARC T1-Designs;
  • Verifikationssuite und Simulationsmodelle;
  • ISA-Spezifikation (UltraSPARC Architecture 2005);
  • Die Simulationsbilder des Betriebssystems Solaris 10.

Verweise

Externe Links