Gate News Nachrichten, 17. März: Nvidia hat auf der GTC-Konferenz offiziell den Vera CPU vorgestellt, den ersten Prozessor, der speziell für Agent AI und Reinforcement Learning entwickelt wurde. Während AI sich vom Generieren und Inferenz zu autonomen Agenten entwickelt, steigen die Anforderungen an CPUs für Arbeitsabläufe wie Planung, Tool-Calls, Code-Ausführung und Ergebnisüberprüfung erheblich. Nvidia-CEO Jensen Huang sagte: „CPUs sind nicht mehr nur unterstützend für Modelle, sie treiben die Modelle an.“
Vera nutzt 88 Nvidia-eigene Olympus-Kerne, wobei jeder Kern durch Spatial Multithreading gleichzeitig zwei Aufgaben ausführen kann, ideal für Multi-Tenant AI-Fabriken mit massiver Parallelverarbeitung. Der Speicher basiert auf der zweiten Generation energiesparender Subsysteme LPDDR5X mit einer Bandbreite von 1,2 TB/s, doppelt so hoch wie bei herkömmlichen CPUs, bei halbiertem Energieverbrauch.
Bereits geplante Cloud-Anbieter für den Einsatz sind Alibaba, ByteDance, Cloudflare, CoreWeave, Lambda, Nebius, Oracle Cloud (OCI), Together.AI, Vultr und andere. In Bezug auf Hardware haben sich 19 Hersteller wie Dell Technologies, HPE, Lenovo und Supermicro bereits angepasst. Michael Truell, Mitbegründer und CEO des AI-Programmier-Tools Cursor, sagte, dass Vera die Durchsatz- und Reaktionsgeschwindigkeit bei der Programmierung von Agenten verbessern werde. Das Streaming-Datenplattform Redpanda hat Vera getestet, um Apache Kafka-kompatible Lasten auszuführen, wobei die Latenz um bis zu 5,5-mal reduziert wurde. Auch das Los Alamos National Laboratory, das Lawrence Berkeley National Laboratory und das Texas Advanced Computing Center haben die Planung für den Einsatz abgeschlossen. Der Vera CPU befindet sich in der Massenproduktion und wird im zweiten Halbjahr dieses Jahres über Partner ausgeliefert.