Nvidia hat auf der GTC die Einführung von NIM-Microservices bekannt gegeben. NIM bündelt optimierte Inferenz-Engines, gängige APIs und KI-Modelle in Containern, um eine unkomplizierte Bereitstellung zu ermöglichen. Große Softwareanbieter wie SAP, Adobe, Cadence, CrowdStrike, Getty Images, ServiceNow und Shutterstock sowie Datenplattformanbieter wie BOX, Cohesity, Cloudera, Databricks, Datastax, Dropbox, NetApp und Snowflake unterstützen NIM. NIM ist auch ein Bestandteil der Nvidia Enterprise AI Software Suite, die auf der GTC ihre Version 5.0 präsentiert.
Im Wesentlichen ist ein NIM ein Container, der mit Microservices gefüllt ist und sowohl offene als auch proprietäre Modelle enthält, die auf Nvidia-GPUs laufen. Dieser Container kann überall dort eingesetzt werden, wo Container lauffähig sind, sei es in einer Kubernetes-Bereitstellung in der Cloud, auf einem Linux-Server oder in einem serverlosen Function-as-a-Service-Modell. NIMs unterstützen auch Funktionen wie Retrieval Augmented Generation (RAG) für Unternehmen. Anbieter von Vektordatenbanken wie Apache Lucene, Datastax, Faiss, Kinetica, Milvus, Redis und Weaviate unterstützen ebenfalls NIMs.
Die Einführung von NIMs zielt darauf ab, die Bereitstellungszeit von KI-Anwendungen von Wochen auf Minuten zu verkürzen. Dadurch können Benutzer ihre datengesteuerten Anwendungen sicher in ihrer eigenen Infrastruktur hosten und bei Bedarf skalieren.
Entwickler haben die Möglichkeit, die neuen Microservices auf der Plattform ai.nvidia.com kostenlos auszuprobieren. Die kommerzielle Nutzung der NIM-Microservices ist mit Nvidia AI Enterprise 5.0 auf Nvidia-zertifizierten Systemen und Cloud-Anbietern möglich. Das Unternehmen plant, die NIM-Microservices kontinuierlich zu verbessern, zum Beispiel durch die Optimierung der verwendeten KI-Modelle für Nvidia-Hardware.
Mus Lesen : BYD Stock Forecast FOR 2024, 2025, 2026, 2030, 2040, And 2050.
NIM-Microservices für SAP und Biotech
Eines der ersten großen Unternehmen, das von den neuen NIM-Microservices profitiert, ist SAP. Sie nutzen die Microservices, um den Einsatz von generativer KI in Unternehmensanwendungen zu beschleunigen. Das Ziel ist es, Kunden die Nutzung ihrer Geschäftsdaten in SAP-Cloud-Lösungen mit generativer KI zu ermöglichen.
Die Zusammenarbeit konzentriert sich auf die Entwicklung und Bereitstellung von SAP Business AI, einschließlich skalierbarer, geschäftsspezifischer generativer KI-Funktionen innerhalb von SAPs Joule Copilot und im gesamten Cloud-Lösungs- und Anwendungsportfolio von SAP.
Nvidia hat auch eine Vielzahl von Mikroservices vorgestellt, die die Arzneimittelforschung und die Medizintechnik voranbringen sollen. Diese über zwei Dutzend Services sind über die Cloud verfügbar und basieren auf KI-Modellen und -Tools, die speziell für das Gesundheitswesen optimiert wurden. Sie bieten unter anderem fortschrittliche Bildgebung, Spracherkennung und generative biologische und chemische Vorhersage und Simulation.
Auch Nvidias BioNeMo erhält ein Update mit neuen Modellen für die Analyse von DNA-Sequenzen, die Vorhersage von Veränderungen der Proteinstruktur durch Medikamente und die Bestimmung der Zellfunktion basierend auf RNA. Diese Modelle sind nun auch als Microservices über Nvidias NIM verfügbar.