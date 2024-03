Cloudera et NVIDIA collaborent pour développer des capacités d’IA générative avec NVIDIA Microservices

mars 2024 par Marc Jacob

Les données d’entreprise, associées à une plateforme complète optimisée pour les LLM (Large Language Models), jouent un rôle essentiel pour la progression des applications d’IA générative de la phase de pilotage à celle de la production. Les microservices NVIDIA NIM et NeMo Retriever permettent aux développeurs de relier des modèles d’IA à leurs données d’entreprise, afin de générer des réponses très précises et adaptées au contexte. Ces données d’entreprise peuvent notamment inclure du texte, des images et des diagrammes à barres, linéaires et circulaires. Grâce à ces microservices, les développeurs peuvent déployer des applications via NVIDIA AI Enterprise. Ils disposent ainsi de runtimes optimisés pour la construction, la personnalisation et le déploiement de LLM d’entreprise. Grâce aux microservices NVIDIA, Cloudera Machine Learning permet aux clients de libérer toute la valeur des données d’entreprise gérées avec Cloudera, où qu’elles se trouvent, en y associant non seulement des workflows ; et une plateforme d’IA à hautes performances, mais aussi des fonctions d’Accelerated Computing.

Avec les microservices NVIDIA, Cloudera proposera de multiples intégrations. Cloudera Machine Learning intégrera des services de modèles et d’applications basés sur les microservices de NVIDIA afin de booster les performances d’inférence des modèles pour l’ensemble des charges de travail. Grâce à cette nouvelle fonctionnalité de service de modèles d’IA, les clients peuvent bénéficier, pour tous les modèles déployés, quel que soit le lieu (à partir de clouds publics et privés) de la tolérance aux pannes, d’un service à faible latence et de l’auto-scaling. De plus, Cloudera Machine Learning offrira des microservices intégrés NVIDIA NeMo Retriever pour simplifier la connexion des LLM personnalisés avec les données d’entreprise. Les utilisateurs pourront ainsi construire des applications RAG (Retrieval-Augmented Generation) pour l’utilisation en production.

Cloudera a déjà travaillé avec NVIDIA en vue de la maîtrise du traitement des données accélérés par GPU grâce à l’intégration de NVIDIA RAPIDS Accelerator for Apache Spark dans Cloudera Data Platform. Aujourd’hui, avec le projet d’ajout des microservices NVIDIA et l’intégration de NVIDIA AI Enterprise, Cloudera Data Platform fournira des pipelines d’IA hybrides totalement rationalisés.

À l’avenir, les organisations, dans tous les secteurs d’activité, pourront construire, personnaliser et déployer plus rapidement et de façon plus intuitive les LLM exploités par l’IA générative. Les applications peuvent notamment inclure des copilotes de codage pour accélérer le temps de développement, des chatbots pour automatiser les interactions avec les clients et les services, des services de résumé de texte pour traiter rapidement des documents, la recherche rationalisée et contextuelle, entre autres fonctionnalités. Toutes ces innovations assurent un retour sur investissement plus rapide (revenus accrus et coûts optimisés) pour les entreprises en simplifiant et en accélérant les processus d’IA avancés.