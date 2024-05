Teradata AI Unlimited sera bientôt disponible

mai 2024 par Marc Jacob

Teradata annonce l’adoption d’une approche ouverte et connectée unique pour la prise en charge de formats de tables ouverts (OTF) Apache Iceberg et Linux Foundation Delta Lake. Celle-ci s’inscrit dans la volonté de Teradata de répondre à l’évolution de l’industrie vers les technologies open source et de proposer à ses clients une offre inégalée en matière de gestion des données. En outre, cette décision vient ajouter une dimension prospective à Teradata VantageCloud Lake, la plateforme d’analyse de données cloud-native de dernière génération de Teradata pour l’IA, ainsi qu’à Teradata AI Unlimited, un moteur d’IA/ML à la demande et cloud-native, qui sera présenté au grand public en avant-première sur les marketplaces d’AWS et d’Azure à partir du deuxième trimestre 2024. L’approche entièrement ouverte et connectée de Teradata est conçue pour être tournée vers l’avenir, et permettre aux entreprises d’employer une stratégie de données moderne combinant une agilité et une flexibilité inégalées pour utiliser une IA de confiance à grande échelle.

Les OTF représentent une évolution considérable du stockage des données propriétaires en faveur d’un stockage plus flexible et qui peut être utilisé sur plusieurs plateformes. L’objectif de cette introduction consiste à améliorer l’interopérabilité, augmenter la rentabilité et à offrir une plus grande liberté de choix aux clients. Si certaines entreprises se targuent d’offrir une capacité d’ouverture grâce aux OTF, elles enferment les utilisateurs dans des formats privilégiés qui étouffent la créativité et l’innovation souhaitées par les premiers et les futurs utilisateurs. La prise en charge agnostique des OTF et l’intégration des catalogues ouverts de Teradata sont conçues pour permettre à la plateforme de lire différents catalogues dans des conditions d’exécution prévisibles. Grâce à sa mise en œuvre et à son approche uniques du traitement parallèle, de la gestion des workloads et de l’optimisation des requêtes pour les données partagées, la plateforme est conçue pour fournir les meilleures performances du marché. Avec ses offres cloud-native, multicloud et à la demande, Teradata offre la liberté de choix souhaitée en matière de gestion des données, sans impacter la puissance et l’évolutivité de son moteur, ce qui lui permet de se démarquer en termes d’optimisation de la valeur et des résultats d’une entreprise.

La plateforme de Teradata, la plus ouverte du secteur, offre des services first-party pour les OTF Apache Iceberg et Linux Foundation Delta Lake avec une prise en charge complète des données en lecture et en écriture stockées dans plusieurs OTF. Cette interopérabilité s’étend aux catalogues AWS Glue, Unity et Apache Hive et fonctionne dans des environnements multicloud et multi data lakes, de sorte à offrir aux clients de Teradata une expérience de données connectée et harmonisée, sans avoir à déplacer ou transformer les données.

L’adoption de l’IA a entraîné une consolidation rapide des entrepôts de données, de l’analytique et des workloads de data science dans des lakehouses unifiés. La prise en charge des OTF améliore considérablement les capacités des entrepôts de données de Teradata, en fournissant une couche d’abstraction de stockage conçue pour être flexible, rentable et facile d’utilisation. En outre, les utilisateurs peuvent exploiter AI Unlimited et d’autres moteurs analytiques sur leurs propres ensembles de données, dans leurs propres cloud object stores – ce qui leur permet d’adopter une approche agile et optimale sans devoir déplacer leurs données –, une tâche à la fois complexe et coûteuse. Enfin, l’accès sécurisé et partagé à de grands ensembles de données permet aux clients de Teradata de créer des pipelines de données, d’évaluer et d’entraîner des modèles, ou encore d’améliorer l’analyse et la prise de décision.

Teradata AI Unlimited

Aujourd’hui, les ensembles de données d’IA sont l’une des façons les plus courantes dont les entreprises organisent leurs OTF. Il est donc primordial que les plateformes destinées à accélérer les cas d’usage de l’IA – telles que Teradata AI Unlimited – puissent prendre en charge ce format de données. Teradata AI Unlimited est un moteur d’intelligence artificielle et de machine learning (IA/ML) à la demande et natif dans le cloud, entièrement ouvert et connecté, qui prend désormais en charge les OTF afin d’accélérer, de faciliter et de rentabiliser l’innovation dans le domaine de l’IA. Bientôt disponible en avant-première publique sur les marketplaces d’AWS et d’Azure, AI Unlimited permet aux data scientists, aux ingénieurs data et aux développeurs d’explorer, d’expérimenter et d’opérationnaliser des projets d’IA à l’échelle.

Teradata AI Unlimited est conçu pour fournir des capacités de calcul extrêmement performantes, un traitement massivement parallèle et des analyses avancées in-engine nécessaires à l’exécution et à l’opérationnalisation des workloads d’IA. AWS SageMaker et Azure Machine Learning peuvent être intégrés aux workloads d’AI Unlimited, et Azure OpenAI Services fournit de grands modèles de langage (LLM) pouvant être utilisés pour développer des applications d’IA générative. En outre, les prototypes réalisés dans AI Unlimited peuvent être transférés en toute simplicité vers la phase de production dans VantageCloud, ce qui, selon Teradata, apportera une valeur ajoutée rapide et substantielle aux entreprises.

AI Unlimited allie les capacités puissantes de ClearScape Analytics, la solution analytique de référence sur le marché, conçue pour fournir aux entreprises la transparence, l’explicabilité et la reproductibilité nécessaires pour leur permettre d’utiliser une IA de confiance.

Nouvelles intégrations

Les OTF et AI Unlimited peuvent réduire les coûts et la complexité des workloads d’IA en minimisant les coûts de stockage ainsi que la nécessité de déplacer ou de reproduire les données. Teradata a également ajouté de nouvelles intégrations avec des outils tiers – Airbyte Cloud, Apache Airflow™ et dbt™ (data build tool) – qui font partie du Modern Data Stack. Ces intégrations ont pour but d’accélérer la construction de pipelines de données, de maximiser la productivité en allégeant la charge de travail des ingénieurs data (en éliminant les tâches répétitives) et d’ainsi favoriser une croissance rentable.

• Airbyte Cloud : rationalise l’ingestion de données dans VantageCloud grâce à un service entièrement managé et hébergé, qui élimine la nécessité d’une configuration et d’une gestion fastidieuse de l’infrastructure.

• Apache Airflow : permet de créer, planifier et contrôler systématiquement les workflows.

• dbt (data build tool) : s’occupe de la phase de « Transformation » dans le processus d’ELT (Extract Load Transform) et est un outil couramment utilisé pour la transformation de données dans les bases de données, les data lakes et les entrepôts de données.

Disponibilité

La prise en charge des OTF sera disponible sur VantageCloud Lake et AI Unlimited sur AWS et Azure à partir de juin 2024.

AI Unlimited sera disponible à l’achat en avant-première sur les marketplaces d’AWS et d’Azure à partir du deuxième trimestre 2024.

Les intégrations avec Airbyte Cloud, Apache Airflow et dbt sont désormais disponibles au grand public.