Rechercher
Contactez-nous Suivez-nous sur Twitter En francais English Language
 

Abonnez-vous gratuitement à notre NEWSLETTER

Newsletter FR

Newsletter EN

Vulnérabilités

Se désabonner

L’impact réciproque du stockage flash et de l’IA, et sur l’évolution des coûts de la mémoire flash

novembre 2023 par Federica Monsone, fondatrice d’A3 Communications, l’agence RP experte Storage

La mémoire flash a été, sans aucun doute, une technologie révolutionnaire lorsqu’elle est entrée pour la première fois dans les centres de données des entreprises il y a une vingtaine d’années et a immédiatement commencé à transformer les performances d’un large éventail d’applications.

Nous avons voulu comprendre la relation entre la mémoire flash et les développements révolutionnaires qui se produisent actuellement dans le domaine de l’intelligence artificielle (IA). Nous avons donc réuni un groupe d’experts sur le sujet de l’impact de la mémoire flash sur l’IA et également sur les domaines connexes de l’analytique, de l’IoT et du edge computing.

Et vice versa, nous avons également demandé à ces experts dans quelle mesure ces technologies allaient modifier le niveau d’adoption de la technologie flash. Le coût étant un facteur déterminant pour la mise en œuvre de toute technologie, et les prix du flash ayant chuté au cours des vingt dernières années, nous leur avons également demandés s’ils s’attendaient à ce que les prix du flash continuent de baisser dans les 5 ans à venir.

La relation entre l’IA et la technologie flash est difficile à définir

Plus une application a besoin d’accéder à un grand nombre de données, plus l’augmentation des performances est importante si les données sont stockées dans la mémoire flash plutôt que sur un disque en rotation. L’IA étant une application très gourmande en données, il peut sembler raisonnable de supposer que sans flash, il n’y aurait pas d’IA moderne. Cependant, plus d’un expert de notre panel a remis en question cette notion.

"Certains acteurs du secteur affirment que l’IA d’aujourd’hui n’existerait pas sans le passage à la technologie de stockage à semi-conducteurs. C’est peut-être vrai, mais c’est extrêmement difficile à prouver. La formation à l’IA consomme d’énormes ressources, et les disques SSD (solid-state drives) ont accéléré l’amélioration des performances informatiques dans tous les domaines, de sorte que l’IA en a bénéficié", a déclaré Jim Handy, directeur général du cabinet d’analystes Objective Analysis. Et d’ajouter : "Il en va de même pour toute discipline avec une technologie informatique avancée, qu’il s’agisse d’analyse, de physique nucléaire ou de météorologie".

David Norfolk, responsable du développement au sein du cabinet d’analyse Bloor Research, a déclaré :

" Dans la mesure où le flash rend le stockage plus rapide, moins cher et plus fiable, il permet des innovations à forte intensité de données telles que l’IA/ML, l’analytique, l’IoT et le traitement en périphérie. Inversement, ces innovations ont besoin d’un stockage plus rapide, moins cher et plus fiable, et je m’attends à ce que l’adoption de la technologie flash suive l’adoption de ces innovations."

Leander Yu, président-directeur général de Graid Technology, a déclaré : "Les solutions de mémoire flash et de stockage tout-flash sont avant tout une question de performance. Les killer apps de l’IA/ML et de l’analytique sont les domaines dans lesquels les clients investissent dans leur infrastructure informatique, et ces charges de travail exigent les performances fournies par le stockage all-flash."

Peter Donnelly, directeur des produits chez ATTO, a un point de vue plus large : "Je pense que nous sommes au milieu d’un changement radical dans la manière dont les données sont collectées et consommées, ainsi que dans l’endroit où elles le sont. C’est ce qui rend nécessaire la désagrégation du centre de données. Cela ne veut pas dire que les centres de données cesseront d’exister, mais ils deviennent moins structurés et plus flexibles. Il s’agit là d’une dynamique importante qui stimule le besoin de mémoire flash et de stockage flash. Comment accéder à des données situées à l’autre bout du pays, voire du monde, et les utiliser d’une manière qui donne l’impression qu’elles sont localisées localement ? La mémoire flash permet de relever ce défi et de mettre en œuvre des technologies émergentes telles que l’intelligence artificielle et l’analyse de données à une échelle qui était impossible jusqu’à présent.

L’IA et l’analytique modifient l’architecture des systèmes de stockage alimentés par flash.

Mais même si l’impact du flash sur l’IA, l’analytique, l’IoT et le traitement en périphérie est difficile à quantifier, la flash est certainement un élément clé de l’infrastructure informatique construite pour gérer ces charges de travail. Lorsqu’il s’agit de mettre en œuvre l’IA, cette infrastructure est sur le point de recevoir plus d’attention qu’elle ne l’a fait jusqu’à présent, selon Randy Kerns, directeur Stratégie au sein du cabinet d’analystes Futurum Group.

"Je pense que nous commençons tout juste à voir l’importance de la technologie sous-jacente utilisée pour l’IA/ML. Actuellement, l’accent a été mis sur les algorithmes et le conditionnement des données à partir de sources multiples pour opérer et construire les données de formation et de test. C’est à juste titre que l’attention s’est portée sur le fonctionnement des aspects fonctionnels. Aujourd’hui, avec la maturation, l’importance d’améliorer la technologie et d’obtenir des résultats plus rapidement va amener à prendre davantage en considération les technologies de stockage. Certaines implémentations peuvent être plus avancées que d’autres, mais nous verrons plus d’importance dans l’IA/ML et l’utilisation du stockage flash comme une évidence", a-t-il déclaré

La capacité de la mémoire flash à gérer des accès aléatoires aux données ou aux opérations IO répond aux besoins de l’IA/ML et de l’analytique. "Les disques durs sont des dispositifs steampunk. Les disques SSD, grâce à leurs énormes avantages en termes d’IOP [opérations d’entrée-sortie par seconde], ont pris en charge toutes les charges de travail qui impliquent des transferts de petite taille et/ou aléatoires. La formation et l’analyse AI/ML impliquent un caractère aléatoire dans leurs charges de travail E/S, et l’IoT est dominé par des transferts extrêmement faibles, ce qui en fait deux exemples de réussite précoce pour les systèmes de stockage tout-flash ", a déclaré Curtis Anderson, architecte logiciel chez Panasas, un fournisseur de logiciels de stockage pour les charges de travail nécessitant des performances élevées.

En plus de contribuer à l’adoption des systèmes de stockage tout-flash, les besoins en performances de l’IA/ML entraînent également des changements architecturaux au sein de ces systèmes. "Les considérations architecturales relatives à la manière dont les données entrent et sortent du stockage sont également importantes. C’est pourquoi le stockage HPC traditionnel est bien adapté aux charges de travail de l’IA, et de nombreuses nouvelles entreprises de stockage arrivent sur le marché et exploitent le flash et le NVMe [le protocole de stockage utilisé pour accéder au flash] pour offrir une faible latence sur toute la ligne et éradiquer tout goulot d’étranglement potentiel au niveau de la couche de stockage", a déclaré Amos Ankrah, spécialiste des solutions chez Boston, un fournisseur de serveurs et de systèmes de stockage à haute performance.

De TB à PB - l’échelle de l’utilisation de la mémoire flash varie énormément

Les applications d’IA telles que la conduite autonome et les grands modèles de langage (LLM) sont, selon les termes de Curtis Anderson, des " bébés exemples " pour les énormes ensembles de données d’entrainement des modèles d’IA. À titre d’exemple, il cite l’utilisation par Tesla de plus de 200 Po de ce que le constructeur automobile appelle la "capacité de cache à chaud". Toutefois, C. Anderson affirme que la plupart des entreprises utilisent des ensembles de données beaucoup plus petits pour le développement de l’IA. "La grande majorité (en nombre) des projets d’IA/ML ont des besoins en capacité (nettement) inférieurs à 100 To", a-t-il déclaré. C’est 2 000 fois moins de capacité que le "hot tier" de Tesla.

Curtis Anderson et ses collègues s’attendent à ce que ces ensembles de données d’IA plus spécifiques augmentent, mais lentement. Et c’est tant mieux, car la mémoire flash est nettement plus chère que le disque, mais son utilisation est souvent essentielle pour l’apprentissage de l’IA. L’écart entre les performances des disques et celles de la mémoire flash est encore plus important pour l’IA que pour d’autres applications, en raison de la nature généralement aléatoire de l’accès aux données de l’IA. Pendant des décennies, les fournisseurs de solutions de stockage ont compensé la vitesse relativement faible à laquelle les disques traitent les demandes d’accès semi-aléatoires aux données en identifiant les données chaudes ou fréquemment accédées et en les stockant dans des caches de lecture DRAM-mémoire très rapides. "La mise en cache de la lecture est très utile lorsqu’un petit pourcentage des données est connectée plusieurs fois. L’IA/ML ne correspond pas souvent à ces schémas d’accès E/S traditionnels, ce qui oblige les entreprises à adopter une approche largement basée sur la mémoire flash pour de nombreuses charges de travail IA/ML", a déclaré Steven Umbehocker, fondateur et PDG d’OSNexus, un fournisseur de systèmes de stockage évolutifs définis par logiciel.

La performance n’est pas la seule vertu du flash, en particulier pour l’IoT et la périphérie.

La performance n’est pas le seul avantage qu’offre le flash par rapport au disque, car les disques SSD consomment moins d’énergie tout en étant potentiellement plus fiables et capables de résister à des environnements difficiles. "Dans des applications telles que l’IoT, le traitement en périphérie et le TinyML (apprentissage automatique en périphérie), l’une des principales priorités en matière de conception est la volonté toujours croissante de réduire la consommation d’énergie - à la fois dynamique et en veille - tout en garantissant les performances les plus élevées possibles. En outre, pour toute conception IoT, la réduction des coûts est une autre grande priorité", a déclaré Coby Hanoch, PDG et fondateur de Weebit Nano, un développeur de mémoires à semi-conducteurs de nouvelle génération.

La capacité de la mémoire flash à survivre aux environnements difficiles est un autre avantage. "Si l’on parle de la périphérie, de l’infrastructure des tours cellulaires et d’autres infrastructures locales, le stockage à l’état solide, en particulier les disques SSD, est une technologie habilitante indéniable car elle fonctionne mieux à des températures extrêmes que d’autres technologies de stockage, telles que les disques durs, qui trouveraient ces conditions difficiles", a déclaré Tom Coughlin, président du cabinet d’analystes Coughlin Associates, et membre de l’initiative Compute, Memory and Storage de l’organisme industriel Storage Networking Industry Association (SNIA).

Roy Illsley, analyste en chef du cabinet d’études Omdia, a mis en évidence une autre caractéristique physique de la mémoire flash : "Un deuxième aspect digne d’intérêt est que pour les cas d’utilisation en périphérie, la capacité de fonctionner à partir d’un faible encombrement, de sorte que les charges de travail d’inférence de l’IA peuvent être déployées dans des endroits éloignés, signifie que la flash est le stockage de choix lorsque l’espace physique est un facteur restrictif."

Dennis Hahn, analyste principal chez Omdia, a déclaré que le stockage flash à la périphérie se trouve souvent dans une infrastructure hyperconvergée (HCI). "Dans des cas d’utilisation tels que la périphérie, le traitement de résultats en temps réel est souvent le cas, et un stockage flash rapide local aux serveurs de traitement est donc nécessaire. Dans ses recherches, Omdia a constaté que ces systèmes de périphérie sont souvent des systèmes HCI utilisant des dispositifs SSD." Mais cela ne signifie pas que les données de l’IdO sont toujours stockées en flash. "La collecte de données comme celle de l’IdO est souvent plus axée sur le coût, et les données voyagent souvent sur l’internet relativement lent. [Les solutions de stockage en vrac telles que les disques durs sont donc plus fréquemment utilisées. Mais, en fin de compte, la mémoire flash entre en jeu pour sa vitesse de traitement des données de l’IdO."
Se référant à la variante NOR de la flash qui est intégrée dans les processeurs de systèmes sur puce, Hanoch de Weebit Nano a déclaré : "Dans les appareils effectuant de l’IA ou de la ML à la périphérie, la flash est utilisée non seulement pour le stockage et le démarrage du code / firmware, mais surtout la flash, et encore plus les nouveaux types de NVM comme ReRAM, est également utilisée pour stocker les poids des réseaux neuronaux nécessaires aux calculs de l’IA. Pour prendre en charge cette fonctionnalité tout en maintenant le coût et la puissance au minimum, nous voyons des conceptions qui poussent vers des nœuds plus avancés tels que 28nm et 22nm, qui sont actuellement le point idéal pour les dispositifs IoT et de périphérie. Cela nécessite une NVM intégrée dans un SoC de manière monolithique, mais la flash intégrée ne peut pas être mise à l’échelle en 28 nm ou moins, de sorte que les concepteurs ne peuvent pas l’intégrer avec d’autres fonctionnalités sur une seule matrice. Il s’agit là d’un défi de taille pour la conception de ces petits appareils bon marché, souvent alimentés par des piles.

L’écart entre les prix des disques et des mémoires flash ne changera pas

La variante de la mémoire flash qui domine largement l’utilisation de la mémoire flash est la mémoire flash NAND. Jusqu’à la fin des années 90, la mémoire flash NAND était une technologie très coûteuse et rarement utilisée. Cette situation a changé à la fin des années 90, lorsque les fabricants d’appareils alimentés par batterie, tels que les lecteurs MP3 et les téléphones mobiles, ont cherché un support de stockage de données consommant moins d’énergie que les lecteurs de disques miniatures. La technologie flash NAND répondait à ce besoin, la production a explosé et les prix ont chuté. Il est toutefois surprenant de constater que ce n’est que vers 2004 que la mémoire flash NAND est devenue moins chère que la mémoire DRAM.

Cependant, la comparaison de prix la plus importante a toujours été celle entre la mémoire flash et le disque. Bien que le prix de la mémoire flash ait baissé au cours des vingt dernières années, il en a été de même pour le prix des lecteurs de disques, lorsque les deux sont mesurés en termes de dollars par unité de capacité de stockage. Au cours de la dernière décennie, l’écart entre les deux est resté relativement stable. "Au cours des dix dernières années, les prix des disques SSD par rapport aux prix des disques durs ont été multipliés par 5 ou 7, selon les cas", a déclaré C. Anderson. Cette estimation de la différence de prix a été reprise par Umbehocker et par Giorgio Regni, directeur technique de Scality, qui ont tous deux estimé que la différence de prix par To était multipliée par cinq.

"Nous ne pensons pas que le marché pousse les vendeurs de flash à changer cela à l’avenir", a déclaré C. Anderson. Se référant à ce que l’on appelle les fabs - les usines de fabrication qui produisent des puces flash et d’autres semi-conducteurs - M. Anderson a ajouté : "Il n’y a qu’une poignée de fabs flash dans le monde et on n’en construit pas de nouvelles à un rythme qui dépasserait la croissance de la demande de flash". Ce point de vue est partagé par d’autres experts, qui soulignent la nécessité de construire de nouvelles fabs pour augmenter la production mondiale, ainsi que les dépenses énormes que cela implique, qui vont de centaines de millions à des milliards de dollars par usine de fabrication, et les années de planification et de construction nécessaires.

Les experts s’attendent à ce que les prix du flash continuent à baisser

À court terme, les prix du flash ont toujours connu des variations spectaculaires. Pour Objective Analysis, Handy a déclaré "Pendant les pénuries, les prix s’aplanissent généralement, mais ils augmentent parfois un peu. Dans de très rares cas, ils augmentent considérablement, comme en 2018. Lorsque la pénurie se transforme en offre excédentaire, on assiste toujours à un effondrement rapide et alarmant des prix. Cet effondrement s’est produit au second semestre 2022, lorsque les prix ont chuté de 70 %."

Boyan Krosnov, directeur technique et cofondateur de StorPool, un fournisseur de systèmes de stockage distribués définis par logiciel, a décrit les facteurs qui influencent les tendances de prix à long terme pour la mémoire flash. "Le prix futur de la mémoire flash dépendra du coût du capital, du coût de l’énergie, de l’offre et de la demande, qui dépendent fortement de la croissance globale de l’infrastructure informatique. Si vous pensez que l’économie mondiale va croître et que l’infrastructure informatique va se développer encore plus rapidement, le prix de la mémoire flash augmentera dans les 1 à 2 prochaines années. Ensuite, la capacité de production rattrapera son retard et, dans quelques années, le prix reprendra sa lente tendance à la baisse.

Shawn Meyers, directeur technique de Tintri, partage cet avis : "L’économie mondiale sera le facteur le plus important, en dehors des nouvelles percées révolutionnaires dans la fabrication des flashes. Les ondulations de la chaîne d’approvisionnement suivront l’effet de fouet dans un avenir prévisible". Toutefois, entre l’effondrement des prix et les hausses de prix, les prix par TB chutent lentement, selon M. Handy d’Objective Analysis, qui a déclaré que les tendances de prix sont étonnamment prévisibles et que sa société produit les prévisions de prix les plus précises et les plus constantes du secteur. À quelle vitesse l’analyse objective estime-t-elle que les prix de l’éclair baisseront au cours des cinq prochaines années ? "D’ici à la mi-2028, la baisse moyenne des prix sera d’environ 15 % par an", a déclaré M. Handy, ajoutant qu’une éventuelle pénurie au milieu ou à la fin de l’année 2024 serait suivie d’une offre excédentaire et d’un effondrement des prix en 2026.

Toutefois, G.Regni, de Scality, prévoit une baisse de prix encore plus rapide pour la variante QLC la moins chère de la mémoire flash. "D’après les feuilles de route des fabricants de matériel et de disques, nous prévoyons une baisse spectaculaire du coût (mesuré en dollars par téraoctet) des disques SSD flash à haute densité (QLC). Les données qui nous ont été communiquées indiquent une baisse de plus de 60 % entre 2022 et 2025", a déclaré G. Regni pour Scality.
Cette baisse de prix de 60 % citée par Regni pour la flash QLC équivaut à une réduction moyenne composée de 26 % entre 2022 et 2025, ce qui serait nettement plus rapide que la prédiction de 15 % de Handy pour les prix globaux de la flash sur la période plus longue de 2023 à 2028. Regni a ajouté : "Bien que cette baisse soit plus rapide que celle des disques durs haute densité équivalents, nous constatons que les disques durs conservent un avantage de coût de 5 fois par rapport aux disques SSD au cours de la même période".


Voir les articles précédents

    

Voir les articles suivants