Le calcul haute performance (HPC) fait référence à la pratique consistant à agréger la puissance de calcul d'une manière qui offre une puissance de cheval beaucoup plus élevée que les ordinateurs et serveurs traditionnels. Le HPC, ou supercalcul, est comme l’informatique quotidienne, mais en plus puissant. Il permet de traiter d’énormes volumes de données à des vitesses très élevées grâce à plusieurs ordinateurs et à des terminaux de stockage organisés dans un ensemble cohérent. Le HPC permet d’explorer et de trouver des réponses à certains des plus grands problèmes mondiaux dans les domaines de la science, de l’ingénierie et des affaires.
Aujourd'hui, le calcul haute performance est utilisé pour résoudre des problèmes complexes nécessitant de nombreuses performances, et les entreprises migrent de plus en plus les charges de travail de calcul haute performance vers le cloud. Le calcul haute performance dans le cloud modifie l'aspect économique du développement de produits et de la recherche, car il nécessite moins de prototypes, accélère les tests et réduit le délai de mise sur le marché.
Certaines tâches, telles que le séquençage de l’ADN, sont tout simplement trop immenses pour être traitées par un seul ordinateur. Les environnements HPC ou de supercalcul relèvent ces défis importants et complexes avec des nœuds individuels (ordinateurs) travaillant ensemble dans un cluster (groupe connecté) pour effectuer d’énormes quantités de calcul en peu de temps. La création et la suppression de ces clusters sont souvent automatisées dans le cloud pour réduire les coûts.
Le HPC peut être réalisé sur de nombreux types de tâches, mais les deux plus courantes sont les tâches parallèles embarrassantes et les tâches étroitement liées.
Ce sont des problèmes de calcul divisés en petites tâches simples et indépendantes qui peuvent être exécutées en même temps, souvent avec peu ou pas de communication entre elles. Par exemple, une entreprise peut soumettre 100 millions d’enregistrements de carte de crédit à des cœurs de processeur individuels dans un cluster de nœuds. Le traitement d’un enregistrement de carte de crédit est une petite tâche, mais lorsque 100 millions d’enregistrements sont répartis dans le cluster, ces petites tâches peuvent être effectuées en même temps (en parallèle) à des vitesses étonnantes. Les cas d’utilisation courants incluent les simulations de risques, la modélisation moléculaire, la recherche contextuelle et les simulations logistiques.
En général, on prend une grande charge de travail partagée et on la divise en petites tâches qui communiquent en permanence. En d’autres termes, les différents nœuds du cluster communiquent entre eux pendant qu’ils effectuent leur traitement. Les cas d’utilisation courants incluent la dynamique des fluides computationnelle, la modélisation des prévisions météorologiques, les simulations de matériaux, les émulations de collision automobiles les simulations géospatiales et la gestion du trafic.
Le HPC est un élément essentiel de la recherche universitaire et de l’innovation industrielle depuis des décennies. Il aide les ingénieurs, les scientifiques des données, les concepteurs et autres chercheurs à résoudre des problèmes complexes et volumineux en beaucoup moins de temps et à un coût moindre que l’informatique traditionnelle.
Les principaux avantages du HPC sont:
Les entreprises du classement Fortune 1000 dans presque tous les secteur d’activité font appel au HPC, dont la popularité ne cesse de croître. Selon Hyperion Research, le marché mondial du HPC devrait atteindre 44 milliards de dollars d’ici 2022.
Voici quelques-uns des secteurs qui utilisent le HPC et les types de charges de travail que ce dernier les aide à exécuter :
Le HPC peut être réalisé on-premise, dans le cloud, ou au sein d’un modèle hybride qui comporte une partie de chaque modèle.
Dans un déploiement HPC on-premise, une entreprise ou un institut de recherche construit un cluster HPC composé de serveurs, de solutions de stockage et d’autres infrastructures qu’elle gère et met à niveau au fil du temps. Dans un déploiement HPC cloud, un fournisseur de service cloud administre et gère l’infrastructure, et les organisations l’utilisent selon un modèle de paiement à la demande.
Certaines organisations adoptent des déploiements hybrides, en particulier celles qui ont investi dans une infrastructure on-premise, mais qui souhaitent également bénéficier de la vitesse, la flexibilité et les économies de coût du cloud. Elles peuvent utiliser le cloud pour exécuter certaines charges de travail HPC de manière continue et opter pour les services cloud ponctuellement, lorsque le temps d’attente on-premise devient un problème.
Les entreprises disposant d'environnements HPC sur site ont un grand contrôle sur leurs opérations, mais elles doivent faire face à plusieurs défis, notamment
En partie à cause des coûts et autres défis des environnements sur site, les déploiements de calcul haute performance basés sur le cloud sont de plus en plus populaires, tandis que Market Research Future anticipe 21 % de croissance du marché mondial de 2017 à 2023. Lorsque les entreprises exécutent leurs charges de travail HPC dans le cloud, elles ne payent que pour ce qu'elles utilisent et peuvent rapidement évoluer en fonction de leurs besoins.
Pour gagner et fidéliser les clients, les principaux fournisseurs cloud offrent des technologies de pointe spécialement conçues pour les charges de travail HPC, il n’y a donc aucun risque de baisse des performances lorsque l’équipement on-premise vieillit. Les fournisseurs cloud proposent les processeurs et les GPU les plus récents et les plus rapides, ainsi qu’un stockage flash à faible latence, des réseaux RDMA ultra-rapides et une sécurité d’entreprise. Les services sont disponibles toute la journée, tous les jours, avec peu ou pas de temps d’attente.
Tous les fournisseurs cloud ne se valent pas. Certains clouds ne sont pas conçus pour le HPC et ne peuvent pas fournir des performances optimales pendant les périodes de pointe des tâches exigeantes. Les quatre caractéristiques à prendre en compte lors de la sélection d’un fournisseur cloud sont les suivantes
En règle générale, il est préférable d’opter pour des services cloud bare metal, qui offrent plus de contrôle et de performances. Combiné à la mise en réseau de cluster RDMA, le HPC bare metal fournit des résultats identiques à ceux que vous obtenez avec un matériel similaire on-premise.
Les entreprises et les institutions de plusieurs secteurs se tournent vers le HPC, ce qui engendre une croissance qui devrait se poursuivre pendant de nombreuses années. Le marché mondial du HPC devrait passer de 31 milliards USD en 2017 à 50 milliards USD en 2023. Alors que les performances du cloud ne cessent de s’améliorer et de devenir encore plus fiables et puissantes, une grande partie de cette croissance devrait provenir des déploiements HPC basés sur le cloud, qui évitent aux entreprises de devoir investir des millions dans l’infrastructure datacenter et les coûts associés.
Dans un proche avenir, attendez-vous à voir big data et HPC converger, le même grand cluster d’ordinateurs étant utilisé pour analyser le big data et exécuter des simulations et d’autres charges de travail HPC. Lorsque ces deux tendances convergeront, la puissance et la capacité de calcul de chacune seront démultipliées, ce qui permettra des recherches et des innovations encore plus révolutionnaires.
i Earl Joseph, Steve Conway, Bob Sorensen, Alex Norton. Mise à jour d'Hyperion Research : ISC19. https://hyperionresearch.com/wp-content/uploads/2019/06/Hyperion-Research-ISC19-Breakfast-Briefing-Presentation-June-2019.pdf