Под высокопроизводительными вычислениями (HPC) понимается практика объединения вычислительных мощностей, которая обеспечивает более высокие рабочие характеристики, чем у обычных компьютеров или серверов. HPC, или супервычисления, ничем не отличаются от обычных вычислений, кроме мощности. Это способ обработки огромных объемов данных на очень высоких скоростях. Для этого несколько компьютеров и устройств хранения используются как единая фабрика. HPC позволяет проводить исследования и находить ответы на некоторые из крупнейших мировых задач в области науки, техники и бизнеса.
Сегодня высокопроизводительные вычисления используются для решения сложных задач, требующих высокой производительности, и компании все чаще переносят нагрузки высокопроизводительных вычислений в облако. Высокопроизводительные вычисления в облаке меняют экономику разработки и исследования продуктов, потому что в этом случае требуется меньше прототипов, ускоряется тестирование и сокращается время вывода продукта на рынок.
Некоторые нагрузки, такие как секвенирование ДНК, слишком велики, чтобы их мог обработать один компьютер. Среды высокопроизводительных вычислений или вычислений на суперкомпьютере решают эти большие и сложные задачи следующим образом: отдельные узлы (компьютеры) работают вместе в кластере (связанной группе) для выполнения огромных объемов вычислений за короткий период времени. Для снижения затрат создание и удаление этих кластеров в облаке часто автоматизируется.
HPC можно использовать для нагрузок многих типов, но два наиболее распространенных — это нагрузки с массовым параллелизмом и сильносвязанные нагрузки.
Это вычислительные задачи, разделенные на небольшие, простые и независимые задачи, которые можно выполнять одновременно, часто практически без связи между ними. Например, компания может отправить 100 миллионов записей о кредитных картах на отдельные ядра процессора в кластере узлов. Обработка одной записи кредитной карты — небольшая задача, а когда 100 миллионов записей распределены по кластеру, эти небольшие задачи могут выполняться одновременно (параллельно) с поразительной скоростью. Этот вариант часто используют для моделирования рисков, молекулярного моделирования, контекстного поиска и логистического моделирования.
Обычно берут большую общую нагрузку и разбивают ее на более мелкие задачи, которые постоянно обмениваются данными. Другими словами, разные узлы в кластере обмениваются данными друг с другом, выполняя свою работу. Этот вариант часто используют для вычислительной гидродинамики, моделирования для прогнозирования погоды, моделирования материалов, имитации столкновений автомобилей, геопространственного моделирования и управления дорожным движением.
На протяжении десятилетий высокопроизводительные вычисления были важной частью научных исследований и отраслевых инноваций. Высокопроизводительные вычисления помогают инженерам, специалистам по обработке данных, проектировщикам и другим исследователям решать большие и сложные задачи за гораздо меньшее время и с меньшими затратами, чем при использовании традиционных вычислений.
Основные преимущества HPC
Компании из списка Fortune 1000 почти во всех отраслях используют высокопроизводительные вычисления, и их популярность растет. По данным Hyperion Research ожидается, что к 2022 году мировой рынок высокопроизводительных вычислений достигнет 44 миллиардов долларов США.
Ниже приведены некоторые отрасли, где используются высокопроизводительные вычисления, а также типы нагрузок, с которыми они могут справляться:
Высокопроизводительные вычисления могут выполняться локально, в облаке или в гибридной модели, в которой задействованы как облачные, так и локальные компоненты.
При локальном развертывании высокопроизводительных вычислений коммерческая компания или исследовательский институт создают кластер HPC из серверов, решений для хранения данных и другой инфраструктуры, который они контролируют и обновляют с течением времени. При развертывании высокопроизводительных вычислений в облаке инфраструктурой управляет поставщик облачных решений, а компании используют ее, оплачивая только то, чем они действительно воспользовались.
Некоторые компании используют гибридные развертывания. Особенно популярный они у тех компаний, которые вложили средства в локальную инфраструктуру, но также хотят воспользоваться преимуществами скорости, гибкости и экономии, которые дает облако. Они могут использовать локальные системы для выполнения некоторых нагрузок высокопроизводительных вычислений на постоянной основе и обращаться к облачным сервисам на разовой основе, когда время ожидания в очереди становится проблемой в локальной среде.
Компании с локальными средами высокопроизводительных вычислений получают значительный контроль над своими операциями, но им приходится решать несколько проблем, в том числе следующие:
Отчасти из-за затрат и других проблем, связанных с локальными средами, развертывание облачных HPC становится все более популярным. Компания Market Research Future прогнозирует рост мирового рынка на 21 % в период с 2017 по 2023 год. Когда предприятия выполняют свои высокопроизводительные вычисления в облаке, они платят только за то, что используют, и могут быстро увеличивать или уменьшать нагрузки по мере изменения своих потребностей.
Чтобы привлечь и удержать заказчиков, ведущие поставщики облачных решений используют передовые технологии, специально разработанные для нагрузок высокопроизводительных вычислений, поэтому о снижении производительности по мере старения локального оборудования можно не беспокоиться. Поставщики облачных решений предлагают новейшие и самые быстрые процессоры и графические процессоры, а также флэш-накопители с малым временем задержки, высокоскоростные сети RDMA и системы безопасности корпоративного класса. Сервисы доступны в течение всего дня, каждый день, практически без очереди.
Не все поставщики облачных решений одинаковы. Некоторые облака не предназначены для высокопроизводительных вычислений и не могут обеспечить оптимальную производительность в периоды пиковых нагрузок с высокими требованиями. При выборе поставщика облачных решений нужно учитывать следующие четыре особенности:
Как правило, лучше всего выбирать облачные сервисы Bare Metal, которые обеспечивают больший контроль и производительность. В сочетании с кластерными сетями RDMA высокопроизводительные вычисления Bare Metal обеспечивают те же результаты, что и при использовании аналогичного локального оборудования.
Компании и учреждения из разных отраслей обращаются к высокопроизводительным вычислениям, стимулируя рост, который, скорее всего, будет продолжаться в течение многих лет. Ожидается, что глобальный рынок высокопроизводительных вычислений вырастет с 31 миллиарда долларов США в 2017 году до 50 миллиардов долларов США в 2023 году. Поскольку производительность облачных систем продолжает расти, а сами они становятся еще более надежными и мощными, можно предположить, что большая часть этого роста будет связана с развертыванием облачных высокопроизводительных вычислений, которые избавляют предприятия от необходимости вкладывать миллионы в инфраструктуру центра обработки данных и нести связанные с его поддержанием расходы.
В ближайшем будущем можно ожидать конвергенции больших данных и высокопроизводительных вычислений с использованием одного и того же большого кластера компьютеров, используемых для анализа больших данных, моделирования и других нагрузок высокопроизводительных вычислений. По мере объединения этих двух тенденций вычислительная мощность и емкость как больших данных, так и высокопроизводительных вычислений будут расти, что откроет возможности для появления еще более впечатляющих результатов исследований и инноваций.
Эрл Джозеф (Earl Joseph), Стив Конвей (Steve Conway), Боб Соренсен (Bob Sorensen), Алекс Нортон (Alex Norton). Обновленные исследования Hyperion: ISC19. https://hyperionresearch.com/wp-content/uploads/2019/06/Hyperion-Research-ISC19-Breakfast-Briefing-Presentation-June-2019.pdf