Schneider Electric прогнозирует значительное увеличение энергопотребления во всем мире из-за искусственного интеллекта
Технологические достижения, такие как новые видеокарты, привели к значительному увеличению потребления электроэнергии за более высокую производительность.
В последние годы искусственный интеллект (ИИ) добился значительных успехов, однако проблема заключается в растущем потреблении энергии для поддержания работы ИИ. Важно понимать энергетические потребности рабочих нагрузок ИИ и их влияние на использование ресурсов. Повышенный спрос на электроэнергию, а также необходимость в эффективном охлаждении и инфраструктуре вызывают обеспокоенность по поводу ресурсов и окружающей среды, что подчеркивает необходимость поиска устойчивых решений.
ИИ изменил ландшафт анализа данных, распознавания закономерностей и совершенствования процессов принятия решений. Растущая потребность в задачах ИИ оказывает негативное влияние на энергопотребление. С ростом размера и сложности моделей ИИ они требуют значительных вычислительных ресурсов, что приводит к повышению энергопотребления.
По прогнозам Schneider Electric, общее энергопотребление, связанное с рабочими нагрузками ИИ, достигнет примерно 4,3 гигаватт (ГВт), что эквивалентно общему энергопотреблению такой страны, как Дания. Это сравнение показывает значительные энергетические потребности технологий ИИ для удовлетворения растущего спроса на интеллектуальные решения.
По оценкам Schneider Electric, к 2023 году 95 % рабочих нагрузок ИИ будет обрабатываться централизованно, и только 5 % - на стороне. Однако в отчете подчеркивается возможность существенного изменения ситуации к 2028 году, когда рабочие нагрузки ИИ будут распределены поровну: 50 % будут обрабатываться централизованно, а остальные 50 % - на границе. Несмотря на такое изменение ландшафта, общая рабочая нагрузка на центры обработки данных, по прогнозам, увеличится до 90 ГВт к 2028 году по сравнению с 54 ГВт в 2023 году.
Рабочие нагрузки ИИ в центрах обработки данных
В этой статье мы рассмотрим некоторые факторы, объясняющие повышенный спрос на электроэнергию в центрах обработки данных, особенно в контексте обучения и рабочих нагрузок ИИ. Кроме того, мы рассмотрим, как технологические достижения, такие как новые видеокарты, привели к значительному росту энергопотребления, несмотря на повышение производительности.
Обучение и вывод моделей искусственного интеллекта
Для масштабного распределенного обучения моделей ИИ необходим большой объем данных, специализированные серверы, оснащенные ускорителями вроде GPU, а также необходимое хранилище данных и сетевое оборудование. Эти ускорители рассчитаны на работу практически на максимальной мощности в течение большей части периода обучения, среднее энергопотребление обучающего кластера практически равно его пиковому потреблению. Например, Schneider Electric приводит пример кластера ИИ с 22 000 графических процессоров H100, распределенных примерно по 700 стойкам, который потребляет 31 мегаватт энергии. В эту оценку мощности не включена мощность, необходимая для охлаждения физической инфраструктуры.
В отличие от техники, динамика энергопотребления ИИ и его влияние на энергопотребление зависят от потребностей пользователя. Компании стремятся найти баланс между точностью вывода и задержкой, что требует различных размеров моделей и методов развертывания. Конфигурация аппаратного обеспечения может сильно различаться в зависимости от размера модели и области применения: от одного устройства до нескольких стоек серверов. Плотность стоек может варьироваться от нескольких сотен ватт для небольших краевых устройств до более 10 кВт для крупных серверных установок.
Компания Schneider Electrics пришла к выводу, что общие рабочие нагрузки, связанные с выводом, будут потреблять больше энергии, чем обучающие кластеры. Это связано в первую очередь с масштабностью, с которой умозаключения постоянно применяются в различных нагрузках. С другой стороны, рабочие нагрузки, связанные с обучением ИИ, постоянно работают при чрезвычайно высокой плотности стоек и являются ресурсоемкими, поскольку предполагают обработку огромных массивов данных для обучения моделей ИИ. Такой требовательный вычислительный процесс приводит к высокому энергопотреблению в расчете на стойку.
Размер кластера ИИ влияет на потребление электроэнергии
Согласно отчету Schneider Electric, внедрение новых поколений графических процессоров привело к значительному увеличению энергопотребления, несмотря на более высокий рост производительности. Отраслевая точка зрения на этот вопрос заключается в том, что рост производительности перевешивает дополнительное энергопотребление. На рисунке ниже показано примерное энергопотребление в центрах обработки данных в зависимости от количества графических процессоров в кластерах для обучения искусственному интеллекту, относящихся к трем поколениям видеокарт NVIDIA.
Расчетное энергопотребление центра обработки данных в зависимости от количества видеокарт
Для сравнения: 40000 кВт энергии, потребляемой примерно 22 500 моделями видеокарт NVIDIA DGX H100, могут обеспечить энергией около 31000 средних американских домов. Это подчеркивает растущую озабоченность энергопотреблением новых поколений видеокарт, и эти проблемы в управлении энергопотреблением распространяются не только на графические процессоры, но и на различные аспекты физической инфраструктуры. На рисунке показано, что модели V100 по сравнению с тем же количеством H100 потребляют в два раза меньше энергии.
Современные технологии охлаждения повышают энергоэффективность
Хотя воздушное охлаждение традиционно является основным методом охлаждения ИТ-оборудования и может эффективно работать при средней плотности размещения в стойке около 20 киловатт, рост энергопотребления серверов ИИ часто превышает этот 20-киловаттный порог. По мере расширения кластеров ИИ и повышения плотности мощности необходимо внедрять жидкостное охлаждение.
Жидкостное охлаждение обеспечивает более высокую теплоотдачу на единицу объема, что делает его более эффективным по сравнению с воздушным охлаждением. Однако важно отметить, что в случае прекращения подачи жидкости температура чипов может повышаться гораздо быстрее, чем при воздушном охлаждении, что может привести к более быстрому отключению системы. Чтобы снизить этот риск, рекомендуется использовать источники бесперебойного питания (ИБП) для насосов.
В отчете Schneider Electric подчеркивается, что жидкостное охлаждение дает преимущества с точки зрения экологичности за счет снижения энергопотребления и использования воды. В отчете также рекомендуется использовать воду для жидкостного охлаждения непосредственно на кристалле, что выгодно благодаря лучшей совместимости с существующей инфраструктурой воздушного охлаждения.