Технологија течног хлађења: суочавање са изазовима хлађења центара података у АИГЦ ери
Aug 28, 2024
Остави поруку
Са брзим развојем садржаја генерисаног вештачком интелигенцијом (АИГЦ), потражња за рачунарском снагом је експлодирала, што је довело до наглог повећања потрошње енергије и потреба за управљањем топлотом центара података. Високи захтеви за рачунарским ресурсима током обуке АИ модела и закључивања значајно повећавају производњу топлоте сервера, подижући стандарде за технологије хлађења. Према извештају компаније Цолоцатион Америца, просечна снага по кабинету у глобалним центрима података порасла је на 16,5 кВ до 2020. године, што представља пораст од 175% у поређењу са 2008. Као резултат тога, технологија течног хлађења је постала нова жаришна тачка за хлађење дата центара решења.
На овогодишњој ГТЦ конференцији, НВИДИА не само да је представила Б200 и ГБ200 чипове већ је истакла и пратећу технологију течног хлађења. Поред тога, на СИЕПР економском самиту 2024., извршни директор НВИДИА-е Јенсен Хуанг открио је да ће ДГКС ГПУ сервери следеће генерације у потпуности усвојити течно хлађење. Одлука НВИДИА-е поставила је тренд у индустрији, убризгавајући нови замах у развој технологије течног хлађења. Како АИ технологија наставља да напредује, важност течног хлађења постаје све очигледнија. Технологија течног хлађења не само да значајно смањује потрошњу енергије у дата центрима, већ и побољшава оперативну ефикасност сервера и продужава животни век опреме. Стога, течно хлађење постепено постаје приоритет за решења за хлађење центара података.
I Поређење метода хлађења центара података
Тренутно су системи за хлађење дата центара првенствено подељени на два типа: ваздушно и течно хлађење. Технологија течног хлађења замењује ваздух течним медијумом ради размене топлоте са компонентама сервера које стварају топлоту, чиме се одводи топлота и обезбеђује стабилан рад сервера у оптималном температурном опсегу. Насупрот томе, ваздушно хлађење се ослања на вентилаторе и системе за климатизацију да одводе топлоту кроз кретање ваздуха. Течно хлађење директно хлади компоненте које стварају топлоту, постижући ефикасност топлотне проводљивости 25 пута већу од ваздуха, са специфичним топлотним капацитетом од 1,000 до 3.500 пута већим, и ефикасношћу конвективног преноса топлоте 10 до 40 пута већом од ваздух. Дакле, под истим условима, технологија течног хлађења далеко превазилази ваздушно хлађење у ефикасности хлађења.

▲ Системи за хлађење центара података

▲ Технологија хлађења течности и ваздушно хлађење
У поређењу са ваздушним хлађењем, течно хлађење обезбеђује већу ефикасност хлађења и мању потрошњу енергије. У рачунарским окружењима високе густине, системи за ваздушно хлађење се често боре да испуне захтеве за хлађењем, док течно хлађење може ефикасно да реши овај изазов. Поред тога, течно хлађење нуди предности као што су ниска разина буке и мањи отисак, што га чини погодним за конфигурације високе густине и захтјеве за уштеду енергије модерних центара података.
ИИ Шта покреће развој течног хлађења у ери вештачке интелигенције?
1. Растућа топлотна снага рачунарских чипова: ваздушно хлађење достиже своју границу
Са брзим развојем АИ технологије, потражња за рачунарском снагом наставља да расте, што доводи до повећања производње топлоте и густине топлотног флукса у чиповима. Када чипови раде на високим температурама током дужег периода, њихов учинак и животни век су негативно погођени, а стопа кварова се повећава. Истраживања показују да када се радна температура чипа приближи 70-80 степену, сваки пораст од 10 степени може да смањи његове перформансе за око 50%.
Тренутно, Интелови ЦПУ-и имају топлотну пројектовану снагу (ТДП) до 350В, НВИДИА Х100 достиже 700В, а будући Б100 би могао да достигне 1,000В, приближавајући се граници хлађења у једној тачки од 800В ваздушног хлађења. Како потрошња енергије рачунарског чипа наставља да расте, а потрошња енергије ЦПУ-а и ГПУ-а чини око 80% укупне снаге АИ сервера, наставак коришћења ваздушног хлађења ће довести до значајног повећања потреба за климатизацијом у низу. У сценаријима хлађења високе густине, течно хлађење нуди значајне предности у погледу трошкова и перформанси.
Осим на страни чипа, густина снаге по кабинету у дата центрима је такође у порасту. Традиционално ваздушно хлађење обично задовољава потребе за хлађењем кабинета у опсегу од 12КВ до 15КВ. ПремаИзвештај о истраживању глобалног центра података за 2022Уптиме Институте, максимална снага за један НВИДИА ДГКС А100 сервер је 6,5КВ, а стандардни ормар од 42У може да смести око пет 5У високих АИ сервера, са укупном снагом која прелази 20КВ по кабинету. Традиционално ваздушно хлађење не може задовољити потребе за хлађењем АИ серверских ормара.
2. Покрећу потребе за уштедом енергије дата центра: виши захтеви за ПУЕ
ПУЕ (Ефективност употребе енергије) је кључни индикатор за процену енергетске ефикасности центра података, израчунат као: ПУЕ=Укупна потрошња енергије центра података / Потрошња енергије ИТ опреме. Што је ПУЕ вредност ближа 1, то је већа енергетска ефикасност дата центра; обрнуто, што је већа ПУЕ вредност, то је нижа укупна ефикасност.
Статистика дели потрошњу енергије дата центра на неколико делова: ИТ опрема чини 45%, системи за хлађење 43%, системи напајања и дистрибуције 10%, а осветљење и друга употреба 2%. Међу њима, потрошња енергије система за климатизацију је на другом месту после ИТ опреме, тако да смањење потрошње енергије система за климатизацију постаје посебно важно када ИТ системи не могу да се надограде.
У контексту националних циљева постизања „пика угљеника“ и „неутралности угљеника“ и стратегије „Источни подаци, западна рачунања“, новообјављенаСтандарди потражње за државним набавкама зеленог центра података (пробно)намеће строже ПУЕ захтеве.Овај стандард предвиђа да од јуна 2023. ПУЕ центра података не сме бити већи од 1,4, а до 2025. године захтев ће бити ПУЕ од највише 1,3. Према подацима ЦДЦЦ-а и Инспур Информатиона, центри података који користе ваздушно хлађење обично имају ПУЕ између 1,4 и 1,5, док технологија течног хлађења може смањити ПУЕ на испод 1,2. Стога је усвајање енергетски ефикасније и ефикасније технологије хлађења течности постало тренд.
Потрошња енергије у центрима података је дуго била у фокусу пажње индустрије, посебно у позадини глобалних ограничења енергетских ресурса и повећане еколошке свести. Побољшање енергетске ефикасности дата центра је од посебног значаја. Технологија течног хлађења, обезбеђујући ефикаснија решења за хлађење, смањује потрошњу енергије система за климатизацију, чиме значајно снижава ПУЕ вредности дата центра. Ова технологија не само да помаже у смањењу оперативних трошкова, већ и смањује емисије угљеника, усклађујући се са циљевима одрживог развоја.

▲ Потрошња енергије центра података
ИИИ Класификација технологије хлађења течностима
Системи за хлађење течности могу се класификовати на директно течно хлађење и индиректно течно хлађење на основу начина на који течност интерагује са хардвером. Директно течно хлађење укључује течност која долази у директан контакт са хардверским компонентама ради преноса топлоте. Овај метод се даље може поделити на хлађење потапањем и хлађење распршивањем. Хлађење урањањем потапа компоненте хардвера у потпуности у течност, док хлађење распршивањем укључује прскање течности директно на хардвер.
Индиректно течно хлађење, с друге стране, користи посредничку компоненту (као што је измењивач топлоте или расхладна плоча) за одвођење топлоте, спречавајући течност да директно дође у контакт са хардвером. Уобичајени систем индиректног течног хлађења је систем за хлађење хладне плоче, који се даље може поделити на једнофазно и двофазно хлађење хладне плоче на основу тога да ли расхладни медијум пролази кроз фазну промену.

▲ Увод у методе хлађења течностима
1. Од хладних плоча до хладних плоча за урањање
Технологија хлађења течности преноси топлоту са компоненти које генеришу топлоту на расхладну течност кроз хладне плоче, а расхладна течност затим распршује топлоту кроз своја својства хлађења. У овом систему, радна течност не долази у директан контакт са електронским компонентама, што резултира минималним модификацијама рачунарског система. Оригинални хладњак за ваздушно хлађење се једноставно може заменити комплетом за течно хлађење, а цеви за расхладну течност могу да се извуку ван шасије. Ова технологија је посебно погодна за потребе хлађења са средњом до високом густином топлотног флукса.
Систем за хлађење течности са хладном плочом првенствено се састоји од расхладног торња, јединице за дистрибуцију расхладне течности (ЦДУ), примарног и секундарног расхладног кола течног расхладног средства, расхладног медијума и течно хлађеног кабинета. Примарни круг се односи на петљу која испушта топлоту из секундарног кола у спољашње окружење или друге јединице за рекуперацију топлоте, док се секундарно коло односи на петљу која уклања топлоту са сервера и распршује је кроз примарни круг. Два кола размењују топлоту преко ЦДУ-а или јединице за дистрибуцију расхладне течности.
Принцип рада система за хлађење течности са хладним плочама је релативно једноставан, али у практичним применама, потребно је узети у обзир дизајн хладних плоча, избор расхладних течности и одржавање система. Поред тога, системи за течно хлађење са хладном плочом раде изузетно добро у окружењима са великом густином топлотног флукса, што их чини веома погодним за захтеве за распоредом високе густине савремених центара података.

▲ Шематски дијаграм система за хлађење течности са хладним плочама
Системи за хлађење течним потапањем постижу ефикасно одвођење топлоте директним урањањем компоненти које стварају топлоту у непроводне расхладне течности. У зависности од тога да ли расхладна течност пролази кроз фазну промену током циркулације, хлађење имерзионом течношћу се може поделити на једнофазно имерзионо хлађење и двофазно хлађење потапањем.
Код једнофазног хлађења потапањем, расхладна течност се само подвргава промени температуре током процеса размене топлоте без промене фазе. Пренос топлоте се у потпуности ослања на осетљиву промену топлоте течности, користећи карактеристику да се течност шири и смањује густину када се загреје. Топлија расхладна течност се природно подиже и хлади је измењивачем топлоте спољне расхладне петље. Охлађена течност тада тоне под гравитацијом, завршавајући циклус хлађења. У овој методи, расхладна течност остаје у течном стању током целог процеса. Насупрот томе, двофазно хлађење потапањем укључује расхладну течност која пролази кроз фазну промену из течности у гас током дисипације топлоте, а затим се враћа из гаса у течност.
Систем за хлађење течним потапањем укључује унутрашње и спољашње компоненте. Спољна страна укључује расхладни торањ, примарну мрежу цевовода и примарну расхладну течност; унутрашња страна укључује јединицу за дистрибуцију расхладне течности (ЦДУ), резервоар за урањање (орман), ИТ опрему, секундарну мрежу цевовода и секундарну расхладну течност. Током употребе, ИТ опрема је потпуно уроњена у расхладну течност, тако да при избору расхладне течности треба узети у обзир непроводне течности, као што су силиконско уље или флуорисане течности.

▲ Шематски дијаграм једнофазног лмерзионог течног хлађења
Иако постоји хлађење распршивањем, његова примена је релативно ограничена и није погодна за сервере велике густине и велике центре података. Краткорочно гледано, течно хлађење са хладном плочом је веома погодно за потребе хлађења ере АИ и прелазак центара података са ваздушног хлађења на течно хлађење због своје зрелости, компатибилности са постојећим системима, лакоће одржавања и ниских трошкова накнадне уградње. . Дугорочно гледано, имерсионо течно хлађење, са својом одличном топлотном проводљивошћу, ефикасном способношћу поврата отпадне топлоте и подршком за већу снагу кабинета, биће погодније за растуће потребе хлађења будућих центара података. Нарочито како снага ормарића наставља да расте, течно хлађење уроњавањем може да обезбеди ефикаснија решења за хлађење, помажући да се смањи укупна ефикасност коришћења енергије (ПУЕ) центара података.
2. Преферирани избор за интелигентне рачунарске центре – течно хлађење
Како се густина снаге повећава, решења за течно хлађење постају избор за више новоконструисаних ГПУ рачунарских центара. Према ИДЦ-овом извештају „Цхина Сеианнуал Ликуид-Цоолед Сервер Маркет (Х1 2023) Трацкер“, кинеско тржиште сервера са течним хлађењем достигло је 1,51 милијарду долара у 2023. ИДЦ предвиђа да ће од 2022. до 2027. године укупна годишња стопа раста кинеско тржиште сервера са течним хлађењем ће достићи 54,7%, а очекује се да ће величина тржишта достићи 8,9 милијарди долара до 2027. године.
Примена технологије течног хлађења у интелигентним рачунарским центрима не само да побољшава перформансе рачунара већ и значајно смањује потрошњу енергије и оперативне трошкове. Промоција технологије течног хлађења подстаћи ће центре података ка ефикаснијем, зеленом и интелигентнијем развоју, пружајући чврсту основу за испуњавање потреба за обрадом података у ери вештачке интелигенције.

▲ Величина тржишта сервера за течно хлађење
ИВ Индустријски ланац за хлађење течности
Индустријски ланац течног хлађења обухвата три главна сегмента: добављаче компоненти за производе, средње произвођаче сервера са течним хлађењем и кориснике рачунарских моћних корисника. Међу садашњим корисницима, домаће компаније попут Алибабе фокусирају се на развој једнофазног течног хлађења уроњавањем, док друге, као што су Баиду, Тенцент и ЈД.цом, углавном користе течно хлађење хладним плочама. У иностранству, имерсионо хлађење је напредније од хлађења хладним плочама, а водеће америчке компаније као што су Интел, Гоогле и Мета покрећу брзи развој имерсионог течног хлађења, посебно уз подршку АИ.

▲ Индустријски ланац за хлађење течности
В Потенцијални проблеми са технологијом хлађења течним потапањем
1. Избор расхладне течности
Расхладна течност је једна од кључних сировина у технологији течног хлађења и представља високу техничку баријеру. У технологији хлађења течним уроњавањем, расхладна течност треба да директно контактира електронске производе, што намеће високе захтеве за перформансе расхладне течности, као што су одлична топлотна проводљивост, добра изолација и компатибилност материјала. Поред тога, карактеристике животне средине као што су мирис, токсичност и лакоћа деградације су такође важне, а расхладна течност треба да буде што је могуће више прилагођена кориснику и еколошки прихватљивија.
Најчешће коришћена расхладна средства за урањање тренутно укључују угљоводонике и органосилицијуме (који се обично називају "уљима", као што је минерално уље) и флуорована једињења (као што су флуорисане течности). Флуорисане течности имају добре укупне перформансе и сматрају се идеалним материјалима за хлађење течности. Међутим, главни изазов са флуорованим течностима је њихова висока цена. Са све строжим захтевима заштите животне средине, силиконско уље, које има већу топлотну проводљивост и мању густину, такође је еколошки прихватљивије. Избор расхладног медија углавном зависи од процеса хлађења.
2. Проблеми заптивања оптичког пута
Расхладне течности као што су флуорисане течности или силиконска уља поседују одлична изолациона својства, ефикасно спречавајући кратке спојеве. У условима нискофреквентног сигнала, ове расхладне течности имају минималне сметње у преносу сигнала. Међутим, под високофреквентним сигналима, утицај расхладне течности на пренос сигнала захтева пажљиву процену и контролу. Све у свему, утицај на кола је подношљив.
Што се тиче оптичких путања, већина оптичких модула у центрима података је дизајнирана са нехерметичком амбалажом, што значи да без одговарајућих модификација расхладна течност може ући у оптичку шупљину, што утиче на оптичке перформансе. Чак и код херметичког паковања, неке пасивне оптичке стазе, као што су сочива, остају изван херметичке коморе.
Дизајн оптичких путања се обично заснива на индексу преламања ваздуха (приближно 1.0). Када су оптичке компоненте уроњене у расхладну течност, индекс преламања расхладне течности, који се разликује од ваздуха, може изазвати промене у жаришним тачкама и ефикасности спајања. На пример, индекс преламања флуорованог уља је обично око 1,3, а ова промена индекса преламања може захтевати прилагођавање параметара дизајна оптичке путање.
Да би се позабавила потенцијалним утицајем имерсионог течног хлађења на оптичке и електричне путеве, индустрија предузима различите мере, као што је развој нових технологија паковања оптичких модула прилагођених окружењу расхладне течности, оптимизација дизајна кола за високофреквентне сигнале и истраживање оптичких материјала и структуре погодније за хлађење потапањем.
3. Интегрисана испорука у односу на одвојену испоруку
Тренутно постоје три модела испоруке за сервере са течним хлађењем хладним плочама:
① страна ИТ опреме испоручује само сервер хлађен течношћу;
② ИТ страна испоручује „течно хлађен сервер + течно хлађен кабинет“;
③ ИТ страна испоручује „течно хлађен сервер + течно хлађен кабинет + ЦДУ + секундарно коло“.
Трећи модел испоруке, интегрисана испорука, где цео орман испоручује исти произвођач са самодефинисаним стандардом за интегрисани дизајн и развој, највише се користи. Раздвојена испорука укључује праћење кориснички дефинисаних спецификација дизајна интерфејса између кабинета са течним хлађењем и сервера са течним хлађењем, при чему ормар и сервер испоручују различити произвођачи. Произвођачи инфраструктуре и сервера морају да координирају и сарађују. Раздвојену испоруку је лакше скалирати и флексибилно применити.

▲ Разликовање режима испоруке сервера са течним хлађењем на хладној плочи
Тренутно је ниво стандардизације у технологији течног хлађења у Кини релативно низак. Различита серверска опрема, расхладне течности, расхладни цевоводи и производи за напајање се разликују по форми, а не постоји јединствени стандард интерфејса, што представља изазове за стандардизацију и примену великих размера. Беле књиге које су објавила три главна домаћа телеком оператера оцртавају трогодишњу визију технологије течног хлађења, постепено верификујући и тестирајући технологију, са плановима за почетак примене течног хлађења великих размера до 2025. Очекује се да ће преко 50% Пројекти са подацима ће усвојити ову технологију, промовишући стандардизацију и широку имплементацију течног хлађења и подржавајући одвојену испоруку.
