Ինչ հզորություն ունի ՀՀ կառավարության ձեռք բերած գերհամակարգիչը և ինչի համար է օգտագործվելու
Հասարակություն
01.05.2025 | 17:10
2024 թվականի տարեվերջին կառավարության ձեռք բերած SuperMicro գերհամակարգչի լիարժեք գործարկումն ու բնականոն աշխատանքն ապահովելու, ինչպես նաև արհեստական բանականության ոլորտում գիտահետազոտական աշխատանքների մրցունակությունը բարձրացնելու նպատակով՝ ներկայումս ընթանում է գերհամակարգչի տվյալների մշակման կենտրոնի ձևավորման համար անհրաժեշտ սարքավորումների ձեռքբերման և տեղադրման գործընթացը: Այս մասին Factor.am-ի հարցմանն ի պատասխան տեղեկացնում են Կրթության, գիտության, մշակույթի և սպորտի նախարարությունից։ Ապրիլի 10-ին Կառավարության նիստի ժամանակ Նիկոլ Փաշինյանը հիշեցրել էր, որ նախորդ տարվա բյուջեով ֆինանսավորել են և ձեռք են բերել նոր գերհամակարգիչ։
Կենտրոնը նախատեսվում է գործարկել տվյալ գործընթացի ավարտին՝ նախնական գնահատմամբ՝ 2025 թվականի տարեվերջին։ Այն կտեղակայվի Երևանի պետական համալսարանում։ Նոր սարքավորումը տարբերվում է նախկինում Ինժեներական քաղաքում տեղադրված գերհամակարգչից․ այն նախատեսված է մեծ ծավալով տվյալների մշակման և բարդ հաշվարկների իրականացման համար։
Նախարարությունից հայտնում են՝ գերհամակարգչի կենտրոնի լիարժեք գործարկումը առանցքային նշանակություն ունի ՀՀ-ում արհեստական բանականության ոլորտի զարգացման և արհեստական բանականության խնդիրներով զբաղվող գիտահետազոտական աշխատանքների համար։
SuperMicro գերհամակարգչի օգնությամբ իրականացվելու է․
1) Արհեստական բանականություն և մեքենայական ուսուցում․ ձեռք բերված NVIDIA H100 GPU գերհամակարգիչը կոչված է մեծածավալ AI մոդելների (օրինակ՝ լեզվային մոդելներ, գեներատիվ AI) վարժեցման համար։ Օրինակ՝ Փրինսթոնի համալսարանը ներդրել է H100 GPU-ների վրա հիմնված կլաստեր՝ գեներատիվ AI-ի հետազոտությունները խթանելու համար։
2) Բարձր արտադրողականությամբ հաշվողական համակարգեր (HPC)․ GPU-ները կարող են օգտագործվել ֆիզիկայի, քիմիայի, կլիմայի մոդելավորման և այլ բնագավառներում կատարվող բարդ մաթեմատիկական մոդելավորումների և սիմուլյացիաների համար։
3) Տվյալների վերլուծություն և վիզուալիզացիա․ H100-ները մեծ ծավալի տվյալների արագ մշակման և իրական ժամանակում վերլուծությունների համար անգերազանցելի գործիքներ են։ Դրանք օգտակար են նույնիսկ հասարակագիտական կամ մարդաբանական հետազոտություններում։
4) Առողջապահություն և կենսաբժշկական հետազոտություններ․ GPU-ները կարող են արագացնել դեղորայքի հայտնաբերման, գենոմիկայի և բժշկական պատկերների վերլուծության գործընթացները։
5) Ռոբոտատեխնիկա և ինքնավար համակարգեր․ GPU-ները կարող են օգտագործվել ռոբոտների շարժման մոդելավորման, միջավայրի վերլուծության և որոշումների ընդունման ալգորիթմների մշակման համար։
6) Կրթական նպատակներ․ ուսանողներին նման տեխնոլոգիաների հասանելիություն տրամադրել հնարավորություն է տալիս ձեռք բերել հմտություններ, որոնք պահանջված են ժամանակակից արդյունաբերության մեջ։
Նախարարությունից նշում են, որ 64 H100 GPU-ներից կազմված կլաստերի տեղակայումը կարող է նպաստել Երևանի պետական համալսարանը գիտահետազոտական առաջատար կենտրոն դարձնելուն, խթանել միջազգային համագործակցությունը և ներգրավել հավելյալ ֆինանսական միջոցներ ՀՀ-ում գիտության և ժամանակակից տեխնոլոգիաների և ԵՊՀ կարողությունների զարգացման համար, ինչը կնպաստի համալսարանի վարկանիշի զգալի աճին համաշխարհային ինդեքսներում։
Հանգույցի ընդհանուր հաշվողական հզորությունը 535 FP32 TFLOPs և 31664 FP8 TFLOPs է: Սա ենթադրում է, որ հանգույցը կարող է կատարել 535 տրիլիոն 32-բիթանոց և 31,664 տրիլիոն 8-բիթանոց թվերով գործողություններ մեկ վայրկյանում։
Ըստ առաջարկվող ապրանքի ամբողջական նկարագրի՝ համալիրը կիրառվելու է 7 մլրդ պարամետրեր պարունակող նեյրոնային ցանցերի ուսուցման համար: Ուսուցումը իրականացվելու է համակարգի բոլոր հանգույցների վրա միաժամանակ, ինչը պահանջում է հանգույցների միջև արագ կապի ապահովում։
Տեխնիկական նվազագույն պահանջները
Համակարգը պետք է պարունակի 8 հաշվողական հանգույց։ Յուրաքանչյուր հանգույց պետք է բավարարի հետևյալ տեխնիկական պահանջներին․
– 8 GPU, յուրաքանչյուրը 80GB HBM3 կամ HBM3e հիշողությամբ և SXM ինտերֆեյսով,
-2TB ECC DDR5 RAM,
-2 64-bit կենտրոնական պրոցեսոր, յուրաքանչյուրը 56 միջուկներով, 2.0GHz արագությամբ,
-2 NVMe M.2 SSD սկավառակներ, յուրաքանչյուրը 1920GB ծավալով,
-8 NVMe U.2 կամ U.3 SSD սկավառակներ, յուրաքանչյուրը 3840GB ծավալով,
-Հոսանքի սնուցումը 6 հատ 3000W, 4+2 սխեմայով,
-OSFP պորտեր 400 Gb/s թողունակությամբ,
-Հանգույցի ընդհանուր հաշվողական հզորությունը 535 FP32 TFLOPs և 31664 FP8 TFLOPs։
Տվյալների պահպանման համակարգ
-266TB ընդհանուր տարողությամբ NVMe U.2 կամ U.2 SSD սկավառակներ,
-Ընդհանուր տարողությունը 622TB,
-Համապատասխան պորտեր infiniband NDR ցանցին միանալու համար։
Կառավարման հանգույցներ
Գերհամակարգիչը պարունակում է 4 կառավարման հանգույցներ։ Յուրաքանչյուր կառավարման հանգույց պետք է բավարարի հետևյալ տեխնիկական պահանջներին․
-2 կենտրոնական պրոցեսորներ,
-384GB RAM 2.4.2.3 OSFP պորտ(եր) 400 GB/s թողունակությամբ։
Ցանց
Համակարգի բոլոր հաշվողական հանգույցները, տվյալների պահպանման համակարգը և կառավարման հանգույցները պետք է միացված լինեն infiniband NDR ցանցին։ Infiniband NDR ցանցը պետք է կառուցվի 5 կառավարվող ցանցային սարքերով, հետևյալ պահանջներով․
-64 պորտեր,
-400GB/s թողունակությամբ ամեն պորտի համար,
-51.2TB/s ընդհանուր թողունակությամբ,
-Ցանցի տոպոլոգիան պետք է լինի չբլոկավորող (non-blocking) fat-tree,
-Ցանցի մշտադիտարկման համար UFM համակարգ, համապատասխան սարքերով, մալուխներով և ծրագրային ապահովմամբ,
-Համակարգի բոլոր հաշվողական հանգույցները, տվյալների պահպանման համակարգը և կառավարման հանգույցները պետք է միացված լինեն 100GbE թողունակությամբ կառավարման ցանցին,
-Այլ ցանցային սարքավորումներ, մալուխներ, տրանսիվերներ ըստ անհրաժեշտության։
Ծրագրային ապահովում
-Բաց կոդով օպերացիոն համակարգ,
-Դրայվերներ GPU-ների համար,
-Համակարգի կառավարման ծրագրային ապահովում,
-NVIDIA Base Command Manager Essentials,
-NVIDIA AI Enterprise license 3 տարով։
Տեղադրում և սպասարկում
Մատակարարը պետք է զբաղվի անհրաժեշտ արտահանման լիցենզիաներ ստանալու ողջ փաստաթղթային գործընթացով։ Եթե Երևանի պետական համալսարանից պահանջվում են որևէ փաստաթղթեր, ԵՊՀ-ն դրանք կտրամադրի հարցումից հետո 14 օրվա ընթացքում։ Մատակարարը պետք է մատակարարի/առաքի բոլոր սարքավորումները Երևանի պետական համալսարան։ ԵՊՀ տվյալների մշակման կենտրոնի պատրաստ լինելուց հետո, բայց ոչ ավել, քան մատակարարումից ութ ամիս հետո, մատակարարը պետք է սարքավորումները տեղադրի նախատեսված վայրում, միացնի Երևանի պետական համալսարանի առկա ցանցին, գործարկի համալիրը, ստուգի հանգույցների և այլ սարքավորումների առողջությունը, տեղադրի և կարգավորի մոնիտորինգի ծրագրակազմը: Տեղադրելուց հետո մատակարարը պետք է սկսի 70B պարամետրերով Llama 2 նեյրոնային ցանցի (կամ համարժեք) զուգահեռ ուսուցում համալիրի բոլոր GPU-ների վրա և ցուցադրի 1380 թոքեն / վայրկյան / GPU FP8 արագագործություն: Բոլոր բաղադրիչների համար կա 3 տարվա երաշխիք։ Մատակարարը 3 տարի պետք է կատարի ՕՀ-ի, դրայվերների և ներկառուցված ծրագրային ապահովման կանոնավոր թարմացումներ:
Անի Թամրազյան