HPC системийн архитектур гэдэг нь High-Performance Computing (Өндөр Гүйцэтгэлтэй Тооцоолол) хийх зориулалттай компьютерийн системийн бүтэц, зохион байгуулалт, ажиллах зарчмыг хэлдэг. Энэ нь асар их хэмжээний тооцоолол, өгөгдөл боловсруулах чадвартай системийг бүтээхэд чиглэгдсэн техник, програм хангамжийн хослол юм.
HPC системийн архитектурын үндсэн бүрэлдэхүүн хэсгүүд:
1. Тооцооллын зангилаа (Compute nodes)
- Тооцооллыг гүйцэтгэдэг үндсэн нэгж.
- Нэг зангилаа (node) нь олон процессортой (CPU) эсвэл GPU-тэй байж болно.
- Заримдаа “кластер” гэж нэрлэгдэнэ: олон зангилаа хоорондоо сүлжээгээр холбогдсон систем.
- Жишээ:
- 2 CPU + 4 GPU бүхий нэг node
- 10,000 node бүхий кластер систем
2. Процессор (CPU) болон график процессор (GPU)
- CPU (Central Processing Unit): Уламжлалт олон үүрэг гүйцэтгэгч, ерөнхий боловсруулагч.
- GPU (Graphics Processing Unit): Маш олон жижиг цөмтэй, зэрэгцээ (parallel) тооцоололд маш хүчирхэг.
- HPC системүүд сүүлийн үед GPU-н тулгууртай архитектур руу шилжиж байна (жишээ нь: NVIDIA A100, AMD MI300).
3. Санах ой (Memory)
- Node-н доторх RAM: Нэг зангилаанд хамаарах хурдан санах ой.
- Shared memory vs Distributed memory:
- Shared memory: нэг физик RAM-д хандалттай (ихэвчлэн SMP системд)
- Distributed memory: зангилаанууд тус тусдаа RAM-тай (кластер системд)
4. Хурдан холболтын сүлжээ (Interconnect / Network fabric)
- Тооцооллын зангилаануудыг маш бага сааталтай, өндөр хурдтай холбодог.
- HPC-д хэрэглэгддэг сүлжээ:
- InfiniBand (200+ Gbps)
- Omni-Path
- Intel Slingshot (Frontier супер компьютерт ашиглагддаг)
5. Хадгалах систем (Storage subsystem)
- Хэмжээ ихтэй, хурдан өгөгдөл унших/бичих чадвартай хадгалах төхөөрөмжүүд.
- Хэрэглэдэг формат:
- Parallel File Systems (жишээ: Lustre, GPFS, BeeGFS)
- Tiered storage бүтэц:
- RAM → SSD → HDD → Архивын систем
6. Удирдлагын зангилаа (Head / Management node)
- Зангидаж удирдах, хэрэглэгчийн орчин хангах хэсэг.
- Queue удирдах (SLURM, PBS гэх мэт)
- Хэрэглэгчийн ажил хуваарилах, мониторинг хийх

HPC архитектурын үндсэн төрлүүд
Архитектурын төрөл | Тайлбар | Жишээ |
---|---|---|
Shared-memory | Нэг машинд олон CPU, RAM-аа хуваалцдаг | SMP (Symmetric Multiprocessing) |
Distributed-memory | Олон node, тус тусдаа RAM-тай | Кластер систем |
Hybrid | CPU + GPU хослуулсан, shared ба distributed хослуулсан | Summit, Frontier супер компьютер |
HPC системийн ажиллах зарчим
- Хэрэглэгч програм/кодоо удирдлагын node-оор дамжуулан системд өгнө.
- Job scheduler (SLURM, PBS) үүнийг зөв node-уудад хуваарилна.
- Тооцоолол зэрэгцээ хэлбэрээр олон зангилаа дээр гүйцэтгэгдэнэ.
- Өгөгдөл хадгалах систем рүү үр дүнг бичнэ.
HPC-ийн үр ашиг хэмжигч үзүүлэлтүүд
- FLOPS (Floating Point Operations Per Second): Тооцооллын хүчин чадал.
- Latency & Bandwidth: Сүлжээний саатал ба хурд.
- Scalability: Систем томроход гүйцэтгэл хэр нэмэгдэх.
- Efficiency: Эрчим хүчний хэрэглээ vs тооцооллын чадвар (GFLOPS/watt)
HPC систем ашигладаг хэрэглээний жишээ
Салбар | Ашиглалт |
---|---|
Эрдэм шинжилгээ | Геномик, уур амьсгал, материалын шинжлэх ухаан |
Инженерчлэл | CFD (шингэний урсгал), машин бүтээх симуляци |
AI / ML | Гүн сургалт, том хэлний загварууд |
Кино, 3D график | Рендер хийх, эффект боловсруулах |
Цэрэг, сансар | Сансрын загварчлал, зэвсгийн симуляци |
HPC системийн архитектур бол олон процессор, сүлжээ, санах ой, хадгалах төхөөрөмжүүдийг харьцангуй бага сааталтай, өндөр найдвартай байдлаар хамтран ажиллуулах зохион байгуулалт юм. Энэ нь маш том асуудлыг богино хугацаанд тооцоолох боломжийг олгож, шинжлэх ухаан, инженерчлэл, AI, санхүү зэрэг олон салбарт зайлшгүй хэрэгтэй.