fbpx

HPC системийн архитектур гэдэг нь High-Performance Computing (Өндөр Гүйцэтгэлтэй Тооцоолол) хийх зориулалттай компьютерийн системийн бүтэц, зохион байгуулалт, ажиллах зарчмыг хэлдэг. Энэ нь асар их хэмжээний тооцоолол, өгөгдөл боловсруулах чадвартай системийг бүтээхэд чиглэгдсэн техник, програм хангамжийн хослол юм.

🔧 HPC системийн архитектурын үндсэн бүрэлдэхүүн хэсгүүд:

1. Тооцооллын зангилаа (Compute nodes)

  • Тооцооллыг гүйцэтгэдэг үндсэн нэгж.
  • Нэг зангилаа (node) нь олон процессортой (CPU) эсвэл GPU-тэй байж болно.
  • Заримдаа “кластер” гэж нэрлэгдэнэ: олон зангилаа хоорондоо сүлжээгээр холбогдсон систем.
  • Жишээ:
    • 2 CPU + 4 GPU бүхий нэг node
    • 10,000 node бүхий кластер систем

2. Процессор (CPU) болон график процессор (GPU)

  • CPU (Central Processing Unit): Уламжлалт олон үүрэг гүйцэтгэгч, ерөнхий боловсруулагч.
  • GPU (Graphics Processing Unit): Маш олон жижиг цөмтэй, зэрэгцээ (parallel) тооцоололд маш хүчирхэг.
  • HPC системүүд сүүлийн үед GPU-н тулгууртай архитектур руу шилжиж байна (жишээ нь: NVIDIA A100, AMD MI300).

3. Санах ой (Memory)

  • Node-н доторх RAM: Нэг зангилаанд хамаарах хурдан санах ой.
  • Shared memory vs Distributed memory:
    • Shared memory: нэг физик RAM-д хандалттай (ихэвчлэн SMP системд)
    • Distributed memory: зангилаанууд тус тусдаа RAM-тай (кластер системд)

4. Хурдан холболтын сүлжээ (Interconnect / Network fabric)

  • Тооцооллын зангилаануудыг маш бага сааталтай, өндөр хурдтай холбодог.
  • HPC-д хэрэглэгддэг сүлжээ:
    • InfiniBand (200+ Gbps)
    • Omni-Path
    • Intel Slingshot (Frontier супер компьютерт ашиглагддаг)

5. Хадгалах систем (Storage subsystem)

  • Хэмжээ ихтэй, хурдан өгөгдөл унших/бичих чадвартай хадгалах төхөөрөмжүүд.
  • Хэрэглэдэг формат:
    • Parallel File Systems (жишээ: Lustre, GPFS, BeeGFS)
  • Tiered storage бүтэц:
    • RAM → SSD → HDD → Архивын систем

6. Удирдлагын зангилаа (Head / Management node)

  • Зангидаж удирдах, хэрэглэгчийн орчин хангах хэсэг.
  • Queue удирдах (SLURM, PBS гэх мэт)
  • Хэрэглэгчийн ажил хуваарилах, мониторинг хийх

🧠 HPC архитектурын үндсэн төрлүүд

Архитектурын төрөлТайлбарЖишээ
Shared-memoryНэг машинд олон CPU, RAM-аа хуваалцдагSMP (Symmetric Multiprocessing)
Distributed-memoryОлон node, тус тусдаа RAM-тайКластер систем
HybridCPU + GPU хослуулсан, shared ба distributed хослуулсанSummit, Frontier супер компьютер

⚙️ HPC системийн ажиллах зарчим

  • Хэрэглэгч програм/кодоо удирдлагын node-оор дамжуулан системд өгнө.
  • Job scheduler (SLURM, PBS) үүнийг зөв node-уудад хуваарилна.
  • Тооцоолол зэрэгцээ хэлбэрээр олон зангилаа дээр гүйцэтгэгдэнэ.
  • Өгөгдөл хадгалах систем рүү үр дүнг бичнэ.

📊 HPC-ийн үр ашиг хэмжигч үзүүлэлтүүд

  • FLOPS (Floating Point Operations Per Second): Тооцооллын хүчин чадал.
  • Latency & Bandwidth: Сүлжээний саатал ба хурд.
  • Scalability: Систем томроход гүйцэтгэл хэр нэмэгдэх.
  • Efficiency: Эрчим хүчний хэрэглээ vs тооцооллын чадвар (GFLOPS/watt)

🎯 HPC систем ашигладаг хэрэглээний жишээ

СалбарАшиглалт
Эрдэм шинжилгээГеномик, уур амьсгал, материалын шинжлэх ухаан
ИнженерчлэлCFD (шингэний урсгал), машин бүтээх симуляци
AI / MLГүн сургалт, том хэлний загварууд
Кино, 3D графикРендер хийх, эффект боловсруулах
Цэрэг, сансарСансрын загварчлал, зэвсгийн симуляци

HPC системийн архитектур бол олон процессор, сүлжээ, санах ой, хадгалах төхөөрөмжүүдийг харьцангуй бага сааталтай, өндөр найдвартай байдлаар хамтран ажиллуулах зохион байгуулалт юм. Энэ нь маш том асуудлыг богино хугацаанд тооцоолох боломжийг олгож, шинжлэх ухаан, инженерчлэл, AI, санхүү зэрэг олон салбарт зайлшгүй хэрэгтэй.

Leave a Reply