Энэхүү нийтлэлээрээ энэ тэнд трэнд болоод байгаа янз бүрийн хиймэл оюунаар үүсгэсэн зурагнуудыг AI хэрхэн үүсгэдэг вэ гэдгийг товч тодорхой ямар ч технологийн мэдлэггүй хүнд ойлгомжтой байхаар бичихийг хичээлээ. Тухлан сууж таалан уншаарай.
1.Зураг компьютерт хэрхэн дүрслэгддэг вэ?
Маш энгийн боловч энэ нийтлэлийн үндсэн суурь болно гэж бодлоо. Хэрвээ та үүнийг ойлговол зураг үүсгэх процессыг ойлгоход амархан байна гэж бичээч миний бие найдаж байна.
Компьютер зургыг маш олон жижиг пиксел болгон хувааж дүрсэлдэг. Пиксел бүр доор дурдсан 3 тоогоор илэрхийлэгддэг. За тэгэхээр бидний харж буй зураг нь пикселүүдийн массив амарчилж хэлбэл хүснэгт байх нь байна шүү дээ.
- Улаан (R): 0–255
- Ногоон (G): 0–255
- Хөх (B): 0–255
1 пиксел гурван тоо агуулна гэхээр 1024×1024 пикселтэй нэг зураг 1024x1024x3 = 3,145,728 ширхэг тоон цуваа болдог байх нь ээ. Зүгээр л ямар их тоог ганц зурагний ард хадгалах хэрэгтэй болохыг харуулах гэж хэлсэн юм.
Пиксел гэж үнэхээр мэдэхгүй бол яг одоо зурагтаа асаагаад утасныхаа камерыг micro дээр нь тавиад зүүм хийгээд үзээрэй. За та нэг иймэрхүү юм харагддаг.
![Découverte de l'image numérique [Processing]](https://www.tee.education/wp-content/uploads/2025/08/image-3.jpeg)
2.AI зураг үүсгэх процесс
Хэрэглэгч промптоо оруулна.
Зиа ямартай ч хэрэглэгч юу хүсэж байгаагаа бичээд илгээнэ. Жишээ нь: “ Скүүтэр унаж буй монгол дээлтэй морь” ч гэдэг юм уу.

Тухайн текстийг тоонд хөрвүүлнэ.
Компьютер зөвхөн тоо л ойлгодог гэж мэдэх байх аа. Тиймээс саяны текстийг ойлгомжтой тоон илэрхийлэлд хөрвүүлэх шаардлагатай. Ингэхдээ “текст кодлогч” ашиглан өгүүлбэрийг үг үгээр нь задлан “embedding” буюу тоон дүрслэл болгон хувиргадаг. За энэ chatgpt ашигладаг текст кодлогчийг туршаад промптоо хувиргавал ийм болох нь ээ.

AI Noisy буюу рандом зурагнаас эхэлдэг.
Хүмүүс цэвэр цаасан дээр зургаа зурж эхэлдэг дээ , харин AI яг л сүлжээ нь тасалдсан хуучны зурагт дээр гардаг хүн аймар чимээтэй дүрстэй яг адил зүүлнээс зурагаа үүсгэж эхэлдэг.

Cуралцах үйл явц
- AI-д интернетээс цуглуулсан маш олон зураг, тэдгээрийн тайлбар өгдөг.
- Зураг бүрийг зураг кодлогчоор дамжуулж embedding үүсгэнэ: Энэ нь зураг дахь пикселүүдийн улаан, ногоон, цэнхэр (RGB) өнгөний утгыг тоон хэлбэрт шилжүүлдэг (0-255 хооронд).
- Текст тайлбаруудыг мөн текст кодлогчоор дамжуулна.
- AI эдгээр мэдээллүүд дээр үндэслэн “гүн сургалт” хийдэг
- Хүн бодит ертөнцийг ойлгохын тулд харьцуулалт хийдэгтэй адил AI ч мөн адил зураг ба текстийн хоорондын холбоог олж тогтоон, тухайн зүйлсийг таньж мэдэх “хувьсагч” шиг зүйл үүсгэдэг.
Ингээд AI нь скүүтэр хавтгай юм байна. За тэгээд монгол дээр захтай юм байна гэх мэтчилэн промптний гол үгнүүдийн шинжүүдийг агуулсан шинжүүдийг хувьсагч болгодог. Тэдгээр нь бүгд олон хэмжээст огторгуйн нэг хэмжэээс болдог.
Зураг үүсгэх: Reverse Diffusion
Сургалтын дараа AI хэрэглэгчийн өгсөн текстийг тэр огторгуйтай холбож түүнийгээ ашиглан Reverse Diffusion аргаар зургийг үүсгэж эхэлнэ — шуугианыг аажмаар арилгаж, зураг бий болгоно.
Ижил текст ч өөр зураг үүсгэж болдог нь санамсаргүй түрүүн тайлбарласан зурагтай холбоотой

Дүгнэлт
Зураг зурах нь нарийн мэдрэмж туршлага шаардахаа больж хүссэн хүн төсөөллөө хэдхэн секунтийн дотор бүтээл болгох боломжтой болжээ. AI хүний бүтээл дээр үндэслэн суралцдаг. Харин бүтээгчийн зөвшөөрөлгүйгээр үүнд ашиглаж, шинэ бүтээл гаргаж байгаа нь ёс зүйн хувьд нилээн маргаан гаргаад байгаа. Юм бүхэн 2 талтай шиг энэхүү арга зарим хүмүүсд үр өгөөжөө өгч зарим нь хохирч байгаа мэт санагдлаа.