fbpx

Гүн сургалтыг гүнээс нь сурцгаая №1 (Let’s dive deep into deep learning.)

Өмнөх үг

Эрхэм уншигч танд энэ өдрийн мэндийг хүргэе. Энэхүү нийтлэлээрээ би бүхий л хиймэл оюуны том том амжилтуудын эхлэлийг тавьсан гүн сургалтыг эхнээс нь энгийн байдлаар тайлбарлах гэж оролдох болно.Тиймээс энэхүү нийтлэлээрээ персептрон гэх хамгийн анхны мэдрэлийн сүлжээний загварыг тайлбарлана. Уг нийтлэлийг бичсэнээр өөрөө ч бас их зүйл судалж ойлгоно гэж найдаж байна.

Eр нь яагаад гүн сургалт хэрэгтэй вэ?

Программчлал гэдэг маш гайхалтай. Хүний хэдэн жил хийгээд барахгүй тооцооллыг хэдхэн секунтэд гүйцэтгэх чадвартай. Гэхдээ нөгөө талаасаа программчлал өөрөө маш учир дутагдалтай. Хүний амархан хийдэг зүйлс маш төвөгтэй болж хувирдаг. Жишээ нь та яг одоо надад зурагнаас нохой муур хоёрыг ялгаж чаддаг программ бичиж өгч чадах уу? Хүний хувьд маш амархан зүйл мэт боловч компьютерт маш төвөгтэй болж хувирдаг.

Neural Network (Multilayer Perceptron) | Freelancer

Хүн тэгвэл яаж үүнийг төвөггүй хийж чаддаг юм бол? Бид тархиныхаа маш нарийн бүтэц бүхий нейрон гэх зүйлийн тусламжтайгаар бүхий л зүйлийг хийж бодож таньж байдаг. Тийм ч учраас энэхүү бүтцээс санаа аван Warren McCulloch ба Walter Pitts нар A Logical Calculus of the Ideas Immanent in Nervous Activity нэртэй өгүүлэл бичсэн нь мэдрэлийн сүлжээ ( Neural network) ийн үндэс гэж үздэг.

Artificial Neural Networks — Mapping the Human Brain | by Shubham Panchal |  Predict | Medium

Персептрон (Perceptron)

Мэдрэлийн сүлжээг ойлгохын тулд хамгийн энгийн хиймэл нейрон болох персептроныг авч үзье. 1958 онд Frank Rosenblatt персептрон нэртэй анхны суралцдаг мэдрэлийн сүлжээг зохион бүтээсэн. Энэ нь компьютерыг жишээнээс сургаж болохыг харуулсан хамгийн том алхам байсан.

Deep Neural Network: What is it and how is it working?

Персептрон хэрхэн ажилладаг вэ?

Персептрон хэд хэдэн хоёртын утгатай оролт авч эргээд нэг ширхэг хоёртын утгатай хариу гаргадаг загвар юм. Доорх зурган дээрх жишээн дээр харагдаж байгаачлан манай персептрон 3 ширхэг оролттой тус бүр дээр нь харгалзах weights буюу жингүүд байгаа энэхүү жин нь тухайн оролтын утга гаралтын утгад хэр нөлөөлөх вэ гэдгийг харуулж буй тоо юм. Шийдвэрийг тухайн оролтуудыг тус бүрийн жингээр үржүүлэн нэмээд хариуг нь гаргадаг.

доорх зургаас гаралт= x*w1 + y*w2 + z*w3 болно гэсэн үг.

Perceptron: Concept, function, and applications

Нийтлэл унших уу ? болих уу?

За сая арай ойлгоогүй бол жишээ аваад үзье л дээ. Энэхүү загвар нь та энэ нийтлэлийг унших эсэхийг таамагладаг загвар байсан гэж бодъё. Та 3н хүчин зүйлээс шалтгаалан нийтлэл унших эсэхээ шийддэг гэж үзье.

  1. x =>Надад зав байгаа юу?
  2. y=> Нийтлэлийн гарчиг сонирхол татахуйц байна уу?
  3. z=> Миний сонирхдог төрлийн сэдэв мөн үү?

Эдгээр асуултуудад тийм үгүй гэж хариулна гэж үзээд хоёртын утгаар илэрхийлье. Жишээ нь та завгүй ( x=0) гэхдээ нийтлэлийн гарчиг сонирхолтой (y=1) бас таны сонирхдог төрлийн сэдэв бол (z=1) тус тусын утгатай болно. За та тэгээд сонирхолтой сэдэв тааралдвал завтай байна уу эсвэл таны сонирхдог сэдэв байна уу хамаагүй унших дуртай байя л даа. Эсвэл та сонирхдог сэдвээсээ өөр ямар ч нийтлэл унших дургүй байж болно. Энэ тохиолдлуудад жингээ ашиглан шийдвэрийнхээ загварыг бүтээж болно. w1=2, w2=6, w3=2 гэсэн утгаар жингээ сонгон авч үзье. Тэгвэл таны загьар w2 маш өндөр буюу зав нийтлэлийн гарчиг таны шийдвэрт маш ихээр нөлөөлнө гэсэн үг болно.

Threshold буюу босго утга

Тэгвэл яг эцсийн шийдвэрээ яаж гаргах вэ? Танд босго утга буюу “за яг хэдэн онооноос дээш байвал уншина даа” гэсэн утга хэрэгтэй гэсэн үг. Миний хувьд босго утгыг шалгалтын дүнтэй зүйрлүүлэн бодох дуртай. 60 онооноос дээш авбал тэнцдэг шүү дээ. Тэгэхээр шалгалтны босго утга нь 60 гэсэн үг болно. Та нийтлэл унших дуртай хүн бол таны босго утга маш бага байх ёстой болно. Түрүүний жишээн дээр босго утгыг 3 аар сонгоод w1=3, w2=4 ,w3=3 жингүүдийг сонговол танд зав гарвал эсвэл сонирхолтой гарчиг ч юм уу эсвэл сонирхдог сэдэв чинь байвал шууд тухайн нийтлэлийг уншина гэсэн үг. Эсрэгээрээ та нийтлэл унших нэлээн дургүй хүн байлаа гэж бодвол босго утгыг өсгөх шаардлагатай болно. босго утгыг 9 өөр сонгож авч үзвэл манай гурван нөхцөл 3 уулаа бүрдэж байж л загвар “нийтлэл уншина ” гэх хариу өгнө гэсэн үг.

гаралт=> 0 (уншихгүй ) босго утга > x*w1 + y*w2 + z*w3

1 (уншина ) босго утга < x*w1 + y*w2 + z*w3

Page 8 | Threshold Images - Free Download on Freepik

гэсэн шийдвэр гаргадаг загвартай боллоо. Та жин болон босго утгыг өөрийн хүслээр өөрчлөн туршиж үзээд өөрийн нийтлэл унших эсэхийг шийддэг загвараа хийж бодоод үзээрэй.

Дүгнэлт

Бодит амьдрал дээр хүний шийдвэр гаргалтыг 3 хан хувьсагчаар илэрхийлэх боломжгүй. Хүмүүс өөрсдөө ч мэдэхгүй маш олон хүчин зүйлийг харгалзаж эсвэл зүгээр л unconscious (өөрийн мэдэлгүй) шийдвэр гаргадаг учраас үүнийг загварчлах нь хэтэрхий комплекс болох болно. Энэхүү нийтлэлээрээ хоёртын шийдвэр гаргадаг нэг ширхэг персептроныг тайлбарлалаа. Дараагийн нийтлэлээрээ олон персептронууд нийлж хэрхэн хамтдаа комплекс шийдвэр гаргах загвар болдгийг харах болно. Дараагийн нийтлэлээрээ уулзахыг тэсэн ядан хүлээж байна.

Эх сурвалжууд

Илүү гүнзгий ойлгомоор байвал доорх бичлэгийг санах болгоё

Leave a Reply