fbpx

machine learning

Support Vector Machine (SVM)

SVM гэж юу вэ? Support Vector Machine (SVM) нь N хэмжээст орон зайд класс бүрийн хоорондох зайг хамгийн их байлгах оновчтой шугам эсвэл гипер хавтгайг (hyperplane) олох замаар өгөгдлийг ангилдаг хяналттай машин сургалтын (supervised machine learning) алгоритм юм. SVM-үүдийг ангиллын асуудлуудад түгээмэл ашигладаг. Тэд өөр ангиллын хамгийн ойрын өгөгдлийн цэгүүдийн хоорондох заагийг хамгийн их байлгах […]

Гүн сургалтыг гүнээс нь сурцгаая №3 (Let’s dive deep into deep learning)

Өмнөх үг Эрхэм уншигч танд энэ өдрийн мэндийг хүргэе. Энэхүү нийтлэл нь өмнөх  Гүн сургалтыг гүнээс нь сурцгаая №2 нийтлэлийн үргэлжлэл учир өмнөх 2 нийтлэлийг уншаагүй бол заавал уншаад эргэж ирээрэй. Илүү хэцүү бодлого Өмнөх нийтлэлээр бид жижиг хэмжээний нэмэх үйлдэл гүйцэтгэдэг сүлжээг персептроны жин болон байсыг ашиглан өөрсдөө зохиосон. Тэгвэл одоо хамгийн энгийн зураг танилтын […]

Label Encoding vs One-Hot Encoding: Машинд мэдээлэл ойлгуулах хоёр арга

Машин сургалтын алгоритмууд өгөгдлийг зөвхөн тоогоор ойлгодог. Гэвч бидний амьдрал дахь мэдээлэл ихэнхдээ текст, нэр, категори хэлбэртэй байдаг. Эдгээрийг машин ойлгодог тоон мэдээлэл болгож хувиргах шаардлагатай бөгөөд үүнийг хийх хамгийн түгээмэл хоёр арга нь Label Encoding болон One-Hot Encoding юм. Label Encoding гэж юу вэ? Label Encoding гэдэг нь өгөгдлийн категори тус бүрд нэг тоо […]

SMOTETomek аргаар тэнцвэргүй өгөгдөлтэй тэмцэх нь

Машин сургалтын бодит хэрэглээнд, жишээ нь залилах илрүүлэлт, өвчний оношлогоо зэрэгт тэнцвэргүй өгөгдөл (нэг ангилал нөгөөгөөсөө хавьгүй их тоотой байх) түгээмэл тохиолддог. Энэ нь загваруудыг олонхи ангиллын талд хэт нэг талыг барьсан байдлаар сургах хандлагатай болгож, цөөнхийн ангиллыг зөв таамаглах чадварыг сулруулдаг гэж өмнөх нийтлэлээрээ бид ярилцсан. Энэ асуудлыг шийдвэрлэх үр дүнтэй аргуудын нэг нь […]

Өгөгдлийн тэнцвэртэй байдал гэж юу вэ- Part1

Өнөөгийн машин сургалтын алгоритмууд нь том хэмжээний өгөгдөлд суурилан загварчлагдаж, янз бүрийн хэрэглээний талбарт өргөн ашиглагдаж байна. Гэсэн хэдий ч бодит амьдрал дээр өгөгдөл ихэвчлэн тэнцвэргүй (imbalanced) байдаг нь загварын гүйцэтгэлийг муутгаж, цөөн тооны (minority) ангиллын өгөгдлийг үл тоомсорлох хандлагыг бий болгодог. Энэхүү нийтлэлд бид өгөгдлийн тэнцвэржилтийн хэрэгцээ, ач холбогдлыг тайлбарлаж, түгээмэл хэрэглэгддэг аргачлал болох […]