fbpx

python

SMOTETomek аргаар тэнцвэргүй өгөгдөлтэй тэмцэх нь

Машин сургалтын бодит хэрэглээнд, жишээ нь залилах илрүүлэлт, өвчний оношлогоо зэрэгт тэнцвэргүй өгөгдөл (нэг ангилал нөгөөгөөсөө хавьгүй их тоотой байх) түгээмэл тохиолддог. Энэ нь загваруудыг олонхи ангиллын талд хэт нэг талыг барьсан байдлаар сургах хандлагатай болгож, цөөнхийн ангиллыг зөв таамаглах чадварыг сулруулдаг гэж өмнөх нийтлэлээрээ бид ярилцсан. Энэ асуудлыг шийдвэрлэх үр дүнтэй аргуудын нэг нь […]

Программчлалын хэл хэрхэн бүтээгддэг вэ?

Python, JavaScript эсвэл C++ зэрэг программчлалын хэл хэрхэн үүссэн талаар та бодож байсан уу? Хүмүүс эдгээр программчлалын хэлийг өдөр тутамдаа апп, вэбсайт, тоглоом бүтээхэд ашигладаг ч эдгээрийн  ард цааш унших тусам илүү гүнзгий онол, зохион байгуулалт, инженерчлэлийн түүх байдаг. Программчлалын хэл бүтээнэ гэдэг нь зүгээр л үг, дүрмийг зохиох биш — харин хүний бүтээсэн хэлээр […]

Өгөгдлийн тэнцвэртэй байдал гэж юу вэ- Part1

Өнөөгийн машин сургалтын алгоритмууд нь том хэмжээний өгөгдөлд суурилан загварчлагдаж, янз бүрийн хэрэглээний талбарт өргөн ашиглагдаж байна. Гэсэн хэдий ч бодит амьдрал дээр өгөгдөл ихэвчлэн тэнцвэргүй (imbalanced) байдаг нь загварын гүйцэтгэлийг муутгаж, цөөн тооны (minority) ангиллын өгөгдлийг үл тоомсорлох хандлагыг бий болгодог. Энэхүү нийтлэлд бид өгөгдлийн тэнцвэржилтийн хэрэгцээ, ач холбогдлыг тайлбарлаж, түгээмэл хэрэглэгддэг аргачлал болох […]

TF-IDF (Term Frequency-Inverse Document Frequency)

TF-IDF (Term Frequency – Inverse Document Frequency) нь NLP-(Natural Learning Processing) болон мэдээлэл хайлтын салбарт өргөн хэрэглэгддэг статистик арга юм. Энэ аргачлал нь тухайн тодорхойлсон үг нь документэд дахь давтамж болон нийт документийн хүрээн дэхь давтамжуудыг тодорхойлдог. TF-IDF хэрхэн ажилладаг вэ? Энэхүү аргачлал нь 2 үндсэн аргаар тогтоно.1. Term Frequency- TF Энэхүү томьёо нь үг […]

Python програмчлалын хэл дээр оролтын утга авах аргууд.

Python програмчлалын хэл дээр бодлого бодож эхэлж байгаа анхан шатны суралцагчдад маань ихээхэн тулгардаг нэгэн асуудал бол input буюу оролтын утгыг авах билээ. Өнөөдрийн нийтлэлээр бид хэрхэн оролтын утгыг хувьсагчид зөв авч, цаашид үр дүнтэй хэрэглэх талаар дэлгэрэнгүй тайлбарлана. Бидний сонгож авсан жишээ бодлого бол SPOJ RGB7 сайтын “3 тооны их” нэртэй бодлого юм. Энэхүү […]