fbpx

Khishigjargal Gantulga

Хүн ойлгоно, машин ойлгохгүй… Харин Feature Extraction тусална!

Та зураг харлаа гэж бодъё. Тэр зураг дээр нохой байна уу, муур байна уу гэдгийг хүн амархан ялгаж чадна. Гэтэл машин, компьютер үүнийг ойлгохын тулд “зураг дотор байгаа мэдээллийг” утгатай өгөгдөл болгон хувиргах хэрэгтэй болдог. Энэ процессыг Feature Extraction гэж нэрлэдэг. Энгийнээр хэлбэл, feature extraction гэдэг нь “компьютерт мэдээллийг ойлгож болохуйц хэлбэрт оруулах” ухаалаг алхам […]

Data Lake гэж юу вэ?

Мэдээллийн хэмжээ өдөр ирэх тусам нэмэгдэж, байгууллагууд төрөл бүрийн өгөгдөл цуглуулдаг болсон. Эдгээр мэдээллийг нэг дор төвлөрүүлэн хадгалах хэрэгцээ бий болжээ. Энэ асуудлыг шийдэх нэг оновчтой арга бол Data Lake ашиглах явдал юм. Data Lake нь боловсруулалт хийгдээгүй (raw) бүх төрлийн өгөгдлийг ямар ч ялгалгүйгээр хадгалах зориулалттай орчин юм. Жишээ нь, Excel файл, зураг, бичлэг, […]

N-gram ашиглан текстийн анализ хийх: Үгний харилцан хамаарлыг олж илрүүлэх

Өнөө үед бидний хэрэглэдэг цахим мэдээлэл, хариу үйлдэл, мэдээлэл дамжуулалт бүрт их хэмжээний текст бий. Текстийн шинжилгээ хийх нь хүний үг, өгүүлбэр, тодорхойлж буй утгыг компьютерт ойлгуулан, утга агуулсан мэдээлэлд хүрэх гол арга зам юм. Машин сургалт, хиймэл оюун ухаан (AI)-ийн хөгжилтэй холбоотойгоор текстийн анализын техникүүд мөн өөрчлөгдөж байна. Үүний нэг чухал хэсэг нь N-gram […]

Client-Server загвар гэж юу вэ?

Бид өдөр тутамдаа ухаалаг төхөөрөмжүүдээрээ дамжуулан интернет ашиглаж, мэдээлэл хайж, аппликейшнүүдийг хэрэглэдэг. Энэ бүх үйлдэл Client–Server загвар дээр суурилдаг. Хэрэглэгчийн төхөөрөмж (Client) нь серверт хүсэлт илгээж, сервер нь хариу өгдөг. Энэ загвар нь интернэт, аппликейшн, цахим үйлчилгээний үндэс суурь болдог. Амьдрал дээрх энгийн жишээ Та нарийн боовны газар орж, “нэг шоколадтай бялуу өгөөч” гэж хэллээ […]

ChatGPT ба эелдэг үгийн зардал

Та ChatGPT-д “баярлалаа” эсвэл “гуйя” гэж хэлдэг үү? Тэгвэл таны эелдэг байдал OpenAI-д жил бүр хэдэн арван сая долларын зардал нэмдэг гэдгийг компанийн гүйцэтгэх захирал Сэм Алтман дурдлаа. Учир нь энэ мэт жижиг боловч давтагддаг үгс AI-ийн боловсруулж буй өгөгдлийн хэмжээг өсгөж, илүү их цахилгаан, тооцооллын нөөц шаардаж эхэлдэг байна. Бидний ганц өгүүлбэрийн ард асар […]