fbpx

Та зураг эсвэл бичлэг доторх хүн, машин, тэмдэг, нохой гэх мэт зүйлийг автоматаар ялгаж таньдаг системийг харж байсан уу? Тэдгээрийн ард ажилладаг ухаалаг тархи нь YOLO буюу “You Only Look Once” хэмээх алгоритм юм. Нэр нь нэг л удаа харж бүхнийг олж танина гэсэн санааг илэрхийлдэг. Энэ арга нь хиймэл оюунд нэг зураг, нэг бичлэгийг дахин дахин шалгахын оронд нэг дор бүх объектийг илрүүлэх чадвар өгдөг.

YOLO хэрхэн ажилладаг вэ?

Өмнө нь объект илрүүлэх системүүд зураг бүрийг олон жижиг хэсэг болгон хувааж, хэсэг бүрт нь “энд юу байна вэ?” гэж дахин дахин шалгадаг байлаа. Энэ нь их цаг, тооцооллын нөөц шаарддаг. Харин YOLO зураг бүхэлд нь нэг дор харж, яг тэр агшинд дотор нь байгаа бүх объектийг тодорхойлдог. Тэр зурагт хүн, машин, гэрэл, тэмдэг зэрэг ямар зүйл байгааг нэг л алхамд таньдаг. Энэ аргын онцлог нь хурд, нарийвчлал, үр ашиг гурвыг нэгэн зэрэг хангаж чаддагт оршино.

YOLO-ийн хэрэглээ

YOLO бодит амьдралд олон салбарт ашиглагдаж байна. Автомат жолоодлоготой машинууд камерт бичигдсэн дүрснээс хүн, тэмдэг, гэрэл зэрэг зүйлийг танихдаа YOLO-г ашигладаг. Аюулгүй байдлын системүүд бичлэг доторх хөдөлгөөн, сэжигтэй үйлдлийг илрүүлэхэд YOLO хэрэглэнэ. Мөн байгаль хамгааллын байгууллагууд дроны тусламжтай амьтдыг тоолох, хууль бус агнуурыг илрүүлэхэд энэ аргыг ашигладаг. Эмч нар ч рентген зураг дээрх өвчний шинж тэмдгийг илрүүлэхэд YOLO-ийн тусламжийг авч эхэлжээ.

YOLO-ийн хөгжил

YOLO анх 2016 онд судлаач Жозеф Редмон болон түүний багийн бүтээсэн анхны хувилбараас үүдэлтэй. Эхний загвар нь хурдан боловч энгийн байлаа. Дараа нь гарсан YOLOv3, v4 хувилбарууд илүү гүн сүлжээтэй болж, илүү нарийн, хурдтай ажилладаг болсон. Сүүлийн үеийн YOLOv7, YOLOv8 хувилбарууд нь жижиг төхөөрөмж дээр ч ажиллах чадвартай болж, гар утас, ухаалаг камер зэрэгт суурилуулах боломжтой болсон. Энэ хөгжлийн замнал нь YOLO-г бодит цагийн дүрс боловсруулахад хамгийн өргөн хэрэглэгддэг технологийн нэг болгосон юм.

Давуу болон сул тал

YOLO-ийн гол давуу тал нь хурд. Энэ систем бодит цагийн бичлэг дээр ажиллаж, секунд бүрийн дотор олон объектийг илрүүлж чадна. Мөн нэг сүлжээнд илрүүлэлт, ангилалт, байршлын тооцооллыг зэрэг хийдэг тул үр ашигтай. Гэхдээ сул тал ч бий. Маш жижиг объектуудыг, жишээ нь алсад байгаа хүн эсвэл холын тэмдэгийг танихад алдаа гарч болдог. Зарим тохиолдолд олон объект давхцсан зургуудыг зөв ялгахад хүндрэлтэй байдаг.

Дүгнэлт

YOLO бол компьютерийн харааны салбарт шинэ эрин үеийг нээсэн технологи юм. Нэг л хараад дэлхий дээр юу болж байгааг ойлгож чаддаг хиймэл оюуны “нүд” гэж хэлж болно. Энэ системийг ашиглан машин илүү ухаалаг жолоодож, камерууд илүү аюулгүй байдлыг хангаж, эрдэмтэд илүү нарийн судалгаа хийх боломжтой болж байна. YOLO бол зөвхөн нэг алгоритм биш — хиймэл оюуныг бодит ертөнцтэй холбож буй чухал гүүр юм.

Leave a Reply