Google DeepMind-ын Gemma 3 нээлттэй загварын тухай

Сүүлийн жилүүдэд хиймэл оюун ухааны (AI) загваруудын хөгжүүлэлт нь илүү хүчирхэг, олон төрлийн өгөгдөл боловсруулах чадвартай болж байна. Google DeepMind-ийн 2025 оны 3-р сарын 12-ны өдөр танилцуулсан Gemma 3 загвар нь өмнөх хувилбаруудаасаа томоохон ахиц гаргаж, олон төрлийн өгөгдөл (multimodal) боловсруулах, урт контекст дэмжих, олон хэлний орчуулга болон ойлголтыг сайжруулах зэрэг шинэ боломжуудыг багтаасан.

Gemma 3 нь 1-27 тэрбум параметр бүхий хөнгөн нээлттэй загваруудын нэг бөгөөд томоохон өөрчлөлтүүдийг багтаасан нь энэ судалгааны ажлын гол онцлог юм. Энэхүү нийтлэлээр Gemma 3-ийн шинэчлэлт, сургалтын процесс, гүйцэтгэлийн үнэлгээ болон аюулгүй байдлын арга хэмжээнүүдийг тайлбарлах болно. Мөн Монгол хэл дээрх туршилт болон ашиглах эх сурвалжуудыг нийтлэлийн төгсгөлөөс уншаарай.

Gemma хэрхэн бүтээгдсэн бэ?

Gemma-ийн урьдчилсан сургалт (pre-training) болон дараах сургалтын (post-training) процесс нь том загваруудаас жижиг загвар руу мэдлэг гаргаж авах (distillation), хүч нэмэгдүүлсэн сургалт (reinforcement learning), загвар нэгтгэх (model merging) зэрэг аргуудыг ашиглан оновчлогдсон. Энэ хосолсон аргачлал нь математик, код бичих чадвар, заавар дагах чадварыг ихээхэн сайжруулсан. Мөн аюулгүй байдал ба өгөгдлийн шүүлтүүр (Data Filtering & Safety Measures) ашиглан хувийн мэдээлэл, буруу мэдээлэл болон ёс суртахуунгүй контентуудыг шүүсэн.

Gemma 3 нь 140 гаруй хэл дэмждэг шинэ токенжуулагч ашигладаг бөгөөд 1 тэрбум (1B), 4 тэрбум (4B), 12 тэрбум (12B), 27 тэрбум (27B) параметр бүхий загваруудыг дараах хэмжээтэй өгөгдлөөр сургажээ:

1B загвар – 2 их наяд (2T) токен
4B загвар – 4 их наяд (4T) токен
12B загвар – 12 их наяд (12T) токен
27B загвар – 14 их наяд (14T) токен

Gemma 3-ийн онцлогууд

Gemma 3 нь олон талт өгөгдөл боловсруулах чадвартай байхаас гадна өмнөх хувилбаруудаасаа дараах гол сайжруулалтуудыг хийсэн:

Олон төрлийн өгөгдөл боловсруулах чадвар, зураг, текст гэх мэт (Multimodal Learning)
128,000 токен хүртэл уртасгасан контекстийн дэмжлэг (Long Context Support)
Олон хэлний дэмжлэгийг өргөжүүлсэн ба Монгол хэлний дэмжлэг багтсан (Multilingual Capabilities). Монгол хэл Moderate Performance Languages буюу дунд түвшний гүйцэтгэлтэй гэдэг ангилалд багтаж байна. Энэ нь нөөц ихтэй Англи, Герман, Испани, Хятад зэрэг хэлнүүд дээр ажиллах гүйцэтгэлийг гүйцэхгүй ч тодорхой түвшинд ашиглаж болохоор хөгжүүлэгдсэн байна.
Математик, логик сэтгэлгээ, код бичих чадваруудыг сайжруулсан (Enhanced Instruction Following, Math & Reasoning)
KV-cache санах ойн хэрэглээг сайжруулсан (Optimized Memory Usage for Long Context)

Олон хэл дээрх туршилт – Google Developer Blog

Монгол хэл дээрх туршилт

Харьцуулалт хийх үүднээс “Хувийн зохион байгуулалтаа сайжруулах зөвлөгөө өгнө үү” гэсэн Prompt-г Gemma 2 болон Gemma 3 загваруудад өгч хэрхэн хариулахыг харьцуулж үзье.

Gemma 2 хариулт:

Gemma 3 хариулт:

Дээрх харьцуулалтаас харвал нэг ижил асуултанд Gemma 3 илүү утга учиртай, утга зүйн алдаа багатай хариулт өгснийг харж болохоор байна. Хамгийн гол нь нээлттэй загвар тул Монгол хэл дээрх “ХЭЛ” болон “ЗУРАГ-ХЭЛ” хосолсон даалгаврууд дээр ашиглах боломж бүрдэж байгаа нь том давуу тал болохоор байна.

Гүйцэтгэлийн Үнэлгээ

Gemma 3 загвар нь LMSYS Chatbot Arena болон бусад томоохон платформ дээр шинэ түвшний үнэлгээ авсан. Доорх хүснэгт нь GPT-4o, Claude 3, Gemini 1.5 Pro зэрэг загваруудтай харьцуулсан Elo оноог харуулж байна.

Загвар	Elo Оноо
GPT-4.5 Preview	1411
Gemini-2.0-Pro	1380
ChatGPT-4o	1377
DeepSeek-R1	1363
Gemma-3-27B-IT	1338
Gemma-2-27B-IT	1220

Хэрэглээний Боломжууд

Gemma 3 загварыг олон салбарт ашиглах боломжтой, үүнд:

Олон хэлний орчуулга (Multilingual AI)
Зураг таних, түүнийг тайлбарлах систем (Vision-Language Models)
Математик болон логик сэтгэлгээний AI (Math & Logic AI)
Олон төрлийн контекст боловсруулах чадвар (Long-Context AI for Documents & Research)

Аюулгүй Байдал ба Ёс Зүйн Стандарт

AI загваруудын хэрэглээ нэмэгдэж байгаа тул Google DeepMind нь Gemma 3-ийг дараах аюулгүй байдлын аргуудыг авч хэрэгжүүлсэн байна. Үүнд:

Хувийн мэдээллийг илрүүлэхгүй байх хамгаалалт (PII Detection & Privacy Control)
Ёс суртахуунтай AI (Ethical AI Usage)
Хортой контент шүүгч (Toxic Content Filtering & Safe Deployment)

Дүгнэлт

Gemma 3 нь олон төрлийн өгөгдөл боловсруулах, урт контекстийг дэмжих, олон хэлний ойлголт, математикийн болон код бичих чадвар зэргийг сайжруулсан архитектур, дэвшилтэт сургалтын техникүүд ашиглан хөгжүүлсэн. Энэхүү загвар нь GPT-4o, Claude 3, Gemini 1.5 Pro зэрэг том загваруудтай өрсөлдөхүйц түвшинд хүрсэн. Нээлттэй загвар тул AI хөгжүүлэгчид, судлаачид, олон нийтэд ашиглах боломжтой. Мөн Монгол хэл дээр ажиллах чадвар сайжирсан нь бидний хувьд уг загварыг турших, өөрсдийн бүтээгдэхүүн үйлчилгээндээ нэвтрүүлэх боломж бүрдэж байна.

Эх сурвалж

Huggingface models: https://huggingface.co
Kaggle models: https://www.kaggle.com/models/google/gemma-3
Technical paper: https://storage.googleapis.com/
Google AI Studio дээр турших: https://aistudio.google.com/
Google Developer нийтлэл: https://developers.googleblog.com/en/introducing-gemma3/
Ашиглах нөхцөл: https://ai.google.dev/gemma/terms

Эрэлттэй сургалтууд