အင်တာနက်ပေါ်က မြန်မာစာစနစ်

ယနေ့ခေတ် အင်တာနက်တွင် အသုံးပြုနေသော မြန်မာစာစနစ်တွင် “ဇော်ဂျီ” နှင့် “မြန်မာယူနီကုဒ်” ဟူ၍ စနစ် နှစ်မျိုး ကွဲလျှက် ရှိပါသည်။ ဇော်ဂျီ အသုံးပြုသူများမှာ ၈ဝ ရာခိုင်နှုန်းကျော် ရှိနေပြီး မြန်မာယူနီကုဒ်စနစ် အသုံးပြုသူမှာ ၂ဝ ရာခိုင်နှုန်းခန့် ရှိပါသည်။

စနစ်နှစ်ခုကြားက ပြဿနာ

ဇော်ဂျီ နှင့် ယူနီကုဒ် စနစ်နှစ်ခုတွင် တစ်ခုကို အသုံးပြုပါက နောက်တစ်ခုနှင့် ရေးသားထားသော စာများကို ဖတ်ရှုရာတွင် မှန်ကန်စွာ မပြနိုင်ခြင်း ပြဿနာ ရှိပါသည်။ ထိုသို့ စနစ်နှစ်ခု ကွဲပြားနေမှုကြောင့် မြန်မာနိုင်ငံ နည်းပညာလောက တိုးတက်ပြောင်းလဲရေးကို များစွာ နှောင့်နှေးစေသလို သတင်းအချက်အလက် ဖြန့်ဝေရာတွင်လည်း အခက်အခဲဖြစ်စေပါသည်။

စနစ်နှစ်ခုမှ စနစ်တစ်ခုတည်းဆီသို့

စနစ်နှစ်ခုသည် နည်းပညာအရ မဟုတ်ဘဲ သဘောတရားအရ [Code point ပြဿနာ] ပေါင်းစည်းရန် မဖြစ်နိုင်ပါ။ ထို့ကြောင့် ပိုကောင်းသော စနစ်တစ်ခုတည်းသာ အသုံးပြုရန် ရှိပါတော့သည်။

ဘယ်စနစ်က ပိုကောင်းသလဲ

ပိုကောင်းတဲ့ စနစ်တစ်ခုတည်းကိုပဲ ရွေးချယ်အသုံးပြုနိုင်ရေးအတွက် ထိုစနစ်နှစ်ခု၏ အားနည်းချက် အားသာချက်များကို ချိန်ထိုးသုံးသပ်ရမှာဖြစ်ပါသည်။

မူပိုင်ခွင့် (Copyright)

ဇော်ဂျီ
မြန်မာယူနီကုဒ် စမ်းသပ်အဆင့်တွင် မြန်မာပညာရှင်တစ်ဦးဖြစ်သော ဦးရဲမြတ်သူ ရေးသားထားသော ဖောင့်တစ်ခုဖြစ်ပါသည်။ မြန်မာယူနီကုဒ်စနစ် မပြည့်စုံသေးခင်တွင် ယာယီအသုံးပြုနိုင်ရန်အတွက် ရည်ရွယ်ပြီး အခမဲ့ ဖြန့်ဖြူးခဲ့ပါသည်။ အခမဲ့ ဖြန့်ဖြူးခဲ့ပါသော်လည်း Software licence အမျိုးအစားကို ပွင့်လင်းစွာ ထုတ်ဖော်ရေးသားထားခြင်း မရှိခဲ့ပေ။

မြန်မာယူနီကုဒ်
မြန်မာယူနီကုဒ် စနစ်ကို မြန်မာစာအဖွဲ့ ၊ မြန်မာကွန်ပြူတာ ပညာရှင်များအသင်း (MCF) တို့မှ ပူပေါင်းပြီး နိုင်ငံတော် စီမံချက်ဖြင့် National Language Processing (NLP) ကို တည်ထောင်ပြီး ကွန်ပြူတာပေါ်တွင် မြန်မာစာကို မှန်ကန်စွာ လုပ်ဆောင်နိုင်ရေး ကြိုးပမ်းမှုမှ ရရှိလာသော နောက်ဆုံးရလာဒ် ဖြစ်ပါသည်။ နိုင်ငံတော်ပိုင် ဖြစ်ပြီး နိုင်ငံသားအားလုံး(တစ်ကမ္ဘာလုံး) အခမဲ့ အသုံးပြုနိုင်သော စနစ်ဖြစ်ပါသည်။

စာရိုက်ပုံ စနစ်

ဇော်ဂျီ
အမြင်အတိုင်း ရေးသား (စာရိုက်) ရသော စနစ် ဖြစ်ပါသည်။ ဥပမာ- “မြင့်” ဟူသော စကားလုံးကို ရေးသားရာတွင် ရရစ် ကို အရင်ရေးသားပြီးမှသာ မ ကို ရေးသားရပါသည်။ ထို့နောက် င နှင့် အသတ် အောက်မြစ် တို့ကို ဆက်ပြီး ရေးသားရပါသည်။

ဗျည်းကို အရင် မရေးဘဲ အမြင်အရ ရေးသားသောကြောင့် အက္ခရာစီခြင်း (Sorting) တွင် အဆင်မပြေတော့ပါ၊ ဥပမာ – “မို့မို့” နှင့် “မြင့်မြင့်” တို့သည် မ အက္ခရာစဥ်တွင် ရှိရမည် ဖြစ်သော်လည်း “မြင့်မြင့်” ကို ရေးသားစဥ်က ရရစ် ကို အရင်ရိုက်သွင်းခဲ့သောကြောင့် “မ” အက္ခရာစဥ်တွင် ရှိမနေတော့ဘဲ ဗျည်းမဟုတ်သော ရရစ် အုပ်စု အဖြစ်နှင့် ရောက်ရှိသွားပါတော့သည်။

ထိုကဲ့သို ဗျည်း/ သရ ခွဲခြားနိုင်စွမ်း မရှိသည့်အပြင် အမြင်အရ ရေးသားသော စနစ်ဖြစ်တာကြောင့် ရရစ် ၆ မျိုးအထိ ရှိနေခြင်း (ပုံစံမတူညီသော ရရစ်များနမူနာ ကြ၊ ခြ၊ ကြွ၊ ခြွ ၊ ကြိ၊ ခြိ )၊ အောက်မြစ် ၃ မျိုး ရှိနေခြင်း (နေရာချထားပုံမတူသော အောက်မြစ်များနမူနာ “ခ့” “က့” “ကွေ့”) တို့ကြောင့် ရေးသားပြီးသော စာများကို ပြန်လည်ရှာဖွေရာတွင် အခက်အခဲများ ဖြစ်ပေါ်စေသည်။ ထို့အပြင် “မွှ” ကဲ့သို့သော စာလုံးများတွင် မ ဝဆွဲ ဟထိုး ရေးလို့မရဘဲ မ ရေးပြီးလျှင် ဝဆွဲ နှင့် ဟထိုး ပေါင်းထားသော သီးသန့်စာလုံး တစ်ခုကို ရိုက်သွင်းရပါသည်။ ထိုကဲ့သို့ ပေါင်းစပ်ထားသော သီးသန့် စာလုံးများလည်း အများကြီးရှိပါသေးသည်။

မြန်မာစာရေးထုံးကို လိုက်နာစရာ မလိုအပ်သောကြောင့် ရှေ့နောက် လွဲမှားမှုများလည်း ရှိနိုင်ပါသည်။ ဥပမာ – “ကို” ဟူသော စာလုံးကို ရိုက်ရာတွင် ကကြီး လုံးကြီးတင် တစ်ချောင်းငင် ဟု ရိုက်သလို ကကြီး တစ်ချောင်းငင် ကို အရင်ရိုက်ပြီးမှ လုံးကြီးတင် ရိုက်လျှင်လည်း ရပါသည်။ အမြင်အရ အဆင်ပြေသော်လည်း ပြန်လည်ရှာဖွေရာတွင် တစ်ချောင်းငင် ပြီးမှ လုံးကြီးတင် ရေးထားသည့် “ကို” စာလုံးကို လုံးကြီးတင် ပြီးမှ တစ်ချောင်းငင် နည်းဖြင့် ပြန်လည်ရှာဖွေပါက ရှာမတွေ့နိုင်တော့ပေ။

မြန်မာယူနီကုဒ်
မြန်မာစာ ရေးထုံးကို လိုက်နာထားပါသည်။ ထို့ကြောင့် မှားရွင်း ရိုက်သွင်းပါက အမှားစက်ဝန်း (dotted circle) ပြသောကြောင့် စာရေးသားရာတွင် မှားရွင်းသွားသည်ကို အလွယ်တကူ သိရှိနိုင်ပါသည်။ (ဥပမာ “ကို” စာလုံးကဲ့သို့ အရေးအသားများတွင် တစ်ချောင်းငင် ရေးပြီးမှ လုံးကြီးတင် ရေးလျှင် အမှားစက်ဝန်း ပြသည်ကို တွေ့ရပါမည်။ (အမှား နမူနာ “ကို” ။ အလိုအလျောက်ပုံဖေါ်စနစ် (Shaping engine) ပါဝင်မှုကြောင့် ရရစ် တစ်မျိုးသာ ရှိပြီး အလိုအလျာက် ပုံပြောင်းနိုင်ပါသည်။ (ဥပမာ- ကြ၊ ခြ၊ ကြွ၊ ခြွ ၊ ကြိ၊ ခြိ တို့မှ ရရစ် အားလုံးအတွက် ရရစ် တစ်ခုတည်းကိုသာ ရိုက်သွင်းရမှာဖြစ်ပြီး အလိုအလျောက် ပုံပြောင်းစနစ်က လိုအပ်သလို ပုံစံပြောင်းပေးပါလိမ့်မည်။

မြန်မာစာ ရေးထုံးကို လိုက်နာထားပါသော်လည်း ဗျည်း/သရ ခွဲခြားထားသော စနစ်နှင့် အက္ခရာစဥ်ခြင်း အဆင်ပြေစေရန်အတွက် ဗျည်းကိုသာ အရင်ရိုက်သွင်းရပါတယ်။ ထို့ကြောင့် သရဖြစ်သော သဝေထိုးကို ဗျည်းရိုက်ပြီးမှသာ ရိုက်ရပါသည်။ ဥပမာ “မေ” ဟူသော စကားလုံးအတွက် မ ကို အရင်ရေးပြီးမှသာ သဝေထိုး ကို ရေးရပါမည်။ အလိုအလျောက်ပုံပြောင်းစနစ်ကြောင့် သဝေထိုး မှာ မ ၏ အရှေ့သို့ အလိုအလျောက် ရောက်သွားပါမည်။ (သဝေထိုးကို အရှေ့မှာ ရိုက်၍ရသော စာရိုက်စနစ်များလည်း ရှိပါသည်။ ဥပမာ ဗေ ကီးဘုတ်နှင့် tt ကီးဘုတ်)

တိုင်းရင်းသား စာပေ ထောက်ပံ့မှု

ဇော်ဂျီ
ဇော်ဂျီ ဖြန့်ချိစဥ်က မြန်မာယူနီကုဒ်စနစ်တွင် တိုင်းရင်းသားဘာသာများ (ကယား၊ စကောကရင်၊ ပိုးကရင်၊ မွန်၊ သျှမ်း၊ ပအိုဝ်) အတွက် မသတ်မှတ်ရသေးသောကြောင့် ဇော်ဂျီဖောင့်တွင် ဖောင်းပွနေသော ရရစ်များ၊ သရတွဲများ၊ ပဌ်ဆင့် စာလုံးများအတွက် တိုင်းရင်းသား စာလုံးများ၏ နေရာများကို ရယူထားပါသည်။ ထို့ကြောင့် ဇော်ဂျီ အသုံးပြုပါက အဆိုပါ တိုင်းရင်းသား ဘာသာစကားများကို အသုံးပြု၍ မရနိုင်ပါ။

မြန်မာယူနီကုဒ်
မြန်မာယူနီကုဒ် စနစ်တွင် တိုင်းရင်းသား ဘာသာစကားများကိုပါ ထောက်ပံ့ပေးထားပါသည်။

နိုင်ငံတကာ ထောက်ပံ့မှု

ဇော်ဂျီ
နိုင်ငံတကာ ယူနီကုဒ် အဖွဲ့အစည်းကြီးမှ ထုတ်ပြန်ထားသော ကုဒ်ပွိုင့်များမှ သွေဖီသောကြောင့် နိုင်ငံတကာ ထုတ်ကုန်များ အသုံးပြုရာတွင် အဆင်မပြေပါ။ သီးသန့် ထည့်သွင်းမှုများ လိုအပ်ပါသည်။

မြန်မာယူနီကုဒ်
နိုင်ငံတကာ ယူနီကုဒ် အဖွဲ့အစည်းကြီး၏ မြန်မာနိုင်ငံအတွက် အစိတ်အပိုင်းတစ်ခု ဖြစ်ပါသည်။ ဒစ်ဂျစ်တယ် ပစ္စည်းများတွင် အဆင်သင့် ပါဝင်ပြီး ဖြစ်ပါသည်။ သီးသန့် ထည့်သွင်းပေးရန် မလိုအပ်ပါ။

  • 2011 ခုနှစ် Apple ၏ Mac OSX တွင် မြန်မာယူနီကုဒ် စနစ်သုံး Myanmar Sangam MN ဖောင့် နှင့်အတူ မြန်မာယူနီကုဒ်စနစ် အဆင်သင့် ပါဝင်လာခဲ့ပါသည်။
  • 2012 ခုနှစ်တွင် Microsoft ၏ Windows 8.1 တွင် မြန်မာယူနီကုဒ် စနစ်သုံး Myanmar Text ဖောင့် နှင့်အတူ မြန်မာယူနီကုဒ်စနစ် အဆင်သင့် ပါဝင်လာခဲ့ပါသည်။
  • 2012 ခုနှစ်တွင် Google ၏ Android 4 တွင် မြန်မာယူနီကုဒ် စနစ်သုံး Padauk ဖောင့် နှင့်အတူ မြန်မာယူနီကုဒ်စနစ် အဆင်သင့်ပါဝင်လာခဲ့ပြီး Android စနစ်သုံး Smart Phone များတွင် အဆင်ပြေစွာ အသုံးပြုနိုင်ပါပြီ။
  • 2016 ခုနှစ်တွင် Apple ၏ iPhone နှင့် iPad တို့တွင်အသုံးပြုသော စနစ် iOS 10 တွင် မြန်မာယူနီကုဒ် စနစ်သုံး ဖောင့်နှင့်အတူ မြန်မာယူနီကုဒ်စနစ် အဆင်သင့် ပါဝင်လာခဲ့ပါသည်။

သုံးသပ်ချက်

မြန်မာယူနီကုဒ်မှာ ဇော်ဂျီစနစ်ထက် အစစ သာလွန်ပါသော်လည်း ဇော်ဂျီအသုံးပြုသူ များပြားလွန်းခြင်း၊ သတင်းဌာနများ နှင့် အစိုးရ၏ သတင်းထုတ်ပြန်မှုများတွင် အသုံးများသော ဇော်ဂျီကိုသာ အသုံးပြုခြင်း၊ MPT, Telenor, Ooredoo တို့ကဲ့သို့ ဆက်သွယ်ရေး ကုမ္ပဏီကြီးများတွင် အသုံးများသော ဇော်ဂျီကိုသာ အသုံးပြုခြင်း၊ အစိုးရ၏ ထောက်ပံ့အားပေးမှု မရရှိခြင်းတို့ကြောင့် မြန်မာယူနီကုဒ်စနစ်မှာ လူသုံးနည်းပါးလှပါသည်။

မြန်မာယူနီကုဒ်စနစ်ကိုသာ အသုံးပြုပါက Text to speech စနစ်ကိုပင် အသုံးပြုနိုင်မည် ဖြစ်သောကြောင့် မြန်မာစာများကို ကွန်ပြူတာမှ အသံထွက်ဖတ်နိုင်ပါမည်။ (မျက်စိ နှစ်ကွင်း အလင်းကွယ်နေသူများအတွက် အလွန်တန်ဖိုးရှိပါသည်။)

ဇော်ဂျီကိုသာ ဆက်လက်အသုံးပြုပါက အက္ခရာပင် မစဥ်နိုင်သောကြောင့် Database များ မတည်ဆောင်နိုင်ဘဲ တိုင်းပြည်တိုးတက်ရေးအတွက် အလွန်အရေးပါလှသည့် e-government စနစ်ကြီး ဖြစ်မလာနိုင်တော့ပါ။ ထို့အပြင် တိုင်းရင်းသားစာပေများကို အသုံးပြုခွင့်မရသောကြောင့် တိုင်းရင်းသားများအတွက် နစ်နာရသလို တိုင်းရင်သား စာပေများကို နည်းပညာခေတ်တွင်ပျက်သုန်းစေခြင်း (Digital genocide) ကိုပင် ဖြစ်စေပါသည်။

ထို့ကြောင့် ပိုမိုကောင်းမွန်သော တိုင်းပြည်အနာဂါတ်အတွက် တတ်သိပညာရှင်ကြီးများမှ နိုင်ငံ့ခေါင်းဆောင်များ သိရှိရေးနှင့် အများပြည်သူကို အသိပညာပေးရေးအတွက် ကူညီဆောင်ရွက်ပေးကြပါရန် တိုက်တွန်းအပ်ပါသည်ခင်ဗျာ။

ဆောင်းပါးရှင် – ကျော်သက်ထက်ဇော်

2 thoughts on “အင်တာနက်ပေါ်က မြန်မာစာစနစ်”

  1. ကောင်းပါသည်။ နိုင်ငံ့အနာဂတ်အတွက် အမျှော်အမြင်က​ြီးစွာဖြင့် နည်းပညာရှင်များ ပေါင်းစည်းနိုင်ရေး၊ အစိုးရ၏ အားပေးကူညီမှုရရှိနိုင်ရေး အမြန်ဆုံး လိုလားပါ၏။
    မိမိ blog တွင် ဘယ်ဟာ သုံးမှန်း မသိ၊ ခေါင်းခဲနေတယ်။
    let’s use the only Unicode for myanmar future.

    1. Blog မှာ Unicode သုံးမယ်ဆိုရင် Zawgyi သမားတွေပါ ဖတ်လို့ရအောင် Font Embedded လုပ်ပေးထားရင် အဆင်ပြေနိုင်ပါတယ်ခင်ဗျ

Leave a Reply