content top
Showing posts with label ယူနီကုဒ်. Show all posts
Showing posts with label ယူနီကုဒ်. Show all posts

Failed Stories by Lionslayer

(1) Failed Unicode

ဒီနှစ် ၂၀၁၁ ကို ယူနီကုဒ်နှစ်အြဖစ်သတ်မှတ်ြပီး​​​ အား​​​ြကိုး​​​မာန်တက်လုပ်ြကမယ်လို့​​​ ယူနီကုဒ် Developer ​​​ေတွနဲ့​​​ Contributor ​​​ေတွ ၂၀၁၀ နှစ်ကုန်ပိုင်း​​​မှာ အြကံြပုြကပါတယ်။ အဲဒီအချိန်က MITP မှာ လတ်တ​​​ေလာ တာဝန်ယူ​​​ေနတဲ့​​​ Admin တစ်​​​ေယာက်နဲ့​​​ ြပဿနာြဖစ်လို့​​​ MITP ကထွက်ထား​​​တဲ့​​​ အချိန်ြဖစ်ပါတယ်။ အ​​​ေြကာင်း​​​ရင်း​​​က တချို့​​​က ယူနီကုဒ်နဲ့​​​ ​​​ေရး​​​ချင်တယ်၊​ MITP က ယူနီကုဒ်ကို ​​​ေထာက်ခံတယ်​​​ေြပာ​​​ေပမဲ့​​​ Zawgyi-One, Zawgyi1 ကို Default လုပ်ထား​​​လို့​​​ အလွယ်​​​ေရး​​​မရတဲ့​​​ အတွက် ကျွန်​​​ေတာ်က Post တစ်ခု​​​ေရး​​​ြပီး​​​ ဘာြမန်မာ​​​ေဖာင့်​​​ကိုမှ Default လုပ်မထား​​​ဘဲ ထား​​​လိုက်ရင် ြကိုက်တဲ့​​​လူက ြကိုက်တဲ့​​​​​ေဖာင့်​​​နဲ့​​​​​ေရး​​​လို့​​​ဖတ်လို့​​​ရမယ်လို့​​​ အြကံြပုပါတယ်။ ယူနီကုဒ်နဲ့​​​​​ေရး​​​ချင်ရင် ကိုယ့်​​​ဆိုက်ကိုယ်​​​ေထာင်ြပီး​​​​​ေရး​​​လို့​​​ အက်ဒမင်က​​​ေြပာလို့​​​ အကျယ်ကျယ် မြဖစ်ချင်လို့​​​ အဲဒီက ထွက်ခဲ့​​​ပါတယ်။ ​​​ေနာက်ပိုင်း​​​ MITP မှာ ယူနီကုဒ်နဲ့​​​ပတ်သက်ြပီး​​​ ​​​ေမး​​​တာ​​​ေတွကို ​​​ေြဖသူမရှိတဲ့​​​အတွက် မျက်နှာ​​​ေြပာင်​​​ေြပာင်နဲ့​​​ပဲ အ​​​ေကာင့်​​​ြပန်ဝင်ြပီး​​​ ​​​ေြဖခဲ့​​​ပါတယ်။


အခု​​​ေနာက်ပိုင်း​​​မှာ ​​​ေတွ့​​​လာတာက ယူနီကုဒ်ဆိုရင် စံအြဖစ်သတ်မှတ်ထား​​​တဲ့​​​ ကွန်ပျူတာသံုး​​​ ြမန်မာစာရယ်လို့​​​ မြမင်နိုင်​​​ေတာ့​​​ဘဲ ယူနီကုဒ်ရယ်၊​ စံရယ် စကား​​​တစ်ခုခုကို​​​ေြပာလိုက်တာနဲ့​​​ တီဆား​​​တို့​​​သလို ြဖစ်သွား​​​​​ေနတာကို ​​​ေတွ့​​​ပါတယ်။ ကိုယ်ကလည်း​​​ မသိတဲ့​​​လူ​​​ေတွ့​​​ရင် အလိုက်မသိ ပညာ​​​ေပး​​​ချင်​​​ေနတာဆို​​​ေတာ့​​​ ​​​ေတာက်ညင့်​​​ကတ်ခံရ​​​ေပါင်း​​​လည်း​​​ များ​​​ြပီ။ အမှတ်မရှိ ကိုယ့်​​​ကိုမ​​​ေမး​​​​​ေပမဲ့​​​ စံအ​​​ေရး​​​မြကီး​​​​​ေြကာင်း​​​ ​​​ေြပာ​​​ေနတဲ့​​​ ​​​ေနရာတစ်ခုမှာ သွား​​​ကွန်း​​​မန့်​​​​​ေပး​​​မိပါတယ်။ ချက်ချင်း​​​ပဲ ​​​ေဖာင့်​​​အ​​​ေြကာင်း​​​​​ေရာက်သွား​​​ြပီး​​​ ယူနီကုဒ်က ဘာလို့​​​ ​​​ေဇာ်ဂျီအရင် မထွက်တာလဲ၊​ ဘာလို့​​​ ယူနီကုဒ်​​​ေတွ အများ​​​ြကီး​​​ြဖစ်​​​ေနတာလဲဆိုတာကို “​​​ေသာက်” တပ်ြပီး​​​ ​​​ေြပာလာတာ​​​ေြကာင့်​​​ ဝမ်း​​​နည်း​​​စွာနဲ့​​​ပဲ တစ်စံုတစ်ခုကို သတိြပုလိုက်မိပါတယ်။ ယူနီကုဒ်မ​​​ေအာင်ြမင်ပါ။ ယူနီကုဒ်ဟာ ြမန်မာ​​​ေတွအတွက် ​​​ေကာင်း​​​လွန်း​​​​​ေနပါတယ်၊​ စနစ်ကျလွန်း​​​​​ေနပါတယ်။ ြဗဲလရမ်း​​​​​ေရး​​​တတ်တဲ့​​​ စာလံုး​​​​​ေပါင်း​​​မမှန်တဲ့​​​ လူ​​​ေတွနဲ့​​​ ဘယ်လိုမှ မကိုက်ပါဘူး​​​။ “ယူနီကုဒ်သမား​​​” “အဲဒီအုပ်စု” ဆိုတဲ့​​​ အြမင်ရှိ​​​ေနတာလည်း​​​ စိတ်မ​​​ေကာင်း​​​စွာ ​​​ေတွ့​​​လိုက်ရပါတယ်။ လက်ရှိယူနီကုဒ်သံုး​​​​​ေနသူ ယူဇာ​​​ေတွအ​​​ေနနဲ့​​​လည်း​​​ ဒီ”ယူနီကုဒ်သမား​​​”​​​ေတွကို အြမင်မြကည်မှု​​​ေတွ ရှိ​​​ေနြပီး​​​ အချိန်မ​​​ေရွး​​​ မသံုး​​​​​ေတာ့​​​မယ့်​​​ အ​​​ေနအထား​​​မှာ ရှိပါတယ်။

အား​​​လံုး​​​က ခုချိန်မှာ ယူနီကုဒ်ကို တ​​​ေြပး​​​ညီ စနစ်တကျသံုး​​​ရင် ​​​ေနာက်​​​ေလး​​​ငါး​​​ဆယ်နှစ်အတွင်း​​​မှာ အသား​​​ကျသွား​​​ြပီး​​​ ြမန်မာစာဆိုတာ ဒီလိုပါလား​​​ ဆိုတဲ့​​​ ရလဒ်တစ်ခုနဲ့​​​ ​​​ေနာင်လာ​​​ေနာက်သား​​​​​ေတွအတွက် တည်ြငိမ်တဲ့​​​ စနစ်တစ်ခု ဖန်တီး​​​နိုင်မှာ သိပါတယ်။ အဲလို မဟုတ်ဘူး​​​ဆိုရင် ခုလာမယ့်​​​ Windows8 မှာ Unicode ထည့်​​​​​ေပး​​​လည်း​​​ ​​​ေဖာင့်​​​ြပင်သံုး​​​ြကမယ်၊​ Patches ​​​ေတွလုပ်ြပီး​​​ ပါလာတဲ့​​​ ယူနီကုဒ်​​​ေဖာင့်​​​ ပျက်သွား​​​​​ေအာင်လုပ်မယ်ဆိုတာ ​​​ေြမြကီး​​​လက်ခတ်မလွဲ သိပါတယ်။ ဒါက နည်း​​​နည်း​​​ ​​​ေရှ့​​​​​ေရာက်​​​ေနတဲ့​​​ အိုင်တီသမား​​​တိုင်း​​​ပါဝင်လာရင် ြဖစ်နိုင်မှာပါ။ သို့​​​​​ေသာ်…။ မြဖစ်နိုင်​​​ေတာ့​​​ပါ။ ဒီလိုပဲ ကိုယ်ြကိုက်တဲ့​​​​​ေဖာင့်​​​ကိုယ်သံုး​​​ြပီး​​​ ​​​ေရှ့​​​​​ေလျှာက်လည်း​​​ တရွတ်ဆွဲသွား​​​​​ေနဦး​​​မယ်ဆိုတာ ြမင်ပါတယ်။



(2) Failed Burmese

သတ်ပံုမှား​​​တယ်ဆိုတာ အွန်လိုင်း​​​မှာ ဆိုက်တိုင်း​​​လိုလို ဘ​​​ေလာ့​​​တိုင်း​​​လိုလို ြဖစ်​​​ေနတဲ့​​​ ထမင်း​​​စား​​​​​ေရ​​​ေသာက် ကိစ္စြဖစ်​​​ေနပါြပီ။ သတ်ပံုမမှား​​​​​ေအာင် ဂရုစိုက်ြပီး​​​​​ေရး​​​တဲ့​​​ဆိုက်ဆိုတာ လက်ချိုး​​​​​ေရလို့​​​ ရပါတယ်။ သတ်ပံုမှား​​​​​ေလ၊​ ​​​ေနာက်ြကည့်​​​တဲ့​​​လူက လိုက်မှား​​​​​ေလဆို​​​ေတာ့​​​ ြမန်မာအွန်လိုင်း​​​​​ေလာကြကီး​​​တစ်ခုလံုး​​​ဟာ သတ်ပံုအမှား​​​​​ေတွနဲ့​​​ ြပည့်​​​​​ေနတယ်လို့​​​ ​​​ေြပာရင် လွန်မယ်မထင်ပါဘူး​​​။ သတ်ပံုမှာလည်း​​​ စံရှိပါတယ်။ စံကိုလိုက်နာတာ ကိုယ့်​​​စာ​​​ေပ ကိုယ့်​​​ဘာသာကို ြမှင့်​​​တင်ရာ​​​ေရာက်သလို ကိုယ့်​​​စာကိုဖတ်မယ့်​​​ ​​​ေနာင်လာ​​​ေနာက်သား​​​​​ေတွအတွက် သာဓကြပုစရာ အမှန်တစ်ရပ်ကို ချန်ခဲ့​​​တယ်ဆိုတာ သတိြပုမိသူ နည်း​​​မယ်ထင်ပါတယ်။ သတ်ပံုအမှန်အမှား​​​ဆိုတာ မိမိရဲ့​​​ စာ​​​ေပ​​​ေရချိန်နဲ့​​​ ဆိုင်ပါတယ်။ သတ်ပံုမှန်တဲ့​​​ စာ​​​ေတွကို များ​​​များ​​​ဖတ်တဲ့​​​လူဟာ မသိစိတ်မှာ အဲဒီစာလံုး​​​​​ေပါင်း​​​​​ေတွကို ရင်း​​​နှီး​​​ြပီး​​​ြဖစ်တဲ့​​​အတွက် သတ်ပံုအလိုလို မှန်လာပါ​​​ေတာ့​​​တယ်။ ထို့​​​နည်း​​​တူစွာ စာ​​​ေပ​​​ေရချိန်နည်း​​​တဲ့​​​လူ​​​ေတွအတွက် အွန်လိုင်း​​​ကဖတ်တဲ့​​​စာ​​​ေတွဟာ စိတ်ထဲမှာ စွဲြပီး​​​ ​​​ေရး​​​တိုင်း​​​​​ေရး​​​တိုင်း​​​ စာလံုး​​​​​ေပါင်း​​​အမှား​​​​​ေတွ ြဖစ်လာပါ​​​ေတာ့​​​တယ်။ အထူး​​​သြဖင့်​​​ အွန်လိုင်း​​​မှာ Active ြဖစ်တယ်ဆိုတာ အိုင်တီသမား​​​​​ေတွများ​​​ပါတယ်။ အိုင်တီသမား​​​အများ​​​စု သတ်ပံုဂရုမစိုက်ြကဘူး​​​၊​ သတ်ပံုဂရုစိုက်ြခင်း​​​ဟာ ြမန်မာစာကို ထိန်း​​​သိမ်း​​​ြခင်း​​​ြဖစ်တယ်လို့​​​လည်း​​​ ခံယူထား​​​ပံုမ​​​ေပါ်ပါဘူး​​​ လို့​​​​​ေြပာရင် မှန်မယ်ထင်တယ်။ ဒီမိုက​​​ေရစီရဖို့​​​ လူတိုင်း​​​မှာ တာဝန်ရှိတယ်လို့​​​ခံယူရင် ြမန်မာစာ အရှည်တည်တံ့​​​ဖို့​​​ သတ်ပံု​​​ေလး​​​​​ေတာ့​​​ မှန်​​​ေအာင်​​​ေရး​​​ဖို့​​​လိုတယ်ဆိုတဲ့​​​ ခံယူချက်​​​ေတာ့​​​ အများ​​​စုမှာ မရှိြကပါ။ အဂင်္လိပ်လိုသာ မှန်​​​ေအာင်ြကိုး​​​စား​​​​​ေရး​​​ြက​​​ေပမဲ့​​​ ြမန်မာစာကို​​​ေတာ့​​​ အဲလိုခံယူချက် ရှိတာနည်း​​​ပါတယ်။


ြမန်မာစာကို ြမတ်နိုး​​​တဲ့​​​ လူတစ်စု​​​ေပါင်း​​​ြပီး​​​ သတ်ပံုအမှန်ြပင်​​​ေပး​​​​​ေရး​​​ ​​​ေကာ်မတီဆိုြပီး​​​ ဖွဲ့​​​ထား​​​ြကပါတယ်။ ပထမ​​​ေတာ့​​​ ​​​ေတွ့​​​ရာ​​​ေနရာမှာကွန်း​​​မန့်​​​​​ေပး​​​ြပီး​​​ လိုက်ြပင်ြက​​​ေပမဲ့​​​ အြမင်ကတ်ခံရတာ များ​​​လာတာ​​​ေြကာင့်​​​ သူများ​​​ကို အမှန်ြပင်ြခင်း​​​ ​​​ေလျှာ့​​​လိုက်ြကပါတယ်။ တ​​​ေလာက ြမန်မာကျူတိုရီရယ်မှာ ကိုသီဟက သတ်ပံုအမှား​​​​​ေတွ့​​​ရင်လည်း​​​ ြပင်​​​ေပး​​​ပါဗျာဆိုလို့​​​ ဝမ်း​​​သာအား​​​ရနဲ့​​​ ြပင်​​​ေပး​​​ြကပါတယ်။ ဟုတ်ပါတယ်၊​ ဒီလို လူဖတ်များ​​​တဲ့​​​ ဆိုက်တစ်ခုက စြပင်လို့​​​ တြဖည်း​​​ြဖည်း​​​နဲ့​​​ လူ​​​ေတွကို သတ်ပံုမှန်လာ​​​ေအာင် ဆွဲ​​​ေဆာင်နိုင်မယ်လို့​​​ ယံုြကည်မိတာကိုး​​​။ အမှန်ြပင်တယ်ဆိုရာမှာလည်း​​​ အမှား​​​နဲ့​​​ အမှန်ကို တွဲြပြပီး​​​ ကွန်း​​​မန့်​​​​​ေပး​​​တာကို နှစ်သက်ပါတယ်။ အဲဒါက ြမင်လွယ်ြပီး​​​ စိတ်ထဲကို ဒိုင်း​​​ကနဲ့​​​ ​​​ေရာက်သွား​​​​​ေစတဲ့​​​အတွက် ြဖစ်ပါတယ်။ အဲဒီအချိန်မှာ ဘာသာရပ်နဲ့​​​မဆိုင်ဘဲ သတ်ပံုလာြပင်တာ မြကိုက်ဘူး​​​၊​ မှား​​​လည်း​​​အ​​​ေရး​​​မြကီး​​​ ဖတ်သူနား​​​လည်ရင်ြပီး​​​တာပဲဆိုတဲ့​​​ အ​​​ေပါက်မျိုး​​​ အ​​​ေြပာခံလိုက်ရပါတယ်။ အဲဒီစိတ်ဓာတ်ကို မြကိုက်ပါ။ ဗမာစာသည် တို့​​​စာရယ်လို့​​​ြဖစ်​​​ေအာင် အဂင်္လိပ်လက်​​​ေအာက်မှာ ြပန်တူး​​​ဆွ ထိန်း​​​သိမ်း​​​ခဲ့​​​ရတာ နှစ်တစ်ရာ မြပည့်​​​​​ေသး​​​ပါ။ ဒီလိုစိတ်ဓာတ်​​​ေတွက ြမန်မာစာ ​​​ေပျာက်သွား​​​​​ေအာင်၊​ ပျက်သွား​​​​​ေအာင် တွန်း​​​ချ​​​ေနတယ်လို့​​​ ခံစား​​​ရပါတယ်။ ကျွန်​​​ေတာ်သွား​​​ြကည့်​​​​​ေတာ့​​​ ကွန်း​​​မန့်​​​ပိတ်သွား​​​ပါြပီ။ ဒါ​​​ေြကာင့်​​​ FB မှာ Status တင်ပါတယ်။ ကိုယ်​​​ေြပာတဲ့​​​ အ​​​ေပါက်က အချိုး​​​မ​​​ေြပ​​​ေတာ့​​​ ြပဿနာမီး​​​ထွန်း​​​ရှာသလို ြဖစ်ပါတယ်။


အဲဒီကစ အကျယ်အကျယ်မြငိမ်း​​​ဖွယ်​​​ေတွြဖစ်ြပီး​​​ ​​​ေညာင်ြမစ်တူး​​​လို့​​​ ပုတ်သင်ဥ​​​ေပါ်တဲ့​​​ ကိစ္စ​​​ေတွ ြဖစ်ကုန်ပါတယ်။ ဘာမဆိုင်ညာမဆိုင် ယူနီကုဒ်လည်း​​​ ပတ်ရမ်း​​​ခံလိုက်ရသလို “ယူနီကုဒ်အဖွဲ့​​​” ဆိုတဲ့​​​ အြမင်က ယူနီကုဒ်သံုး​​​သူယူဇာ​​​ေတွ ြကား​​​ထဲမှာရှိတာလည်း​​​ ​​​ေတွ့​​​လိုက်ရပါတယ်။ ဒီဆိုက်အ​​​ေြကာင်း​​​​​ေြပာချင်ရင် ဒီဆိုက်မှာ Contribute လုပ်မှ​​​ေြပာဆိုတဲ့​​​ အြမင်ရယ်၊​ သတ်ပံုြပင်ြခင်း​​​သည် သိပ်အ​​​ေရး​​​မြကီး​​​ ဆိုတဲ့​​​အြမင်ရယ်၊​ စံတစ်ခုသတ်မှတ်သံုး​​​စွဲစရာမလို​​​ေြကာင်း​​​ဆိုတဲ့​​​ အြမင်​​​ေတွရယ် ​​​ေတွ့​​​လိုက်ရ​​​ေတာ့​​​ ကျွန်​​​ေတာ်တို့​​​​​ေြပာ​​​ေြပာ​​​ေနတဲ့​​​ စံဆိုတာရယ်၊​ ြမန်မာစာကို တန်ဖိုး​​​ထား​​​ဖို့​​​ရယ်ဆိုတာ​​​ေတွက ​​​ေြပာသာ​​​ေြပာ၊​ ဒီဘက်နား​​​ကဝင် ဟိုဘက်နား​​​ကထွက်သွား​​​ပါလား​​​လို့​​​ သိလိုက်ရပါတယ်။ သူတပါး​​​နား​​​ဝင်​​​ေအာင် မ​​​ေြပာတတ် မ​​​ေြပာနိုင်၊​ ​​​ေြပာတိုင်း​​​လည်း​​​ ဆရာြကီး​​​​​ေလသံ​​​ေတွြဖစ်ြဖစ်​​​ေနတတ်တဲ့​​​ ကိုယ့်​​​ရဲ့​​​ ​​​ေရး​​​ပံု​​​ေရး​​​​​ေပါက်ကိုပဲ အြပစ်တင်မိပါ​​​ေတာ့​​​တယ်။



(3) Failed Credit

ဘာသာစကား​​​မှာ ရင်း​​​ြမစ်​​​ေဒတာ​​​ေတွက အ​​​ေရး​​​ြကီး​​​တယ်၊​ နည်း​​​ပညာက ​​​ေနာက်မှလာတယ်ဆိုတာ ဘာသာ​​​ေဗဒကို လုပ်​​​ေနသူတိုင်း​​​သိပါတယ်။ အခု အွန်လိုင်း​​​မှာ ​​​ေခတ်စား​​​​​ေနတာ အဘိဓာန်ပါ။ ဟိုလူအဘိဓာန်လုပ်တယ်၊​ ဒီလူအဘိဓာန်လုပ်တယ်နဲ့​​​လည်း​​​ ​​​ေတွ့​​​​​ေတွ့​​​​​ေနရတာပါ။ ​​​ေကာင်း​​​တဲ့​​​စိတ်ကို အ​​​ေြခခံြကြပီး​​​လုပ်တာြဖစ်​​​ေပမဲ့​​​ Credit ​​​ေပး​​​ဖို့​​​ကိစ္စကို​​​ေတာ့​​​ သိပ်အ​​​ေရး​​​ထား​​​ြကတာ မ​​​ေတွ့​​​ပါဘူး​​​။ အခုအွန်လိုင်း​​​မှာ အများ​​​ဆံုး​​​ ယူသံုး​​​​​ေနတာက Ornagai ရယ် Saing dict က ​​​ေဒတာ​​​ေတွြဖစ်ပါတယ်။ အဲဒီက ​​​ေဒတာ​​​ေတွ ဘယ်ကရလဲ ဆိုတာ အ​​​ေသး​​​စိတ် Credit ထား​​​ဖို့​​​​​ေတာ့​​​ ​​​ေမ့​​​​​ေနလို့​​​ပဲြဖစ်ြဖစ်၊​ မအား​​​ြကလို့​​​ပဲြဖစ်ြဖစ် ြဖစ်ပါလိမ့်​​​မယ်။ Ant ပုရွက်ဆိတ်ဆိုတာ လူတိုင်း​​​က ဒီလိုပဲ ြပန်မှာပါပဲ။ ဒါ​​​ေပမဲ့​​​ ဒီထက်ပိုတဲ့​​​ ဖွင့်​​​ဆိုချက်​​​ေတွ ရှိလာမယ်ဆိုရင် အဘိဓာန်တစ်ခုနဲ့​​​ တစ်ခု ကွဲသွား​​​မှာပါ။ အဘိဓာန်ြပုစုတယ်ဆိုတာ ဆယ်စုနှစ်နဲ့​​​ ချီြပီး​​​ ြကာတဲ့​​​ ကိစ္စပါ။ ကိုယ်က ြပန်ကူး​​​ယူြပီး​​​ြဖန့်​​​တယ်ဆိုရင် ကိုယ်လက်​​​ေညာင်း​​​​​ေပမဲ့​​​ မူရင်း​​​ြပုစုသူ​​​ေတွ အဆ​​​ေပါင်း​​​များ​​​စွာ ပင်ပန်း​​​ခဲ့​​​တယ်ဆိုတာ သတိရဖို့​​​ပါ။


အစက မပါတဲ့​​​ စာလံုး​​​​​ေတွလည်း​​​ ​​​ေနာက်ပိုင်း​​​ကိုယ့်​​​ဟာကိုယ်စဉ်း​​​စား​​​ြပီး​​​ ထပ်ြဖည့်​​​ရင်း​​​ ြကာ​​​ေတာ့​​​ ဘယ်သူဘာလုပ်ခဲ့​​​တယ်ဆိုတာ အမှတ်အသား​​​ မရှိ​​​ေတာ့​​​ပါ။ မူရင်း​​​ သာလွန်လား​​​၊​ ြမန်မာနိုင်ငံ အဂင်္လိပ်စာအဖွဲ့​​​လား​​​ စကား​​​လံုး​​​တစ်လံုး​​​ချင်း​​​မှာ Ref လုပ်ဖို့​​​ လိုတာ အမှန်ပဲ။ အကျဉ်း​​​ချုပ်မဟုတ်တဲ့​​​ အဘိဓာန်​​​ေတွမှာ ရှုပ်​​​ေထွး​​​တဲ့​​​စာလံုး​​​​​ေတွ၊​ တြခား​​​က ကိုး​​​ကား​​​ယူရတဲ့​​​ စာလံုး​​​​​ေတွဆိုရင် ​​​ေအာက်မှာ footnote နဲ့​​​ Ref ​​​ေတွ ထည့်​​​​​ေပး​​​ြကပါတယ်။ ကိုး​​​ကား​​​အစံုက​​​ေတာ့​​​ အဘိဓာန်​​​ေနာက်ဆံုး​​​မှာ အြမဲပါပါတယ်။ အစက ref တပ်တာကို မလုပ်ခဲ့​​​ရင်​​​ေတာင် ​​​ေနာက်ပိုင်း​​​မှာ field တစ်ခုအ​​​ေနနဲ့​​​ တပ်သွား​​​ဖို့​​​ အြကံြပုချင်ပါတယ်။ ​​​ေလာ​​​ေလာဆယ်​​​ေတာ့​​​ ​​​ေသာင်း​​​ချီသိန်း​​​ချီ​​​ေနတဲ့​​​ Data ​​​ေတွနဲ့​​​ မြဖစ်နိုင်​​​ေတာ့​​​ဘူး​​​ ထင်ပါတယ်။ ဒီအ​​​ေတွး​​​​​ေတွး​​​မိတာကလည်း​​​ အခုရက်ပိုင်း​​​ VOA သတင်း​​​မှာ ြမင်လိုက်တဲ့​​​ Gtalk ပါဠိ-ြမန်မာ-အဂင်္လိပ် အဘိဓာန်ဆိုတာမှာ ဦး​​​ဟုတ်စိန်နာမည်တစ်လံုး​​​ မ​​​ေတွ့​​​မိလို့​​​ ြဖစ်ပါတယ်။



Conclusion

Prediction လုပ်တာ ဝါသနာပါလို့​​​ ​​​ေြပာချင်ပါတယ်။ ဒီစာ​​​ေရး​​​တဲ့​​​အချိန်ကစလို့​​​ ​​​ေနာက်ဆယ်နှစ်အတွင်း​




  • ၁။ ြမန်မာြပည်ဒီမိုက​​​ေရစီ(အစစ်အမှန်)ရဖို့​​​လည်း​​​မြမင်၊

  • ၂။ ယူနီကုဒ်ကို လူြကိုက်များ​​​လာဖို့​​​လည်း​​​မြမင်၊

  • ၃။ ြမန်မာစာစာလံုး​​​​​ေပါင်း​​​လည်း​​​ ပိုမှန်လာဖို့​​​လည်း​​​မြမင်မိ။


ဒီယူနီကုဒ်ကိစ္စ၊​ သတ်ပံုကိစ္စ၊​ ဝီကီကိစ္စ​​​ေတွလုပ်​​​ေနတယ်ဆိုတာလည်း​​​ ြမန်မာစာကို ချစ်တဲ့​​​စိတ်တစ်ခုနဲ့​​​ လုပ်​​​ေနတာပါ။ အချိန်အရမ်း​​​ကုန်ပါတယ်။ အချိန်ကုန်သ​​​ေလာက် ရလာတဲ့​​​ Feedback နဲ့​​​ အြမင်​​​ေတွကလည်း​​​ အား​​​ရစရာ မ​​​ေကာင်း​​​ပါ။ ဒီ​​​ေတာ့​​​ ဒီကိစ္စ​​​ေတွ (ကျွန်​​​ေတာ့်​​​အ​​​ေနနဲ့​​​) မ​​​ေအာင်ြမင်ဘူး​​​လို့​​​ ဝမ်း​​​နည်း​​​စွာနဲ့​​​ပဲ ကိုယ့်​​​ဟာကိုယ် သံုး​​​သပ်ပါတယ်။ ြမန်မာဝီကီမှာ အား​​​ြကိုး​​​မာန်တက် တစ်ကိုယ်​​​ေတာ် ြကဲခဲ့​​​တဲ့​​​ ကိုဟသင်္ာ ဘာလို့​​​ထွက်သွား​​​သလဲဆိုတာ ရိပ်ခနဲ ြမင်လိုက်သလို ရှိပါတယ်။ ယူနီကုဒ်ကိစ္စကို လက်ရှိ Developer ​​​ေတွအ​​​ေနနဲ့​​​ ဆက်လုပ်ြကပါလိမ့်​​​မယ်။ ကျွန်​​​ေတာ့်​​​အ​​​ေနနဲ့​​​ စိတ်ပါရင် ပါသလို တိုး​​​တိုး​​​တိတ်တိတ်နဲ့​​​ ဒီဘ​​​ေလာ့​​​​​ေလး​​​မှာ ​​​ေရး​​​သွား​​​ပါဦး​​​မယ်။ ယူနီကုဒ်နဲ့​​​ သတ်ပံုကိစ္စကို​​​ေတာ့​​​ အြမင်ကတ်ခံ လူမုန်း​​​ခံြပီး​​​ ဘယ်​​​ေနရာမှာမှ သွား​​​​​ေရာက်​​​ေြပာြကား​​​ ကွန်း​​​မန့်​​​ထား​​​​​ေတာ့​​​မှာ မဟုတ်​​​ေတာ့​​​ပါ။ ဒါပါပဲ။


Credit: Lionslayer: The Legend @ http://lionslayer.yoeyar.com/?p=1154#comments

“အလံ​မလှဲပါနှင့်​ဧရာ” သို့​မဟုတ် ြမန်မာ​ယူနီကုဒ်​တို့​အ​ေြကာင်း​တ​ေစ့​တ​ေစာင်း​



သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ကျွန်​​ေတာ်သည် ြမန်မာစာပညာရှင်လည်း​​ မဟုတ်၊​ ယူနီကုဒ်ပညာရှင်လည်း​​ မဟုတ်ပါ။ သို့​​​ေသာ် ကျွန်​​ေတာ်သည် ြမန်မာစာကို ​​ေန့​​တဓူဝ သံုး​​စွဲ​​ေနသူ ြဖစ်သည့်​​အ​​ေလျာက်၊​ ​​ေခတ်သစ်ြမန်မာစာ၏ ​​ေနာင်​​ေရး​​သည် ယ​​ေန့​​​ေခတ် ​​ေကျာ်ြဖတ်​​ေနရ​​ေသာ ြမန်မာယူနီကုဒ် အသွင်​​ေြပာင်း​​မှုအ​​ေပါ် အနည်း​​နှင့်​​ အများ​​ မှီတည်​​ေနရသည်ကို သိြမင်​​ေနသူ တဦး​​ ြဖစ်ပါသည်။ ထို့​​​ေြကာင့်​​ ြမန်မာစာ ြမတ်နိုး​​သူ တဦး​​ အြဖစ်လည်း​​​ေကာင်း​​၊​ ကွန်ပျူတာနှင့်​​ အင်တာနက် သံုး​​စွဲသူတဦး​​ အြဖစ်လည်း​​​ေကာင်း​​ ဤ​​ေဆာင်း​​ပါး​​ကို ​​ေရး​​သား​​ပါသည်။

နိဒါန်း​


ယခုတ​​ေလာ အင်တာနက်တွင် ြမန်မာယူနီကုဒ်ပညာရှင်တချို့​​က မြကာမီကမှ ​​ေပါ်​​ေပါက်လာသည့်​​ ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​​ကို ထိုး​​နှက်တိုက်ခိုက်သည့်​​ အ​​ေရး​​အသား​​များ​​ တင်လာပါသည်။ ဧရာအဖွဲ့​​ကလည်း​​ ြပန်လည်တံု့​​ြပန်​​ေချပသည်ကိုြမင်ရပါသည်။ ြမန်မာစာတိုး​​တက်ဖွံ့​​ြဖိုး​​​ေရး​​အတွက် ရည်ရွယ် လုပ်​​ေဆာင်​​ေနြကသူများ​​ အချင်း​​များ​​ြကသည်ကို ကျွန်​​ေတာ် မြမင်လိုပါ။ အ​​ေြကာင်း​​မှာ ဤသို့​​ အချင်း​​များ​​ြကြခင်း​​သည် ြမန်မာစာ ​​ေခတ်မီတိုး​​တက်​​ေရး​​ကို ​​ေနှာင့်​​​ေနှး​​​ေစ​​ေသာ​​ေြကာင့်​​ ြဖစ်သည်။

ထိုပညာရှင်တို့​​ အချင်း​​များ​​ြကရသည့်​​ အရင်း​​ခံအချက်မှာ ဧရာကို ယူနီကုဒ်စာလံုး​​အြဖစ် ယူနီကုဒ် ပညာရှင် အချို့​​က အသိအမှတ် မြပုလိုြကြခင်း​​ ြဖစ်သည်။ ဧရာက မိမိတို့​​သည် ယူနီကုဒ်စနစ်၏ အ​​ေြခခံသတ်မှတ်ချက်ြဖစ်သည့်​​ code points ​​ေခါ် သ​​ေကင်္တအမှတ်အသား​​ြပုစနစ်ကို တိတိကျကျ လိုက်နာ​​ေသာ​​ေြကာင့်​​ ဧရာသည် ယူနီကုဒ်စာလံုး​​ ြဖစ်သည်ဟု ဆိုသည်။ အြခား​​တဖက်မှ ယူနီကုဒ် ပညာရှင်တို့​​ကမူ ဧရာသည် ယူနီကုဒ် သ​​ေကင်္တအမှတ်အသား​​ြပုစနစ်ကို အတိအကျ လိုက်နာ​​ေသာ်လည်း​​၊​ Unicode encoding ဟု​​ေခါ်သည့်​​ ယူနီကုဒ်သ​​ေကင်္တ​​ေြပာင်း​​စနစ်ကို အြပည့်​​အဝ မလိုက်နာ​​ေသာ​​ေြကာင့်​​ ယူနီကုဒ်အစစ် မဟုတ်ဟု ဆိုသည်။ ဧရာအဖွဲ့​​ကလည်း​​ ဧရာသည် သ​​ေဝထိုး​​၊​ ယရစ်နှင့်​​ ကင်း​​စီး​​တို့​​မှ လွဲ၍ သ​​ေကင်္တ​​ေြပာင်း​​စနစ်ကို လိုက်နာပါသည်ဟု ြပန်လည် တံု့​​ြပန်သည်။ ထိုစာလံုး​​ ၃ လံုး​​ကို ြမန်မာယူနီကုဒ် သ​​ေကင်္တ​​ေြပာင်း​​စနစ်အတိုင်း​​ လိုက်နာ​​ေရး​​သား​​လျှင် operating system တချို့​​နှင့်​​ software အများ​​စုတို့​​က ပံု​​ေဖါ်​​ေပး​​နိုင်ြခင်း​​ (rendering လုပ်​​ေပး​​နိုင်ြခင်း​​) မရှိသြဖင့်​​ ထို စာလံုး​​ ၃ လံုး​​ကို ချွင်း​​ချက်ထား​​ရြခင်း​​ ြဖစ်သည်ဟု ဧရာအဖွဲ့​​က ဆိုသည်။

ထိုအခါ အြခား​​တဖက်မှ ယူနီကုဒ်ပညာရှင်များ​​က ဧရာသ​​ေကင်္တ​​ေြပာင်း​​စနစ်သည် ဧရာစနစ်သံုး​​ ကွန်ပျူတာများ​​ရှိ data တို့​​ကို ပျက်စီး​​​ေစသည်ဟု စွပ်စွဲြပန်သည်။ ဧရာအဖွဲ့​​ကမူ ဤစွပ်စွဲချက်များ​​ မဟုတ်မှန်​​ေြကာင်း​​ သက်​​ေသသာဓကများ​​ ြပ၍ ြပန်လည်​​ေြဖရှင်း​​သည်။

ထိုသို့​​ အချင်း​​များ​​​ေနြခင်း​​ မည်သို့​​မည်ပံု အဆံုး​​သတ်မည်ကို မခန့်​​မှန်း​​တတ်​​ေသာ်လည်း​​ ဧရာယူနီကုဒ် စာလံုး​​များ​​ကို သံုး​​စွဲ​​ေနသည့်​​ ကျွန်​​ေတာ်သည် ဤကိစ္စကို ထဲထဲဝင်ဝင် ​​ေလ့​​လာမိပါသည်။ ကျွန်​​ေတာ် ​​ေလ့​​လာမှတ်သား​​မိသည်တို့​​ကို ဤ​​ေဆာင်း​​ပါး​​​ေရး​​သား​​ြခင်း​​ြဖင့်​​ အြခား​​သူတို့​​အား​​ မျှ​​ေဝလိုက်ပါသည်။

သ​​ေကင်္တ​​ေြပာင်း​​စနစ် (encoding) နှင့်​​ ပံု​​ေဖါ်စနစ် (rendering) မညီညွတ်မှု ြပဿနာ


ြမန်မာယူနီကုဒ် သ​​ေကင်္တ​​ေြပာင်း​​စနစ်အား​​ အြပည့်​​အဝ လိုက်နာသည့်​​ စာလံုး​​များ​​ကို Windows နှင့်​​ Linux တို့​​မှ လွဲ၍ Mac OSX အပါအဝင် အြခား​​ operating system များ​​တွင် ​​ေကာင်း​​မွန်စွာ ဖတ်ရှု၍ မရပါ။ သ​​ေဝထိုး​​၊​ ယရစ်နှင့်​​ ကင်း​​စီး​​တို့​​မှ လွဲ၍ ကျန် ြမန်မာယူနီကုဒ် သ​​ေကင်္တ​​ေြပာင်း​​စနစ်အား​​ လိုက်နာထား​​သည့်​​ ဧရာစာလံုး​​များ​​ကိုမူ operating system အများ​​စုတွင် ​​ေကာင်း​​မွန်စွာ ဖတ်ရှု၍ ရပါသည်။ ပံု (၁) မှ (၈) အထိ ရှုပါ။

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁) ။ ။ ဧရာစာလံုး​​များ​​ကို Mac OSX ၏ desktop တွင် ြမင်ရပံု

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၂) ။ ။ ဧရာစာလံုး​​များ​​ကို OpenOffice (Ubuntu) တွင် ြမင်ရပံု

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၃) ။ ။ ဧရာစာလံုး​​များ​​ကို FireFox (Mac OSX) တွင် ြမင်ရပံု

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၄) ။ ။ ဧရာစာလံုး​​များ​​ကို FireFox (Windows) တွင် ြမင်ရပံု

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၅) ။ ။ ဧရာစာလံုး​​များ​​ကို Safari (Mac OSX) တွင် ြမင်ရပံု

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၆) ။ ။ ဧရာစာလံုး​​များ​​ကို Nokia OS တွင် ြမင်ရပံု

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၇) ။ ။ ဧရာစာလံုး​​များ​​ကို Amazon Kindle တွင် ြမင်ရပံု

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၈) ။ ။ ဧရာစာလံုး​​များ​​ကို Android OS တွင် ြမင်ရပံု

အြခား​​​ေသာ​အ​ေသး​စိတ်ရုပ်ပံုများ​ကို http://ic.ayar.co/ တွင်ြကည့်​ရှုနိုင်ပါသည်။

စာဖတ်ရန် သီး​​သန့်​​ ထုတ်လုပ်ထား​​​ေသာ Amazon Kindle ​​ေခါ် mobile ကွန်ပျူတာအ​​ေသး​​တမျိုး​​ကို အသံုး​​ြပု၍ ြမန်မာယူနီကုဒ်နှင့်​​ ဧရာယူနီကုဒ် စာလံုး​​များ​​ြဖင့်​​ ​​ေရး​​သား​​ထား​​​ေသာ website များ​​ကို ကျွန်​​ေတာ် ဖတ်ရှုြကည့်​​ပါသည်။ အံအား​​သင့်​​စရာ ​​ေကာင်း​​သည်မှာ အဆိုပါ mobile ကွန်ပျူတာ၌ ဧရာ ယူနီကုဒ်ြဖင့်​​ ​​ေရး​​ထား​​​ေသာ စာများ​​ကို ​​ေကာင်း​​မွန်စွာ ဖတ်ရှု၍ရ​​ေသာ်လည်း​​၊​ အြခား​​ ြမန်မာယူနီကုဒ် စာမျက်နှာများ​​ကို ​​ေကာင်း​​မွန်စွာ ဖတ်ရှု၍ မရြခင်း​​ပင် ြဖစ်သည်။ ပံု (၉) ကို ရှုပါ။

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၉) ။ ။ Myanmar 3 စာလံုး​​များ​​ကို Amazon Kindle တွင် အမှန်အတိုင်း​​ မြမင်ရပံု

ဧရာနှင့်​​ အြခား​​ ြမန်မာယူနီကုဒ်စာလံုး​​များ​​ကို Microsoft နှင့်​​ Adobe software များ​​တွင် မည်သို့​​ မည်ပံု အလုပ်လုပ်​​ေြကာင်း​​ စမ်း​​သပ်ြကည့်​​ရာ စမ်း​​သပ်သည့်​​ software အား​​လံုး​​တို့​​၌ ဧရာစာလံုး​​များ​​ ကို ​​ေကာင်း​​မွန်စွာ ြမင်ရ​​ေသာ်လည်း​​ အြခား​​ြမန်မာယူနီကုဒ်စာလံုး​​များ​​ကိုမူ ​​ေကာင်း​​မွန်စွာ မြမင်ရပါ။ ပံု (၁၀) မှ (၁၃) ကို ရှုပါ။

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၀) ။ ။ Myanmar 3 စာလံုး​​များ​​ကို Adobe InDesign (Mac OSX) တွင် အမှန်အတိုင်း​​ မြမင်ရပံု

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၁) ။ ။ JackX နှင့်​​ M-Myanmar 4 စာလံုး​​များ​​ကို Adobe Illustrator (Mac OSX) တွင် အမှန်အတိုင်း​​ မြမင်ရပံု

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၂) ။ ။ M-Myanmar 4 စာလံုး​​များ​​ကို Adobe PhotoShop (Windows) တွင် အမှန်အတိုင်း​​ မြမင်ရပံု

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၃) ။ ။ JackX စာလံုး​​များ​​ကို Adobe PhotoShop (Windows) တွင် အမှန်အတိုင်း​​ မြမင်ရပံု

ဤသက်​​ေသသာဓကများ​​ကို ​​ေထာက်ချင့်​​၍ ​​ေကာက်ချက်ဆွဲရပါက (ဧရာမှ အပ ြဖစ်​​ေသာ) ြမန်မာယူနီကုဒ်စနစ်သည် ယူနီကုဒ်သ​​ေကင်္တ​​ေြပာင်း​​စနစ်ကို အြပည့်​​အဝ လိုက်နာသြဖင့်​​ နာမည်​​ေကာင်း​​ ရထိုက်​​ေသာ်လည်း​​၊​ လက်​​ေတွ့​​၌မူ အချို့​​ operating system များ​​နှင့်​​ လူသံုး​​များ​​သည့်​​ software များ​​တွင် ​​ေကာင်း​​မွန်စွာ အသံုး​​ချနိုင်သည့်​​ အဆင့်​​ကို မ​​ေရာက်​​ေသး​​ဟု ဆိုရပါလိမ့်​​မည်။ အြခား​​တဖက်တွင်မူ အထက်​​ေဖါ်ြပပါ အြဖည့်​​အက္ခရာ ၃ မျိုး​​ကို နည်း​​ပညာအရ ြပင်ဆင်ြပုစုထား​​သည့်​​ ဧရာယူနီကုဒ်စနစ်သည် ယူနီကုဒ်သ​​ေကင်္တ​​ေြပာင်း​​ စနစ်ကို ရာနှုန်း​​ြပည့်​​ မလိုက်နာသြဖင့်​​ ယူနီကုဒ် ပညာရှင်အချို့​​၏ ြငိုြငင်မှုကို ခံရ​​ေသာ်လည်း​​၊​ လက်​​ေတွ့​​၌ အလုပ်ြဖစ်​​ေသာ​​ေြကာင့်​​ ကွန်ပျူတာနှင့်​​ အင်တာနက်တွင် ြမန်မာစာ ​​ေရး​​သား​​ဖတ်ရှုြကသည့်​​ ပရိသတ်၏ ချီး​​ကျူး​​မှုကို ခံယူထိုက်ပါသည်။

သ​​ေကင်္တ​​ေြပာင်း​​စနစ် (encoding) နှင့်​​ အက္ခရာစဉ်စနစ် (sorting) မညီညွတ်မှု ြပဿနာ


ယူနီကုဒ်သ​​ေကင်္တ​​ေြပာင်း​​စနစ်သည် လက်တင်အက္ခရာများ​​နှင့်​​ အြခား​​ လွယ်ကူရှင်း​​လင်း​​​ေသာ အက္ခရာများ​​ကို မာတိကာ အစီအစဉ်အတိုင်း​​ စီရာတွင် ြပဿနာမရှိ​​ေသာ်လည်း​​၊​ ြမန်မာအက္ခရာများ​​ကို စီစဉ်ရာတွင် ြပဿနာ ရှိပါသည်။ လက်တင်စာလံုး​​များ​​ကို အက္ခရာစဉ်ရာတွင် ဗျည်း​​နှင့်​​ သရ ဟူ၍ပင် ခွဲြခား​​စရာမလိုပဲ ​​ေရှ့​​​ေနာက်စဉ်ဆက် စီချလိုက်ရံုပင် ြဖစ်သည်။ ြမန်မာအက္ခရာများ​​ကို အက္ခရာစဉ်ရာ၌မူ က မှ အ အထိ ြဖစ်​​ေသာ ဗျည်း​​ ၃၃ လံုး​​၊​ အသတ်ြပု​​ေသာ ဗျည်း​​ ဆယ်လံုး​​၊​ ​​ေရး​​ချ၊​ လံုး​​ြကီး​​တင်၊​ ​​ေချာင်း​​ငင်၊​ ဝစ္စ​​ေပါက်၊​ ​​ေနာက်ပစ်၊​ သ​​ေဝထိုး​​ စ​​ေသာ သရ လက္ခဏာများ​​၊​ ယပင့်​​၊​ ရရစ်၊​ ဝဆွဲ၊​ ဟထိုး​​၊​ ယပင့်​​ဝဆွဲ၊​ ယပင့်​​ဟထိုး​​၊​ ရရစ်ဟထိုး​​ စ​​ေသာ သံယုတ်များ​​၊​ ပါဠိသက် သသင်္ကရိုက်သက် ​​ေဝါဟာရများ​​အတွက် ပါဌ်ဆင့်​​ စာလံုး​​များ​​ကိုပါ ထည့်​​သွင်း​​ စီစဉ်ရသြဖင့်​​ အလွန် ခက်ခဲပါသည်။

ထို​​ေြကာင့်​​လည်း​​ ြမန်မာယူနီကုဒ် သ​​ေကင်္တ​​ေြပာင်း​​စနစ်ကို အများ​​ဆံုး​​ လက်ခံ အလုပ်လုပ်​​ေပး​​သည့်​​ Linux operating system ၌ပင် အက္ခရာစဉ်ြခင်း​​က အလုပ်လုပ်​​ေသာ်လည်း​​ ligation ​​ေခါ် ပံု​​ေဖါ် စနစ်က အလုပ်မလုပ်သြဖင့်​​ အက္ခရာစဉ်ထား​​​ေသာ ြမန်မာယူနီကုဒ်စာလံုး​​များ​​ကို မှန်ကန်စွာ ဖတ်ရှုရန် မြဖစ်နိုင်​​ေသး​​ပါ။ ပံု (၁၄) ကို ရှုပါ။

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၄) ။ ။ Ubuntu စနစ်တွင် Myanmar 3 စာလံုး​​များ​​ကို သံုး​​၍ အက္ခရာစဉ်ရာတွင် အက္ခရာများ​​ ​​ေရှ့​​​ေနာက်စဉ်ဆက် လွဲြခင်း​​၊​ စာလံုး​​များ​​ ထက်​​ေအာက်စဉ်ဆက် လွဲြခင်း​​ တို့​​ကို ြမင်​​ေနရပံု

ဤြဖစ်ရပ်​​ေြကာင့်​​ အက္ခရာစဉ်စနစ်ကို မရှိမြဖစ် အသံုး​​ြပု ြကရသည့်​​ ဘဏ်လုပ်ငန်း​​၊​ စာရင်း​​စစ်လုပ်ငန်း​​၊​ စာြကည့်​​တိုက်လုပ်ငန်း​​ စသည်တို့​​သည် လက်ရှိ ယူနီကုဒ်နည်း​​စနစ်ကို မသံုး​​ပဲ၊​ အြခား​​ software application များ​​ကိုသာ ယ​​ေန့​​အထိ အသံုး​​ြပု​​ေနြကြခင်း​​ ြဖစ်သည်။

ဧရာစာလံုး​​များ​​သည် ြမန်မာယူနီကုဒ်သ​​ေကင်္တ​​ေြပာင်း​​စနစ်အား​​ လိုက်နာရာတွင် သ​​ေဝထိုး​​၊​ ယရစ် နှင့်​​ ကင်း​​စီး​​တို့​​ကို ချွင်း​​ချက်ထား​​ခဲ့​​သြဖင့်​​ ဧရာစာလံုး​​များ​​ကိုသံုး​​၍ အက္ခရာစဉ်ပါကလည်း​​ အက္ခရာစဉ် အတိုင်း​​ မှန်ကန်စွာ မ​​ေပါ်သည်ကို ​​ေတွ့​​ရပါသည်။ တနည်း​​ဆိုရပါလျှင် ဧရာကို သံုး​​၍ အက္ခရာစဉ်လျှင် အက္ခရာစဉ်ဆက် ရာနှုန်း​​ြပည့်​​ မှန်ကန်နိုင်မည် မဟုတ်သကဲ့​​သို့​​၊​ အြခား​​ ြမန်မာယူနီကုဒ် စာလံုး​​များ​​ကို သံုး​​စွဲ၍ အက္ခရာစဉ်ပါကလည်း​​ စဉ်ြပီး​​​ေသာ အက္ခရာများ​​ ​​ေရှ့​​​ေနာက်စဉ်ဆက် လွဲြခင်း​​၊​ စာလံုး​​များ​​ ထက်​​ေအာက်စဉ်ဆက် လွဲြခင်း​​တို့​​ ရှိ​​ေနသြဖင့်​​ ရာနှုန်း​​ြပည့်​​ မှန်ကန်စွာ ြမင်ရလိမ့်​​မည် မဟုတ်ပါ။ ထို့​​​ေြကာင့်​​ ချို့​​ယွင်း​​ချက် အသီး​​သီး​​ ရှိြကသူချင်း​​ အတူတူ တဖက်နှင့်​​ တဖက် အြပစ်ဖို့​​ြကြခင်း​​သည် ရှိရင်း​​စွဲ ြပဿနာကို ​​ေြပလည်​​ေစမည် မဟုတ်ပါ။ ဤြပဿနာကို ​​ေြပလည်​​ေစလိုပါက အက္ခရာစဉ်စနစ် လွဲမှား​​ရြခင်း​​ အ​​ေြကာင်း​​ရင်း​​များ​​ကို ရှာ​​ေဖွ​​ေဖါ်ထုတ်၍ ​​ေြဖရှင်း​​ရန်သာ လိုအပ်ပါသည်။

ြမန်မာယူနီကုဒ်ဇယား​​၏ အား​​နည်း​​ချက်များ​​


အက္ခရာစဉ်စနစ် လွဲမှား​​ရြခင်း​​ အ​​ေြကာင်း​​ရင်း​​များ​​ကို ကျွန်​​ေတာ် လက်လှမ်း​​မီသ​​ေရွ့​​ ရှာ​​ေဖွြကည့်​​သည့်​​ အခါ ြမန်မာယူနီကုဒ်ဇယား​​ ကိုယ်၌တွင် ချို့​​ယွင်း​​အား​​နည်း​​ချက်များ​​ ရှိ​​ေနသည်ကို ​​ေတွ့​​ရပါသည်။

ဤသို့​​ြဖစ်ရြခင်း​​မှာ ြမန်မာအက္ခရာများ​​ကို ယူနီကုဒ်ဇယား​​၌ သ​​ေကင်္တအမှတ်အသား​​များ​​ (code points များ​​) ​​ေပး​​ခဲ့​​ြကစဉ်က ြမန်မာ့​​မူရင်း​​အက္ခရာစဉ်စနစ်နှင့်​​ တသ​​ေဝမတိမ်း​​ ြဖစ်​​ေအာင် ​​ေပး​​နိုင်ခဲ့​​ြခင်း​​ မရှိ​​ေသာ​​ေြကာင့်​​ ြဖစ်သည်။ ြမန်မာယူနီကုဒ် ​​ေပါ်​​ေပါက််​​ေရး​​အတွက် ြကိုး​​ပမ်း​​ရာ၌ ြမန်မာစာဌာနမှ ြမန်မာစာ​​ေပပညာရှင်များ​​ ပါဝင်ခဲ့​​ြကသည်ဟု ဆို​​ေသာ်လည်း​​၊​ ကိုယ်တိုင် ပါဝင်ခဲ့​​​ေသာ ပညာရှင်အချို့​​၏ အဆိုအရ ၎င်း​တို့​​အား​​ ​​ေခါ်ယူအသိ​​ေပး​​သည့်​​အဆင့်​​တွင်သာ ရှိခဲ့​​ြပီး​​၊​ ​​ေဆွး​​​ေနွး​​ တိုင်ပင်သည့်​​ အြကိမ်အ​​ေရအတွက်နှင့်​​ အချိန်ပမာဏ မလံု​​ေလာက်ခဲ့​​ဟု သိရပါသည်။

ြမန်မာယူနီကုဒ်ဇယား​​၌ အက္ခရာစဉ်ရာတွင် ​​ေနရာတည်ရှိမှုများ​​ မှား​​ယွင်း​​​ေနပါသည်။ ပံု (၁၅) ကို ရှုပါ။

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၅) ။ ။ ြမန်မာယူနီကုဒ်ဇယား​​၌ အက္ခရာစဉ်ပံု

ဥပမာအား​​ြဖင့်​​ ယူနီကုဒ်ဇယား​​တွင် ဉ (ညက​​ေလး​​) နှင့်​​ ည (ညြကီး​​) တို့​​ကို ပင်ရင်း​​ ဗျည်း​​အုပ်စုတွင် ​​ေရှ့​​​ေနာက်စဉ်ဆက်ထား​​၍ အက္ခရာစဉ်ခဲ့​​​ေသာ်လည်း​​၊​ ဿ (သြကီး​​) ကိုမူ သ တည်ရှိရာ ပင်ရင်း​​ ဗျည်း​​အုပ်စုမှ သီး​​သန့်​​ခွဲထုတ်၍ အက္ခရာစဉ်ခဲ့​​သည်ကို ​​ေတွ့​​ရပါသည်။ သ နှင့်​​ ဿ တို့​​သည် သ​​ေကင်္တ အမှတ်အသား​​ြပုစနစ်အရ ​​ေရှ့​​ဆင့်​​​ေနာက်ဆင့်​​ တည်ရှိရမည့်​​ ဗျည်း​​များ​​ ြဖစ်​​ေသာ်လည်း​​ ယခုကဲ့​​သို့​​ ​​ေနရာအထား​​အသို မှား​​ယွင်း​​မှု​​ေြကာင့်​​ Natural Sorting ြဖင့်​​ အက္ခရာစဉ်သည့်​​အခါ မှန်ကန်​​ေသာ အက္ခရာစဉ်အတိုင်း​​ မြမင်ရြခင်း​​ ြဖစ်သည်။

တဖန် သ အက္ခရာကို နှစ်လံုး​​ဆင့်​​ထား​​သည့်​​ ဿ ကို ဗျည်း​​အြဖစ် သတ်မှတ်၍ သီး​​သန့်​​​ေနရာ ​​ေပး​​ထား​​​ေသာ်လည်း​​၊​ ဋ (ဋသန်လျင်း​​ချိတ်) နှင့်​​ ဌ (ဌဝမ်း​​ဘဲ) အက္ခရာတို့​​ကို နှစ်လံုး​​ဆင့်​​ထား​​သည့်​​ ဋ္ဌ ကိုမူ ြမန်မာယူနီကုဒ်ဇယား​​၌ မည်သည့်​​​ေနရာမှ မ​​ေပး​​ပဲ ချန်လှပ်ထား​​ခဲ့​​သည်ကို ​​ေတွ့​​ရပါသည်။ အမှန်တွင် ဿ နှင့်​​ ဋ္ဌ သည် အြခား​​ အက္ခရာနှင့်​​ တွဲဖက်မှ စာလံုး​​အြဖစ် တည်ရှိနိုင်သည့်​​ ဂုဏ်ရည်တူ အက္ခရာများ​​ ြဖစ်ြကပါသည်။

ထို့​​ြပင် Myanmar Vowel Sign E Above ဟု သံုး​​နှုန်း​​ကာ ယူနီကုဒ် အမှတ်စဉ် 1035 အြဖစ် ​​ေနရာ ချထား​​သည့်​​ --ဵ အက္ခရာသည် စင်စစ်အား​​ြဖင့်​​ မွန် သရစာလံုး​​ ြဖစ်​​ေသာ်လည်း​​ ယူနီကုဒ် ဇယား​​၌ ြမန်မာအက္ခရာ အြဖစ်သာ ​​ေဖါ်ြပထား​​ပါသည်။ ပံု (၁၆) ကို ရှုပါ။

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၆) ။ ။ မွန်သရစာလံုး​​ကို ြမန်မာအက္ခရာစာရင်း​​၌ ထည့်​​သွင်း​​ထား​​ပံု

ဤမျှသာမက ြမန်မာစာလံုး​​များ​​အား​​ ြမန်မာယူနီကုဒ် စံနှုန်း​​နှင့်​​အညီ အက္ခရာစဉ်ရာတွင် ြမန်မာ အဘိဓာန်၏ အက္ခရာစဉ်ပံုနှင့်​​ ကွဲလွဲ​​ေနသည်ကို ​​ေတွ့​​ရပါသည်။ က အက္ခရာအား​​ အက္ခရာစဉ်ပံုတွင် ထပ်တူြဖစ်​​ေသာ်လည်း​​၊​ က တွင် ဗျည်း​​တွဲများ​​ တွဲလိုက်သည်နှင့်​​ ကွဲလွဲမှု ရှိလာသည်ကို ​​ေတွ့​​ရပါ သည်။ ထို့​​ြပင် နှစ်​​ေချာင်း​​ငင်ကို တစ်​​ေချာင်း​​ငင်၏ အထက်တွင် အက္ခရာစဉ်ထား​​ြခင်း​​၊​ ဗျည်း​​တွဲများ​​ မြပီး​​ခင် ကက်ကရာ ဆိုသည့်​​ အသတ်စဉ်များ​​ ဝင်လာြခင်း​​ စသည့်​​ မရှိသင့်​​​ေသာ အမှား​​များ​​ ရှိ​​ေနသည်ကိုလည်း​​ ​​ေတွ့​​ြမင်ရပါသည်။

အထက်ပါ အား​​နည်း​​ချက်များ​​မှာ ကျွန်​​ေတာ် လတ်တ​​ေလာ ​​ေတွ့​​ြမင်ရသည့်​​ အား​​နည်း​​ချက်များ​​သာ ြဖစ်ြပီး​​၊​ ယခုထက် အချိန်​​ေပး​​ြပီး​​ ​​ေလ့​​လာပါက အြခား​​ အား​​နည်း​​ချက်များ​​ကိုပါ ထပ်​​ေတွ့​​​ေကာင်း​​ ​​ေတွ့​​ရနိုင်ပါသည်။ ဘာသာ​​ေဗဒ ​​ေလ့​​လာ​​ေနသူတဦး​​ြဖစ်သည့်​​ ကိုညီလင်း​​ဆက်က ြမန်မာအက္ခရာ စနစ်သည် ဖွဲ့​​စည်း​​ပံုအား​​ြဖင့်​​ ရှုပ်​​ေထွး​​လှ​​ေသာ​​ေြကာင့်​​ အက္ခရာစဉ်ရာတွင် ြပဿနာ အများ​​အြပား​​ ရှိနိုင်​​ေြကာင်း​​နှင့်​​ ကွန်ပျူတာစနစ် တခုမှ တခုသို့​​ ​​ေြပာင်း​​လဲသည့်​​အခါတွင်လည်း​​ အခက်အခဲများ​​စွာ ြကံု​​ေတွ့​​ရနိုင်​​ေြကာင်း​​ ​​ေြပာဆိုခဲ့​​ဖူး​​ပါသည်။

မည်သို့​​ပင်ြဖစ်​​ေစ၊​ အစ မ​​ေကာင်း​​သြဖင့်​​ အ​​ေနှာင်း​​မ​​ေသချာ ြဖစ်​​ေနရသည့်​​ ြမန်မာယူနီကုဒ်စနစ်တွင် အား​​နည်း​​ချက်များ​​ ရှိ​​ေနသည်ကို အသိအမှတ်ြပု၍ ြပုြပင်ရမည့်​​အစား​​၊​ ဤအမှား​​များ​​​ေြကာင့်​​ ဆင့်​​ပွား​​ ြဖစ်ရ​​ေသာ အဆင်မ​​ေြပမှုများ​​ကို နည်း​​ပညာသံုး​​၍ ​​ေကျာ်လွှား​​ြပုြပင်ထား​​သည့်​​ ဧရာယူနီကုဒ်စာလံုး​​ များ​​ကို ြမန်မာယူနီကုဒ်စာလံုး​​များ​​ စာရင်း​​မှ ပထုတ်ရန် ြကိုး​​ပမ်း​​ြခင်း​​သည် မသင့်​​​ေလျာ်​​ေသာ ြဖစ်ရပ်၊​ ​​ေခတ်သစ် ြမန်မာစာ ဖွံ့​​ြဖိုး​​တိုး​​တက်​​ေရး​​ကို အတား​​အဆီး​​ြပု​​ေသာ လုပ်ရပ်တခု အြဖစ် ကျွန်​​ေတာ် ရှုြမင်ပါသည်။

အထက်တွင် ​​ေဖာ်ြပထား​​​ေသာ ချို့​​ယွင်း​​ချက်များ​​ကို ​​ေြဖရှင်း​​ရန်မှာ ဧရာကို ​​ေဝဖန် ​​ေနြကသည့်​​ ပညာရှင်များ​​ ကိုယ်တိုင် ပါဝင် လုပ်ကိုင်​​ေနသည့်​​ Myanmar Unicode and National Language Processing Research Center (MMNLP) တွင် အဓိက တာဝန်ရှိပါသည်။ ယူနီကုဒ်သ​​ေကင်္တ​​ေြပာင်း​​စနစ်နှင့်​​ ြမန်မာအက္ခရာစဉ်စနစ် ညီညွတ်သွား​​သည်နှင့်​​ တြပိုင်နက် ဧရာအဖွဲ့​​ကလည်း​​ ယူနီကုဒ်သ​​ေကင်္တ​​ေြပာင်း​​စနစ်အတိုင်း​​ အတိအကျ လိုက်နာသည့်​​ ဧရာစာလံုး​​များ​​ကို ထုတ်​​ေဝမည်ဟု ဆိုထား​​ရာ၊​ ဤြဖစ်ရပ်ကို အနာဂတ် ြမန်မာယူနီကုဒ်​​ေလာက၏ အလား​​အလာ​​ေကာင်း​​တခုအြဖစ် ကျွန်​​ေတာ် ယူဆပါသည်။

လက်ရှိြမန်မာယူနီကုဒ်စနစ်နှင့်​​ Unicribe နည်း​​ပညာ


ယူနီကုဒ်စာလံုး​​များ​​အား​​ ယူနီကုဒ်သ​​ေကင်္တ​​ေြပာင်း​​စနစ်ြဖင့်​​ ​​ေြပာင်း​​လဲြပီး​​​ေနာက် ကွန်ပျူတာ​​ေပါ်၌ မှန်ကန်စွာ ြမင်ရနိုင်ရန်အတွက် Microsoft Windows က ထုတ်လုပ်သည့်​​ Unicribe နည်း​​ပညာ လိုအပ်ပါသည်။ Uniscribe ကို shaping engine ဟုလည်း​​ ​​ေခါ်ြကသည်။ Unicribe သည် ကွန်ပျူတာ က နား​​လည်​​ေအာင် Unicode နည်း​​အရ ရိုက်လိုက်​​ေသာ စာလံုး​​များ​​ (input text များ​​) ကို စာဖတ်သူ က မျက်ြမင်သ​​ေဘာအရ အမှန်အတိုင်း​​ ြမင်ရ​​ေအာင် (visual sequence အြဖစ်) ​​ေဆာင်ရွက်​​ေပး​​သည်။ ထို့​​ြပင် အနက်တူအက္ခရာများ​​အား​​ သက်ဆိုင်ရာ စာဖွဲ့​​ပံုနည်း​​စနစ်အရ ​​ေနရာအထား​​အသို မှန်ကန်​​ေအာင် ပံုသဏ္ဍာန်​​ေြပာင်း​​၍ အစား​​ထိုး​​ြခင်း​​ (glyph substitution) ြပုလုပ်​​ေပး​​သည်။

Uniscribe နည်း​​ပညာသည် ြမန်မာအပါအဝင် ြဗဟ္မီအက္ခရာစနစ်ကို အ​​ေြခြပုသည့်​​စာ​​ေပများ​​နှင့်​​ တရုတ်၊​ အာ​​ေရဗီ စသည့်​​ စာ​​ေပများ​​အတွက် အလွန် အသံုး​​ဝင်ပါသည်။ သို့​​​ေသာ် ြပဿနာရှိသည်မှာ ြမန်မာ ယူနီကုဒ် အက္ခရာစဉ်စနစ်ကို Microsoft Windows က အသိအမှတ် မြပု​​ေသး​​သြဖင့်​​ ၎င်း​၏ Unicribe နည်း​​ပညာကိုလည်း​​ ြမန်မာယူနီကုဒ်သမား​​တို့​​ အသံုး​​ချ၍ မရ​​ေသး​​ြခင်း​​ ြဖစ်သည်။ အကျိုး​​ဆက် အား​​ြဖင့်​​ Uniscribe နည်း​​ပညာကို အား​​ထား​​အသံုး​​ြပုရသည့်​​ Myanmar3, Parabaik, Padauk, Thanlwin, WinuniInnwa, MyMyanmar, Yunghkio စသည့်​​ ြမန်မာယူနီကုဒ်စာလံုး​​များ​​ကို သံုး​​၍ စာရိုက်ပါက စာလံုး​​များ​​ ချက်ချင်း​​မ​​ေပါ်ြခင်း​​၊​ ​​ေရး​​သား​​လိုသည့်​​စာတို့​​ကို အစဉ်အတိုင်း​​မဟုတ်ပဲ ​​ေရှ့​​​ေနာက် ​​ေြပာင်း​​ြပန် ရိုက်ရြခင်း​​များ​​ကို စသည်တို့​​ကို ြကံု​​ေတွ့​​ရပါသည်။ အရင်လာ အရင်ရိုက်သည့်​​ လက်နှိပ်စက်နည်း​​ကို အသံုး​​ြပုမည်ဆိုပါကလည်း​​ ​​ေရှ့​​​ေနာက်​​ေြပာင်း​​ြပန် ရိုက်ထား​​​ေသာ စာတို့​​အား​​ ကွန်ပျူတာမှတ်ဉာဏ်ကို အသံုး​​ြပု၍ ဗျည်း​​၊​ ဗျည်း​​တွဲ၊​ သရ၊​ အသတ် စသည့်​​ အစီအစဉ်အတိုင်း​​ တမဟုတ်ချင်း​​ မှတ်သား​​ရသြဖင့်​​ ကွန်ပျူတာအား​​ ဝန်ပိ​​ေစသည့်​​အြပင် လုပ်ငန်း​​လည်း​​ မတွင်ကျယ်ပါ။

Unicribe နည်း​​ပညာကို အသံုး​​ချခွင့်​​ မရသည့်​​ ြမန်မာယူနီကုဒ်စာလံုး​​များ​​အား​​ ကွန်ပျူတာလက်ကွက်တွင် ရိုက်သည့်​​ အဆင့်​​မှ ကွန်ပျူတာမှန်သား​​ြပင်​​ေပါ်တွင် စာ​​ေပါ်​​ေစသည့်​​ အဆင့်​​အထိ လုပ်ငန်း​​စဉ် အဆင့်​​ဆင့်​​ကို ြမန်မာယူနီကုဒ်ပညာရှင်တဦး​​ြဖစ်သည့်​​ ဦး​​​ေငွထွန်း​​က ၎င်း​​​ေရး​​သား​​သည့်​​ Myanmar Unicode Myths vs. Truths ​​ေဆာင်း​​ပါး​​ စာမျက်နှာ ၁၃ နှင့်​​ ၁၄ တို့​​တွင် ​​ေအာက်ပါအတိုင်း​​ ​​ေဖာ်ြပခဲ့​​သည်။ ပံု (၁၇) နှင့်​​ (၁၈) ကို ရှုပါ။

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၇) ။ ။ အက္ခရာတလံုး​​အတွက် ကွန်ပျူတာက လုပ်​​ေဆာင်​​ေပး​​ရသည့်​​ လုပ်ငန်း​​စဉ် အဆင်ဆင့်​​

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၈) ။ ။ ြမန်မာစာတလံုး​​အတွက် ကွန်ပျူတာက လုပ်​​ေဆာင်​​ေပး​​ရသည့်​​ လုပ်ငန်း​​စဉ် အဆင်ဆင့်​​

ဤပံုများ​​ကို ြကည့်​​လျှင် ြမန်မာအက္ခရာတလံုး​​ သို့​​မဟုတ် ြမန်မာစာလံုး​​တလံုး​​ကို ပံု​​ေပါ်​​ေအာင် သွယ်ဝိုက်၍ လုပ်​​ေဆာင်ရာ၌ ကွန်ပျူတာ ဦး​​​ေနှာက် CPU နှင့်​​ မှတ်ဉာဏ် RAM တို့​​ မည်​​ေရွ့​​မည်မျှ အလုပ်လုပ်ရပံုကို ခန့်​​မှန်း​​ သိရှိနိုင်ပါသည်။ သွယ်ဝိုက်၍ ပံု​​ေဖါ်​​ေသာ လုပ်ငန်း​​စဉ်သည် Uniscribe နည်း​​ပညာကို သံုး​​ြခင်း​​ထက် ကွန်ပျူတာကို ပိုမို ဝန်ပိ​​ေစသည် ြဖစ်ရာ၊​ အလွန်လျင်ြမန်​​ေသာ ကွန်ပျူတာများ​​အတွက် မ​​ေထာင်း​​သာလှ​​ေသာ်လည်း​​ ကျွန်​​ေတာ်တို့​​ ြမန်မာနိုင်ငံသား​​ အများ​​စုအတွက်၊​ အထူး​​သြဖင့်​​ ဧရာမဟုတ်သည့်​​ ြမန်မာယူနီကုဒ်စာလံုး​​များ​​ကို အင်တာနက်တွင် ဖတ်ရှု​​ေရး​​သား​​ြကသူများ​​ အတွက် အခက်အခဲ ရှိပါသည်။ အ​​ေြကာင်း​​မှာ အင်တာနက်စာမျက်နှာများ​​ကို လွှင့်​​တင်ရာ တွင် မိမိ၏ ကွန်ပျူတာ တလံုး​​သာမက hosting နှင့်​​ sharing လုပ်ရသည့်​​ computer server များ​​နှင့်​​ database များ​​ပါ ပါဝင်ပတ်သက်​​ေနသည် ြဖစ်ရာ၊​ အရွယ်ပမာဏ အသင့်​​အတင့်​​ ရှိသည့်​​ file များ​​၊​ post များ​​နှင့်​​ comment များ​​ကို ထည့်​သွင်း​သည့်​အခါ သို့​​မဟုတ် ြပန်လည်ရယူရန်​ ​ေတာင်း​ဆိုြခင်း​များ​ လုပ်လျှင်ပင် hosting နှင့်​​ sharing လုပ်ရသည့်​​ computer server များ​​တွင် လုပ်ငန်း​​တွင်ကျယ်မှုကို သိသိသာသာ ထိခိုက်​​​ေနှး​​ေကွး​​​ေစနိုင်ပါသည်။

အမှန်စင်စစ် လူဦး​​​ေရ ငါး​​​ေသာင်း​​ခန့်​​သာရှိ​​ေသာ အင်ဒိုနီး​​ရှား​​ လူမျိုး​​စုငယ်တခု၏ ယူနီကုဒ်စနစ်ကိုပင် Microsoft Windows က အသိအမှတ်ြပု၍ Uniscribe နည်း​​ပညာကို အသံုး​​ြပုခွင့်​​ ​​ေပး​​ထား​​ပါသည်။ လူဦး​​​ေရ သန်း​​​ေပါင်း​​ ၅၀ ​​ေကျာ် ရှိ​​ေသာ ြမန်မာနိုင်ငံတွင် လွန်ခဲ့​​​ေသာ ဆယ်နှစ်​​ေကျာ်ကတည်း​​က ​​ေပါ်​​ေပါက်ခဲ့​​သည့်​​ ြမန်မာယူနီကုဒ်ကို Microsoft Windows က အသိအမှတ်ြပုလာ​​ေအာင် ​​ေဆာင်ရွက်​​ေပး​​ရမည့်​​တာဝန်သည် MMNLP အဖွဲ့​​၏ တာဝန်သာ ြဖစ်သည်ဟု ကျွန်​​ေတာ် ရိုး​​သား​​စွာ ြမင်မိပါသည်။

ြမန်မာယူနီကုဒ်နှင့်​​ ြမန်မာတိုင်း​​ရင်း​​ ဘာသာစာ​​ေပများ​​


ထိုင်း​​နှင့်​​ တရုတ် ြမန်မာနယ်စပ်​​ေဒသရှိ Tai Tham, Dai Lue စသည့်​​ လူမျိုး​​စုငယ်များ​​တွင် ြမန်မာအက္ခရာများ​​နှင့်​​ ဆင်တူ​​ေသာ စာ​​ေပများ​​ ရှိြကရာ၊​ ထိုစာ​​ေပများ​​၌ပင် သီး​​သန့်​​ ယူနီကုဒ်ဇယား​​များ​​ ရှိြကပါသည်။ သို့​​​ေသာ် ြမန်မာယူနီကုဒ်သ​​ေကင်္တ​​ေြပာင်း​​စနစ်ကို အြပည့်​​အဝလိုက်နာသည့်​​ ယူနီကုဒ် စာလံုး​​များ​​ကို ြပန်ြကည့်​​ပါက ဗမာယူနီကုဒ်မှတပါး​​ Yunghkio ဆိုသည့်​​ ရှမ်း​​ယူနီကုဒ် တမျိုး​​ကိုသာ တီထွင်​​ထား​​နိုင်​ေသး​​သည်ကိုသာ ​​ေတွ့​​ြမင်ရပါသည်။ သို့​​​ေသာ် အဆိုပါ ရှမ်း​​စာလံုး​​ အတွက်ပင်လျှင် အက္ခရာစဉ်သည့်​​ စနစ်ကို ယ​​ေန့​​တိုင် တီထွင်​​ေပး​​နိုင်ြခင်း​​ မရှိ​​ေသး​​ပါ။

ဧရာယူနီကုဒ်စနစ်၌မူ ကရင်၊​ ကယား​​၊​ ကယား​​လီ၊​ ပအို့​​ဝ်၊​ ပ​​ေလာင်၊​ ဗမာ၊​ မွန်၊​ ရှမ်း​​ ဆိုသည့်​​ တိုင်း​​ရင်း​​သား​​ ယူနီကုဒ်စာလံုး​​များ​​ကိုပါ တီထွင်​​ေပး​​ထား​​ပါသည်။ ဧရာစာလံုး​​တလံုး​​ရှိရံုြဖင့်​​ ြမန်မာတိုင်း​​ရင်း​​သား​​စာ​​ေပများ​​ကိုပါ ​​ေရး​​သား​​၊​ ဖတ်ရှုနိုင်သည့်​​ အခွင့်​​အ​​ေရး​​များ​​ရှိသည်။ ကွန်ပျူတာလက်ကွက် တမျိုး​​ထက် ပို၍ သံုး​​စွဲ​​ေသာ တိုင်း​​ရင်း​​သား​​တို့​​အတွက်လည်း​​ တမျိုး​​ထက် ပို​​ေသာ လက်ကွက်များ​​ကို တီထွင်​​ေပး​​ထား​​ပါသည်။ ပို၍ ထူး​​ြခား​​သည်မှာ တိုင်း​​ရင်သား​​ ယူနီကုဒ် တမျိုး​​စီအတွက် စာလံုး​​နှင့်​​ လက်ကွက် တမျိုး​​စီကို သီး​​သန့်​​ install လုပ်၍ ထည့်​​သွင်း​​စရာ မလိုပဲ၊​ ဧရာစာလံုး​​ တမျိုး​​တည်း​​ကို install လုပ်ရံုြဖင့်​​ တိုင်း​​ရင်း​​သား​​ စာလံုး​​စံု လက်ကွက်စံုတို့​​ကို အသံုး​​ြပုနိုင်ြခင်း​​ြဖစ်သည်။ ဤစနစ်သည် ြပည်​​ေထာင်စုစနစ်ကို အရှင်း​​လင်း​​ဆံုး​​ ​​ေဖာ်ကျူး​​​ေသာစနစ် ြဖစ်သည်ဟုပင် ကျွန်​​ေတာ် ခံစား​​မိပါသည်။ ပံု (၁၉) ကို ရှုပါ။

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၉) ။ ။ ဧရာယူနီကုဒ် တိုင်း​​ရင်း​​သား​​စာလံုး​​များ​​နှင့်​​ လက်ကွက်များ​​ စာရင်း​​

ထိုမှတပါး​​ ဧရာစနစ်တွင် စာလံုး​​ဒီဇိုင်း​​ (type faces) အမျိုး​​မျိုး​​ကို တီထွင်​​ေပး​​ထား​​သည် ြဖစ်ရာ၊​ ဧရာ ယူနီကုဒ်ကို သံုး​​စွဲြကသည့်​​ ြမန်မာတိုင်း​​ရင်း​​သား​​ယူနီကုဒ်သမား​​ မှန်သမျှ အင်တာနက် စာမျက်နှာများ​​​ေပါ်တွင် ြဖစ်​​ေစ၊​ စာအုပ် စာတမ်း​​များ​​ ရိုက်နှိပ်ထုတ်​​ေဝရာတွင် ြဖစ်​​ေစ ဧရာစာလံုး​​ဒီဇိုင်း​​ အမျိုး​​မျိုး​​ကို သံုး​​စွဲနိုင်ြကပါသည်။ ဤအခွင့်​​အလမ်း​​မျိုး​​ကို အြခား​​ ြမန်မာယူနီကုဒ်စာလံုး​​ သံုး​​စွဲသူတို့​​ ယ​​ေန့​​အထိ မရရှိြက​​ေသး​​ပါ။

သရုပ်ြပ ရုပ်ပံု © ဧရာြမန်မာယူနီကုဒ်အဖွဲ့​

ပံု (၁၉) ။ ။ ဧရာယူနီကုဒ်စာလံုး​​ဒီဇိုင်း​​ အမျိုး​​မျိုး​​

နိဂံုး​


အထက်တွင် ​​ေဖာ်ြပခဲ့​​သကဲ့​​သို့​​ operating system အများ​​စုနှင့်​​ အ​​ေရး​​ြကီး​​​ေသာ software application အများ​​စုတို့​​က လက်ရှိ ြမန်မာယူနီကုဒ်အက္ခရာစဉ် စနစ်ကို အသိအမှတ် မြပုြခင်း​​ သို့​​မဟုတ် နည်း​​ပညာပိုင်း​​အရ အ​​ေထာက်အပံ့​​ မြပုြခင်း​​ စသည့်​​ ြပဿနာများ​​ ရှိ​​ေန​​ေသး​​သြဖင့်​​၊​ နိုင်ငံတကာယူနီကုဒ်စနစ်က ​​ေပး​​စွမ်း​​နိုင်သည့်​​ အကျိုး​​​ေကျး​​ဇူး​​နှင့်​​ ြမန်မာယူနီကုဒ်သံုး​​စွဲသူတို့​​က ရယူနိုင်သည့်​​ အကျိုး​​အြမတ်တို့​​ အြကား​​ ကွာဟချက် များ​​စွာ ရှိ​​ေနပါ​​ေသး​​သည်။ ဤကွာဟချက်များ​​ ပ​​ေပျာက်​​ေစရန် အတွက် တည်ရှိဆဲ ြပဿနာများ​​ကို ​​ေြပလည်​​ေအာင် ​​ေြဖရှင်း​​ြကရန် လိုအပ်ပါသည်။ ဤြပဿနာများ​​ကို အဓိက ​​ေြဖရှင်း​​​ေပး​​ရမည့်​​သူများ​​မှာ ဧရာကို ​​ေဝဖန်လျက်ရှိသည့်​​ MMNLP အဖွဲ့​​ဝင်များ​​သာ ြဖစ်ြကပါသည်။ ထိုပုဂ္ဂိုလ်များ​​ အ​​ေနြဖင့်​​ မိမိတို့​​ကိုယ်တိုင် ​​ေြဖရှင်း​​ရမည့်​​ ြပဿနာ များ​​အား​​ အချိန်​​ေပး​​၍ မ​​ေြဖရှင်း​​ပဲ၊​ ဧရာကို ြမန်မာယူနီကုဒ်စာရင်း​​မှ ဖယ်ထုတ်ရန် အချိန်အကုန်ခံ၍ ြကိုး​​ပမ်း​​​ေနြခင်း​​သည် တလွဲဆံပင် ​​ေကာင်း​​ြခင်း​​မျှသာ ြဖစ်ပါသည်။

ကျွန်​​ေတာ်၏ အြမင်အရ ​​ေြပာရလျင် ​​ေပါ်​​ေပါက်​​ေနခဲ့​​သည်မှာ ဆယ်နှစ်​​ေကျာ် ြကာြပီ ြဖစ်​​ေသာ်လည်း​​ ယ​​ေန့​​တိုင် ​​ေခတ်မစား​​​ေသး​​သည့်​​ ြမန်မာယူနီကုဒ်စနစ်အား​​ ယူနီကုဒ် သံုး​​စွဲလိုြကသည့်​​ ​​ေခတ်မီ ြမန်မာ ကွန်ပျူတာ အင်တာနက်သမား​​များ​​နှင့်​​ နီး​​စပ်​​ေအာင် ဧရာအဖွဲ့​​က အခ​​ေြကး​​​ေငွမပါပဲ ကုသိုလ်ြဖစ် ​​ေဆာင်ရွက်​​ေပး​​​ေနြခင်း​​ ြဖစ်သည်။

ကျွန်​​ေတာ်သည် ဧရာအဖွဲ့​​၏ ​​ေစတနာနှင့်​​ လုပ်ရည်ကိုင်ရည်ကို နား​​လည် ယံုြကည်သည် ြဖစ်ရာ လက်ရှိ ြမန်မာယူနီကုဒ် ြပဿနာများ​​ ​​ေြပလည်သွား​​​ေသာ တ​​ေန့​​တွင် ​​ေပါ်​​ေပါက်လာမည့်​​ ဧရာယူနီကုဒ်စာလံုး​​သစ်ကို စိတ်ဝင်စား​​စွာ ​​ေစာင့်​​​ေမျှာ်​​ေနမည်သာ ြဖစ်သည်။ လတ်တ​​ေလာတွင်လည်း​​ အြခား​​ ြမန်မာယူနီကုဒ် စာလံုး​​များ​​ထက် အစစ အရာရာ သာလွန်​​ေကာင်း​​မွန်သည့်​​ လက်ရှိ ဧရာယူနီကုဒ် စာလံုး​​များ​​ကို ​​ေကျနပ်အား​​ရစွာ သံုး​​စွဲ​​ေနဦး​​မည်သာ ြဖစ်သည်။

ထို့​​​ေြကာင့်​​ “အလံမလှဲပါနှင့်​​ ဧရာ” ဟူ၍သာ ဧရာအဖွဲ့​​သို့​​ ကျွန်​​ေတာ်​​ေြပာလိုပါသည်။

​လင်း​ဦး​(စိတ်ပညာ)

ဧရာ ဘာ​ေြကာင့်​သံုး​သလဲ ?

အခု WordPress ကို ဘာသာြပန်တဲ့​​​ေနရာမှာ ဧရာကို သံုး​​ထား​​တာနဲ့​​ပတ်သက်ြပီး​​ ​​ေဝဖန်တာ​​ေတွ ကန့်​​ကွက်တာ​​ေတွ လုပ်​​ေနြကပါတယ်။ ဧရာ ဘာ​​ေြကာင့်​​သံုး​​သလဲဆိုတာနဲ့​​ပတ်သက်ြပီး​​ ြမန်မာယူနီကုတ်ပညာရှင်တစ်ချို့​​ကို​​ေတာ့​​ ပိုလီဂ​​ေလာ့​​ဂ်မှာ အနည်း​​ငယ် ရှင်း​​ြပြပီး​​ြဖစ်ပါတယ်။ ဒါ​​ေပမယ့်​​ အဲဒါက နိုင်ငံြခား​​သား​​​ေတွရှိတဲ့​​​ေနရာမှာ ကိုယ့်​​လူမျိုး​​ ကိုယ့်​​ဘာသာကို အထင်​​ေသး​​မှာ စိုး​​ရိမ်လို့​​ လက်ရှိ ယူနီကုတ်ဆိုတာ​​ေတွက သံုး​​ရတာ အဆင်မ​​ေြပလို့​​ပါ ဆိုတာမျိုး​​ ​​ေလာက်ပဲ အဓိပ္ပါယ်ရတဲ့​​ အသံုး​​အနှုန်း​​​ေတွနဲ့​​ ​​ေြပာခဲ့​​တာပါ။

ဒီမှာက​​ေတာ့​​ အား​​လံုး​​ြမန်မာ​​ေတွပဲြဖစ်မယ်လို့​​ ယူဆသလို ြမန်မာလိုပဲ​​ေရး​​မှာြဖစ်လို့​​ ပိုြပီး​​အကျယ်တစ်ဝင့်​​ ရှင်း​​ြပပါမယ်။ ဧရာဟာ ယူနီကုတ် စတန်း​​ဒတ်ဆိုတဲ့​​ စံကို မမီပါဘူး​​ ဒါကို ကျွန်​​ေတာ်လက်ခံပါတယ်။ ဒါ​​ေပမယ့်​​ အဲဒီလို စတန်း​​ဒတ် မြဖစ်တာ စံမမီတာကို ဘာလို့​​သံုး​​သလဲ ​​ေမး​​ရင်​​ေတာ့​​။ ကျွန်​​ေတာ်က ​​ေမး​​ချင်ပါတယ် ဘယ်ဟာက​​ေရာ စတန်း​​ဒတ်ြဖစ်သလဲ။ ဘယ်ဟာက​​ေရာ စံမီသလဲ လို့​​။ စတန်း​​ဒတ်ဆိုတာကို ဘယ်လိုလက်ခံထား​​ြကပါသလဲ။ ​​ေလာ​​ေလာဆယ် encoding ဆိုတဲ့​​ ​​ေပတံနဲ့​​တိုင်း​​ရင်​​ေတာ့​​ ဧရာက ယူနီကုတ်စံမမှီပါဘူး​​။ ဒါ​​ေပမယ့်​​ အဲဒီလိုပဲ တစ်ြခား​​ယူနီကုတ်​​ေတွကို​​ေရာ ​​ေြပာစရာမရှိ​​ေတာ့​​ဘူး​​လား​​။ ရှိပါတယ်။ ဒါကို ယူနီကုတ်လုပ်​​ေနတဲ့​​သူ​​ေတွအား​​လံုး​​ သိြကပါတယ်။ လက်ရှိမှာ ယူနီကုတ် အစစ်လို့​​ ကျွန်​​ေတာ်ြမင်တာ ပိ​​ေတာက်တစ်ခုပဲရှိပါတယ်။ ဆိုလိုတာက ယူနီကုတ် စတန်း​​ဒတ်ဆိုတဲ့​​ ​​ေပတံနဲ့​​ တိုင်း​​ရင်​​ေတာ့​​ ပိ​​ေတာက်က စံအမီ ဆံုး​​လို့​​​ေြပာနိုင်ပါတယ်။

ဒါ​​ေပမယ့်​​ အခု ကျွန်​​ေတာ်က အဲဒီစံ​​ေတွ ​​ေပတံ​​ေတွနဲ့​​ မတိုင်း​​ချင်ပါဘူး​​။ ယူနီကုတ် ​​ေဖာင့်​​စာလံုး​​ထုတ်တဲ့​​ ယူနီကုတ်ပညာရှင်​​ေတွကို​​ေရာ၊​ ြမန်မာစာကို ြမန်မာလို ကွန်ြပူတာ​​ေပါ်မှာ သံုး​​ချင်ြကတဲ့​​ ြမန်မာလူမျိုး​​​ေတွအား​​လံုး​​ကို​​ေရာ၊​ ြပီး​​​ေတာ့​​ ြမန်မာစာကို ချစ်လို့​​ ြမန်မာစာကို လိုက်စား​​ထား​​တဲ့​​ ြမန်မာစာပညာရှင်​​ေတွကို​​ေရာ အား​​လံုး​​ကို ဒီ​​ေနရာက​​ေန ​​ေမး​​ခွန်း​​ထုတ်ချင်ပါတယ်။ လက်ရှိယူနီကုတ် စတန်း​​ဒတ် ဆိုတာြကီး​​က ြမန်မာစာရဲ့​​ နဂိုမူလ စံ​​ေတွကို မီရဲ့​​လား​​၊​ လိုက်နာရဲ့​​လား​​ဆိုတာပါ။



Ayar Myanmar Unicode Fonts on Mac and Wordpress.org's Burmese Page
Ayar Myanmar Unicode Fonts on Mac and Wordpress.org's Burmese Page


ဒါကို အ​​ေလး​​အနက် စဉ်း​​စား​​ြပီး​​​ေြဖြက​​ေစလိုပါတယ်။ ကျွန်​​ေတာ် ဒီလိုဘာ့​​​ေြကာင့်​​​ေြပာရလဲဆိုတာကို ဆက်ြပီး​​ရှင်း​​ြပသွား​​ပါမယ်။ ပထမဆံုး​​ ​​ေြပာချင်တာက ဧရာကို ဝိုင်း​​ြပီး​​​ေြပာဆို​​ေနြကတဲ့​​ encoding standard ကို မလိုက်နာဘူး​​ဆိုတဲ့​​ encoding ကိစ္စပါ။ ယူနီကုတ်နဲပတ်သက်ြပီး​​ ​​ေြပာဆို​​ေဆွး​​​ေနွး​​​ေနြကတဲ့​​ ဖိုရမ်​​ေတွမှာ​​ေရာ၊​ မာတင် ​​ေရး​​တင်ထား​​တဲ့​​ ယူနီကုတ်ကွန်ဆိုတီယံကို တင်တဲ့​​ အဆိုြပုလွှာမှာ​​ေရာ လက်ရှိသတ်မှတ်ချက်ဟာ ြမန်မာစာ အက္ခရာစဉ်တဲ့​​​ေနရာမှာ ပိုမိုလွယ်ကူ​​ေစဖို့​​ဆိုတဲ့​​ ရည်ရွယ်ချက်ကို​​ေတွ့​​ရပါတယ်။ အဲဒီ​​ေတာ့​​ ​​ေမး​​ချင်တာက တကယ်​​ေရာ ပိုလွယ်သွား​​သလား​​၊​ ြပီး​​​ေတာ့​​ အဲဒီစနစ်အတိုင်း​​ လိုက်လုပ်လို့​​ တကယ်​​ေရာ ြမန်မာစာ အက္ခရာ စီတာ စဉ်တာကို မှန်မှန်ကန်ကန်လုပ်နိုင်ရဲ့​​လား​​ဆိုတာပါပဲ။

ဒါကိုလဲ လက်ရှိယူနီကုတ်လုပ်​​ေနတဲ့​​သူ​​ေတွအား​​လံုး​​ အ​​ေြဖသိြပီး​​သား​​ပါ။ မရပါဘူး​​။ ဒီစနစ်ကို လိုက်နာလည်း​​ ြမန်မာစာကို မှန်​​ေအာင်မစီနိုင်​​ေသး​​တာ​​ေတွ အများ​​ြကီး​​ရှိပါတယ်။ ဘာ​​ေြကာင့်​​မစီနိုင်တာလဲလို့​​​ေမး​​ရင်​​ေတာ့​​ ကျွန်​​ေတာ် ခပ်ရမ်း​​ရမ်း​​ ခပ်ြကမ်း​​ြကမ်း​​​ေြဖချင်ပါတယ်။ သည်း​​ခံြကပါ။ ဒါမှလည်း​​ သတိထား​​ြကမယ်လို့​​ ယူဆလို့​​ပါ။ ​​ေြပာရရင်​​ေတာ့​​ ြမန်မာစာကို သူငယ်တန်း​​ သင်ပုန်း​​ြကီး​​​ေတာင် မ​​ေြကတဲ့​​ ြမန်မာကွန်ြပူတာပညာရှင်များ​​နဲ့​​ ြမန်မာ ယူနီကုတ်ပညာရှင်များ​​ရဲ့​​ ပရမ်း​​ပတာ ​​ေရး​​ြပီး​​ ယူနီကုတ်ကွန်ဆိုတီယံကို တင်လိုက်တဲ့​​ အဆိုြပုလွှာ​​ေြကာင့်​​ပါ။ ဒီလို​​ေြပာြပန်​​ေတာ့​​ ကျုပ်တို့​​လုပ်​​ေနတုန်း​​က ဒါ​​ေတွဘာလို့​​မ​​ေြပာလဲလို့​​ ြပန်​​ေြပာတဲ့​​သူက​​ေြပာပါတယ်။ တစ်ချို့​​ကလည်း​​ ြမန်မာစာအဖွဲ့​​တို့​​ ၊​ ဆရာြကီး​​ ​​ေမာင်ခင်မင်တို့​​၊​ ​​ေမာင်သာနိုး​​တို့​​လို ပုဂ္ဂိုလ်​​ေတွကို တိုင်ပင်ြပီး​​မှ လုပ်ခဲ့​​တာပါလို့​​​ေြပာပါတယ်။ ကျွန်​​ေတာ်​​ေတာ့​​ အဲဒီလို လုပ်ခဲ့​​လိမ့်​​မယ်လို့​​မထင်ပါဘူး​​။ လုပ်ခဲ့​​တယ်ဆိုရင်​​ေတာင် တိုင်ပင်​​ေဆွး​​​ေနွး​​တဲ့​​ အဆင့်​​မဟုတ်ဘဲ အသိ​​ေပး​​တဲ့​​အဆင့်​​​ေလာက်ပဲ ြဖစ်မှာပါ။

အဲဒီဆရာြကီး​​​ေတွ အ​​ေနနဲ့​​လည်း​​ ကျွန်​​ေတာ်​​ေြပာတာ ဟုတ်မဟုတ်ကို ရှင်း​​​ေစချင်ပါတယ်။ စာစီလို့​​မရ​​ေအာင် သူတို့​​ပရမ်း​​ပတာ တင်ခဲ့​​တာ​​ေတွထဲက ပထမဆံုး​​အချက်က​​ေတာ့​​ သခင်္ျာ ဂဏန်း​​​ေတွကို ​​ေနရာချထား​​ပံုပါပဲ။ ဘယ်ဘာသာစကား​​မဆို စာစီတဲ့​​​ေနရာမှာ သခင်္ျာ ဂဏန်း​​​ေတွကို အရင်ဆံုး​​ စီြကပါတယ်။ ြမန်မာစာအတွက် သူတို့​​ ဂဏန်း​​​ေတွကို ​​ေနရာချ​​ေတာ့​​ ဗျည်း​​ အက္ခရာ​​ေတွရဲ့​​ ​​ေရှ့​​ဆံုး​​လည်း​​ မဟုတ် ​​ေနာက်ဆံုး​​လည်း​​ မဟုတ်တဲ့​​ ြကား​​ထဲမှာ ​​ေနရာချပါတယ်။ ဗျည်း​​၊​ ဗျည်း​​တွဲ၊​ သရ၊​ ဆိုတာ​​ေတွ​​ေနာက်မှာ ဂဏန်း​​​ေတွကို ​​ေနရာချပါတယ်၊​ အဲဒီဂဏန်း​​​ေတွရဲ့​​​ေနာက်မှာ ၌ တို့​​ ၍ တို့​​လို့​​ ဝိဘတ်​​ေတွ၊​ ပစ္စည်း​​​ေတွထား​​ပါတယ် တကယ့်​​ကိုး​​ရိုး​​ကား​​ယား​​နဲ့​​ ထား​​ချင်သလိုထား​​တဲ့​​ အစီအစဉ်မျိုး​​ပါ။ ​​ေနာက်တစ်ချက် အသတ်ကိစ္စပါ၊​ အသတ်ကိစ္စက ပိုဆိုး​​ပါတယ်။ ဘာ​​ေြကာင့်​​ဆို​​ေတာ့​​ ြမန်မာစာမှာ အသတ်နဲ့​​ ပံုစံတူ ​​ေရှ့​​ထိုး​​ရှိပါတယ်။ နှစ်ခုက ပံုစံတူ​​ေပမယ့်​​ သံုး​​တဲ့​​​ေနရာ​​ေရာ အဓိပ္ပါယ်​​ေရာ ဘာမှမဆိုင်ပါဘူး​​။

ဒါကို မာတင်​​ေရး​​တင်တဲ့​​ encoding နဲ့​​ဆိုင်တဲ့​​ အဆိုြပုလွှာထဲမှာ အတည့်​​အလင်း​​ပဲ ​​ေအာ် သရမှာသံုး​​တဲ့​​ သ​​ေကင်္တဟာ အသတ်နဲ့​​ အတူတူပဲသံုး​​တယ် လို့​​​ေရး​​ထား​​ြပီး​​ အသတ်ကိုသာ ြမန်မာယူနီကုတ် ဇယား​​မှာထည့်​​ြပီး​​ ​​ေရှ့​​ထိုး​​ကို မထည့်​​ထား​​ပါဘူး​​။ ဒါက ြဖစ်သင့်​​မြဖစ်သင့်​​ ဆရာြကီး​​​ေမာင်ခင်မင်တို့​​ကို တိုင်ပင်ခဲ့​​ပါတယ်လို့​​​ေြပာရင်​​ေတာ့​​ ဒီဆရာြကီး​​​ေတွရဲ့​​ ြမန်မာစာအ​​ေပါ်ထား​​တဲ့​​ သ​​ေဘာထား​​နဲ့​​ ြမန်မာစာ တတ်ကျွမ်း​​မှုကို ​​ေစာ်ကား​​သလိုပါပဲ။ ကျွန်​​ေတာ်​​ေြပာတာဟုတ်မဟုတ် စဉ်း​​စား​​ြကပါ။ ြမန်မာစာမှာ ​​ေလး​​စား​​​ေလာက်တဲ့​​ ဘယ်သူ့​​ကို မဆို​​ေမး​​လို့​​ရပါတယ်။ အခုလက်ရှိယူနီကုတ် စတန်း​​ဒတ်ဆိုတဲ့​​ စံသတ်မှတ်ချက်ြကီး​​ဟာ ြမန်မာရဲ့​​ စံဟုတ်ပါသလား​​လို့​​။ သိပ်အ​​ေဝး​​ြကီး​​ကို မစဉ်း​​စား​​ြကပါနဲ့​​ဦး​​ ​​ေနာက် ၅ နှစ်ဆိုတဲ့​​အချိန်​​ေလာက်ကို ပဲြကို​​ေတွး​​ြကည့်​​ပါ။ အဲဒီအချိန်မှာ လူတိုင်း​​ ကွန်ြပူတာ သံုး​​မ​​ေနဘူး​​လို့​​ မ​​ေြပာနိုင်ပါဘူး​​။ ​​ေနာက် ၅ နှစ်မှာ သူငယ်တန်း​​​ေနရမယ့်​​ က​​ေလး​​​ေတွကို ကွန်ြပူတာနဲ့​​ပဲ သင်တယ်ဆိုရင် လက်ရှိယူနီကုတ်စနစ်နဲ့​​ ြမန်မာစာကို သင်ရမယ်ဆိုရင် သူငယ်တန်း​​ ဖတ်စာ သင်ပုန်း​​ြကီး​​ကို ြပန်ြပင်​​ေရး​​ရပါမယ်။ အဲဒီ​​ေတာ့​​ အခု​​ေလာ​​ေလာဆယ်မှ ​​ေပါ်လာတဲ့​​ ယူနီကုတ် စံသတ်မှတ်ချက်ဆိုတာကို ြပင်ြကမလား​​၊​ နှစ်​​ေပါင်း​​နှစ်​​ေထာင်နီး​​ပါး​​ ရပ်တည်လာတဲ့​​ ြမန်မာစာရဲ့​​ စံ​​ေတွကို ​​ေြပာင်း​​ြကမလား​​၊​ စဉ်း​​စား​​ြကပါ။ ဒါက လက်ရှိြမန်မာယူနီကုတ် အ​​ေပါ်ကျွန်​​ေတာ်ထား​​တဲ့​​သ​​ေဘာထား​​ အြမင်ကို​​ေြပာြပတာပါ။
ဧရာနဲ့​​ပတ်သက်ြပီး​​​ေတာ့​​လည်း​​ နည်း​​နည်း​​​ေြပာချင်ပါတယ်။ လွန်ခဲ့​​တဲ့​​ နှစ်နှစ်ကထိ ဧရာဆိုတာ မ​​ေပါ်လာ​​ေသး​​ပါဘူး​​။ အဲဒီအချိန်က ြမန်မာယူနီကုတ်သမား​​​ေတွနဲ့​​ ​​ေဇာ်ဂျီနဲ့​​ အြပန်အလှန် ြငင်း​​ခံု​​ေနြကတဲ့​​အချိန်ပါ။ ​​ေြပာရရင် ြမန်မာြပည်ကို ယူနီကုတ်ဆိုတဲ့​​ စကား​​လံုး​​​ေရာက်တာ ၁၀ နှစ်​​ေလာက်ရှိြပီြဖစ်သလို NLP ဆိုတာ​​ေပါ်လာြပီး​​ ြမန်မာ ၁၊​ ြမန်မာ ၂၊​ ြမန်မာ ၃ ဆိုတာ​​ေတွထုတ်ခဲ့​​တာလည်း​​ ၁ဝနီး​​ပါး​​ပဲ။ အဲဒီ၁ဝနှစ်အတွင်း​​မှာ NLP ဘာလုပ်ထား​​ပါသလဲ။ ​​ေဇာ်ဂျီနဲ့​​ ြငင်း​​ြကတဲ့​​ကိစ္စက လွဲရင် ြမန်မာ ၃ ဟာ ြမန်မာနိုင်ငံရဲ့​​ အစိုး​​ရ အသိအမှတ်ြပု ယူနီကုတ်တစ်ခုလို့​​​ေြပာထား​​ြပီး​​။ ြမန်မာယူနီကုတ်သတ်မှတ်ချက်​​ေတွထဲမှာပါတဲ့​​ တိုင်း​​ရင်း​​သား​​ဘာသာ​​ေလး​​ လက်တစ်ဆုပ်စာအတွက် ဘာအ​​ေထာက်အပံ့​​မှ ​​ေပး​​မထား​​​ေသး​​ပါဘူး​​။ ြမန်မာ ၃ ကို သံုး​​လို့​​ ရှမ်း​​စာလည်း​​ ဖတ်မရသလို မွန်စာလည်း​​ ဖတ်မရပါဘူး​​။ ​​ေဇာ်ဂျီသံုး​​​ေနတဲ့​​ သူ​​ေတွဆိုတာကလည်း​​ ြမန်မာြပည်တစ်ြပည်လံုး​​မှာ ကျွန်​​ေတာ်တို့​​​ေရာ လက်ရှိ ြမန်မာယူနီကုတ်မှ ယူနီကုတ်ပါလို့​​ ​​ေအာ်​​ေနြကသူအား​​လံုး​​​ေရာ ​​ေဇာ်ဂျီဆိုတာ မသံုး​​လို့​​ကို မြဖစ်တဲ့​​အ​​ေနအထား​​​ေရာက်​​ေနပါြပီ။ ဒါ​​ေပမယ့်​​ ​​ေဇာ်ဂျီဟာ ယူနီကုတ် ၄.၀ မှာကျန်​​ေနခဲ့​​တာတင်မကပဲ ယူနီကုတ် သတ်မှတ်ချက်​​ေတွကိုလည်း​​ လံုး​​ဝမလိုက်နာပါဘူး​​။ ဒါ​​ေပမယ့်​​ သံုး​​လို့​​အဆင်​​ေြပတာ​​ေတာ့​​ လူတိုင်း​​လက်ခံြကမှာပါ။ အဲဒီ​​ေတာ့​​ ဧရာရဲ့​​ အဓိက ရည်ရွယ်ချက်ကို ကျွန်​​ေတာ်ခန့်​​မှန်း​​​ေြပာရရင် ​​ေဇာ်ဂျီနဲ့​​ ြမန်မာယူနီကုတ်​​ေတွြကား​​မှာ ရှိ​​ေနတဲ့​​ ြခား​​နား​​ချက်ြကီး​​ကို ​​ေပါင်း​​ကူး​​​ေပး​​ဖို့​​ ရည်ရွယ်တယ်လို့​​ ယူဆပါတယ်။

​​ေဇာ်ဂျီသံုး​​တဲ့​​သူ​​ေတွအ​​ေနနဲ့​​ ဧရာသံုး​​ရတာဟာ ​​ေဇာ်ဂျီသံုး​​ရတာနဲ့​​ မထူး​​ဘူး​​ အဆင်​​ေြပတာပဲဆိုြပီး​​ ဧရာကို သံုး​​လာြကမယ်ဆိုရင် ပထမအဆင့်​​အ​​ေနနဲ့​​ ယူနီကုတ်နံပါတ်သတ်မှတ်ချက်ကို အတိအကျလိုက်နာထား​​တဲ့​​ စနစ်တစ်ခုကို ရင်း​​နှီး​​လာ​​ေစမှာပါ။ ဒီလိုသံုး​​ရင်း​​နဲ့​​ ယူနီကုတ်နံပါတ်သတ်မှတ်ချက်ကို လိုက်နာထား​​တာကို သံုး​​ရတာက ​​ေဇာ်ဂျီသံုး​​တာထက်ပို​​ေကာင်း​​တဲ့​​အချက်​​ေတွရှိတယ်ဆိုတာကိုလက်ခံလာြကမှာပါ။ သိသာြမင်သာတဲ့​​အချက်က​​ေတာ့​​ ​​ေဇာ်ဂျီမှာ ၈ မျိုး​​​ေလာက်မှတ်ထား​​ရတဲ့​​ ရရစ်​​ေတွကို တစ်မျိုး​​တည်း​​နဲ့​​ ရိုက်လို့​​ရသွား​​တာမျိုး​​ပါ။ ဒီက​​ေနတစ်ဆင့်​​တက်ြပီး​​ encoding ကိုပါလိုက်နာထား​​တဲ့​​ စနစ်​​ေတွကို စမ်း​​သံုး​​ြကည့်​​လာတဲ့​​အခါ စာစီဖို့​​လွယ်တာမျိုး​​ ပိုြပီး​​​ေတာ့​​ အဆင်​​ေြပတာမျိုး​​​ေတွကို သိလာြကမယ်ဆိုရင် အခု ​​ေဇာ်ဂျီသံုး​​​ေနတဲ့​​သူ​​ေတွ ြမန်မာ ၃ လို ယူနီကုတ်ကို ​​ေြပာင်း​​သံုး​​လာြကမှာပါ။ ကျွန်​​ေတာ်​​ေြပာတာ​​ေတွထဲမှာ ဧရာရဲ့​​ သ​​ေဘာထား​​ အြမင်နဲ့​​ မကိုက်ညီတာရှိရင် ဧရာအ​​ေနနဲ့​​ ြပင်​​ေြပာနိုင်ပါတယ်။

အခု WordPress ကို ဘာသာြပန်တာကို ဧရာသံုး​​လိုက်ရတဲ့​​ ကျွန်​​ေတာ့်​​ရဲ့​​ ရည်ရွယ်ချက်က​​ေတာ့​​ အဲဒါ​​ေြကာင့်​​ပါ။ ကျွန်​​ေတာ့်​​ဘာသာြပန်မူဟာ ြမန်မာ ၃ လို ယူနီကုတ်သံုး​​​ေနြပီး​​သား​​လူ​​ေတွအတွက် လံုး​​ဝမရည်ရွယ်ပါဘူး​​။ လက်ရှိမှာ ​​ေဇာ်ဂျီပဲသံုး​​ြပီး​​​ေရး​​တတ်တဲ့​​ ဘ​​ေလာ့​​ဂ်​​ေရး​​သူ​​ေတွ ဘ​​ေလာ့​​ဂါ​​ေတွ ဖိုရမ်​​ေတွ ဆိုရယ်ကွန်ယက်​​ေတွလုပ်​​ေနြကသူ​​ေတွအား​​လံုး​​က ​​ေဇာ်ဂျီအစား​​ ဧရာကို ​​ေြပာင်း​​သံုး​​လာြကမယ်ဆိုရင် တစ်ချိန်ချိန်မှာ ြမန်မာ ၃ ကို​​ေြပာင်း​​သံုး​​ြဖစ်ဖို့​​ ပိုြပီး​​​ေတာ့​​ အ​​ေြခအ​​ေန အခွင့်​​အလမ်း​​များ​​မှာပါ။ ​​ေနာက်ဆံုး​​ တစ်ချက်​​ေြပာရရင် ​​ေဇာ်ဂျီလို က​​ေဘာက်တိ က​​ေဘာက်ချာ ယူနီကုတ်နံပါတ်​​ေတွနဲ့​​ ​​ေရး​​ထား​​တဲ့​​ ​​ေဒတာ​​ေဗ့​​​ေတွပဲ အများ​​ြကီး​​ အင်တာနက်​​ေပါ်မှာ ရှိ​​ေနတာထက် အနည်း​​ဆံုး​​​ေတာ့​​ ယူနီကုတ်နံပတ်သတ်မှတ်ချက်​​ေတာ့​​ တူ​​ေန​​ေသး​​တဲ့​​ ဧရာနဲ့​​ရှိ​​ေနတာက ပိုြပီး​​​ေတာ့​​ ​​ေနာက်ပိုင်း​​မှာ ​​ေြပာင်း​​လွယ်ြပင်လွယ်ြဖစ်ပါမယ်။

ယခုလက်ရှိမှာလည်း​​ ​​ေဇာ်ဂျီသံုး​​​ေနတဲ့​​သူ အား​​လံုး​​ အခု WordPress ကို​​ေြပာင်း​​သံုး​​မယ်ဆိုရင် နည်း​​ပညာပိုင်း​​ဆိုင်ရာ အား​​လံုး​​ကို အကူအညီ​​ေပး​​ဖို့​​ အသင့်​​ရှိ​​ေနပါတယ်လို့​​​ေြပာရင်း​​ ကျွန်​​ေတာ့်​​ရဲ့​​ စာမူကို ဒီမှာ အဆံုး​​သတ်ချင်ပါတယ်။

Encoding ဆိုတာ ဘာလဲ။ ဘာ​ေြကာင့်​လိုအပ်သလဲ။ Encoding မတူလို့​ယူနီကုဒ် မစစ်ဘူး​ဆိုတာ​ေရာ မှန်ပါသလား​။

Encoding ဆိုတာဘာလဲ ကို အရင် သိဖို့​ Unicode Consortium ၏အဖွဲ့​ဝင်ြဖစ်ြပီး​ ဝီကီပိဒိယ ြမန်မာ​ဘာသာ​အပိုင်း​တွင် System Operator ြဖစ်သူ၊ Technomation Studios နှင့်​ MyMyanmar Projects တို့​တွင် အမှု​ေဆာင်​ဒါရိုက်တာအြဖစ် တာဝန်​ထမ်း​​ေဆာင်​လျှက်ရှိသည့်​ ကိုထူး​ြမင့်​​ေနာင်က (http://www.myanmartutorials.com/articles/computerized-myanmar-languages/) မှာ

Encoding​ဆို​သည်​မှာ …?

Encoding ဆိုသည်မှာ


ကွန်ြပူတာသည် ကျွနု်ပ်တို့​လူအများ​ နား​လည်သလို ဘာသာစကား​များ​၊ စာလံုံး​များ​ကို နား​လည်သိရှိနုိင်ြခင်း​ မရှိပါ။ အ​ေြခခံအကျဆံုံး​အဆင့​်တွင် ကွန်ြပူတာများ​သည် ဂဏန်း​များ​ကို သိမ်း​နုိင်၊ တွက်ချက်နိုင်ြခင်း​ စွမ်း​ရည်သာ ရှိြကပါသည်။ ထုိ့​​ေြကာင့​် ဘာသာစကား​များ​၏ အက္ခရာများ​ကို ကွန်ြပူတာများ​တွင် သံုး​နုိင်ရန်အတွက်လည်း​ အက္ခရာတလံုး​ချင်း​စီကို ဂဏန်း​များ​အြဖစ် သတ်မှတ်ရပါသည်။ ဥပမာ အဂင်္လိပ်အက္ခရာ ​ေအ ‘A’ ကို 41 ဟု သတ်မှတ်ပါသည်။ ထိုသို့​ သတ်မှတ်မှသာ ကွန်ြပူတာက ကျွနု်ပ်တို့​သံုံး​​ေသာ စာ​ေပများ​ကို သိမ်း​ဆည်း​နိုင်ြခင်း​၊ ပရင်တာထုတ်နုိင်ြခင်း​၊ ၀က်ဘ်ဆုိက်များ​တွင် ဖတ်ရှုနုိင်ြခင်း​ စသည်တို့​ကို ​ေဆာင်ရွက်နိုင်ြခင်း​ ြဖစ်ပါသည်။ သို့​​ေသာ်လည်း​ ဘာသာအသီး​သီး​၏ အက္ခရာအသီး​သီး​ကို မည်သည့​်ဂဏန်း​အြဖစ် သိမ်း​မည်ဆို​ေသာ သတ်မှတ်ချက်သည် တနုိင်ငံနှင့​် တနုိင်ငံ၊ ကွန်ြပူတာစနစ် တခုနှင့​်တခု၊ ​ေဆာ့​ဝဲတခုနှင့​်တခု မတူညီခဲ့​ြကပါ။ ဥပမာ အဂင်္လိပ်ဘာသာစကား​တွင်ပင် အက္ခရာများ​ကုိ ANSI Encoding, ASCII Encoding, MacRoman Encoding စသည်ြဖင့​် အမျုိး​မျုိး​ သတ်မှတ်ခဲ့​ြကပါသည်။ ထို့​​ေြကာင့​် Encoding​ ဆိုသည်မှာ မည်သည့​်အက္ခရာကို မည်သည့​်ဂဏန်း​သတ်မှတ်သည်ဆို​ေသာ သတ်မှတ်ချက်တခု သက်သက်ပင် ြဖစ်ပါသည်။ ASCII Encoding​ တွင် ‘A’ သည် 41 ြဖစ်ြပီး​ ‘Z’ သည် 90 ြဖစ်ပါသည်။


Encoding Standards​ ​ဆို​သည်​မှာ


ဘာသာစကား​တခုတည်း​ကိုပင် အမျုိး​မျုိး​​ေသာ ဂဏန်း​သတ်မှတ်ချက်များ​နှင့​် သိမ်း​ဆည်း​ြက​ေသာ​ေြကာင့​် ကွန်ြပူတာ တခုနှင့​်တခု၊ ​ေဒသတခုနှင့​်တခု အချက်အလက်များ​ (စာများ​) ​ေပး​ပို့​သည့​်အခါ encoding​ မတူညီ​ေသာ​ေြကာင့​် တ​ေနရာမှ အချက်အလက်ကို အြခား​တ​ေနရာမှ ဖတ်၍မရြခင်း​ ြပဿနာများ​ ​ေြပလည်​ေစရန်အတွက် International အဖဲွ့​အစည်း​များ​သည် စံသတ်မှတ်ချက်များ​ သတ်မှတ်ြပီး​ အ​ေကာင်အထည်​ေဖာ်ခဲ့​ြကပါသည်။ ပထမဦး​ဆံုး​ ထွက်​ေပး​လာ​ေသာ စံသတ်မှတ်ချက်မှာ အဂင်္လိပ်ဘသာသာစကား​အတွက်ြဖစ်ြပီး​ ​၎င်း​​ကို ASCII​ ဟု ​ေခါ်ပါသည်။ ထိုအချိန်မှစ၍ တကမ္ဘာလံုး​တွင် အဂင်္လိပ်စာကို ASCII encoding နှင့​်သာ သိမ်း​ဆည်း​ြက​ေသာ​ေြကာင့​် စနစ်မတူြခင်း​၊ ​ေဖာင့​်မတူြခင်း​ ြပဿနာများ​ ကင်း​​ေဝး​ခဲ့​ြကပါသည်။ ထို့​​ေနာက် အဂင်္လိပ်ဘာသာစကား​ကဲ့​သို့​ပင် တကမ္ဘာလံုး​မှ ဘာသာစကား​အား​လံုး​၏ အက္ခရာများ​ကို စံသတ်မှတ်နိုင်ရန်အတွက် ISO​ နှင့​် Unicode Consortium အဖဲွ့​အစည်း​များ​ ဖဲွ့​စည်း​၍ ြကုိး​ပမ်း​လုပ်​ေဆာင်ခဲ့​ြကပါသည်။ Unicode Standard​ သည် အဆိုပါ ISO​ နှင့​် Unicode Consortium​ တို့​၏ ြကုိး​ပမ်း​မှုများ​မှ ရလဒ်ပင် ြဖစ်ပါသည်။ တကမ္ဘာလံုး​တွင် လက်ရှိသံုး​​ေန​ေသာ Encoding စနစ်သည် Unicode Standard​ ပင် ြဖစ်ပါသည်။


ြမန်မာစာ encoding များ​


ASCII​ ​ေခတ်တွင် ြမန်မာစာ encoding များ​ ရှိခဲ့​​ေသာ်လည်း​​ Standard​ အြဖစ် သတ်မှတ်နုိင်ြခင်း​ မရှိခဲ့​ပါ။ ထိုအချိန်က ြမန်မာစာ encoding များ​မှာ အဂင်္လိပ်စာ စာလံုး​များ​ကို အ​ေြခခံ​ေသာ စနစ်များ​သာ ြဖစ်ခဲ့​ပါသည်။ ဥပမာ ကွန်ြပူတာ ကီး​ဘုတ်တွင် ‘u’ ကို နှိပ်လုိက်လျှင် ကြကီး​ ​ေပါ်နိုင်ရန် ​ေဖာင့​်ထဲတွင်ရှိ​ေသာ ‘u’ ၏ စာလံုး​ပံုစံဒီဇုိင်း​ကို ‘က’ ြဖစ်​ေအာင် ြပင်ဆင်ထား​​ေသာ ​ေဖာင့​်များ​သာ ထွက်​ေပါ်ခဲ့​ပါသည်။ ထို့​​ေြကာင့​် ကွန်ြပူတာစကရင်​ေပါ်တွင် ကြကီး​​ေပါ်​ေသာ်လည်း​ ကွန်ြပူတာက အမှန်တကယ် မှတ်သား​သိမ်း​ဆည်း​ထား​သည်မှာ အဂင်္လိပ်အက္ခရာ ‘u’ သာ ြဖစ်ပါသည်။ ထုိ့​​ေြကာင့​် ​၎င်း​​စနစ်များ​သည် စာပံုနှိပ်လုပ်ငန်း​မှအပ အြခား​လုပ်ငန်း​များ​တွင် တွင်ကျယ်လာြခင်း​ မရှိပါ။ ASCII encoding ြဖင့​် ြမန်မာစနစ်များ​ကို ‘​ေဖာင့​်’ များ​ဟုသာ ​ေခါ်ခဲ့​ြကပါသည်။ ​ေရး​သား​သူမတူ​ေသာ ASCII ​ေဖာင့​်အမျုိး​မျုိး​သည် အဂင်္လိပ်အက္ခရာအမျုိး​မျုိး​ကို ​ေနရာလဲခဲ့​​ေသာ​ေြကာင့​် တခုနှင့​်တခု မတူညီြကပါ။ ထို့​​ေြကာင့​် English ASCII လို စနစ်အား​လံုး​၊ ​ေနရာအား​လံုး​တွင် တသတ်မှတ်တည်း​ သံုး​နုိင်​ေသာ ြမန်မာစာ ASCII စနစ်လည်း​ မရှိခဲ့​ပါ။ ASCII Encoding/Font များ​မှာ




  • Avalaser (Mac only)

  • CE

  • Academy

  • M-Myanmar

  • Ava

  • Win Myanmar: Win Innwa, Win Hakha, Win Thanlwin, etc

  • W Art House, A Art House


ထို့​​ေနာက်တွင် ISO/Unicode Consortium မှ ြမန်မာဘာသာကို Unicode Standard​ ထဲတွင် ထည့​်သွင်း​နုိင်ခဲ့​ပါသည်။ သို့​ရာတွင် Unicode Standard Encoding​ ဆိုသည်မှာ အက္ခရာများ​ကို ဂဏန်း​သတ်မှတ်​ေပး​ြခင်း​ ြဖစ်​ေသာ်လည်း​ ြမန်မာစာ​ေဖာင့​်​ေရး​သူများ​ နား​လည်ထား​​ေသာ အဂင်္လိပ်အက္ခရာများ​ကို ြမန်မာစာနှင့​် လဲမည်ဆို​ေသာ အယူအဆနှင့​် လံုး​ဝ ဆန့​်ကျင်ဘက် ကွာြခား​ပါသည်။ ASCII ​ေဖာင့​်များ​တွင် ‘က’ တလံုး​အတွက် ​၎င်း​​နှင့​် ပံုသဏ္ဌာန်ကိုလိုက်ြပီး​ ဂဏန်း​များ​ကို ကိုယ်စား​ြပုပါသည်။ ဥပမာ ဝင်း​အင်း​ဝတွင် ‘က’ အတွက် 75 နှင့​် ‘ka sit’ အတွက် 250 ဟု မှတ်သား​ပါသည်။ ယူနီကုတ်တွင် ‘က’ သည် 4096 ြဖစ်ြပီး​ ‘ka sit’ သည်လည်း​​ 4096 ြဖစ်ပါသည်။ ထို့​​ေြကာင့​် ASCII​ မှာလို ‘က’ ၏ စာလံုး​ဒီဇိုင်း​​ေရး​ရန် တ​ေနရာ၊ ‘ka sit’ အတွက် တ​ေနရာ မရှိပါ။ အ​ေြခအ​ေနကိုလိုက်၍ ‘က’ နှင့​် ‘ka sit’ ကို အလို​ေလျာက် ​ေြပာင်း​လဲနုိင်သည့​် Rendering System ​ေခါ် နည်း​ပညာြဖင့​် လုပ်​ေဆာင်ရမည် ြဖစ်ပါသည်။ ထုိ့​မှသာ ကျွနု်ပ်တို့​ ကွန်ြပူတာတွင် သံုး​​ေန​ေသာ​ Database​ များ​၊ အီး​​ေမး​လ်များ​၊​ Search Engine များ​၊ ကွန်ြပူတာသံုး​စနစ်များ​ (e-government, Baking, POS, etc) သည် မှန်ကန်တိကျစွာ အလုပ်လုပ်နုိင်မည် ြဖစ်ပါသည်။ ‘က’ နှင့​် ‘ka sit’ သည် ဂဏန်း​နှစ်ခုကိုသာ ကိုယ်စား​ြပုပါလျှင် ကွန်ြပူတာအား​ ‘တက္ကသိုလ်’ တွင် ‘က’ ဘယ်နှလံုး​ ပါသလဲ​ေမး​ပါက ‘ka sit’ ကို ‘က’ မှန်း​ မသိဘဲ၊ ‘က’ တလံုး​သာပါသည်ဟု အ​ေြဖထွက်ပါလိမ့​်မည်။ ​၎င်း​​အ​ေြဖသည်​ Database​ များ​၊ အီး​​ေမး​စနစ်များ​၊ Search Engine များ​တွင် များ​စွာ ထိခိုက်​ေစနုိင်ပါသည်။ ဥပမာ သင်ရှာလို​ေသာ အချက်အလက်များ​ တိကျစွာ မရှာ​ေဖွနိုင်ြခင်း​၊ အက္ခရာစဉ်ြခင်း​ အပါအဝင် အချက်အလက်များ​ကို စီစဉ်နိုင်မ၍ မရှိြခင်း​မှစ၍ စနစ်တခုလံုး​ အလုပ်​ေသချာစွာ မလုပ်နိုင်ြခင်း​ အထိ မလိုလား​အပ်​ေသာ ဆိုး​ကျုိး​များ​စွာ ရရှိနိုင်မည် ြဖစ်ပါသည်။ ထို့​​ေြကာင့​် Unicode Standard တွင် ‘က’ သည် ဂဏန်း​တခုတည်း​အြဖစ်​ေသာ သတ်မှတ်ပါသည်။ ထိုနည်း​တူ ASCII ​ေဖာင့​်များ​တွင် ​ေတွ့​ရ​ေသာ ရရစ်အြကီး​အ​ေသး​ အမျုိး​မျုိး​၊ ​ေအာက်ြမစ်အမျုိး​မျုိး​၊ တ​ေချာင်း​ငင်အမျုိး​မျုိး​တို့​ မရှိ​ေတာ့​ပါ။ အား​လံုး​မှာ သတ်မှတ်ထား​​ေသာ စံအတိုင်း​ တခုစီသာ ရှိပါသည်။ ​၎င်း​​အက္ခရာများ​ မည်သည့​်ပံုစံ​ေပါ်မည်ဆို (ဥပမာ တ​ေချာင်း​ငင် တိုမည်၊ ရှည်မည်) ကို ကွန်ြပူတာစနစ်များ​က လုပ်​ေဆာင်​ေပး​မည် ြဖစ်ပါသည်။


ထူး​ြမင့​်​ေနာင်


၁၉​၊​​ ၂​၊​​ ၂ဝ၁​ဝ


(ထူး​ြမင့​်​ေနာင်သည် Unicode Consortium ၏ အဖဲွ့​ဝင်ြဖစ်ြပီး​ ဝီကီပိဒိယ ြမန်မာဘာသာအပိုင်း​တွင် System Operator ြဖစ်ပါသည်။ Technomation Studios နှင့​် MyMyanmar Projects တို့​တွင် အမှု​ေဆာင် ဒါရိုက်တာအြဖစ် တာဝန်ထမ်း​​ေဆာင်လျက်ရှိပါသည်။)

Fake Unicode Encoding များ​နှင့်​Unicode​Standard

Fake Unicode Encoding များ​

Unicode Standard တွင် အထက်ပါ စာလံုး​အပိုများ​ မပါြခင်း​က ြမန်မာ​ေဖာင့်​​ေရး​သူများ​အတွက် Unicode Standard ကို သံုး​စဲွရန် အခက်အခဲ ြဖစ်​ေစခဲ့​ပါသည်။ ဥပမာ တက္ကသိုလ်၏ ကြကီး​နှစ်လံုး​တွင် အ​ေပါ်ကြကီး​သည်လည်း​ 4096 ၊ ​ေအာက်ကြကီး​သည်လည်း​ 4096 ြဖစ်ြပီး​ ‘က’ နှင့်​ ‘ka sit’ စာလံုး​ ဒီဇုိင်း​နှစ်မျုိး​ကို 4096 တ​ေနရာထဲတွင် ​ေရး​၍မရပါ။ ယခင် ASCII​ တွင် ရသည်မှာ ကြကီး​နှစ်လံုး​သည် ဂဏန်း​မတူ​ေသာ​ေြကာင့်​ ဂဏန်း​နှစ်​ေနရာတွင် အသံုး​ချရန် လိုအပ်ပါသည်။ ထိုသို့​​ေသာ နည်း​ပညာများ​ကို အသံုး​မချနိုင်ခင်တွင် အချုိ့​​ြမန်မာ​ေဖာင့်​ ​ေရး​သူများ​က ​ေဆး​ြမီး​တိုတခုကို စတင်အသံုး​ချခဲ့​ြကပါသည်။ ​၎င်း​​မှာ ြမန်မာတုိင်း​ရင်း​ဘာသာများ​အတွက် Unicode Consortium က သတ်မှတ်ထား​​ေသာ ဂဏန်း​​ေနရာများ​တွင် ASCII မှ စာလံုး​အပုိများ​ ထည့်​ြကြခင်း​ ြဖစ်ပါသည်။ ဥပမာ ‘တက္ကသိုလ်’ တွင် ‘ka sit’ နှင့်​ ‘က’ ဂဏန်း​တူရမည် ြဖစ်​ေသာ်လည်း​ ‘ka sit’ ကို တုိင်း​ရင်း​သား​စာလံုး​ ‘-’ ၏ ဂဏန်း​​ေနရာတွင် ယခင် ASCII ​ေဖာင့်​များ​ ‘A’ ​ေနရာတွင် ‘က’ ထား​သလို သွား​ထား​ြကပါသည်။ ထိုသို့​လုပ်ြခင်း​ြဖင့်​ Rendering Engine​ များ​ မလိုဘဲ ြမန်မာစာကို သံုး​နုိင်လာခဲ့​ပါသည်။ သို့​​ေသာ် ထိုသို့​အသံုး​ြပုနုိင်ြခင်း​သည် ယူနီကုတ်ဟု အမည်​ေပး​ြက​ေသာ်လည်း​ တကယ်တမ်း​တွင် Unicode Standard​ ၏ အနှစ်သာရများ​ လံုး​ဝ ​ေပျာက်ဆံုး​​ေစပါသည်။ တကယ်တမ်း​ ​၎င်း​​​ေဖာင့်​များ​သည်​ Fake Unicode Font​ များ​ (သို့​မဟုတ်) Unicode Standard ကုိ ချုိး​​ေဖာက်​ေသာ ​ေဖာင့်​များ​သာ ြဖစ်ပါသည်။ သို့​ရာတွင် ​၎င်း​​​ေဖာင့်​များ​သည် ASCII​ ​ေဖာင့်​များ​ထက် အား​သာချက်တခု ရှိပါသည်။ ​၎င်း​​မှာ ကွန်ြပူတာမှ ‘က’ ကို ‘u’ အြဖစ် သိမ်း​ဆည်း​မှု မြပုြခင်း​ ြဖစ်ပါသည်။ ဤဆိုပါ အချက်​ေြကာင့်​ Unicode Font​ များ​သည် အင်တာနက်​ေပါ်တွင် ဝက်ဘ်ဆုိက်များ​တင်ြခင်း​နှင့်​ ကွန်ြပူတာတွင် ဖိုင်များ​ကို အမည်​ေပး​ြခင်း​ စသည်တို့​ကို ရရှိလာ​ေသာ်လည်း​ encoding standard​ မရှိြခင်း​၊ ​ေဖာင့်​တခုနှင့်​တခု ​ေရး​သား​ထား​​ေသာ စာများ​ ဖလှယ်၍ သံုး​နုိင်မှု မရှိြခင်း​ စ​ေသာ ASCII ​ေခတ်က ရှိခဲ့​​ေသာ အား​နည်း​ချက်များ​အား​လံုး​ မ​ေပျာက်မပျက် ဆက်လက်တည်ရှိ​ေနပါသည်။ ထိုသို့​​ေသာ ​ေဖာင့်​များ​အား​ Unicode Standard​ ကို အသံုး​မြပုနိုင်​ေသာ ​ေနရာများ​တွင် ယာယီ ြမန်မာစာ စာလံုး​​ေပါ်​ေစရန်သာ အသံုး​ြပုသင့်​ပါသည်။


Fake Unicode Font များ​သည် အနီ​ေရာင်ြပထား​​ေသာ တုိင်း​ရင်း​သား​ စာလံုး​များ​​ေနရာတွင် ASCII ​ေဖာင့်​များ​မှ လိုအပ်​ေသာ စာလံုး​များ​ကို ထည့်​သွင်း​အသံုး​ြပုြကပါသည်။


[caption id="attachment_105" align="aligncenter" width="501" caption="Unicode Chart for Myanmar ---- Unicode Consortium. Modified to show a purpose."]Unicode Chart for Myanmar ---- Unicode Consortium. Modified to show a purpose.[/caption]

Unicode မဟုတ်​ေသာ encoding များ​မှာ -




  • MyaZedi Unicode

  • TPartial

  • XPartial

  • BIT

  • ZawGyi Unicode


အထက်ပါ​ Fake Unicode ​ေဖာင့်​များ​ကို အသံုး​ြပုြခင်း​ြဖင့်​ ​ေအာက်ပါ ဆိုး​ကျုိး​များ​ကို ရရှိနုိင်မည် ြဖစ်ပါသည်။


တုိင်း​ရင်း​သား​ ဘာသာစကား​များ​ အသံုး​ြပုရန် ြပဿနာရှိြခင်း​

တိုင်း​ရင်း​သား​များ​အတွက် သတ်မှတ်ထား​​ေသာ စာလံုး​များ​ကို လဲလှယ်အသံုး​ြပုထား​ြခင်း​ ြဖစ်​ေသာ​ေြကာင့်​ ဤ​ေဖာင့်​များ​ကို ဆက်လက်အသံုး​ြပုပါက ​ေနာင်တချိန်တွင် ရှမ်း​ကွန်ြပူတာစနစ်၊ မွန်ကွန်ြပူတာစနစ် စ​ေသာ တုိင်း​ရင်း​သား​ စာ​ေပများ​ကို ကွန်ြပူတာ​ေပါ်တွင် အသံုး​ချနိုင်ရန် ခက်ခဲသွား​မည် ြဖစ်ပါသည်။


ြမန်မာစာ​ Searching အသံုး​မြပုနုိင်ြခင်း​

‘က’ နှင့်​ ‘ka sit’ ကိုပင် ကွန်ြပူတာက အတူတူြဖစ်သည်ဟု မသိပါက ​ေဒတာအချက်အလက်များ​စွာ ပါ​ေသာ စနစ်များ​တွင် ကျွနု်ပ်တို့​လိုချင်သည်ကို မှန်ကန်တိကျစွာ ရှာ​ေဖွနိုင်မည် မဟုတ်ပါ။ ဥပမာ အင်တာနက်တွင် ကျွနု်ပ်တို့​ ြမန်မာလို ရှာ​ေဖွလို့​ ရပါသလား​။ ရှာ​ေဖွ၍ ရလာ​ေသာ ရလဒ်များ​သည် ရာခုိင်နှုန်း​အနည်း​ငယ်မျှ​ေသာ မှန်ကန်မည်ြဖစ်ြပီး​ ကျန်အချက်အလက်များ​သည် ​ေပျာက်ဆံုး​​ေနမည်ြဖစ်သည်။


ြမန်မာစာ အစီအစဉ်များ​ လဲွမှား​နုိင်ြခင်း​

‘တက္ကသိုလ်’ နှင့်​ ‘တက်ကသုိလ်’ သည် အတူတူပင်ြဖစ်သည်ကို ကွန်ြပူတာမှ မသိနုိင်ပါက ြမန်မာစာလံုး​များ​ကို ြကီး​စဉ်ငယ်လိုက် စီစဉ်နုိင်မည် မဟုတ်ပါ။ အ​ေြခခံ ြကီး​စဉ်ငယ်လိုက် စီစဉ်ြခင်း​ကို မလုပ်နုိင်ပါက ပိုမိုြကီး​များ​ကျယ်ြပန့်​​ေသာ စနစ်များ​တွင် စီစဉ်ြခင်း​များ​ လုပ်​ေဆာင်နုိင်မည် မဟုတ်ပါ။ ဥပမာ အင်တာနက်တွင် ‘University’ ဝက်ဘ်ဆိုဒ်များ​ကို ရရှိမည် ြဖစ်ပါသည်။ ‘တက္ကသိုလ်’ ဟု ရှာ၍ ထွက်လာ​ေသာ ြဖစ်နုိင်​ေြခနည်း​​ေသာ ဝက်ဘ်ဆုိက်များ​ကို ရရှိမည် ြဖစ်ပါသည်။ အြခား​စနစ်များ​ ဥပမာ Banking, e-Government, e-Commerce စနစ်များ​တွင်လည်း​ ရလဒ်များ​သည် ​ေသချာတိကျြခင်း​ ရှိနုိင်မည် မဟုတ်ပါ။


ကွန်ြပူတာစနစ်များ​တွင် အံမဝင်ြခင်း​

နိုင်ငံတကာမှ ​ေရး​သား​ထား​​ေသာ ​ေဆာ့​ဖ်ဝဲများ​ ဥပမာ - စီမံခန့်​ခဲွ​ေရး​ ​ေဆာ့​ဖ်ဝဲများ​၊ အ​ေရာင်း​​ေဆာ့​ဖ်ဝဲများ​ စသည်တို့​သည် နိုင်ငံတကာမှ ဘာသာမျုိး​စံုနှင့်​ အသံုး​ြပုနုိင်​ေလ့​ ရှိြကပါသည်။ ထိုသို့​ အသံုး​ြပုရန် အဆိုပါ ​ေဆာ့​ဖ်ဝဲများ​ကို ဘာသာတခုစီအတွက် သီး​ြခား​ြပင်ဆင်ရန် မလိုအပ်သည်မှာ Unicode Standard ကို အသံုး​ြပု​ေသာ​ေြကာင့်​ ြဖစ်ပါသည်။ အကယ်၍ ြမန်မာစာအတွက်​ Fake Unicode များ​ကို သံုး​မည်ဆုိလျှင် ထို​ေဆာ့​ဖ်ဝဲများ​ကို ြမန်မာဘာသာြဖင့်​ သံုး​ရန် ခက်ခဲသွား​မည် ြဖစ်ပါသည်။


Data Corruption ြဖစ်နုိင်ြခင်း​

ASCII ​ေဖာင့်​များ​တွင် သုည နှင့်​ ဝလံုး​သည် ပံုစံတူ​ေသာ​ေြကာင့်​ နှစ်လံုး​စလံုး​ကို ဂဏန်း​ ၃ဝ အြဖစ် သတ်မှတ်ထား​ပါသည်။ ထို့​​ေြကာင့်​ ကွန်ြပူတာသည် မည်သည့်​နည်း​နှင့်​မျှ ဂဏန်း​တူ​ေန​ေသာ ထိုသုညနှင့်​ ဝလံုး​ကို ခဲွြခား​သိရှိနိုင်မည် မဟုတ်ပါ။ ASCII နှင့်​ ​ေရး​ထား​​ေသာ စာများ​ကို သီး​သန့်​ြပုလုပ်ထား​​ေသာ ​ေဆာ့​ဖ်ဝဲများ​နှင့်​ Unicode Standard သို့​ ​ေြပာင်း​လဲနုိင်​ေသာ်လည်း​ သုညနှင့်​ ဝလံုး​ သံုး​ထား​​ေသာ ​ေနရာများ​တွင် အချက်အလက်များ​သည် မှန်ကန်မှု ရှိမည် မဟုတ်ပါ။ အချို့​​​ေသာ Fake Unicode Font များ​တွင်လည်း​ သုညနှင့်​ ဝလံုး​ကို ခဲွြခား​ထား​​ေလ့​ မရှိြကပါ။ အချက်အလက်များ​စွာ ထည့်​သွင်း​ထား​​ေသာ​ database စနစ်များ​တွင် အချက်အလက်များ​သို့​ ထည့်​သွင်း​ထား​​ေသာ အချက်အလက်များ​ မမှန်ကန်ြခင်း​ကို​ data corruption ဟု ​ေခါ်ပါသည်။ ဥပမာ ကွန်ြပူတာက အဂင်္လိပ်မှ ြမန်မာသို့​ အလိုအ​ေလျာက် ဘာသာြပန်​ေသာ စနစ်တခု တည်​ေဆာက်မည်ဆုိပါလျှင် သုညနှင့်​ ဝလံုး​တို့​ ဆက်စပ်​ေသာ ​ေနရာများ​တွင် အ​ေြဖသည် အြမဲမှား​မည် ြဖစ်ပါသည်။


Unicode​ Standard

Unicode Standard သည် encoding တခု တနည်း​အား​ြဖင့်​ အက္ခရာများ​ကို ဂဏန်း​သတ်မှတ်​ေပး​ြခင်း​သာ ြဖစ်​ေသာ်လည်း​ ​၎င်း​​သတ်မှတ်ချက်အတိုင်း​ လိုက်နာြပီး​ ြမန်မာစာစနစ်တခု ဖန်တီး​ရန်မှာ ​ေဖာင့်​တခုတည်း​ြဖင့်​ မြဖစ်နိုင်ပါ။ ြမန်မာစာလံုး​များ​ကို​​ screen ​ေပါ်တွင် ​ေပါ်နိုင်ရန် Rendering Engine ၊ ​၎င်း​​နှင့်​အလုပ်လုပ်နိုင်​ေသာ​ Smart Font နှင့်​ ြမန်မာစာကို ရိုက်ရန် Input Engine တို့​ လိုအပ်ပါသည်။ ဥပမာ ‘တက္ကသိုလ်’ တွင် ပါ​ေသာ ‘က’ နှစ်လံုး​တွင် မည်သည့်​ ‘က’ သည် ‘ka sit’ ြဖစ်မည်ကို​ Smart Font ထဲတွင် ​ေရး​သား​ရပါသည်။ ​၎င်း​​အချက်အလက်ကို Rendering Engine က သိရှိြပီး​​ screen တွင် မှန်ကန်​ေသာ ပံုစံကို ြပ​ေပး​နုိင်မည် ြဖစ်ပါသည်။ ယ​ေန့​ အသံုး​ြပု​ေန​ေသာ ကွန်ြပူတာစနစ် (OS) များ​ အား​လံုး​တွင် Rendering System များ​ တပါတည်း​ ပါရှိပါသည်။ ဥပမာ ဝင်း​ဒိုး​ကွန်ြပူတာများ​တွင် OpenType Rendering Engine ပါရှိပါသည်။ သို့​ရာတွင် မိုဘုိင်း​လ်ဖုန်း​များ​နှင့်​ ကွန်ြပူတာ (PC) ထက်နိမ့်​​ေသာ ကွန်ြပူတာများ​တွင် အဆုိပါ Rendering Engine များ​ မပါရှိြက​ေသး​​ေသာ​ေြကာင့်​ ြမန်မာစာ ယူနီကုတ် အသံုး​ြပုရန် မြဖစ်နုိင်​ေသး​ပါ။ ထိုအချိန်မျုိး​တွင် Fake Unicode Font များ​ကို အသံုး​ြပုနိုင်ပါသည်။ စာရိုက်ရာတွင်လည်း​ ယခင် ASCII စနစ်များ​တွင် ‘u’ ကို နှိပ်ြပီး​ ယူနီကုတ်ဂဏန်း​များ​ သိမ်း​ရန်မှာမူ Input Engine လိုအပ်ပါသည်။ ASCII စနစ်များ​နှင့်​ Fake Unicode Font များ​တွင် ‘​ေလ’ ကို ‘​ေ’ + ‘လ’ ဟု သိမ်း​ဆည်း​​ေသာ်လည်း​ Unicode Standard တွင် ‘​ေလ’ ကို ‘လ’ + ‘​ေ’ ဟု သိမ်း​ဆည်း​ပါသည်။ အ​ေြကာင်း​မှာ စကား​လံုး​အား​လံုး​၏ အ​ေြခခံမှာ ဗျည်း​စာလံုး​များ​ြဖစ်​ေသာ​ေြကာင့်​ ထိုသို့​ ဗျည်း​ကို ​ေရှ့​​ဆံုး​မှ သိမ်း​မှသာ​ sorting/searching အဆင်​ေြပနုိင်မည် ြဖစ်​ေသာ​ေြကာင့်​ ြဖစ်ပါသည်။ ထို့​​ေြကာင့်​ Input Engine မှ ကီး​ဘုတ်​ေပါ်တွင် ရိုက်​ေသာ စာလံုး​များ​ကို ယူနီကုတ် စံအတိုင်း​ ကွန်ြပူတာက သိမ်း​ဆည်း​​ေအာင် လုပ်​ေဆာင်​ေပး​ြပီး​ ​၎င်း​​စာများ​ကို​ screen ​ေပါ်တွင် မှန်ကန်စွာ ​ေပါ်​ေအာင် Rendering Engine မှ​ Smart Font ကို သံုး​ြပီး​ လုပ်​ေဆာင်ြခင်း​ ြဖစ်ပါသည်။


လက်ရှိ Unicode Standard ြမန်မာစာစနစ်များ​မှာ -



  • Myanmar2, Myanmar3 (OpenType Font, Keyman Input Engine)

  • Paduak (OpenType + Graphite Font for Linux and Windows, Keyman Input Engine)

  • Parabaik (OpenType font)

  • MyMyanmar (Universal Font for Linux, Windows and Mac, MyInput Engine)

  • MyMyanmar Developed Unicode Fonts from ASCII Fonts. (M-Myanmar Unicode, CE Unicode, Art House Unicode ...)

  • AyeYar


Myanmar 2,​ 3 ​ေဖာင့်​များ​ကို အစိုး​ရရံုး​များ​တွင် အသံုး​ြပုရန် အခမဲ့​ ​ေပး​ထား​ပါသည်။ ပိ​ေတာက်​ေဖာင့်​သည် Open Source Community ြကုိး​ပမ်း​မှုတခုြဖစ်ြပီး​ အခမဲ့​ ရရှိနိုင်ပါသည်။ MyMyanmar အား​ အခမဲ့​ရရှိ​ေသာ အင်တာနက် ဗား​ရှင်း​အြဖစ်လည်း​​ေကာင်း​၊ ​ေရာင်း​ချလျက်ရှိ​ေသာ​ DVD Software ဗား​ရှင်း​အြဖစ်လည်း​​ေကာင်း​ ရရှိနုိင်ပါသည်။ အင်တာနက် ဗား​ရှင်း​သည် အင်တာနက်ရှိမှ အသံုး​ြပု၍ ရမည်ြဖစ်ြပီး​ ဝယ်ယူ​ေသာ ဗား​ရှင်း​နှင့်​ စွမ်း​​ေဆာင်ရည် မကွာြခား​ပါ။ MyMyanmar မှ ယခင် ASCII ​ေဖာင့်​များ​စွာ၏ လုပ်ပိုင်ခွင့်​များ​ကို ရယူြပီး​ ​၎င်း​​စာလံုး​ပံုစံများ​ကို Unicode Standard Font များ​ ြဖစ်​ေအာင် ဖန်တီး​ထား​ပါသည်။ ​၎င်း​​တို့​တွင် အခမဲ့​ရ​ေသာ ​ေဖာင့်​များ​သည် အခမဲ့​ရမည်ြဖစ်ြပီး​ စီး​ပွား​ြဖစ်​ေဖာင့်​များ​လည်း​ ပါဝင်ပါသည်။ ​၎င်း​​တို့​ကို MyInput သို့​မဟုတ် Myanmar 2, 3 Keyman စနစ်များ​နှင့်​ တဲွသံုး​နုိင်ပါသည်။


ယူနီကုတ်စနစ်များ​သည် မည်သူ​ေရး​​ေသာ​ေဖာင့်​ြဖစ်​ေစ၊ မည်သည့်​စနစ်ြဖစ်​ေစ ဖလှယ်အသံုး​ြပုနိုင်စွမ်း​ ရှိပါသည်။ ဥပမာ MyMyanmar နှင့်​ ရိုက်ထား​​ေသာ စာများ​ကို အစိုး​ရရံုး​များ​အတွက် Myanmar2, Myanmar3 ြဖင့်​ အသံုး​ြပုနုိင်သလို ပိ​ေတာက်နှင့်​ ရိုက်ထား​​ေသာ စာများ​ကိုလည်း​ MyMyanmar နှင့်​လည်း​​ေကာင်း​၊ အြခား​ ယူနီကုတ်​ေဖာင့်​များ​နှင့်​လည်း​​ေကာင်း​ ဖတ်ရှုနိုင်ပါသည်။


​ေဖာင့်​တခု သို့​မဟုတ် စနစ်တခုကို ယူနီကုတ် ဟုတ်မဟုတ် စစ်​ေဆး​ရန်မှာ လွယ်ကူပါသည်။ ထုိ​ေဖာင့်​စနစ်ြဖင့်​ စာအနည်း​ငယ်ရိုက်ြပီး​ အထက်တွင်ပါ​ေသာ ယူနီကုတ်စနစ်တခုခုနှင့်​ ဖွင့်​ြကည့်​နုိင်ပါက Unicode Standard နှင့်​ ကိုက်ညီ​ေသာ ​ေဖာင့်​၊​ စနစ် ြဖစ်​ေြကာင်း​ သိရှိနိုင်ပါသည်။ အထက်တွင် ​ေဖာ်ြပထား​​ေသာ စာရင်း​တွင် ပါဝင်သည့်​ ​ေဖာင့်​များ​မှအပ အြခား​​ေဖာင့်​များ​သည် Unicode Standard နှင့်​ ကိုက်ညီ​ေလ့​မရှိြကပါ။ ထုိ့​​ေြကာင့်​ ​၎င်း​​တို့​ကို သံုး​မည်ဆုိလျှင် စနစ်အချင်း​ချင်း​ ဖလှယ်အသံုး​ြပုနုိင်စွမ်း​ မရှိရံုသာမက အနာဂတ်တွင် တွင်ကျယ်လာမည့်​ ှSearch Engine များ​၊ e-Government စနစ်များ​၊ လုပ်ငန်း​သံုး​ ကွန်ြပူတာစနစ်များ​၊ ဝက်ဘ်ဆုိက်​ေပါ်တယ်များ​တွင် ြမန်မာစာသည် စာလံုး​​ေပါ်ရံုမှလဲွ၍ အြခား​ဘာသာများ​တွင် အသံုး​ြပု​ေနြက​ေသာ စွမ်း​​ေဆာင်ရည်များ​ ရရှိနုိင်​ေတာ့​မည် မဟုတ်ပါ။ ထို့​​ေြကာင့်​ ြဖစ်နုိင်လျှင် Unicode Standard စနစ်များ​ကိုသာ သံုး​စဲွသင့်​ပါသည်။


ထူး​ြမင့်​​ေနာင်


(ထူး​ြမင့်​​ေနာင်သည် Unicode Consortium ၏ အဖဲွ့​ဝင်ြဖစ်ြပီး​ ဝီကီပိဒိယ ြမန်မာဘာသာအပိုင်း​တွင် System Operator ြဖစ်ပါသည်။ Technomation Studios နှင့်​ MyMyanmar Projects တို့​တွင် အမှု​ေဆာင် ဒါရိုက်တာအြဖစ် တာဝန်ထမ်း​​ေဆာင်လျက်ရှိပါသည်။)

ြမန်မာစာစနစ် တူညီစွာ သံုး​စွဲ​ေရး​ဆိုတာ

ြမန်မာစာစနစ်​ တူညီစွာသံုး​စွဲ​ေရး​​ ဆိုတာ ကွျန်​ေတာ်တို ့​ လွန်ခဲ့​တဲ့​ နှစ်​ ၂၀​ ​ေကျာ်​ေလာက်​ ကတည်း​က​ မက်ခဲ့​တဲ့​ အိပ်မက်ပါ။ ascii ​ေတွ ​ေပါ်လာြပီး​ စာလံုး​​ မတူတဲ့​​ ဒုက္ခကို အ​ေစာြကီး​​ ကတည်း​က ခံခဲ့​ြကရသူ​ေတွပါ။ အ​ေြကာင်း​​ေြကာင်း​​ေသာ အ​ေြကာင်း​တို့​ကို အ​ေြကာင်း​ြပုြပီး​​ သကာလ ဘယ်သူမှ ြမန်မာစာ ascii standard ကို ပတ်ဝန်း​ကျင်​ နိုင်ငံများ​​ နည်း​တူ ြဖစ်​ေအာင်​ မလုပ်​ နိုင်ခဲ့​ြကပါဘူး​။ လွန်ခဲ့​တဲ့​ ၁၀​ နှစ် ကွန်ပျုတာ​ အသင်း​​ေတွ ဖွဲ့​ြပီး​​ ကာစမှာ CICC ( Center of the international Cooperation for Computerization) JAPAN က​ေနြပီး​ ၄​ ြကိမ်​ေြမာက် AFSIT ( Asia Forum for Standardization of Information Technology) နဲ့​ language Forum ကို ၁၉၉၈ မှာ ြပည်လမ်း​က IBC မှာ လုပ်​ ခဲ့​ြကပါ​ေသး​တယ်။ ၁၉၉၂​ ​ေလာက်ကတည်း​က windows ​ေပါ်မှာ​ ​ေခတ်စား​လာတဲ့​ ြမန်မာစာကို standard လုပ်ဖို ့​မ​ေအာင်ြမင်​ ခဲ့​ြကပါဘူး​။ ပွစိတက် ရှုပ်ရှက်ခတ်​ေနတဲ့​ ​ေဖာင့်​​ သိမ်း​ဆည်း​မှု​ေတွရဲ့​​ ဒုက္ခဟာ အင်မတန်ဆိုး​ပါတယ်။ ​ေနာက်ပိုင်း​မှာ unicode စနစ်​ အား​​ေကာင်း​လာချိန် ြမန်မာစာ​ အတွက် ​ေနရာမှာ နိုင်ငံြခား​သား​​ တစ်​ေယာက်တင်ထား​တာ ကို ြမန်မာြပည်က​ တဝန်ရှိသူ​ေတွ​ သွား​​ေရာက်​ ​ေဆွး​​ေနွး​ြပီး​ ပထမဦး​ဆံုး​ standard ကို 4.1 မှာ စပါလာပါတယ်။


ကွျန်​ေတာ်​ နား​လည်​ သ​ေလာက်​ေြပာရရင် Unicode ဟာ ဘာသာ​ စကား​တိုင်း​​ အတွက် သူ​ေနရာ​ သူ​ေပး​ထား​ြပီး​ စာလံုး​​ တစ်လံုး​ဟာ အ​ေြခအ​ေန​ အရ ​ေရး​ထံုး​​ အရ ပံုသဏ္ဍန်​ ​ေြပာင်း​တာ​ေတွကို တန်ဘိုး​​ တစ်ခုနဲ့​ သိမ်း​ခွင့်​​ မ​ေပး​ဘဲ မူရင်း​​ စာလံုး​​ေတွသာ​ သိမ်း​ခွင့်​ြပုထား​တဲ့​ မူရှိပါတယ် roman မှာ garma လား​မသိဘူး​ အလယ်မှာနဲ့​ ​ေရှ့​မှာ ပံုစံ​ မတူပါဘူး​။ ြမန်မာစာမှာဆို ရရစ်​ေတွပါ အများ​ြကီး​​ ပံုကွဲ​ေပမဲ့​ တန်ဘိုး​​ တခုထဲပါ။ အဲဒီမူကို​ အ​ေြကာင်း​ြပြပီး​ ြမန်မာစာမှာ ပင့်​​ ရစ်​ ဆွဲ​ ထိုး​​ ပါ​ မလာပါဘူး​။ အ​ေြကာင်း​က ပင့်​ရစ်ဆွဲထိုး​ဟာ ရ​ ယ​ ဝ​ ဟ ​ေတွကို ထပ်​ ထား​တယ်လို့​​ အ​ေြကာင်း​​ ြပပါတယ်။ အဲဒီဟာဟာ ြမန်မာ​ ပါဋိမှာ လံုး​ဝ အတိအကျကို​ မှန်ပါတယ်။ roman pali နဲ့​ ြမန်မာ​ ပါဋိ​ အ​ေြပာင်း​မှာ ြကည့်​ရင် ဒီ​ အတိုင်း​ပါဘဲ ဒီမှာတင် တဝက်တပျက်သာ​ သိတဲ့​ နိုင်ငံြခား​သား​​ေတွက ြမန်မာစာကို ြမန်မာ​ အက္ခရာသံုး​​ ပါဋိနဲ့​​ အတူတူ​ မှတ်ထင်ခဲ့​ြကပါတယ်။ တကယ်​ေတာ့​ ပါဋိမှာ အသတ်​ ဆိုတာမရှိပါဘူး​ အသံကို​ အ​ေြခခံတဲ့​​ စနစ်​ ြပီြပီ ဗျည်း​ရှိရင်​ သရပါရမယ် မပါရင် အထပ်ဘဲ ဆိုတဲ့​ စနစ်​ ကိုသံုး​တယ်။ ြပီး​​ေတာ့​ ဗျည်း​ ၃၂လံုး​ သရ ၈လံုး​ နိဂဟိတ် ၁လံုး​ဘဲ ပါတယ်။ ြမန်မာမှာလို ​ေနာက်ထိုး​ြပင် မရှိဘူး​ အသတ်​ မရှိဘူး​ ​ေ-ာ နဲ့​ ​ေ-ာ် မရှိဘူး​။ အဲဒီ​ေတာ့​​ ဘာြဖစ်ကုန်လဲ​ ဆို​ေတာ့​ (အြမန်)​ ဆိုတဲ့​စာလံုး​ကို ( အရ် မန်) လို့​​ သိမ်း​တာခံရတယ် တကယ်​ေတာ့​ ( အ + ြမ+ -န်) ြဖစ်ရမှာ ဆိုလိုတာက ပါဋိလို ဗျည်း​+သရ မဟုတ်ဘဲ ြမန်မာက ဗျည်း​+ဗျည်း​တွဲ+သရ+အသတ် ြဖစ်​ေနလို့​ဘဲ။ ဘာဘဲ​ေြပာ​ေြပာ ြဖစ်​ေအာင်​ ​ေရး​ရင်​ေတာ့​ ြဖစ်တယ်လို​ ဆို​ေပမဲ့​ ​ေနာင် ​ေခတ်​ အဆက်ဆက် သံုး​ရမယ့်​ ြပင်​ မရ​ေတာ့​မဲ့​ standard ြကီး​မှာ unicode rule ြဖစ်တဲ့​ မူရင်း​​ တန်ဘိုး​ဆိုတာနဲ့​ မကိုက်လို့​ လက်မခံတာဟာ ကိုယ့်​​ တိုင်း​ြပည်​ ကိုယ့်​လူမျိုး​​ အတွက် ြမန်မာစာအ​ ​ေြကာင်း​ကို ြမန်မာလို​ ​ေြပာမရလို အဂင်္လိပ်လို​ ြပိုင်ြငင်း​တာ မနိုင်လို ့​ အ​ေလျာ့​​ ​ေပး​တာမျိုး​နဲ့​​ေတာ့​ လက်မခံနိုင်ဘူး​။ ဆိုလိုတာ မြငိမ်​ေလာက်​ေသး​ဘူး​​ လို့​တွက်တယ်။


တဖက်မှာလဲ ြမန်မာစာ digitalization process ​ေတွအရ တခုခုကို​ သံုး​မှရမဲ့​ ​ေတာင်း​ဆိုလာတဲ့​ အချိန်ကို​ ​ေရာက်ြပီ။ ​ေနာက်​ ြပဿနာတခုက အခု​ ​ေခတ်စက်​ေတွလို rander က အလိုလို​ မရဘူး​ usb10.dll ဆိုတဲ့​ uniscript က စက်​ေတွတိုင်မှာမရှိသလို အလွယ်တကူထည​ ့်​မရခဲ့​ဘူး​။ နိုင်ငံ​ေတာ်က ဒါမှမဟုတ် အဖွဲ့​အစည်း​တခုက တရား​ဝင်​ သံုး​စွဲစရာ ​ေဖာင်စနစ် မရှိခင်မှာ ​ေဇာ်ဂျီကို​ စသံုး​စွဲလာခဲ့​ရတာပါ။ standard သံုး​ရတဲ့​​ အချိန်​ေစာင့်​ရင်း​ ဆိုြပီး​ သံုး​ခဲ့​ြကတာြဖစ်လို့​ ယာယီ​ ဆိုတာ​ေတာ့​​ အား​လံုး​​ သိြကပါတယ်။ ဘယ်သူကမှ​ ဇွတ်တိုက် မသံုး​ခိုင်း​ပါဘူး​၊ ​ေဇာ်ဂျီ​ ​ေပါ်ြပီး​မှ myanmar1 ထွက်လာတယ် တရား​ဝင်​ အစိုး​ရသံုး​​ သတ်မှတ်တယ် ​ေနာက် ​ေနြပည်​ေတာ်က စက်​ ၃၀ စသံုး​ဖို ့​ computer အဖွဲ့​ချုပ်က ပညာရှင်များ​စွာ​ လွတ်ြပီး​​ အခိျန်ယူ install လုပ်ခဲ့​ြကရတယ် သင်တန်း​​ေတွ​ ​ေပး​ခဲ့​ြကရတယ်။ ဆိုလိုတာ လွယ်လွယ်သံုး​ဖို ့​ခက်ခဲ​ ခဲ့​ သလို အချို့​​ စာလံုး​​ေတွ​ သံုး​မရတာ​ေတွ​ေြကာင့်​ ြပင်ဆင်​ ရမယ်ဆိုတာ ​ေပါ်လာတယ်။ ပင့်​ရစ်ဆွဲထိုး​ ထည့်​ဖို ့​ လုပ်လာြကတယ်။ ြမန်မာစာ​ေတွ သံုး​တဲ့​ အလုပ်​ေတွအတွက် ဒါ​ေတွကို​ေစာင့်​​ေနရင် ​ေနှာင့်​​ေနှး​​ နိုင်တာ​ေြကာင့်​ ​ေဇာ်ဂျီနဲ့​ ဘဲ သံုး​ခဲ့​တယ် ​ေဇာ်ဂျီဟာ သူ့​အရင်ထွက်တဲ့​ standard ထဲက storage ကိုလိုက်နာြပီး​ rander စက်တိုင်း​နဲ့​​ မ​ေြပလည်တာကို​ ​ေြဖရှင်း​ထား​ယံုဆိုတာ သိ​ေပမဲ့​ အချိန်မ​ေရွး​ data ​ေတွကို​ေြပာင်း​လိုရတယ် ဆိုတာနဲ့​ ​ေစာင့်​စား​ရင်း​သံုး​​ေနတဲ့​သ​ေဘာထက်မပိုပါဘူး​။
​ေဇာ်ဂျီ ၅.၁ ထွက်လာဖို့​က​ေတာ့​ 5.1 ဟာ storage သာ standard လုပ်ထား​​ေပး​ြပီး​ encode , decode အတွက် white paper ​ေတွ standard ​ေတွမရှိလို ့​ အခု​ေတာင် 5.1 data ​ေတွကို myanmar 3, ပိ​ေတာက် ပရပိုက် mymyanmar ​ေတွမှာ တခုမှာ အမှန်​ေပါ်ရင် ​ေနာက်တခုမှာ​ လွဲ​ေနတာ​ေတွ ရှိ​ေနပါ​ေသး​တယ်။ ဒါ​ေတွ အဆင်​ေြပဖို ့​ ​ေဇာ်ဂျီက ဗီလိမ်​ အ​ေန နဲ့​​ တွန်း​အား​​ မ​ေပး​ရင် ဘယ်​ေတာ့​မှြပီး​မှာ​ မဟုတ်ဘူး​လို့​ြမင်ပါတယ်။


​ေဇာ်ဂျီဟာ internet ​ေပါ်မှာ အသံုး​​ ဘယ်​ေလာက်များ​များ​ ascii နဲ့​ DTP market ကို မဝင်နိုင်မ​ေြပာင်း​နိုင်ခဲ့​ပါဘူး​။ နယ်သစ်မှာသာ ​ေနခဲ့​ရပါတယ်။ ြမန်မာ စာအုပ်​ေတွ အချက်အလက်​ေတွဟာ prnter မှာ လှလှပပထွက်ဖို ့​ standard မရှိတဲ့​ ascii ​ေတွ​ေပါ်မှာဘဲ​ မှီ​ေနတာကို လံုး​ဝ​ မသက်​ေရာက်နိုင်ခဲ့​ပါဘူး​။ ဘာလို့​လဲဆို​ေတာ့​ ဘယ်သူကိုမှ​ ဇွတ်မသံုး​ခိုင်း​ပါဘူး​ အဆင်​ေြပ​ သလိုသံုး​​ေနြကတာပါ။ ဒါ​ေပမဲ့​ MS Office လို စတာ​ေတွမှာ ​ေဖာင့်​ရှိရင် myanmar1 ​ေရာ 5.1 ​ေရာ ​ေဇာ်ဂျီ​ေရာ အ​ေနှာက်အယှက်​ မရှိသံုး​နိုင်တာ​ အ​ေသအချာပါ။ တခါတရံ​ ​ေဇာ်ဂျီ​ မသံုး​​ေအာင်​ ချိမ်း​​ေြခာက်တဲ့​အ​ေနတဲ့​ default ကို​ေြပာင်း​ြပီး​​ မရ​ေအာင်​ လုပ်တာ​ေတွ မပါခဲ့​ရင်ပါ။
၅.၁ ကို ြကိုဆိုပါတယ် တခု​ေတာ့​ရှိတယ် တကယ်​ သံုး​လို့​ရြက​ေအာင် လုပ်​ေပး​ဖို ့​လိုပါမယ်။ ​ေဇာ်ဂျီ​ သမား​​ေတွ​ ​ေြပာင်း​သံုး​​ ​ေစချင်ရင် ဘာပို​ သာမလဲ​ ဆိုတဲ့​ စည်း​ရံုး​မှုရယ် မိုက်ဂ​ေရး​ရှင်း​​ ကိစ္စ​ေတွရယ် နဲ့​မဆွဲ​ေဆာင်ရင် မြဖစ်နိုင်ပါဘူး​။ နှစ်​ေပါင်း​များ​စွာ ပျိုး​​ေထာင်ထား​တဲ့​ အချက်အလက်​ေတွကို customer service အြမင်နဲ့​ မြကည်ဘဲ မင်း​တို့​ သံုး​တာတလွဲြကီး​ အဲဒါ​ေြကာင့်​ မင်း​လုပ်ထား​​ သမှျ​ သွား​ြပီဆိုတဲ့​ သ​ေဘာနဲ့​ ဆရာြကီး​​ ဝင်လုပ်ရင် အများ​စု​ မ​ေြပာင်း​မှာ​ ​ေသချာပါတယ်။


ကမ္ဘာမှာ ​ေနရာတိုင်း​မှာ standard ​ေတွအများ​ြကီး​ပါ လိုက်နာရင်​ ဘယ်​ေလာက်​ အြကိုး​​ ရှိမယ်ဆိုတာနဲ့​ဘဲ စည်း​ရံုး​​ ဆွဲ​ေဆာင်​ေနြကပါတယ်။ ဘာမှ​ ထူး​​ေအာင်လုပ်​ မ​ေပး​နိုင်ဘဲနဲ့​ ငါမ​ေအာင်ြမင်တာ​ သူ​ေြကာင့်​ဆိုြပီး​ ပတ်ရမ်း​တဲ့​​ နည်း​ဟာ အလုပ်ြဖစ်မယ်​ မထင်ပါ။ ကွျန်​ေတာတို့​က ​ေစာင့်​ြကည့်​​ေနတဲ့​ ​ေနရာမှာဘဲရှိပါတယ်။ တခု​ေတာ့​ရှိတယ် ​ေဆး​မှင်ရည်​ စုတ်ထိုး​ ဆိုတာထက် ပိုဖျက်ရခက်တဲ့​ standard ဆိုတာြကီး​ကို ြပီး​ြပီး​​ေရာ​ မစမ်း​သပ်ဘဲ အြမန် လုပ်ချပစ်သင့်​​ သလား​​ ဆိုတာပါဘဲ။ ၄.၁​ ​ြဖစ်​တဲ့​​ myanmar1 မှာ သခင်္န်း​စာယူသင့်​တယ်။


http://www.myanmaritpro.com/profiles/blog/show?id=1445004%3ABlogPost%3A83518&page=2#comments

ကို​ရဲ​ြမတ်​သူ​ရဲ့​Standard​အ​ေပါ်​သ​ေဘာ​ထား​

ကွျန်​ေတာ်​ေဖာင်လုပ်သူြမန်မာစာထွင်သူမဟုတ်ပါ။ သို့​​ေသာ် ြမန်မ​​ာ ြဖစ်ြပီး​ ြမန်မာစာကို​ ချစ်ပါသည်။ ြမန်မာစာ​ ​ေသမည် အ​ေရး​မပါ​ အ​ေရး​မြကီး​​ ဆိုလျင် စတန်း​ဒတ်ကိုလဲ​ ​ေမျာ်စရာ​ မလို​ေတာ့​ဟု​ ထင်ပါသည်။ ပတ်ဝန်း​ကျင်ကို​ ကွျန်​ေတာ်ြမင်တာက အ​ြခား​​သူ​​ေတွ​နဲ့​​​ ြခား​နား​​ေကာင်း​​ ြခား​နား​​ နိုင်ပါတယ်။ Globalization ​ေခတ်မှာ wave ​ေတွ​ တက်လာပါသည် အဆင်သင့်​​ ြဖစ်သည်​ ြဖစ်​ေစ မြဖစ်သည်​ ြဖစ်​ေစ ရိုက်ခတ်တတ်​ ပါတယ်။ ဂျပန် တရုပ် ယိုး​ဒယား​​ေတွမှာ သူဘာသာ အတွက် အများ​ြကီး​​ ြပင်ဆင်ြပီး​ ပါဝင်​ ခဲ့​ြက​ တာ​ေတွခဲ့​ရတယ်။ ြမန်မာ​ အင်အား​မှာ ြမန်မာ​ေတွ​ ကျန်ခဲ့​လို့​ရမှာလား​​ ဆိုတာ​ စဉ်း​စား​စရာပါ။ local content မဖွံ့​ြဖိုး​ဘဲ ဘယ်လို​ လုပ်မလဲ​ ဆိုတာလဲ တွက်ရပါတယ်။


ကွန်ပျူတာကို ြမန်မာ​ မီနူး​​ေတွနဲ့​​ သံုး​တာ​ ကွျန်​ေတာ်လဲ​ စိတ်​ မဝင်စား​ပါဘူး​။ သို ့​​ေသာ် ြမန်မာ​ေတွရဲ့​ ​ေရှး​​ေခတ်​ အဆက်ဆက်က အချက်အလက်​ေတွ က ကွျန်​ေတာ်​ အ​ေပျာက်​ မခံနိုုင်ပါဘူး​။ ကိုယ့်​​ အမျိုး​​ ဘာသာ​ သာဿနာကို ထိမ်း​တာ ကွျန်​ေတာ်​ တဦး​ထဲ​ အြမင်မှာ ​ေငွရှာတာ လခ​ေကာင်း​တာ ရာထူး​ြကီး​တာ​ ထက် ပိုမက်မိလို့​​ လုပ်​ေနတာပါ။ Standard က အ​ေရး​ြကီး​တာ လက်ခံပါတယ် 4.1 လဲ Standard ပါ​၊​ 5.1 ​ေြပာင်း​လို့​ အလကား​​ ြဖစ်သွား​ရင် 6.1 ​ေြပာင်း​ရင်​ေရာ 5.1 အလကား​​ ြဖစ်သွား​ဦး​မှာလား​​ ​ေမး​ဖို ့​ရှိပါတယ်။ ြမန်မာစာ​ ဒီလို​ မတည်ြငိမ်ရင် ြဖစ်မလား​။ တည်ြငိမ်မယ်​ ဆိုရင် လဲ တကယ်​ အ​ေကာင်း​ဆံုး​​ တခုနဲ့​ဘဲ​ တည်ြငိမ်​ ​ေစချင်လို့​ လို​ေနတာ​ေတွ​ ထည့်​​ေစဖို ့​ ြပုြပင်တာ​ေတွ စနစ်ကျဖို့​​ ြပန်​ ​ေဆွး​​ေနွး​​ေနတာ၊ ကွျန်​ေတာ်​ တို ့​မှာ သင်ပုန်း​ြကီး​ရှိတယ် စနစ်ရှိတယ် ကွန်ပျုတာ​ ​ေြပာင်း​ရင် အပျက်ခံမှာလား​​ ဆိုတာ​ေတွ​ ရှိတယ်။ ခံသင်ရင် ခံရမှာဘဲ​ ဆိုရင် ​ေဇာ်ဂျီကလဲ လိုက်သင့်​မှ​ လိုက်မှာဘဲ ၊ ​ေနာက်​ေဇာ်ဂျီ​ သံုး​​ေနသူ​ေတွက ကွျန်​ေတာ်​ သံုး​ခိုင်း​တာ​ လိုက်သံုး​ရ​ေအာင် ပါဝါ​ ကွျန်​ေတာ်မှာလဲ​ မရှိဘူး​၊ 5.1 သံုး​ြက​ေစ ပံု/------- ဆိုလို့​​ များ​ရမယ်​ ထင်​ေနလို့​လား​။ ြဖစ်သင့်​တာက တကယ်​ေကာင်း​​ေအာင် လုပ် တကယ် အား​ကိုး​ရရင် အလုပ်ြပတာ​ေတွ မဟုတ်ဘဲ​ တကယ်​ လုပ်ြပ​ နိုင်ရင် သံုး​သူသူ့​ဟာ​ သူ​ေရွး​မှာဘဲ။ ကွျန်​ေတာ်​ အ​ေနနဲ့​က​ေတာ့​ ြမန်မာ​ အချက်အလက်​ေတွ အ​ေပါ်မှာ​ ရှိ​ေစချင်တယ် ဘယ်လိုဘဲ​ ရှိရှိ ဘယ်လို​ ရှာရင်​ေတွ့​​ေတွ့​။ ၊ ဒါ​ေတွကို မညီလို့​​ မရှိ​ေစရ​ ဆိုရင်​ေတာ့​ ကာကွယ်ရမှာဘဲ။


migration မလုပ်ဘဲ ဘာသာ​ စကား​​ ​ေြပာင်း​တယ်​ ဆိုတာ​ မရှိဘူး​။


​ေလာ​ေလာဆယ် standard ြဖစ်မှာ ရှာ​ေပး​မယ်လို့​​ မစား​ရ​ ဝခမန်း​​ ​ေြပာြကတယ် ဘာစာလံုး​​ စာရင်း​မှ​ ဘယ်သူမှ​ ဝိုင်း​​ေရး​ြပီး​ မြပုစုထား​ဘူး​ ရှိ​ေနလဲ​ တချို့​အဖွဲ့​​ေတွ အများ​​ မသိ​ေအာင်​ အတွင်း​မှာ​ ထား​တယ်။ အဲဒီလိုနဲ့​ ဘယ်သူက search index ြဖစ်လာ​ေစမှာတုန်း​။ ခုဘာြဖစ်လဲ google က Ngram stat သံုး​ြပီး​ အင်တာနက်​ အသံုး​များ​​ စနစ်နဲ့​ စာလံုး​​ေတွ​ ချလိုက်​ေတာ့​ ၉၀%​ ​ေကျာ်တဲ့​​ ​ေဇာ်ဂျီဘဲ ရှာရ​ေနတယ်။ sorting ရမယ်​ ြမူဆွယ်တယ် လက်​ေတွ ့​ ဘာမှ​ မထူး​ဘူး​။ နည်း​ပညာ​ မကူရင် ဘယ်ဟာမှ အလိုလို​ မရသလို ကူရင် အား​လံုး​​ လုပ်ရတယ်။ Agree to disagree အရ လွတ်လပ်စွာ​ သ​ေဘာ​ ကွဲလွဲလို့​​ ရပါတယ်။ အြမင်ြခင်း​​ က​ေတာ့​ တူမှာမဟုတ်ပ့​ါဘူး​။ တခု​ေတာ့​​ စဉ်း​စား​ရမှာက ရိုက်ညီ​ေနာင်​ တီထွင်တဲ့​​ ​ေလယာဉ်က အခု​ေခတ် ခတ်စုတ်စုတ်​ ​ေလယာဉ်​ေလာက်​ ​ေကာင်း​မှာ​ မဟုတ်ဘူး​၊ သူ​ေခတ်နဲ့​​ သူြဖစ်လာတာ အား​လံုး​​ ဆရာြကီး​​ လုပ်ြပီး​ အဆံုး​အြဖတ်​ေပး​သူ​ ​ေနရာမှာ​ မ​ေနဘဲ လို​ေတနာ​ေတွ ရှာဖို ့​ ပို​ေကာင်း​​ေအာင်​ လုပ်ဖို ့​ အ​ေြဖရှာဖို ့​ကို စစဉ်း​စား​ရင် ​ေတာ့​ ရိုက်ညီ​ေနာင်တဲ့​​ ​ေကာင်း​တာ​ ြဖစ်လာမှာဘဲ အြဖစ်​ မရှိတာ​ေတွကို ​ေတွ့​ရာ​ လူ​ အြပစ်ပံုချြပီး​ ဆင်​ေြခ​ေပး​​ လက်ြငိုး​​ ဝိုင်ထိုး​​ ​ေနလို​ေတာ့​ ဘာအ​ေြဖမှ​ မထွက်ဘူး​။ နည်း​ပညာက solution ကို ပန့်​ပိုး​သင့်​တာ ။ ကွျန်​ေတာ့်​ထက် ပိုသိ ပိုတတ်တဲ့​​ ပညာရှင်​ေတွ အများ​ြကီး​ဘဲ ဘာလို့​ ​ေကာင်း​တာ​ေတွက ထပ်မ​ေပါ်​ လာရတာတုန်း​ ကွျန်​ေတာ်​ ​ေတာ့​​​ အား​မရဘူး​။


​ေနာက်တခု​ ​ေြပာချင်တာက တချိန်က ယဉ်​ေကျး​မှု့​​ ​ေတာ်လှန်​ေရး​မှာ အြပင်​ေရာက်သွား​တဲ့​ တရုတ်​ေတွ တရုပ်​ အြဖစ်နဲ့​ ဆက်ရှိ​ ​ေနနိုင်လို ့​ အခု​ တရုပ်ြပည်ြကီး​​ ြပန်တာက်လာတာ လိှုင်း​​ရိုက်တာ ကို လည်စင်း​ခံရင် လူမျိုး​ပါ​ ​ေပျာက်သွား​​ လိမ့်​မယ်။ ြမန်ြပည်မှာ ကွျန်ပျူတာ​ ဘယ်နှစ်​ေယာက်​ သံုး​တာ ဆိုတာထက် ၂၀၀၁ က စြပီး​ နှစ်စဉ်​ တိုး​တဲ့​နှံုး​ ကမ္ဘာမှာ ြမန်မာ​ အြမန်ဆံုး​ ​ေနာက် ြပည်ပ​ ြမန်မာမှာ ယိုး​ဒယား​မှာ ြမန်မာ ၃-၄ သန်း​ရှိတယ် ၇၀% ဖုန်း​ရှိြပီး​ ၂၀% ကွန်ပျူတာ​ သံုး​တယ် စကင်္ာပူမှာ တရား​ဝင်​ လုပ်ကိုင်သူ ၄၀၀၀၀ ​ေကျာ်ရှိြပီး​ ​ေကျာင်း​သား​​ေရာ အြခား​​ေပါင်း​ရင် ၁​ သိန်း​​ ​ေကျာ်တယ် ၆၀%​ က သံုး​နိုင်တယ် မ​ေလး​မှာ ြမန်မာ​ ၆​ သိန်း​​ ​ေကျာ်ရှိတယ် ၂၀% ဘဲထား​ ဂျပန် မှာလဲ​ သံုး​နိုင်​ သူများ​တယ် ထိုင်ဝမ်မှာ ၁​ သိန်း​​ေကျာ်​ ရှိြပီး​ ၅၀% က အသာ​ေလး​သံုး​နိုင်တယ်။ ဥ​ေရာပ ဒူဘိုင်း​ ကိုရီး​ယား​ အ​ေမရိက ​ေအာ်ဇီမှာလဲ အများ​ြကီး​ဘဲ သိထား​ဖို ့​က အင်တာနက်သံုး​​ ြမန်မာ​ေတွမှာ အလုပ်အြပင် အြခား​ လိုအပ်ချက်​ေတွ​ ရှိတယ် ကိုယ့်​စာနဲ့​မှ​ ကိုယ်​ အဆင်​ေြပတာ​ေတွ​ အများ​ြကီး​ဘဲ။ ​ေနွး​​ေထွး​မှု​ေတွ စိတ်​ ခံစား​ချက်​ေတွ ဖလှယ်ရာမှာ ကိုယ်ြဖစ်တည်မှု​ ဂုဏ်ယူရာမှာ ဘာသာ​ စကား​​ မရှိလို့​မရဘူး​။


လမ်း​ထိပ်မှာ မုန့်​ဟင်း​ခါး​​ ဆိုင်ရှိတာ မုန်ဟင်း​ခါး​​ စား​သူ​ေတွ​ အတွက်လိုဘဲ ကွျန်​ေတာ်​ ြမန်မာစာ​ေတွ အ​ေပါ်မှာ​ ရှိ​ေစချင်တာ လိုအပ်​ ​ေနသူ​ အတွက် စိတ်မဝင်စား​ရင် ​ေတာ့​ လာ​ မသံုး​နဲ့​​ေပါ့​။ သို့​​ေသာ် အင်တာနက်သံုး​သူ​ တသန်း​​ မြပည့်​လို့​ မလုပ်ဘူး​​ ဆိုတာ​ေတာ့​​ မရှိဘူး​။ နှစ်​ေပါင်း​​ များ​စွာသမိုင်း​ရှိတဲ့​​ အချက်အလက်​ေတွ ​ေကျး​ဇူး​ြကီး​တဲ့​​ ဘာသာ​ေရး​​ အဆံုး​အမ​ေတွ မ​ေပျာက်ဖို ့​ ကိုယ့်​​ ယံုြကည်ချက်နဲ့​​ ကိုယ်လုပ်​ ​ေနတာပါ။ ကွျန်ပျူတာ​ တတ်ချင် အဂံလိပ်စာ​ သင်ပါဆိုတဲ့​မူ​ ကို​ေတာ့​​ လက်ခံပါတယ်။ ြမန်မစာ​ေတာ့​ ကွျန်​ေတာ်​ေသသည်​ အထိ​ေတာ့​ အ​ေပျာက်မခံနိုင်သလို ​ေပျာက်မယ်လဲ​ မထင်​ေသး​ပါဘူး​။ ဘာလို့​လဲဆို​ေတာ့​ ကွျန်​ေတာ်က အဂင်္လိပ်စာ​ ညံ့​တယ်။



http://www.myanmaritpro.com/profiles/blog/show?id=1445004%3ABlogPost%3A83518&page=2#comments

Unicode is a Code?

Unicode is a Code and that is why it's called UniCode in the first place.

by Ravi Chhabra on July 17, 2009 at 6:08am






[caption id="attachment_68" align="aligncenter" width="502" caption="Unicode is a Code"]Unicode is a Code[/caption]

(http://www.myanmaritpro.com/forum/topics/1445004:Topic:143672?commentId=1445004%3AComment%3A143866)

ယူနီကုဒ် ဆုိတာ​ဘာ​လဲ​?



ကွန်ပျူတာတွင် ယူနီကုဒ်သည် ကမ္ဘာ​ေပါ်ရှိ စာ​ေရး​စနစ် (writting system) အား​လံုး​နီး​ပါး​ ပါရှိြပီး​ ကွန်ပျူတာများ​နှင့​် လုိက်​ေရာညီ​ေထွ ရှိ​ေစ​ေရး​အတွက် သက်မှတ်ထား​​ေသာ စက်မှုစံ (industry standard) တစ်ခုြဖစ်သည်။ Universal Character Set စံ နှင်အတူ ယူနီကုဒ်စံ သည် အက္ခရာ​ေပါင်း​ ၁၀၀ ၀၀၀ ​ေကျာ်ပါ​ေသာ စာအုပ် ထုတ်​ေဝခဲ့​သည်။

ထုိစံစာအုပ်တွင် ကုိး​ကား​ရန် ဇယား​များ​၊ encoding နည်း​စဥ်များ​၊ character encoding စံများ​၊ အက္ခရာ၏ သ​ေဘာသဘာဝများ​ (ဥပမာ စာလံုး​ြကီး​၊ စာလံုး​​ေသး​)၊ အ​ေထာက်အကူြပု computer file များ​၊ အြခား​ သက်ဆုိင်ရာများ​ (အက္ခရာသ​ေဘာ၊ normalization ဥပ​ေဒ၊ ခဲွြခင်း​၊ ​ေပါင်း​ြခင်း​၊ rendering နှင် နှစ်ဖက်သွား​ စာများ​၏ အစဥ်၊ ဘယ်ညာ သ​ေဘာများ​၊ စသည့​်) ပါရှိသည်။

အြမတ်မယူ အသင်း​အဖွဲ့​ ြဖစ်​ေသာ Unicode Consortium သည် ယူနီကုဒ် ရှင်သန်တုိး​တက်​ေရး​အတွက် ြကိုး​စား​မှုတွင် ရှိြပီး​ character encoding အား​လံုး​ကုိ ယူနီကုဒ် ြဖင့​်အစား​ထုိး​သွား​ရန် ရည်ရွယ်သည်။ ယူနီကုဒ် ၏ Unicode Transformation Format (UTF) scheme များ​တွင် ရှိြပီး​ encoding နည်း​များ​သည် ဘာသာစံု (multilingual) အတွက် လုိအပ်လျက်ရှိသည်။

ဘာသာစံု ပါဝင်​ေသာ ယူနီကုဒ် ၏ ​ေအာင်ြမင်မှု​ေြကာင့​် computer software ကုိ internationalization and localization လုပ်ရာတွင် များ​စွာ အသံုး​ချလျက်ရှိသည်။ ယူနီကုဒ်စံစနစ်ကုိ ယခု ​ေပါ်​ေပါက်​ေန​ေသာ XML၊ Java programming language၊ Microsoft .NET Framework နှင့​် ​ေခတ်​ေပါ် operating system များ​တွင် အသံုး​ချလျက်ရှိသည်။

ယူနီကုဒ်စံစနစ်ကုိ အသံုး​ြပုရာတွင် character encoding မျုိး​စံု အသံုး​ြပုနုိင်သည်။ အသံုး​အများ​ဆံုး​မှာ UTF-8 (1 byte ကုိ ASCII အက္ခရာ အတွက် နှင့​် ၄ byte အထိ ကျန် ​ေနများ​ကုိ အြခား​ အက္ခရာ အတွက်)၊ မသံုး​​ေတာ့​​ေသာ UCS-2 (2 bytes ကုိ အက္ခရာ အား​လံုး​အတွက် သုိ့​​ေသာ် ယူနီကုဒ် အက္ခရာ အား​လံုး​မပါ) နှင့​် UTF-16 (၄ bytes သံုး​ြပီး​ UCS-2 ကုိ ထက်ဆင့​်၍ ကျန်ရှိ​ေန​ေသး​​ေသာ ယူနီကုဒ် အက္ခရာ များ​ကုိ ထည့​်သွင်း​) ြဖစ်ြကသည်။

အစဦး​ နှင့​် တုိး​တက်​ေြပာင်း​လဲြခင်း​

ယူနီကုဒ်သည် ​ေရှး​ရုိး​ သံုး​လာခဲ့​ြက​ေသာ စာလံုး​ သိမ်း​ဆည်း​ပံု (character encoding) များ​၊ ISO 8859 စံ များ​ ကုိ ကျယ်ကျယ်ြပန့်​ြပန့်​ သတ်မှတ်လုိသည်။ ISO 8859 စံ သည် နုိင်ငံ​ေပါင်း​များ​စွာ၏ အသံုး​အနှုန်း​များ​ ကုိ သတ်မှတ်နုိင်ခဲ့​​ေသာ်လည်း​ တစ်ခုနှင့​်တစ်ခု ​ေြပာင်း​လဲ၍ (incompatible) သံုး​နှုန်း​မရ​ေပ။ များ​စွာ​ေသာ ​ေရှး​ရုိး​ရာ စာလံုး​ သိမ်း​ဆည်း​ပံု၏ ​ေတွ့​​ေနကျ ြပသနာမှာ ဘာသာနှစ်မျုိး​ ရရန် ြပုလုပ်ြခင်း​ (များ​​ေသာအား​ြဖင့​် Roman characters နှင် ​ေဒသစာ) တွင် ဘာသာမျုိး​စံု အတွက်မပါ​ေပ။

ယူနီကုဒ်သည် သ​ေဘာအား​ြဖင့​် စာလံုး​ပံု (glyph) များ​ကုိ ထက် အ​ေြခခံ စာလံုး​ (character) များ​ — graphemes and grapheme-like units — ကုိ သိမ်း​ဆည်း​ထား​သည်။ တရုတ်စာတွင် အ​ေြခခံ စာလံုး​ နှင် စာလံုး​ပံု တုိ့​ကုိခဲွြခား​ရန် ခက်ခဲသည်။

စာများ​ကုိ တွက်ချက်ြခင်း​ (text processing) တွင် ယူနီကုဒ်သည် စာလံုး​တုိင်း​အတွက် အတုမရှိ​ေသာ စာခွက် (code point) — စာလံုး​ပံု အစား​ နံပါတ်တစ်ခု — ရှိ​ေရး​ တာဝန်ယူသည်။ တစ်နည်း​အား​ြဖင့​် ယူနီကုဒ်သည် စာလံုး​များ​ကုိ မူရင်း​သဘာဝ (an abstract way) ကုိကုိယ်စား​ြပုြပီး​ ပံု​ေဖာ်ရန် အတွက်ကုိမူ (အရွယ်၊ ပံု၊ ​ေဖာင့​် (သုိ့​) သဏ္ဍာန်) software (web browser, word processor) ၏တာဝန်အြဖစ် ချန်ထား​ခဲ့​သည်။ ထုိမှျရှင်း​လင်း​​ေသာ ြကိုး​စား​မှုပင် ရှုပ်​ေထွး​ရ​ေသာ အ​ေြကာင်း​မှာ ယူနီကုဒ် ဒီဇုိင်း​ြပုသူများ​ ယူနီကုဒ် ကျယ်ြပန့်​စွာ အသံုး​ြပု​ေရး​ ြကိုး​ပမ်း​မှုတွင် သ​ေဘာတူညီမှု မရနုိင်ြခင်း​တုိ့​​ေြကာင့​်ြဖစ်သည်။

ယူနီကုဒ်၏ ပဋ္ဌမ ၂၅၆ လံုး​မှာ ISO 8859-1 နှင့​် တူ​ေသာ​ေြကာင့​် ရှိြပီး​ အ​ေနာက်နုိင်ငံမှ စာများ​အတွက် အခက်အခဲ မရှိ​ေပ။ များ​စွာ​ေသာ အတူတူ စာလံုး​များ​ကုိ မတူ​ေသာ စာခွက်များ​တွင် သက်မှတ်ြခင်း​မှာ ရှိြပီး​ စာလံုး​ သိမ်း​ဆည်း​ပံု နှင့​် အဆင်​ေြပ​ေစရန် ြဖစ်သည်။ ထုိ့​​ေြကာင့​် ရှိြပီး​စာ များ​မှ ယူနီကုဒ်ကုိ ​ေြပာင်း​ရာတွင် မှား​ယံင်း​မှု မရှိနုိင်​ေပ။

သမုိင်း​

ယူနီကုဒ် သမုိင်း​ကုိ ၁၉၈၇ ခု Xerox မှ Joe Becker နှင့​် Apple မှ Lee Collins and Mark Davis တုိ့​က အြပည်ြပည်ဆုိင်ရာ စာလံုး​ စနစ် ြဖစ်နုိင်​ေြခကုိ စတင် စူး​စမ်း​ခဲ့​သည်။ ထုိနှစ် ြသဂုတ်လတွင် Joe Becker သည်
international/multilingual text character encoding system, tentatively called Unicode.

စာတမ်း​ကုိ ထုတ်​ေဝခဲ့​သည်။ Unicode 88 ​ေခါင်း​စဥ်ရှိ​ေသာ ထုိစာတန်း​၏ ၁၆ ဘစ် (bit) အ​ေြခြပု စာလံုး​ မုိဒယ်တွင် Unicode is intended to address the need for a workable, reliable world text encoding. Unicode could be roughly described as "wide-body ASCII" that has been stretched to 16 bits to encompass the characters of all the world's living languages. In a properly engineered design, 16 bits per character are more than sufficient for this purpose.ဟု​ေဖါ်ြပခဲ့​သည်။ မူလ ၁၆ ဘစ် (bit) အ​ေြခြပု စာလံုး​ မုိဒယ်သည် ယခု သံုး​စွဲ​ေန​ေသာ စာ​ေရး​စနစ် များ​ကုိသာ စဥ်း​စား​ခဲ့​သည်။ သုိ့​​ေသာ ယခုသံုး​​ေန​ေသာ စာလံုး​များ​မှာ
Unicode gives higher priority to ensuring utility for the future than to preserving past antiquities. Unicode aims in the first instance at the characters published in modern text (e.g. in the union of all newspapers and magazines printed in the world in 1988), whose number is undoubtedly far below 214 = 16,384. Beyond those modern-use characters, all others may be defined to be obsolete or rare; these are better candidates for private-use registration than for congesting the public list of generally-useful Unicodes.

ဟု သံုး​သပ်ခဲ့​သည်။ ဆုိလုိသည်မှာ ​ေရှး​စာနှင့​် အသံုး​များ​​ေသာ စာလံုး​များ​ပါ ယူနီကုဒ် တွင် ပါဝင်ရန်လုိအပ်ခဲ့​သည်။
From Myanmar Online Encyclopedia

ြမန်မာ ယူနီကုဒ် ဆိုသည်မှာ



ြမန်မာအက္ခရာတစ်လံုး​ချင်း​စီအတွက် သီး​ြခား​သတ်မှတ်​ေပး​ထား​​ေသာ တိကျသည့​် ဘံုသံုး​စနစ် (U 1000 မှ U 109F အတွင်း​ရှိ အက္ခရာများ​)

ယူနီကုဒ် (Unicode) ဆိုသည်မှာ နိုင်ငံနှင့​်လူမျိုး​တိုင်း​တွင် အသံုး​ြပုလျက်ရှိ​ေသာ အက္ခရာစာလံုး​များ​အတွက်

  • မည်သည့​် Platform တွင် ြဖစ်​ေစ

  • မည်သည့​် Program တွင် ြဖစ်​ေစ

  • မည်သည့​် ဘာသာစကား​ language တွင် ြဖစ်​ေစ


သီး​ြခား​သတ်မှတ်​ေပး​ထား​သည့​် နံပါတ်များ​ြဖစ်သည်။ ယူနီကုဒ် ဆိုသည်မှာ ကမ္ဘာသံုး​ဘာသာစကား​ အား​လံုး​မှ အက္ခရာစာလံုး​ တစ်လံုး​တိုင်း​အတွက် တိကျ​ေသာ နံပါတ် တစ်လံုး​တည်း​သာ သတ်မှတ်​ေပး​​ေသာ ဘံုသံုး​စနစ်ဟူ၍လည်း​ ​ေခါ်ဆိုြကသည်။

Unicode => Universal Character Encoding Unicode Consotium ​ေခါ် NGO အဖွဲ့​အစည်း​မှ တစ်ကမ္ဘာလံုး​ရှိ ဘာသာစကား​များ​ကို သိမ်း​ဆည်း​နိုင်ရန်/ စာသား​များ​ဖလှယ်နိုင်ရန် တီထွင်ထား​​ေသာ 16 bit character code set standard ြဖစ်သည်။ ISO (International Standard Organization) က ယင်း​ကို ISO-10646 ဟု သတ်မှတ်​ေပး​သည်။

Unicode ြဖင့​် ဘာသာစကား​​ေပါင်း​ များ​စွာကို Font တခုတည်း​တွင် ထည့​်သွင်း​နိုင်ြပီး​ မည်သည့​် ကွန်ပျူတာစနစ်တွင်မဆို အသံုး​ြပုနိုင်ရမည်ြဖစ်သည်။ Computer ဆိုသည်က ကိန်း​ဂဏန်း​များ​ကိုသာ သိသည်ဟု ​ေယဘုယျအား​ြဖင့​် ​ေြပာနိုင်သည်။ ကွန်ပျူတာတွင် ဖတ်မှတ််ြခင်း​၊ သိမ်း​ဆည်း​ြခင်း​များ​ကို ကိန်း​ဂဏန်း​များ​ြဖင့​်သာ ြပုလုပ်နိုင်သည်။ ယူနီကုဒ်ကို မတီထွင်မီက ကိန်း​ဂဏန်း​တစ်ခုကို သိရှိနိုင်ရန်အတွက် လှျို့​၀ှက်ကိန်း​စနစ်များ​စွာကို အသံုး​ြပုြကရသည်။ ဘာသာစကား​ တစ်ခုအတွက် ြပည့​်စံုလံု​ေလာက်​ေသာ encoding စနစ်များ​ မရှိ​ေပ။

History of Myanmar Unicode

ASCII code ​ေပါ်တွင် ြမန်မာစာကို encode လုပ်၍ အသံုး​ြပုခဲ့​ြကသည်။ အဂင်္လိပ် Character set ယာယီ ငှား​သံုး​ခဲ့​ြကြခင်း​ြဖစ်သည်။ ဥပမာ- ြမန်မာစာ “က” သည် အဂင်္လိပ်အက္ခရာ U (ASCII code point 117) ​ေပါ်တွင် encode လုပ်ထား​ြခင်း​ြဖစ်သည်။ သို့​​ေသာ် ယူနီကုဒ်တွင် “က” နှင့​် "u" သည် အက္ခရာတစ်ခုစီ ကွဲြပား​​ေနသည်။ ကွန်ပျူတာက စံတစ်ခုကို သိလာမှသာ တစ်ကမ္ဘာလံုး​ မည်သည့​်ကွန်ပျူတာကမဆို ြမန်မာစာကို နား​လည်လာပါမည်။ ကွန်ပျူတာက လက်ခံနိုင်သည့​် စံ ဆိုသည်မှာ ကြကီး​ကို U+1000 နှင့​် ခ​ေခွး​ကို U + 1001 အြဖစ် ကုတ်အ​ေနြဖင့​် ပံု​ေသ သတ်မှတ်​ေပး​ရပါလိမ့​်မည်။ သတ်မှတ်ရံုသာမက တစ်ကမ္ဘာလံုး​ရှိ Software Developer များ​ သိ​ေစရန်နှင့​် တ​ေြပး​ညီအသံုး​ြပုနိုင်​ေစရန် သတ်မှတ်ြပီး​ ​ေြကညာထား​ြကရပါလိမ့​်မည်။ ထိုသို့​ သတ်မှတ်​ေြကညာမှုကို ISO က စံထား​ြပီး​သတ်မှတ်​ေပး​သည်။

ယူနီကုတ် ၁.၀ တွင် ယခုလက်ရှိသံုး​​ေန​ေသာ ြမန်မာယူနီကုတ်သည် တိဘက်ဘာသာစကား​​ေအာက်တွင် ရှိခဲ့​ဲသည်။ ယူနီကုတ် ၁.၁ တွင် ယူနီကုတ်တွင် ြမန်မာဘာသာကိုဖယ်ထုတ်ခဲ့​ဲပီး​ ၂.၀ တွင် အြခား​ ကုတ်နံပါတ်များ​​ေအာက်တွင် ြပန်လည်ထည့​်သွင်း​ခဲ့​သည်။

၁၉၉၅ မတ်လ ၁၂ ရက်တွင် မိုက်ကယ်အီဗာဆင်မှ ယူနီကုတ် WG2 တွင် Title: Names of Burmese characters: comment on Unicode Technical Report #1 အမည်ြဖင့​်စာတမ်း​တစ်​ေစာင် စတင်တင်သွင်း​ခဲ့​သည်။

၁၉၉၆ တွင် မိုက်ကယ်အီဗာဆင်မှ proposal စတင်တင်သွင်း​ခဲ့​သည်။

၁၉၉၈ တွင် မိုက်ကယ်အီဗာဆင်မှပင် ammendment တင်သွင်း​ခဲ့​သည်။

၁၉၉၈ ဇူလိုင် ၂၄ တွင် ကို​ေဇာ်ထွဋ်မှ Response to Myanmar Proposal N1729 (Expert Contribution to Unicode Consortium) ကို​ေရး​သား​ခဲ့​သည်။

၁၉၉၈ ​ေအာက်တိုဘာတွင် UK London ၌ ကျင်း​ပ​ေသာ WG 2 meeting 35 သို့​ ြမန်မာနိုင်ငံမှ ​ေဒါက်တာ​ေအာင်​ေမာ် (CE) ၊ ဦး​ခင်​ေမာင်လွင် (ကွန်ပျူတာပညာရှင်အသင်း​)၊ ​ေဒါက်တာ​ေကျာ်သိန်း​ (ကွန်ပျူတာတက္ကသို်လ်)၊ ဦး​​ေသာင်း​တင် (KMD) နှင့​် ဦး​သိန်း​ထွဋ် (Geocomp) တို့​သည် ​ေလ့​လာသူအြဖစ်တက်​ေရာက်ကာ ြမန်မာစာအ​ေြကာင်း​ကို ြပည့​်စံုစွာတင်ြပခဲ့​ြပီး​ ြမန်မာယူနီကုတ်ကို ြမန်မာလူမျိုး​ပညာရှင်များ​လက်သို့​ စတင် မျိုး​​ေစ့​ချ​ေပး​ခဲ့​သည်။ဤ​ေဆွး​​ေနွး​ပွဲတွင် ြမန်မာပညာရှင်များ​ကိုယ်တိုင် တက်​ေရာက်​ေဆွး​​ေနွး​ခဲ့​ြခင်း​ မြပုနိုင်ပါက ယခုအချိန်တွင် ြမန်မာလူမျိုး​များ​သည် ြမန်မာစာကို ြပင်ပမှသာ​ေလ့​လာတတ်​ေြမာက်ထား​​ေသာ နိုင်ငံြခား​ပညာရှင်များ​၏ proposal ြဖင့​် ​ေပါ်ထွက်လာမည့​် ြမန်မာယူနီကုတ်ကိုသာ အသံုး​ြပုြကရမည်ဟု ယူဆနိုင်သည်။

အ​ေြခခံ ြမန်မာယူနီကုတ် Unicode Character Code 3.0 ကို 1998 ခုနှစ်တွင် သတ်မှတ်အတည်ြပု ြပဋ္ဌာန်း​ခဲ့​ြပီး​ြဖစ်ပါသည်။ သို့​​ေသာ် ထိုအချိန်တွင် ယူနီကုတ်ကို လိုက်လံအ​ေကာင်အထည်​ေဖာ် တီထွင်​ေဆာင်ရွက်မည့​်သူ တစ်ဦး​မှျ ြမန်မာနိုင်ငံတွင် မရှိခဲ့​​ေပ။ 1999 ခုနှစ် ​ေနာက်ပိုင်း​မှ 2002 ခုနှစ်အထိ ြမန်မာစာ ယူနီကုတ်ကို သံုး​စွဲနိုင်​ေအာင် လုပ်​ေဆာင်​ေနသူများ​ကို ​ေလ့​လာြကည့​်ရာတွ Graphite enabled Padauk မှ လွဲြပီး​ အြခား​ မည်သူတစ်ဦး​တစ်​ေယာက်မှျ မရှိခဲ့​ပါ။

ြမန်မာစာကို ယူနီကုတ်အြဖစ် သတ်မှတ်​ေပး​ခဲ့​စဥ်က ယူနီကုတ် Consotium အဖွဲ့​ြကီး​တွင် ြမန်မာစာကို ​ေကာင်း​စွာ တတ်ကျွမ်း​သူ မရှိသည့​်အြပင် ြမန်မာနိုင်ငံတွင်လည်း​ Unicode related technologies များ​ကို နား​လည်သူ တစ်ဦး​မှျ ထွက်​ေပါ်လာြခင်း​ မရှိ​ေသး​သြဖင့​် ယူနီကုတ်ဆိုသည်မှာ ချိုနှင့​်လား​ ြပန်​ေမး​ရမည့​် အချိန်ြဖစ်သည်။ ​ေပး​ကား​​ေပး​၏၊ မရ​ေသး​သည့​်သ​ေဘာြဖစ်ခဲ့​ပါသည်။

2002 ခုနှစ်၊ ဒီဇင်ဘာလ ​ေရာက်မှ ကို​ေငွထွန်း​ က ြမ​ေစတီ ယူနီကုတ် စနစ်ကို တီထွင်နိုင်ခဲ့​ြပီး​ 2003 ခုနှစ်၊ ဇန်န၀ါရီလတွင် etrademyanmar.com ၌ ပထမဦး​ဆံုး​ စတင် အသံုး​ြပုနိုင်ခဲ့​သည်။ ကို​ေငွထွန်း​သည် ြမ​ေစတီယူနီကုတ်ကို ရန်ကုန်ြမို့​ရှိ စာချုပ်စာတမ်း​များ​ မှတ်ပံုတင်ရံုး​တွင် ကုန်အမှတ်တံဆိပ် မှတ်ပံုတင်ြပီး​ တရား​၀င်သံုး​စွဲခဲ့​​ေြကာင်း​ သိရှိရသည်။

သို့​ရာတွင် ထိုစဥ်က ြမန်မာယူနီကုတ်စနစ်မှာ Virama စနစ်​ေပါ်တွင်အ​ေြခခံထား​​ေသာ​ေြကာင့​် ြမ​ေစတီယူနီကုတ်စနစ်မှာ ယူနီကုတ်စံကို အြပည့​်အ၀လိုက်နာထား​​ေသာ စနစ်ဟု မဆိုနိုင်​ေပ။ ထိုြပင် ထိုစဥ်က ြမ​ေစတီယူနီကုတ်စနစ်မှာ အဆမတန်​ေဈး​ြကီး​ြခင်း​ အသံုး​ြပုခွင့​်လိုင်စင်မှာလည်း​ ယခုလက်ရှိ​ေပါ်ထွက်လာ​ေသာ လိုင်စင်များ​ကဲ့​သို့​ Open Source လိုင်စင်များ​ မဟုတ်ြခင်း​ စသည့​် အချက်များ​​ေြကာင့​် ကျယ်ကျယ်ြပန့်​ြပန့​် သံုး​စွဲနိုင်ခဲ့​ြခင်း​ မရှိခဲ့​ပါ။

2002 ခုနှစ်တွင် ြမန်မာနိုင်ငံ၌ အတည်မြပုနိုင်​ေသး​သည့​် ယူနီကုတ်စနစ်ကို ြမန်မာနိုင်ငံ ကွန်ပျူတာအသင်း​ချုပ်မှ တာ၀န်ယူ လုပ်​ေဆာင်ြကရန် ၀ိုင်း​၀န်း​ တိုက်တွန်း​ြကပါသည်။ ယူနီကုတ်စနစ်ကို နိုင်ငံ​ေတာ်စံတစ်ခုအ​ေနြဖင့​် အသံုး​ြပုနိုင်​ေရး​အတွက် လုပ်ငန်း​စတင်ရန် ဘဏ္ဍာ​ေရး​အ​ေထာက်အပံ့​များ​ စတင်ရှာ​ေဖွခဲ့​ြကသည်။ နိုင်ငံ​ေတာ်အြကီး​အကဲများ​သည် ြမန်မာ့​စံယူနီကုတ်ြဖစ်​ေြမာက်​ေရး​အတွက် ကျပ်သိန်း​ ၅၀ ကို စတင်​ေထာက်ပံ့​​ေပး​ခဲ့​ပါသည်။ ဤသို့​ြဖင့​် Myanmar Unicode and NLP Research Centre သည် ြမန်မာနိုင်ငံ ကွန်ပျူတာ သင်း​ချုပ်ြကီး​၏ အစီအမံြဖင့​် ဖွဲ့​စည်း​နိုင်ခဲ့​သည်။ NLP အဖွဲ့​ြကီး​သည် 2002 ခုနှစ်မှစြပီး​ နိုင်ငံ​ေတာ်အတွက် ယူနီကုတ်တာ၀န်များ​ကို အချိန်ြပည့​် စတင်တာ၀န်ယူ လုပ်​ေဆာင်ခဲ့​သည် ဟု ဆိုနိုင်သည်။

From Myanmar Online Encyclopedia

Review on Myanmar Unicode 5.1 & Suggestion

[caption id="attachment_61" align="aligncenter" width="402" caption="Review on Myanmar Unicode 5.1 & Suggestion"]Review on Myanmar Unicode 5.1 & Suggestion[/caption]

အသတ် နှင့်​ ​ေရှ့​ထိုး​ကိစ္စ


ယူနီကုဒ် ၅.၁ အထိ အသတ်နဲ့​ ​ေရှ့​ထိုး​ကို တန်ဖိုး​အတူတူ ​ေပး​ထား​တာ ​ေတွ့​ရပါတယ်။ အသတ်နဲ့​ ​ေရှ့​ထိုး​ဟာ အခုမှသာ ခပ်ဆင်ဆင် ြဖစ်​ေန​ေပမယ့်​ တကယ်က မတူပါဘူး​။ ဒါ့​အြပင် အသံုး​ြပုမှုြခင်း​လည်း​ မတူပါဘူး​။ အသတ်ဟာ ဗျည်း​တစ်လံုး​ရဲ့​ အသံကို သတ်ပစ်လိုက်တာ ြဖစ်ပါတယ်။ ဗျည်း​မှာ တွဲကပ်တဲ့​ သရအသံကို သတ်ပစ်လိုက်တာ လို့​လည်း​ ​ေြပာလို့​ရတယ်။ ​ေရှ့​ထိုး​က​ေတာ့​ အသံရှည် ဆွဲရာမှာ အသံုး​ြပုတာပါ။ ​ေရှ့​ထိုး​ဟာ သီး​ြခား​ တစ်လံုး​ထဲ မရပ်တည်နိုင်ပါဘူး​။ တကယ်တမ်း​ သူက (​ေ-ာ်) ​ေအာ်သရပါ။ (​ေ-ာ) သရမှာ သံရှည်ကို ြပချင်တဲ့​အခါ သံ​ေြပာင်း​ြပြဖစ်တဲ့​ ဝစ္စနှစ်လံုး​​ေပါက် (:) ကပ်မလိုက်နိုင်တဲ့​ အတွက် ​ေရှ့​ထိုး​နဲ့​ ြပတယ်လို့​ ယူဆရပါတယ်။ ​ေရှ့​ထိုး​လို့​ နာမည် တပ်လိုက်တာကလည်း​ အသတ်နဲ့​ မတူဘူး​ဆိုတာ ​ေြပာချင်လို့​ ြဖစ်ပါတယ်။


ဿ (U+103F) နဲ့​ (ဋ္ဌ)


ဿ (သြကီး​) ဟာ (သ်+သ) ​ေပါင်း​ထား​တဲ့​ အက္ခရာပါ။ ​ေယဘုယျအ​ေနနဲ့​ ပံုစံတူ အက္ခရာ နှစ်လံုး​ အဲဒီလို ​ေရှ့​​ေနာက် တွဲဆက်လာရင် အထပ် ြဖစ်သွား​တတ်ပါတယ်။ ဥပမာ (ဥက္ကဋ္ဌ)။ ဿကို ဒီ​ေန့​​ေခတ်မှာလည်း​ အသံုး​ြပု​ေနဆဲမို့​ ယူနီကုဒ်မှာ ထည့်​သွင်း​တာကို ဘာမှ မ​ေြပာလို​ေပမယ့်​ ဿ ကို ထည့်​ထား​ြပီး​​ေတာ့​ (ဋ္ဌ) ဆိုတာကို​ေတာ့​ ထည့်​ထား​တာ မ​ေတွ့​ရပါဘူး​။ ဒီ (ဋ္ဌ)ဟာလည်း​ အခုနက ဿြကီး​လိုပဲ ချံု့​ထား​တဲ့​ စာလံုး​ပါ။ ဋ်+ဌ=ဋ္ဌ ြဖစ်ပါတယ်။ ဒါ​ေြကာင့်​ ြဖုတ်မယ်ဆိုရင် နှစ်ခုစလံုး​ြဖုတ်၊ ထည့်​မယ်ဆိုရင်လည်း​ ဒါကို​ေတာ့​ ချန်ခဲ့​တာ အဓိပ္ပာယ် မရှိပါဘူး​။


​ေသး​​ေသး​တင်


​ေသး​​ေသး​တင်ကို ဒီယူနီကုဒ်မှာ Various Sign ထဲထည့်​ထား​တာ ​ေတွ့​ရပါတယ်။ ပညာ​ေရး​ ဝန်ြကီး​ဌာနက ထုတ်​ေဝတဲ့​ ြမန်မာသဒ္ဒါစာအုပ် စာမျက်နှာ ၂မှာ ​ေသး​​ေသး​တင်ကို သင်ရိုး​သရနဲ့​ သရသ​ေကင်္တထဲ ထည့်​ထား​ပါတယ်။ အ​ေြခခံ သရထဲ​ေတာ့​ ထည့်​မထား​ြပန်ဘူး​။ ဒါ​ေပမယ့်​ အခု​ေနာက်ဆံုး​ထုတ် ြမန်မာအဘိဓာန်စာအုပ်ထဲမှာ​ေတာ့​ အံ (​ေသး​​ေသး​တင်)ကို သရထဲ ထည့်​ပါတယ်။ (စာ-ထ၊ ၅၀) အဲဒီမှာ အ​ေြခခံသရကို အ၊ အာ၊ အိ၊ အီ၊ အု၊ အူ၊ ​ေအ၊ အဲ၊ ​ေအာ၊ ​ေအာ်၊ အံ၊ အို ဆိုြပီး​ သရ ၁၂လံုး​ ြပပါတယ်။ အဲဒီ အ​ေြခခံ သရ ၁၂လံုး​ကိုမှ မူတည်ြပီး​ Tone Mark ​ေအာက်ြမစ်နဲ့​၊ ဝိသဇ္ဇနီ (း​) ပွား​ြပီး​လည်း​​ေကာင်း​၊ အသတ်ဗျည်း​များ​နဲ့​ အ​ေရး​ပွား​၍လည်း​​ေကာင်း​ လိုအပ်သလို ချဲ့​ထွင် အသံုး​ြပုနိုင်တယ်လို့​ ဆိုပါတယ်။ ဒါ​ေြကာင့်​ ​ေသး​​ေသး​တင်ဟာ (အံ)သရ သာ ြဖစ်ရပါမယ်။ Various Sign ထဲထည့်​ြပီး​ တြခား​ Tone Mark လို မထား​သင့်​ပါဘူး​။ (​ေသး​​ေသး​တင်ကို (မ်)နဲ့​ သွား​သွား​ တူခိုင်း​​ေနတဲ့​ ကိစ္စကလည်း​ ြမန်စာစာ​ေပမှာ အြပတ်ရှင်း​ရှင်း​လင်း​လင်း​ လုပ်သင့်​တဲ့​ ကိစ္စတစ်ခုပါ) ကွန်ပျူတာစနစ်ကို တက်လှမ်း​မယ်ဆိုရင် ဟိုလိုလို ဒီလိုလို​ေတွ လုပ်လို့​မရပါဘူး​။ အံု (အ ​ေသး​​ေသး​တင် တစ်​ေချာင်း​ငင်) ဟာ အုမ် (အ တစ်​ေချာင်း​ငင် မသတ်) နဲ့​ ကွဲြပား​တာ ​ေတွ့​နိုင်ပါတယ်။ ​ေနာက်ြပီး​​ေတာ့​ ြမန်မာစာလံုး​ တစ်လံုး​တိုင်း​ရဲ့​ အဆံုး​စွန်ဟာ Diacritic (Tone Mark) လို့​ ​ေြပာလို့​ရပါတယ်။ တကယ်လို့​ ​ေသး​​ေသး​တင်ကို Tone Mark လိုလို လုပ်မယ်ဆိုရင် ​ေသး​​ေသး​တင် တစ်​ေချာင်း​ငင်ဆိုတာ အဓိပ္ပာယ် မဲ့​ပါလိမယ့်​မယ်။ (ဟိုး​တုန်း​က နိဂ္ဂဟိတ် ( - ံ) ကို ဗျည်း​ထဲမှာ ထည့်​ြကတယ်။ အဲဒီလို ဗျည်း​ထဲမှာ ထည့်​ထား​တဲ့​အတွက် သူ့​ကို သရထဲမှာ ထည့်​မတွက်ဘူး​။ အဲဒါကို ဗျည်း​က​ေန ထုတ်လိုက်တဲ့​​ေနာက်ပိုင်း​ အ​ေြခခံ သရအ​ေနနဲ့​ သတ်မှတ်ခဲ့​ြကတာ ြကာလှပါြပီ)


၎င်း​


ြမန်မာ ယူနီကုဒ်မှာ (၎င်း​)ကို (၎င်း​) တစ်လံုး​ထဲ ခွဲ​ေရး​ထား​တာ ​ေတွ့​ရပါတယ်။ ဒီ ၎င်း​ ြပဿနာဟာလည်း​ ဆရာြကီး​ ဦး​​ေဖ​ေမာင်တင်တို့​ ​ေခတ်ကတည်း​က အ​ေတာ်ရှင်း​ယူခဲ့​ရတဲ့​ ြပဿနာ တစ်ခုပါ။ လည်း​​ေကာင်း​ကို ချံု့​​ေရး​ြကရာက အဲဒီ ၎င်း​ ြပဿနာ စလာတာပါပဲ။ ယူနီကုဒ်မှာ (၎င်း​)ဆိုတာကို (၎င်း​) နဲ့​ (င်း​) ဆိုြပီး​ ခွဲထား​တာက​ေတာ့​ လံုး​ဝ အဓိပ္ပာယ် မရှိဘူး​ ထင်ပါတယ်။ ဒါဆို (၎င်း​) အဲဒီ တစ်လံုး​ထဲကို ဘယ်လို အသံထွက်ရမလဲ ဆိုတာ ရှိလာပါြပီ။ ငသတ် ဝစ္စ​ေပါက် မပါတဲ့​အတွက် (လည်း​​ေကာ)လို့​ ထွက်ရမှာလား​။ ငသတ် ဝစ္စ​ေပါက် ထည့်​ပါမှ လည်း​​ေကာင်း​လို့​ အသံြပည့်​ ထွက်မှာလား​။ (​ေလး​ဂဏန်း​) ဆိုရင်လည်း​ အသစ်သွင်း​စရာ မလိုဘူး​ ထင်ပါတယ်။ ြဖစ်သင့်​တာက​ေတာ့​ အဲဒီ (၎င်း​) ကို (ဿ)လို သီြခား​အ​ေရး​ရှိတဲ့​ စာလံုး​အ​ေနနဲ့​ ြပသင့်​ပါတယ်။ (Unicode 4.1 မှာတုန်း​က အခုလို မခွဲဘဲ တစ်လံုး​ အ​ေနနဲ့​ ထား​ရာက အခုကျမှ ခွဲထုတ်လိုက်တာ ြဖစ်ပါတယ်)



uni1035
uni1035

ဒီစာလံုး​ကို ယူနီကုဒ်မှာ (1035) Myanmar Vowel Sign E Above ဆိုြပီး​ ြပထား​တယ်။ အဲဒီ စာလံုး​ကို သက္ကတဘာသာနဲ့​ ​ေရး​ထား​တဲ့​ ရာဇမတ္တဏ်ကျမ်း​မှာ ကျွန်​ေတာ် အများ​အြပား​ ​ေတွ့​ဖူး​ပါတယ်။ အနီး​စပ်ဆံုး​ ရှာြကည့်​ချင်ရင်​ေတာ့​ ြမန်မာအဘိဓာန် စာမျက်နှာ (ထ) ဠ် ဆိုတဲ့​ ​ေနရာမှာ ြကည့်​နိုင်ပါတယ်။ ြပုဗ္ဗာသာဠ် ဆိုတဲ့​ စကား​လံုး​ရဲ့​ မူရင်း​ သက္ကတစာကို အဲဒီ သ​ေဝထိုး​ အ​ေပါ်တင်ြပီး​ ​ေရး​ပါတယ်။ အဲဒါဟာ ြမန်မာစာလံုး​ မဟုတ်ပါဘူး​။ သရဆို​ေတာ့​ သရအသစ်များ​လား​ဆိုြပီး​ မျက်စိ​ေတာင် လည်သွား​ပါတယ်။ (​ေရှ့​ထိုး​)ကို ​ေြပာချင်တာလား​လို့​လည်း​ ​ေတွး​မိပါ​ေသး​တယ်။ ဒါ​ေပမယ့်​လည်း​ မဟုတ်ြပန်ဘူး​။ တစ်ချိန်က ရှိခဲ့​ဖူး​တယ် ဆိုရင်​ေတာင် ​ေနာက်ပိုင်း​ လံုး​ဝမသံုး​​ေတာ့​တဲ့​ အရာြကီး​ပါ။ ဘာြဖစ်လို့​ ြမန်မာသရထဲ အတင်း​ထည့်​ထား​တယ် ဆိုတာကို နား​မလည်နိုင်ပါဘူး​။ တကယ်လို့​ အသံုး​လိုတိုင်း​ ယူနီကုဒ်မှာ လိုက်ထည့်​​ေနမယ် ဆိုရင်လည်း​ တြခား​ထည့်​စရာ​ေတွ အများ​ြကီး​ တိုး​လာပါလိမ့်​မယ်။



ဦ ဆိုတဲ့​ သရကို ယူနီကုဒ်တန်ဖိုး​ 1026 သီး​ြခား​​ေပး​ထား​တယ်။ ြပီး​​ေတာ့​ သူ့​​ေအာက်မှာ ဒါဟာ (ဥ)+(- ီ) နဲ့​ အတူတူပါပဲလို့​လည်း​ ​ေြပာထား​​ေသး​တယ်။ ဦဟာ သူ့​တစ်လံုး​ထဲ သီး​ြခား​ရှိတဲ့​ အြမင်ပံုစံပါ။ လံုး​ြကီး​တင်ဆန်ခတ်နဲ့​ ​ေပါင်း​ထား​တာ​ေတာ့​ မဟုတ်ပါဘူး​။ (Normalization လုပ်ချင်လို့​ အတူတူပဲလို့​ သတ်မှတ်ထား​တာလား​လို့​လည်း​ ​ေတွး​မိပါ​ေသး​တယ်) အသံထွက်တဲ့​အခါ အူ ဆိုတဲ့​ အသံကို ထွက်ပါတယ်။



ဒီသရက​ေတာ့​ မကာရ​ေလာပအ​ေကျာ် ခင်ြကီး​​ေဖျာ် တီထွင်လိုက်လို့​ ြဖစ်လာတာပါ။ ဒီတစ်လံုး​ထဲ မဟုတ်ပါဘူး​။ (အို) သရကိုလည်း​ သူပဲ စတီထွင်ခဲ့​တာပါ။ ဒါ​ေပမယ့်​ သူ့​သရဟာ ၁၁လံုး​ပဲ ရှိတယ်။ ဘာြဖစ်လို့​လဲ ဆို​ေတာ့​ (- ံ)ကို ဗျည်း​ထဲ သွား​ထည့်​ထား​လို့​ပါ။ တကယ်​ေတာ့​ ဩသရကို (​ေ-ာ်) ကပ်တယ်ဆိုတာ အဓိပ္ပာယ်ကို မရှိပါဘူး​။ ဘာြဖစ်လို့​လည်း​ဆို​ေတာ့​ ဩ ကိုယ်နှိုက်က မှီခိုကင်း​တဲ့​သရ ြဖစ်​ေနလို့​ပါပဲ။ ြဖစ်နိုင်တာက ခင်ြကီး​​ေဖျာ်ဟာ အသံထွက်အတွက် (​ေအာ်) သရကို ထည့်​သွင်း​ချင်လို့​ ဩ မှာ အနက်ထင်​ေအာင် ပူး​ြပလိုက်ပံု ရပါတယ်။ ဪ ဆိုတာ တကယ်​ေတာ့​ ြမန်မာမှုြပုရင် ​ေအာ် နဲ့​ အတူတူပါပဲ။ အထက်က (ဦ)မှာတုန်း​က (ဥ)နဲ့​(- ီ) ​ေပါင်း​တာနဲ့​ အတူတူပဲလို့​ ြပ​ေပမယ့်​ ဒီ ဪကျ​ေတာ့​ ဘာမှမ​ေတွ့​ရြပန်ဘူး​။ အထက်ကလို သ​ေဝထိုး​+ဩ+​ေရး​ချ+​ေရှ့​ထိုး​ လာရင်​ေရာ အတူတူပဲလို့​ သတ်မှတ်မှာလား​။ သ+ရရစ် ဆိုရင်လည်း​ ဩနဲ့​ အတူတူပဲလို့​ သတ်မှတ်မှာလား​။


တကယ်ဆို အဲဒီ သရ​ေတွကို တစ်လံုး​ချင်း​စီ အ​ေနနဲ့​ မြမင်သင့်​ပါဘူး​။ က+(​ေအာသရ)=​ေကာ၊ ခ+(​ေအာသရ)=​ေခါ ြဖစ်ပါတယ်။ သ​ေဝထိုး​+ဗျည်း​+​ေရး​ချ လို့​ကျွန်​ေတာ့်​ အြမင်အရဆို မသတ်မှတ်ချင်ပါဘူး​။ တကယ်လို့​ အထက်ကလို (​ေ-ာ)(​ေ-ာ်) ( -ို) (- ံု) အတွဲအ​ေနနဲ့​ ထား​လိုက်မယ်ဆိုရင် ြမန်မာအက္ခရာ​ေတွဟာ ပိုလို့​ အဓိပ္ပာယ် ရှိလာမယ်လို့​ ထင်ပါတယ်။ ြပီး​​ေတာ့​ ပိုြပီး​လည်း​ လွယ်ကူလာပါလိမ့်​မယ်။


အြကံြပုချက်


​ေနာက်ဆံုး​ အြကံြပုချက်ကို ​ေရး​ချင်ပါတယ်။ ကုဒ်​ေတွကို မှန်ကန်ပါတယ်ဆိုြပီး​ ပညာရှင်​ေတွ လွယ်လွယ်နဲ့​ လက်မှတ် မထိုး​သင့်​ပါဘူး​။ အြပန်ြပန် အလှန်လှန် စစ်​ေဆး​ြပီး​မှ လက်ခံသင့်​ပါတယ်။ ြမန်မာယူနီကုဒ် ၃နဲ့​ ပတ်သက်ြပီး​ ​ေဒတာ​ေတွ အများ​အြပား​ မရှိ​ေသး​ပါဘူး​။ ရှိရင်လည်း​ အလွယ်တကူ Convert လုပ်နိုင်တဲ့​ အ​ေြခအ​ေနမှာ ရှိပါတယ်။ တချို့​ မှား​​ေနတာ​ေတွကို သိသိြကီး​နဲ့​ ပစ်မထား​သင့်​ပါဘူး​။ လုပ်ြပီး​သား​ြကီး​ ြဖစ်​ေနလို့​လည်း​ မြပင်ဘဲ မ​ေနသင့်​ပါဘူး​။ ဒါဟာ တမျိုး​သား​လံုး​နဲ့​ သက်ဆိုင်တဲ့​ ကိစ္စပါ။ ​ေနာင်ကာလြကာရှည် နှစ်​ေပါင်း​များ​စွာ အသံုး​ြပုြကရမယ့်​ဟာလည်း​ ြဖစ်ပါတယ်။ အလွန်ကို အ​ေရး​ြကီး​ပါတယ်။ ြပီး​​ေတာ့​ အထက်ကပံုမှာလို ယူနီကုဒ်ဇယား​ဟာ အက္ခရာ​ေတွဟာ ​ေရာ​ေနပါတယ်။ ယူနီကုဒ် စစလုပ်ချင်း​တုန်း​က ချန်ထား​တဲ့​ အကွက်​ေတွကို လိုက်ြဖည့်​ရင်း​ ​ေရာ​ေထွး​ကုန်တာ ြဖစ်ပါလိမ့်​မယ်။ ဗမာ အက္ခရာ​ေတွထဲ မွန်​ေတွ၊ ရှမ်း​​ေတွ၊ ကရင်​ေတွ ​ေရာက်​ေနတယ်။ တကယ်ဆို စနစ်တကျ သူ့​အစုနဲ့​သူ ရှိသင့်​ပါတယ်။ ဒါ​ေြကာင့်​မို့​ အချိန်မ​ေနှာင်း​ခင် လုပ်နိုင်တဲ့​သူ​ေတွ လုပ်နိုင်ြက​ေစဖို့​ ကျွန်​ေတာ်အ​ေနနဲ့​ သိထား​သမျှ၊ သံသယ ရှိ​ေနတာ မှန်သမျှကို အြပုသ​ေဘာနဲ့​ အြကံြပု ​ေရး​သား​ပါတယ်။ (ြမန်မာယူနီကုဒ်နဲ့​ ဗမာစာ​ေရာ၊ တိုင်း​ရင်း​သား​စာ​ေတွနဲ့​ပါ ​ေဒတာ အများ​ြကီး​ မရှိ​ေသး​ခင်မှာ စနစ်တကျ သပ်သပ်ရပ်ရပ်ြဖစ်​ေအာင် ြပန်လည် စီသင့်​တယ်လို့​ အ​ေလး​အနက် တိုက်တွန်း​ပါတယ်)။


ကွန်ပျူတာသမား​ဟာ ဘယ်​ေလာက် ကွန်ပျူတာမှာ ​ေတာ်​ေတာ် ြမန်မာစာကို သမရိုး​ကျ သိရံု​ေလာက်နဲ့​ ဒါကို လုပ်လို့​ မရပါဘူး​။ ြမန်မာစာ ပညာရှင် အ​ေနနဲ့​လည်း​ ဘယ်​ေလာက်ပဲ ြမန်မာစာကို ထံုး​လို​ေချ ​ေရလို​ေနှာက် ကွန်ပျူတာရဲ့​ လည်ပတ်ပံု၊ လုပ်ငန်း​​ေဆာင်ရွက်ပံု သ​ေဘာတရား​​ေတွကို မသိရင် ဒါကို လုပ်လို့​ မရြပန်ဘူး​။ အဲဒီနှစ်ခုကို ညီညီမျှမျှ ​ေပါင်း​နိုင်မှ ကွန်ပျူတာမှာ ြမန်မာစာစနစ်ကို အကျယ်တဝင့်​ စနစ်ကျကျ အသံုး​ြပုနိုင်ပါလိမ့်​မယ်။ ​ေနာက်ပိုင်း​ ဘာသာ​ေဗဒ ပညာရှင်​ေတွလည်း​ အ​ေရး​ပါတဲ့​ ကဏ္ဍက​ေန ပါလာရပါဦး​မယ်။ အ​ေရး​အြကီး​ဆံုး​ တစ်ချက်ပဲ ရှိတယ်။ အချင်း​ချင်း​ြကား​ ရှင်း​ရှင်း​လင်း​လင်း​နဲ့​ လိုအပ်တာကို နား​လည်သ​ေဘာ​ေပါက်​ေအာင် ​ေြပာြပနိုင်ဖို့​ အတွက်က​ေတာ့​ ကိုယ့်​ဘက်က ဝမ်း​စာြပည့်​​ေအာင် ြပင်ဆင်ထား​ဖို့​ လိုပါလိမ့်​မယ်။ ကွန်ပျူတာ​ေခတ်ပဲ ြမန်မာစာက နည်း​ပညာကို လိုက်နာရမှာ​ေပါ့​ ဆိုတဲ့​ အိုင်ဒီယာမျိုး​ ​ေတွကို​ေတာ့​ ကျွန်​ေတာ်တို့​ ရဲရဲြကီး​ ဆန့်​ကျင်ပစ်ရပါလိမ့်​မယ်။


​ေလး​စား​စွာ


ညီလင်း​ဆက်
01 March 2009


မှတ်ချက်။ ဒီသံုး​သပ်ချက်ထဲမှာ ဗမာစာ သီး​သန့်​ အပိုင်း​ကိုပဲ ထုတ်နှုတ်​ေဝဖန် အြကံြပုပါတယ်။ အြခား​တိုင်း​ရင်း​သား​ အက္ခရာ​ေတွ မပါ​ေသး​ပါဘူး​။ အြကမ်း​ထွက်တဲ့​ ယူနီကုဒ် ၅.၂ မူြကမ်း​မှာလည်း​ ထူြခား​တဲ့​ ြပင်ဆင်မှု​ေတွကို မ​ေတွ့​မိ​ေသး​ပါဘူး​။ ​ေနာက်ြပီး​​ေတာ့​ ယူနီကုဒ် ၅.၁ စနစ် တစ်ခုတည်း​ အ​ေပါ်မှာ အ​ေြခခံထား​တယ် ဆိုတဲ့​ ြမန်မာသရီး​၊ မိုင်ြမန်မာ၊ ပရပိုဒ်၊ ပိ​ေတာက် စတာ​ေတွဟာ တစ်ခုနဲ့​ တစ်ခု ​ေြပာင်း​ရာမှာ တူ​ေနရမယ့်​အစား​ Rendering မတူတာ​ေြကာင့်​ တလွဲ​ေတွ ထွက်လာတတ်တာကိုလည်း​ စနစ်တကျ ြဖစ်​ေစချင်ပါ​ေသး​တယ်။ သိပ်မြကာခင်မှာ ​ေဇာ်ဂျီ အသံုး​ြပုရြခင်း​ရဲ့​ အား​နည်း​ချက် ​ေတွကိုလည်း​ သံုး​သပ်ြကည့်​ ပါဦး​မယ်။


အထက်က ကိစ္စ​ေတွမှာ ကျွန်​ေတာ့်​အယူအဆ မှား​တယ်ဆိုရင် ဘယ်လိုမှား​တယ် ဆိုတာကို တတ်ကျွမ်း​သူ ဆရာများ​က အမှန်ြပင်​ေပး​ပါလို့​ ​ေတာင်း​ဆိုချင်ပါတယ်။



ညီလင်း​ဆက် (http://blog.nyilynnseck.com/2009/02/review-on-myanmar-unicode-51-suggestion.html)

content top