ကွန်ြပူတာသည် ကျွနု်ပ်တို့လူအများ နားလည်သလို ဘာသာစကားများ၊ စာလံုံးများကို နားလည်သိရှိနုိင်ြခင်း မရှိပါ။ အေြခခံအကျဆံုံးအဆင့်တွင် ကွန်ြပူတာများသည် ဂဏန်းများကို သိမ်းနုိင်၊ တွက်ချက်နိုင်ြခင်း စွမ်းရည်သာ ရှိြကပါသည်။ ထုိ့ေြကာင့် ဘာသာစကားများ၏ အက္ခရာများကို ကွန်ြပူတာများတွင် သံုးနုိင်ရန်အတွက်လည်း အက္ခရာတလံုးချင်းစီကို ဂဏန်းများအြဖစ် သတ်မှတ်ရပါသည်။ ဥပမာ အဂင်္လိပ်အက္ခရာ ေအ ‘A’ ကို 41 ဟု သတ်မှတ်ပါသည်။ ထိုသို့ သတ်မှတ်မှသာ ကွန်ြပူတာက ကျွနု်ပ်တို့သံုံးေသာ စာေပများကို သိမ်းဆည်းနိုင်ြခင်း၊ ပရင်တာထုတ်နုိင်ြခင်း၊ ၀က်ဘ်ဆုိက်များတွင် ဖတ်ရှုနုိင်ြခင်း စသည်တို့ကို ေဆာင်ရွက်နိုင်ြခင်း ြဖစ်ပါသည်။ သို့ေသာ်လည်း ဘာသာအသီးသီး၏ အက္ခရာအသီးသီးကို မည်သည့်ဂဏန်းအြဖစ် သိမ်းမည်ဆိုေသာ သတ်မှတ်ချက်သည် တနုိင်ငံနှင့် တနုိင်ငံ၊ ကွန်ြပူတာစနစ် တခုနှင့်တခု၊ ေဆာ့ဝဲတခုနှင့်တခု မတူညီခဲ့ြကပါ။ ဥပမာ အဂင်္လိပ်ဘာသာစကားတွင်ပင် အက္ခရာများကုိ ANSI Encoding, ASCII Encoding, MacRoman Encoding စသည်ြဖင့် အမျုိးမျုိး သတ်မှတ်ခဲ့ြကပါသည်။ ထို့ေြကာင့် Encoding ဆိုသည်မှာ မည်သည့်အက္ခရာကို မည်သည့်ဂဏန်းသတ်မှတ်သည်ဆိုေသာ သတ်မှတ်ချက်တခု သက်သက်ပင် ြဖစ်ပါသည်။ ASCII Encoding တွင် ‘A’ သည် 41 ြဖစ်ြပီး ‘Z’ သည် 90 ြဖစ်ပါသည်။
ဘာသာစကားတခုတည်းကိုပင် အမျုိးမျုိးေသာ ဂဏန်းသတ်မှတ်ချက်များနှင့် သိမ်းဆည်းြကေသာေြကာင့် ကွန်ြပူတာ တခုနှင့်တခု၊ ေဒသတခုနှင့်တခု အချက်အလက်များ (စာများ) ေပးပို့သည့်အခါ encoding မတူညီေသာေြကာင့် တေနရာမှ အချက်အလက်ကို အြခားတေနရာမှ ဖတ်၍မရြခင်း ြပဿနာများ ေြပလည်ေစရန်အတွက် International အဖဲွ့အစည်းများသည် စံသတ်မှတ်ချက်များ သတ်မှတ်ြပီး အေကာင်အထည်ေဖာ်ခဲ့ြကပါသည်။ ပထမဦးဆံုး ထွက်ေပးလာေသာ စံသတ်မှတ်ချက်မှာ အဂင်္လိပ်ဘသာသာစကားအတွက်ြဖစ်ြပီး ၎င်းကို ASCII ဟု ေခါ်ပါသည်။ ထိုအချိန်မှစ၍ တကမ္ဘာလံုးတွင် အဂင်္လိပ်စာကို ASCII encoding နှင့်သာ သိမ်းဆည်းြကေသာေြကာင့် စနစ်မတူြခင်း၊ ေဖာင့်မတူြခင်း ြပဿနာများ ကင်းေဝးခဲ့ြကပါသည်။ ထို့ေနာက် အဂင်္လိပ်ဘာသာစကားကဲ့သို့ပင် တကမ္ဘာလံုးမှ ဘာသာစကားအားလံုး၏ အက္ခရာများကို စံသတ်မှတ်နိုင်ရန်အတွက် ISO နှင့် Unicode Consortium အဖဲွ့အစည်းများ ဖဲွ့စည်း၍ ြကုိးပမ်းလုပ်ေဆာင်ခဲ့ြကပါသည်။ Unicode Standard သည် အဆိုပါ ISO နှင့် Unicode Consortium တို့၏ ြကုိးပမ်းမှုများမှ ရလဒ်ပင် ြဖစ်ပါသည်။ တကမ္ဘာလံုးတွင် လက်ရှိသံုးေနေသာ Encoding စနစ်သည် Unicode Standard ပင် ြဖစ်ပါသည်။
ASCII ေခတ်တွင် ြမန်မာစာ encoding များ ရှိခဲ့ေသာ်လည်း Standard အြဖစ် သတ်မှတ်နုိင်ြခင်း မရှိခဲ့ပါ။ ထိုအချိန်က ြမန်မာစာ encoding များမှာ အဂင်္လိပ်စာ စာလံုးများကို အေြခခံေသာ စနစ်များသာ ြဖစ်ခဲ့ပါသည်။ ဥပမာ ကွန်ြပူတာ ကီးဘုတ်တွင် ‘u’ ကို နှိပ်လုိက်လျှင် ကြကီး ေပါ်နိုင်ရန် ေဖာင့်ထဲတွင်ရှိေသာ ‘u’ ၏ စာလံုးပံုစံဒီဇုိင်းကို ‘က’ ြဖစ်ေအာင် ြပင်ဆင်ထားေသာ ေဖာင့်များသာ ထွက်ေပါ်ခဲ့ပါသည်။ ထို့ေြကာင့် ကွန်ြပူတာစကရင်ေပါ်တွင် ကြကီးေပါ်ေသာ်လည်း ကွန်ြပူတာက အမှန်တကယ် မှတ်သားသိမ်းဆည်းထားသည်မှာ အဂင်္လိပ်အက္ခရာ ‘u’ သာ ြဖစ်ပါသည်။ ထုိ့ေြကာင့် ၎င်းစနစ်များသည် စာပံုနှိပ်လုပ်ငန်းမှအပ အြခားလုပ်ငန်းများတွင် တွင်ကျယ်လာြခင်း မရှိပါ။ ASCII encoding ြဖင့် ြမန်မာစနစ်များကို ‘ေဖာင့်’ များဟုသာ ေခါ်ခဲ့ြကပါသည်။ ေရးသားသူမတူေသာ ASCII ေဖာင့်အမျုိးမျုိးသည် အဂင်္လိပ်အက္ခရာအမျုိးမျုိးကို ေနရာလဲခဲ့ေသာေြကာင့် တခုနှင့်တခု မတူညီြကပါ။ ထို့ေြကာင့် English ASCII လို စနစ်အားလံုး၊ ေနရာအားလံုးတွင် တသတ်မှတ်တည်း သံုးနုိင်ေသာ ြမန်မာစာ ASCII စနစ်လည်း မရှိခဲ့ပါ။ ASCII Encoding/Font များမှာ
- Avalaser (Mac only)
- CE
- Academy
- M-Myanmar
- Ava
- Win Myanmar: Win Innwa, Win Hakha, Win Thanlwin, etc
- W Art House, A Art House
ထို့ေနာက်တွင် ISO/Unicode Consortium မှ ြမန်မာဘာသာကို Unicode Standard ထဲတွင် ထည့်သွင်းနုိင်ခဲ့ပါသည်။ သို့ရာတွင် Unicode Standard Encoding ဆိုသည်မှာ အက္ခရာများကို ဂဏန်းသတ်မှတ်ေပးြခင်း ြဖစ်ေသာ်လည်း ြမန်မာစာေဖာင့်ေရးသူများ နားလည်ထားေသာ အဂင်္လိပ်အက္ခရာများကို ြမန်မာစာနှင့် လဲမည်ဆိုေသာ အယူအဆနှင့် လံုးဝ ဆန့်ကျင်ဘက် ကွာြခားပါသည်။ ASCII ေဖာင့်များတွင် ‘က’ တလံုးအတွက် ၎င်းနှင့် ပံုသဏ္ဌာန်ကိုလိုက်ြပီး ဂဏန်းများကို ကိုယ်စားြပုပါသည်။ ဥပမာ ဝင်းအင်းဝတွင် ‘က’ အတွက် 75 နှင့် ‘’ အတွက် 250 ဟု မှတ်သားပါသည်။ ယူနီကုတ်တွင် ‘က’ သည် 4096 ြဖစ်ြပီး ‘’ သည်လည်း 4096 ြဖစ်ပါသည်။ ထို့ေြကာင့် ASCII မှာလို ‘က’ ၏ စာလံုးဒီဇိုင်းေရးရန် တေနရာ၊ ‘’ အတွက် တေနရာ မရှိပါ။ အေြခအေနကိုလိုက်၍ ‘က’ နှင့် ‘’ ကို အလိုေလျာက် ေြပာင်းလဲနုိင်သည့် Rendering System ေခါ် နည်းပညာြဖင့် လုပ်ေဆာင်ရမည် ြဖစ်ပါသည်။ ထုိ့မှသာ ကျွနု်ပ်တို့ ကွန်ြပူတာတွင် သံုးေနေသာ Database များ၊ အီးေမးလ်များ၊ Search Engine များ၊ ကွန်ြပူတာသံုးစနစ်များ (e-government, Baking, POS, etc) သည် မှန်ကန်တိကျစွာ အလုပ်လုပ်နုိင်မည် ြဖစ်ပါသည်။ ‘က’ နှင့် ‘’ သည် ဂဏန်းနှစ်ခုကိုသာ ကိုယ်စားြပုပါလျှင် ကွန်ြပူတာအား ‘တက္ကသိုလ်’ တွင် ‘က’ ဘယ်နှလံုး ပါသလဲေမးပါက ‘’ ကို ‘က’ မှန်း မသိဘဲ၊ ‘က’ တလံုးသာပါသည်ဟု အေြဖထွက်ပါလိမ့်မည်။ ၎င်းအေြဖသည် Database များ၊ အီးေမးစနစ်များ၊ Search Engine များတွင် များစွာ ထိခိုက်ေစနုိင်ပါသည်။ ဥပမာ သင်ရှာလိုေသာ အချက်အလက်များ တိကျစွာ မရှာေဖွနိုင်ြခင်း၊ အက္ခရာစဉ်ြခင်း အပါအဝင် အချက်အလက်များကို စီစဉ်နိုင်မ၍ မရှိြခင်းမှစ၍ စနစ်တခုလံုး အလုပ်ေသချာစွာ မလုပ်နိုင်ြခင်း အထိ မလိုလားအပ်ေသာ ဆိုးကျုိးများစွာ ရရှိနိုင်မည် ြဖစ်ပါသည်။ ထို့ေြကာင့် Unicode Standard တွင် ‘က’ သည် ဂဏန်းတခုတည်းအြဖစ်ေသာ သတ်မှတ်ပါသည်။ ထိုနည်းတူ ASCII ေဖာင့်များတွင် ေတွ့ရေသာ ရရစ်အြကီးအေသး အမျုိးမျုိး၊ ေအာက်ြမစ်အမျုိးမျုိး၊ တေချာင်းငင်အမျုိးမျုိးတို့ မရှိေတာ့ပါ။ အားလံုးမှာ သတ်မှတ်ထားေသာ စံအတိုင်း တခုစီသာ ရှိပါသည်။ ၎င်းအက္ခရာများ မည်သည့်ပံုစံေပါ်မည်ဆို (ဥပမာ တေချာင်းငင် တိုမည်၊ ရှည်မည်) ကို ကွန်ြပူတာစနစ်များက လုပ်ေဆာင်ေပးမည် ြဖစ်ပါသည်။
ထူးြမင့်ေနာင်
၁၉၊ ၂၊ ၂ဝ၁ဝ
(ထူးြမင့်ေနာင်သည် Unicode Consortium ၏ အဖဲွ့ဝင်ြဖစ်ြပီး ဝီကီပိဒိယ ြမန်မာဘာသာအပိုင်းတွင် System Operator ြဖစ်ပါသည်။ Technomation Studios နှင့် MyMyanmar Projects တို့တွင် အမှုေဆာင် ဒါရိုက်တာအြဖစ် တာဝန်ထမ်းေဆာင်လျက်ရှိပါသည်။)
2 comments:
ထူးြမင့်ေမာင်သည် Unicode Consortium...
Hiya! You spelled his name wrong!
Thank.. Fixed.
Post a Comment