ယခုအခါ ကွန်ပျူတာသံုး ြမန်မာစာ စနစ်အမျိုးမျိုး ေပါ်ထွန်းလှျက် ရှိသည်။ ၄င်း စနစ် အသီးသီး ၏ ေပါ်ေပါက် လာရြခင်း အေြကာင်းရင်း နှင့် သေဘာ သဘာဝများမှာ တခု နှင့် တခု မတူညီပဲ ကွဲြပား လှျက်ရှိသည်။ Unicode 5.1 တွင် ြမန်မာ အက္ခရာများ ၏ ေနရာ သတ်မှတ်ချက် တည်ြငိမ်လာြပီြဖစ်ရာ အချက်အလက်များ မှျေဝ နုိင်ရန်၊ ြမန်မာ ဘာသာြဖင့် ေရးသား ထားေသာစာများ ကုိ အက္ခရာဝလိစီရန် နှင့် ရှာေဖွနုိင်ရန် ၄င်း ေနရာ သတ်မှတ်ချက်များ အတုိင်း ေြပာင်းလဲ သံုးစွဲ သင့်ြပီ ြဖစ်သည်။ လက်ရှိ စနစ်များ ၏ ေနာက်ခံကားကုိ နားလည် သေဘာေပါက်မှ ၄င်း စနစ်များ အား အသံုးြပု လှျက်ရှိသူတုိ့ကုိ Unicode အဆင့်မီ စနစ်များ သုိ့ ေချာေချာေမွ့ေမွ့ ေြပာင်းလဲနုိင်ေစမည်ြဖစ်ရာ ဤစာတမ်းငယ်တွင် လက်ရှိ ြမန်မာစာ စနစ်များ ၏ သေဘာ သဘာဝကုိ Information Systems Practitioner တစ်ဦး ၏အြမင်မှ ေဆွးေနွး တင်ြပမည် ြဖစ်သည်။
ယခုအခါ ကွန်ပျူတာကုိ အသံုးြပုရာတွင် အဂင်္လိပ်၊ ဂျာမန်၊ ြပင်သစ်စေသာ အေနာက်တုိင်း ဘာသာစကားများသာမကပဲ တရုတ်၊ ကုိရီးယား၊ ဂျပန် စေသာ အေရှ့တုိင်း ဘာသာစကားများြဖင့်လဲ လွယ်ကူစွာ အသံုးြပုနုိင်ြကြပီ ြဖစ်သည်။ ဤကဲ့သုိ့ မိခင်ဘာသာစကားများြဖင့် ကွန်ပျူတာကုိ အသံုးြပုနုိင်ရြခင်းမှာ ဘာသာစကားအများအြပား၏ အက္ခရာများကုိ code-range တစ်ခုအတွင်းတွင် ေနရာချထားေပးေသာ Unicode ေခါ် စံနှုန်းတစ်ရပ်ကုိ အများသေဘာတူ သတ်မှတ်နုိင်ခဲ့ေသာေြကာင့် ြဖစ်သည်။ အဆုိပါ စံနှုန်းအတွင်းတွင် ြမန်မာအက္ခရာများအတွက် code-range ကုိ သတ်မှတ်နုိင်ခဲ့ေသာ်လည်း နှစ်ေပါင်းများစွာြကာသည့်တုိင်ေအာင် အေသးစိတ် အေကာင်အထည်ေဖာ်မည့် ပံုစံကုိ အတည်မြပုနုိင်ေသးပဲ ရှိခဲ့သည်။
ယခုအခါ ြမန်မာစာ Unicode စနစ်သည် တည်ြငိမ်စ ြပုလာြပီြဖစ်ြပီး ေဇာ်ဂျီ ြမန်မာစာ စနစ်မှာ အြခားဘာသာစကားများနှင့် ယှဥ်တွဲ သံုးစွဲနုိင်သည့် Unicode အစစ်မဟုတ်ေသာ်လည်း အများသံုး (de facto) စံနှုန်းတစ်ရပ် အြဖစ် ရပ်တည်လှျက်ရှိသည်။ ယခင်က သံုးစွဲခဲ့ေသာ ASCII (truetype) font များနှင့် Burglish သံုးစွဲမှုများလဲ ယေန့တုိင် ရပ်တည်လှျက်ရှိသည်ကို ေတွ့ရှိရသည်။ ဤစာတမ်းတွင် 8 bit font များနှင့် burglish အေြကာင်းကို ေရှးဦးစွာတင်ြပြပီး အများသံုးြဖစ်သည့် ေဇာ်ဂျီစနစ်အေြကာင်းကုိ ဆက်လက် ေဆွးေနွးမည် ြဖစ်သည်။ ထုိ့ေနာက် Unicode 5.1 အဆင့်မီစနစ်များအေြကာင်းနှင့် ၄င်းတုိ့ကုိ အဘယ်ေြကာင့် ေရွးချယ်သင့်သည်ကို ရှင်းလင်းေရးသားမည် ြဖစ်ပါသည်။
ယခင်က အဂင်္လိပ်စာလံုးကဲ့သုိ့ေသာ လက်တင်စာလံုးများြဖင့် ေရးသားထားသည့် contents များကုိ ကွန်ပျူတာများ ေဝမှျသံုးစွဲနုိင်ေစရန်အတွက် စံအြဖစ် IBM မှ EBCDIC (8 bits) စနစ်နှင့် ASCII (7 bits) စနစ်ဟူ၍ စတင် ေပါ်ေပါက်ခဲ့သည်။ ေနာက်ပုိင်းတွင် ASCII စနစ်ကုိ 8 bit သုိ့ တုိးချဲ့ခဲ့သည်။ နာမည်ြကီး Windows စနစ်များတွင် ASCII စနစ်ကုိ အသံုးြပုနုိင်ရာ အဂင်္လိပ်စာလံုးများကုိ ပံုြပင်ဆွဲ၍ ြမန်မာစာလံုးပံုစံ အများအြပား ေပါ်ထွက်ခဲ့သည်။ ၄င်းတုိ့သည် နည်းပညာရှုေထာင့်အရ အဂင်္လိပ်စာကုိ ပံုေြပာင်းထားြခင်းမှျသာြဖစ်ြပီး ြမန်မာဘာသာြဖင့် ေရးသားထားေသာ အချက်အလက်များကုိ ြမန်မာစာ အက္ခရာစီထံုးြဖင့် အလွယ်တကူ စီ၍မရေပ။ ယခုအခါ ၄င်းတုိ့ကုိ ပံုနှိပ်တုိက်များတွင် ကျယ်ြပန့်စွာ သံုးစွဲလှျက်ရှိြပီး CE နှင့် Win-Myanmar ပံုစံတုိ့မှာ ထင်ရှားသည်။
ြမန်မာနှင့် အဂင်္လိပ်စာ ေရာေထွးေရးသားရန် 16 bit code များ မေပါ်ေပါက်မီက Chat application သံုးစွဲသူအချို့သည် ေြပာလုိေသာ အေြကာင်းအရာကုိ အသံဖလှယ်၍ အဂင်္လိပ် အက္ခရာများြဖင့် ေရးသားသံုးစွဲြကသည်။ (ဥပမာအားြဖင့် Sar Pee P Lar ? = စားြပီးြပီလား ြဖစ်သည်။) ယေန့တုိင် ြမန်မာစာ ေကာင်းစွာ မရိုက်တတ်သူ Chat application အသံုးြပုသူအချို့လဲ ရှိေနဆဲပင် ြဖစ်သည်။ ၄င်းတုိ့အတွက် အလုိအေလျာက် ဘာသာြပန်ေပးသည့် စနစ်အမျိုးမျိုး ေပါ်ထွက်ခဲ့ရာ ဝိဇ္ဇာစနစ်မှာ ထင်ရှားေသာ ဥပမာ တစ်ခုြဖစ်ြပီး ေဇာ်ဂျီနှင့် Myanmar – 3 သုိ့ ဘာသာြပန်ေပးနုိင်သည်။
နုိင်ငံတကာသံုး စံနှုန်းြဖစ်သည့် Unicode စံနှုန်း (16 bit code) တွင် ြမန်မာအက္ခရာများ၏ ေနရာ (ခွင်) ကို အတိအကျ သတ်မှတ်နုိင်ခဲ့ြပီး ြဖစ်ေသာ်လည်း စာလံုးများ၏ ေနရာနှင့် ဘာသာစကား၏ ရှုပ်ေထွးမှု ြပဿနာများကို ေြဖရှင်းနုိင်ရန် စံသတ်မှတ်ချက် အတိအကျ မရှိသည်မှာ အေတာ်ပင် ြကာြမင့်ခဲ့သည်။ ဥပမာအားြဖင့် ြပ နှင့် ြက တွင် ပါဝင်ေသာ ရရစ်မှာ အတူတူပင်ြဖစ်ေသာ်လည်း ၄င်းတုိ့ကုိ ပံုေဖာ်ရန်အတွက် software support (rendering support) လုိသည်။ ၄င်းကုိ အလွယ်နည်းနှင့် ေြဖရှင်းရန်မှာ code-range ကို ချဲ့ပစ်ရန်ြဖစ်ရာ (ရရစ် ၂ ခုသံုးမယ်၊ code ၂ ခုေပး ဆုိတာမျိုး) ပညာရှင်အချို့က စံနှုန်းမတည်ြငိမ်မီ ကာလအတွင်း ေဆးြမီးတုိအြဖစ် အြခားဘာသာစကားများ၏ code များကုိ ေချးငှားသံုးစွဲကာ ေဇာ်ဂျီစာလံုးစနစ်ကုိ ဖန်တီးခဲ့ြကသည်။
၄င်းသည် ြပဿနာ ၂ ရပ်ကုိ ဖိတ်ေခါ်လာသည်။ ေဇာ်ဂျီသည် အဂင်္လိပ် အက္ခရာများ၏ code ကုိ မထိသြဖင့် အဂင်္လိပ်/ြမန်မာ တွဲဖက်ေရးသားရာတွင် အဆင်ေြပေသာ်လည်း ၄င်းေချးငှားထားေသာ ဘာသာစကားများနှင့် ြမန်မာစာကုိ တွဲဖက်ေရးသားပါက ကွန်ပျူတာအေနနှင့် ေချးသံုးထားေသာ code များကုိ မည်သည့် အက္ခရာ (ြမန်မာ အက္ခရာ သို့မဟုတ် အြခား အက္ခရာ) အြဖစ် ေဖာ်ြပေပးရမည်ကုိ မသိနုိင်ပဲ ြဖစ်လိမ့်မည်။ (ဥပမာ 1E29 သည် 'ḩ' လား၊ Latin Small Letter H with Cedilla လား မသိနုိင်ေတာ့ေပ။) ေနာက်ြပဿနာတစ်ရပ်မှာ တူညီေသာ စာလံုးများ ကုိ code အများအြပားသုိ့ assign လုပ်ထားသြဖင့် အက္ခရာစဥ် စီရာ (နှင့် searching ရှာရာ) တွင် မလုိလားအပ်ေသာ ရှုပ်ေထွးမှုများကုိ ြဖစ်ေပါ်ေစပါသည်။ ဥပမာအားြဖင့် ရရစ်သည် ြပ ဟုေရးရာတွင် တမျိုး၊ ြက ဟုေရးရာတွင် တမျိုး၊ လံုးြကီးတင်နှင့် တွဲရန်တမျိုး (ြပိ၊ ြကိ) စသြဖင့် code အမျိုးမျိုး ြဖစ်ေနသည်။ အမှန်မှာ အက္ခရာ စဥ်ရာတွင် ြကသည် ြပအေရှ့ (ြကိသည် ြပိအေရှ့) ဟူ၍ ရရစ် ၂ မျိုးကုိ အတူတူ သေဘာထားြပီး စီရရာ ေဇာ်ဂျီစနစ်ြဖင့် ေရးသားထားေသာ ြမန်မာစာများကုိ အက္ခရာစီနုိင်ရန် ခက်ခဲပါသည်။
ေဇာ်ဂျီ၏ အဓိက အားနည်းချက် တစ်ရပ်မှာ စာလံုးများ၏ စံပံုစံ မရှိြခင်းပင် ြဖစ်သည်။ တ + - ိ + - ု (တုိ) နှင့် တ + - ု + - ိ (တုိ) တုိ့မှာ ေဇာ်ဂျီတွင် မတူညီြကေပ။ သုိ့ြဖစ်၍ ပထမ တုိ ကုိ ရှာေဖွရန် ြကိုးစားရာတွင် ဒုတိယ တုိ ကုိ ထည့်သွင်း ရှာေဖွခုိင်းပါက ရှာေတွ့မည် မဟုတ်ပါေချ။ တူညီေသာစာလံုးများကုိ ရုိက်ထည့်ေသာ အစီအစဥ် မတူညီြခင်းေြကာင့် ကွန်ပျူတာက မတူညီဟု အေြဖထုတ်ေပးြခင်းမှာ လက်ခံနုိင်ဖွယ် အရည်အေသွးတစ်ရပ် မဟုတ်ေပ။ ေဇာ်ဂျီြဖင့် ေရးသားထားေသာ ြမန်မာစာတုိ့မှာ တေန့တြခား တုိးပွားလာေနရာ ေနာင်တချိန်တွင် ၄င်းတုိ့သည် ရှာရ၊ ေဖွရခက်သည့် စာအုပ်ပံုြကီးနှင့် အတူတူပင် ြဖစ်လာေတာ့မည် ြဖစ်သည်။ (အဆုိေတာ် စုိင်းစုိင်းခမ်းလှုိင်၏ အေြကာင်းကို ေရးသားသူ တဝက်က စ + - ိ + - ု + င + - ် + - း ဟု ေရးြပီး ကျန်တဝက်က စ + - ု + - ိ + င + - ် + -း ဟု ေရးပါက မည်သုိ့ ြဖစ်မည်ကို မှန်းဆြကည့်ပါ။) သုိ့ရာတွင် ေရှးယခင် လက်နှိပ်စက်များကဲ့သုိ့ပင် သေဝထုိးနှင့် ရရစ်ကုိ ဗျည်းမရုိက်ခင် ရိုက်ရြခင်း၊ ဗျည်းတွဲများ (ရရစ်ဝဆွဲ၊ ယပင့်ဝဆွဲ စသည်တုိ့)ကုိ ခလုတ်တစ်ချက်နှိပ်ရံုနှင့် ေရးသားနုိင်ြခင်းတုိ့မှာ သံုးစွဲသူတုိ့ နှစ်သက်ဖွယ်ြဖစ်သည်။
Windows စနစ်အများစုတွင် ေဇာ်ဂျီစနစ်ြဖင့် ြမန်မာစာ ေရးသားရန်အတွက် အခမဲ့ ရရှိနုိင်ေသာ Zawgyi installer application ကုိ သွင်းလုိက်ရန်သာလုိအပ်ြပီး ဖတ်ရှုရန်အတွက်မူ သာမာန် စာလံုးပံုစံတစ်ခု သွင်းသကဲ့သုိ့ ေဇာ်ဂျီ စာလံုးပံုစံကုိ သွင်းလုိက်ရန်သာ လုိအပ်သည်။ ေရးသားရန်အတွက် လက်ကွက်မှတပါး ေလ့ကျင့်ရန် မလုိအပ်ေပ။ အသံုးြပုရလွယ်ကူြခင်းေြကာင့် ယေန့တွင် online ေပါ်ရှိ ြမန်မာစာအသံုးြပုမှု (blog, forum, chat application) အများစုသည် ေဇာ်ဂျီ ြမန်မာစာ စနစ်ြဖင့် ြဖစ်သည်။
Myanmar 3 အပါအဝင် Unicode 5.1 စနစ်သံုး ြမန်မာစာစနစ်များသည်လည်း အစုိးရက ေထာက်ခံေနလင့်ကစား အားနည်းချက်များ ရှိဆဲပင်ြဖစ်သည်။ ဥပမာအားြဖင့် ေမာက်ချာ (- ါ) နှင့် ေရးချာ (- ာ) တုိ့မှာ စာလံုး ၂ လံုးြဖစ်ေနသည်။ အက္ခရာစဥ်ရာတွင် ၄င်းတုိ့ကုိ အတူတူဟု သေဘာထားြပီး စီရသည်။ (ေဇာ်ဂျီ၏ ရရစ်ကဲ့သုိ့ပင် မလုိအပ်ပဲ code-range ကုိ ြဖုန်းတီးသကဲ့သုိ့ ြဖစ်ေနပါသည်။) အသတ် (- ်)နှင့် ပံုစံတူေသာ်လည်း အသတ်နှင့် ဘာမှမဆုိင်ေသာ ေရှ့ထုိး (ဥပမာ ေကာ် မှ - ်) မှာ code မရှိပါ။ တနည်းအားြဖင့်ဆုိေသာ် Unicode 5.1 သည်လည်း တုိးတက်ေြပာင်းလဲဦးမည့် အရိပ်အေယာင်များ ရှိေနပါသည်။ သုိ့ရာတွင် ၄င်းသည် စာရိုက်ရာတွင် သတ်မှတ်ထားသလုိသာ ရုိက်သွင်းရသြဖင့် ေဇာ်ဂျီကဲ့သုိ့ တုိ ၂ မျိုး ြဖစ်ေနစရာ မရှိသြဖင့် ေဇာ်ဂျီထက် ပုိမုိ တည်ြငိမ်မည်ဟု ေမှျာ်လင့်ရသည်။
ထုိ့ြပင် Myanmar – 3 ကိုအသံုးြပုရန်အတွက် အနည်းငယ်ရှုပ်ေထွးေသာ အဆင့်များ လုိအပ်သည်။ Windows စနစ်တွင် ဖတ်ရှုရန်အတွက်လဲ သီးသန့် software များ သွင်းရန် လက်ရှိအချိန်တွင် လုိအပ်ဆဲြဖစ်သည်။ ၄င်းကုိ အသံုးြပု ေရးသားရန်အတွက် အချိန်အနည်းငယ်ြကာမှျ ေလ့ကျင့်ရန် လုိအပ်ပါသည်။
ယေန့တွင် အစုိးရဝန်ြကီးဌာနများအားလံုးကို Myanmar-3 ကုိ အသံုးြပုရန် ညှွန်ြကားထားပါသည်။ ထုိ့ေြကာင့် e-Government စနစ်များကို ေနာင်အနာဂါတ်တွင် မိတ်ဆက်ခဲ့ပါက Myamar – 3 ကုိ နုိင်ငံသားတုိင်း မြဖစ်မေန အသံုးြပုရမည်မှာ ေသချာသေလာက် ရှိသည်။ ထုိ့ြပင် Windows စနစ်များတွင် Unicode 5.1 ကုိ အေထာက်အပံ့ေပးပါက ဖတ်ရေရးရခက်ေသာ ြပဿနာမှာ အလုိအေလျာက် ေြပလည်သွားမည်ြဖစ်သည်။ (ယခုအခါ KDE သံုး Linux များတွင် Myanmar – 3 ကုိ ဒီအတုိင်း ဖတ်လုိ့ရြပီြဖစ်သည်။) ထုိအချိန်တွင် ေဇာ်ဂျီသည် Myanmar- 3 ထက်ပုိ၍ ေရးရ၊ ဖတ်ရလွယ်သည်ဆုိေသာ အားသာချက် မရှိနုိင်ေတာ့ေပ။
အသံုးများေသာ ေဇာ်ဂျီမှ Unicode 5.1 သို့ေြပာင်းလဲနုိင်ေရးသည် တကယ်တမ်းအားြဖင့် ကွန်ပျူတာ သိပ္ပံ ြပဿနာ တစ်ရပ်မဟုတ်ပါ (အကျယ်ကုိ ေလာကအလှနှင့် အင်တာဗျူး ရှု)။ Myanmar – 3 ကုိ ေြပာင်းရမည်မှာလဲ ေသချာ၊ ေဇာ်ဂျီကုိလဲ ြကာရှည် အသံုးြပုရန်လဲ အဆင်မေြပ၊ တစ်ဦးချင်း ေြပာင်းရန်လဲ နည်းပညာအရ လွယ်ကူ လှျင်ြမန်ပါလှျက်နှင့် ေဇာ်ဂျီကုိ လူများစု ဖက်တွယ်ထားြကြခင်းမှာ အေြကာင်းရင်း ၂ ရပ်ေြကာင့် ြဖစ်သည်။ ပထမ အေြကာင်းရင်းမှာ Myanmar – 3 တွင် လက်နှိပ်စက်အတုိင်း ရုိက်မရပဲ ေလ့လာသင်ြကားမှု လုိအပ်ေသာေြကာင့် (ေဇာ်ဂျီ၏ တခုတည်းေသာ အားသာချက်) ြဖစ်သည်။ ဒုတိယ အေြကာင်းရင်းမှာ လူများစု သံုးစွဲြခင်း မြပုေသာေြကာင့် အထီးကျန်မည်ကုိ စုိးရိမ်သည့် လူမှုေရး ြပဿနာြဖစ်ြပီး ပုိမုိအေရးြကီးသည်။
ယခုစာတမ်းငယ်တွင် 8 bit font၊ Burglish၊ ေဇာ်ဂျီနှင့် Myanmar – 3 အစရှိေသာ ြမန်မာစာ စနစ်အမျိုးမျိုး၏ သေဘာသဘာဝများကို သိနားလည်မှ Unicode အဆင့်မီ ြမန်မာစာစနစ်များသုိ့ ေြပာင်းလဲရန် အစီအစဥ်ကုိ ြကံဆနုိင်မည်ြဖစ်သြဖင့် ၄င်းတုိ့၏ ဂုဏ်သတ္တိများကုိ နည်းပညာနှင့် လူမှုေရး (သမိုင်းေြကာင်းနှင့် သံုးစွဲသူများ) ရှုေထာင့်များမှ တင်ြပထားသည်။ အဆုိပါ ေတွ့ရှိချက်များကုိ အေြခခံ၍ Unicode အဆင့်မီ ြမန်မာစာစနစ်များသုိ့ ေြပာင်းလဲနုိင်ရန် အစီအစဥ်ကုိ ဆက်လက်ေဆွးေနွးရန် ကျန်ရှိေနပါေသးသည်။
ေလာ ရှည် - က တဲ့ ပွဲ ( http://opera.lawshay.com/2009/07/blog-post_15.html)
0 comments:
Post a Comment