Unicode Standard တွင် အထက်ပါ စာလံုးအပိုများ မပါြခင်းက ြမန်မာေဖာင့်ေရးသူများအတွက် Unicode Standard ကို သံုးစဲွရန် အခက်အခဲ ြဖစ်ေစခဲ့ပါသည်။ ဥပမာ တက္ကသိုလ်၏ ကြကီးနှစ်လံုးတွင် အေပါ်ကြကီးသည်လည်း 4096 ၊ ေအာက်ကြကီးသည်လည်း 4096 ြဖစ်ြပီး ‘က’ နှင့် ‘’ စာလံုး ဒီဇုိင်းနှစ်မျုိးကို 4096 တေနရာထဲတွင် ေရး၍မရပါ။ ယခင် ASCII တွင် ရသည်မှာ ကြကီးနှစ်လံုးသည် ဂဏန်းမတူေသာေြကာင့် ဂဏန်းနှစ်ေနရာတွင် အသံုးချရန် လိုအပ်ပါသည်။ ထိုသို့ေသာ နည်းပညာများကို အသံုးမချနိုင်ခင်တွင် အချုိ့ြမန်မာေဖာင့် ေရးသူများက ေဆးြမီးတိုတခုကို စတင်အသံုးချခဲ့ြကပါသည်။ ၎င်းမှာ ြမန်မာတုိင်းရင်းဘာသာများအတွက် Unicode Consortium က သတ်မှတ်ထားေသာ ဂဏန်းေနရာများတွင် ASCII မှ စာလံုးအပုိများ ထည့်ြကြခင်း ြဖစ်ပါသည်။ ဥပမာ ‘တက္ကသိုလ်’ တွင် ‘’ နှင့် ‘က’ ဂဏန်းတူရမည် ြဖစ်ေသာ်လည်း ‘’ ကို တုိင်းရင်းသားစာလံုး ‘-’ ၏ ဂဏန်းေနရာတွင် ယခင် ASCII ေဖာင့်များ ‘A’ ေနရာတွင် ‘က’ ထားသလို သွားထားြကပါသည်။ ထိုသို့လုပ်ြခင်းြဖင့် Rendering Engine များ မလိုဘဲ ြမန်မာစာကို သံုးနုိင်လာခဲ့ပါသည်။ သို့ေသာ် ထိုသို့အသံုးြပုနုိင်ြခင်းသည် ယူနီကုတ်ဟု အမည်ေပးြကေသာ်လည်း တကယ်တမ်းတွင် Unicode Standard ၏ အနှစ်သာရများ လံုးဝ ေပျာက်ဆံုးေစပါသည်။ တကယ်တမ်း ၎င်းေဖာင့်များသည် Fake Unicode Font များ (သို့မဟုတ်) Unicode Standard ကုိ ချုိးေဖာက်ေသာ ေဖာင့်များသာ ြဖစ်ပါသည်။ သို့ရာတွင် ၎င်းေဖာင့်များသည် ASCII ေဖာင့်များထက် အားသာချက်တခု ရှိပါသည်။ ၎င်းမှာ ကွန်ြပူတာမှ ‘က’ ကို ‘u’ အြဖစ် သိမ်းဆည်းမှု မြပုြခင်း ြဖစ်ပါသည်။ ဤဆိုပါ အချက်ေြကာင့် Unicode Font များသည် အင်တာနက်ေပါ်တွင် ဝက်ဘ်ဆုိက်များတင်ြခင်းနှင့် ကွန်ြပူတာတွင် ဖိုင်များကို အမည်ေပးြခင်း စသည်တို့ကို ရရှိလာေသာ်လည်း encoding standard မရှိြခင်း၊ ေဖာင့်တခုနှင့်တခု ေရးသားထားေသာ စာများ ဖလှယ်၍ သံုးနုိင်မှု မရှိြခင်း စေသာ ASCII ေခတ်က ရှိခဲ့ေသာ အားနည်းချက်များအားလံုး မေပျာက်မပျက် ဆက်လက်တည်ရှိေနပါသည်။ ထိုသို့ေသာ ေဖာင့်များအား Unicode Standard ကို အသံုးမြပုနိုင်ေသာ ေနရာများတွင် ယာယီ ြမန်မာစာ စာလံုးေပါ်ေစရန်သာ အသံုးြပုသင့်ပါသည်။
Fake Unicode Font များသည် အနီေရာင်ြပထားေသာ တုိင်းရင်းသား စာလံုးများေနရာတွင် ASCII ေဖာင့်များမှ လိုအပ်ေသာ စာလံုးများကို ထည့်သွင်းအသံုးြပုြကပါသည်။
[caption id="attachment_105" align="aligncenter" width="501" caption="Unicode Chart for Myanmar ---- Unicode Consortium. Modified to show a purpose."][/caption]
Unicode မဟုတ်ေသာ encoding များမှာ -
- MyaZedi Unicode
- TPartial
- XPartial
- BIT
- ZawGyi Unicode
အထက်ပါ Fake Unicode ေဖာင့်များကို အသံုးြပုြခင်းြဖင့် ေအာက်ပါ ဆိုးကျုိးများကို ရရှိနုိင်မည် ြဖစ်ပါသည်။
တိုင်းရင်းသားများအတွက် သတ်မှတ်ထားေသာ စာလံုးများကို လဲလှယ်အသံုးြပုထားြခင်း ြဖစ်ေသာေြကာင့် ဤေဖာင့်များကို ဆက်လက်အသံုးြပုပါက ေနာင်တချိန်တွင် ရှမ်းကွန်ြပူတာစနစ်၊ မွန်ကွန်ြပူတာစနစ် စေသာ တုိင်းရင်းသား စာေပများကို ကွန်ြပူတာေပါ်တွင် အသံုးချနိုင်ရန် ခက်ခဲသွားမည် ြဖစ်ပါသည်။
‘က’ နှင့် ‘’ ကိုပင် ကွန်ြပူတာက အတူတူြဖစ်သည်ဟု မသိပါက ေဒတာအချက်အလက်များစွာ ပါေသာ စနစ်များတွင် ကျွနု်ပ်တို့လိုချင်သည်ကို မှန်ကန်တိကျစွာ ရှာေဖွနိုင်မည် မဟုတ်ပါ။ ဥပမာ အင်တာနက်တွင် ကျွနု်ပ်တို့ ြမန်မာလို ရှာေဖွလို့ ရပါသလား။ ရှာေဖွ၍ ရလာေသာ ရလဒ်များသည် ရာခုိင်နှုန်းအနည်းငယ်မျှေသာ မှန်ကန်မည်ြဖစ်ြပီး ကျန်အချက်အလက်များသည် ေပျာက်ဆံုးေနမည်ြဖစ်သည်။
‘တက္ကသိုလ်’ နှင့် ‘တက်ကသုိလ်’ သည် အတူတူပင်ြဖစ်သည်ကို ကွန်ြပူတာမှ မသိနုိင်ပါက ြမန်မာစာလံုးများကို ြကီးစဉ်ငယ်လိုက် စီစဉ်နုိင်မည် မဟုတ်ပါ။ အေြခခံ ြကီးစဉ်ငယ်လိုက် စီစဉ်ြခင်းကို မလုပ်နုိင်ပါက ပိုမိုြကီးများကျယ်ြပန့်ေသာ စနစ်များတွင် စီစဉ်ြခင်းများ လုပ်ေဆာင်နုိင်မည် မဟုတ်ပါ။ ဥပမာ အင်တာနက်တွင် ‘University’ ဝက်ဘ်ဆိုဒ်များကို ရရှိမည် ြဖစ်ပါသည်။ ‘တက္ကသိုလ်’ ဟု ရှာ၍ ထွက်လာေသာ ြဖစ်နုိင်ေြခနည်းေသာ ဝက်ဘ်ဆုိက်များကို ရရှိမည် ြဖစ်ပါသည်။ အြခားစနစ်များ ဥပမာ Banking, e-Government, e-Commerce စနစ်များတွင်လည်း ရလဒ်များသည် ေသချာတိကျြခင်း ရှိနုိင်မည် မဟုတ်ပါ။
နိုင်ငံတကာမှ ေရးသားထားေသာ ေဆာ့ဖ်ဝဲများ ဥပမာ - စီမံခန့်ခဲွေရး ေဆာ့ဖ်ဝဲများ၊ အေရာင်းေဆာ့ဖ်ဝဲများ စသည်တို့သည် နိုင်ငံတကာမှ ဘာသာမျုိးစံုနှင့် အသံုးြပုနုိင်ေလ့ ရှိြကပါသည်။ ထိုသို့ အသံုးြပုရန် အဆိုပါ ေဆာ့ဖ်ဝဲများကို ဘာသာတခုစီအတွက် သီးြခားြပင်ဆင်ရန် မလိုအပ်သည်မှာ Unicode Standard ကို အသံုးြပုေသာေြကာင့် ြဖစ်ပါသည်။ အကယ်၍ ြမန်မာစာအတွက် Fake Unicode များကို သံုးမည်ဆုိလျှင် ထိုေဆာ့ဖ်ဝဲများကို ြမန်မာဘာသာြဖင့် သံုးရန် ခက်ခဲသွားမည် ြဖစ်ပါသည်။
ASCII ေဖာင့်များတွင် သုည နှင့် ဝလံုးသည် ပံုစံတူေသာေြကာင့် နှစ်လံုးစလံုးကို ဂဏန်း ၃ဝ အြဖစ် သတ်မှတ်ထားပါသည်။ ထို့ေြကာင့် ကွန်ြပူတာသည် မည်သည့်နည်းနှင့်မျှ ဂဏန်းတူေနေသာ ထိုသုညနှင့် ဝလံုးကို ခဲွြခားသိရှိနိုင်မည် မဟုတ်ပါ။ ASCII နှင့် ေရးထားေသာ စာများကို သီးသန့်ြပုလုပ်ထားေသာ ေဆာ့ဖ်ဝဲများနှင့် Unicode Standard သို့ ေြပာင်းလဲနုိင်ေသာ်လည်း သုညနှင့် ဝလံုး သံုးထားေသာ ေနရာများတွင် အချက်အလက်များသည် မှန်ကန်မှု ရှိမည် မဟုတ်ပါ။ အချို့ေသာ Fake Unicode Font များတွင်လည်း သုညနှင့် ဝလံုးကို ခဲွြခားထားေလ့ မရှိြကပါ။ အချက်အလက်များစွာ ထည့်သွင်းထားေသာ database စနစ်များတွင် အချက်အလက်များသို့ ထည့်သွင်းထားေသာ အချက်အလက်များ မမှန်ကန်ြခင်းကို data corruption ဟု ေခါ်ပါသည်။ ဥပမာ ကွန်ြပူတာက အဂင်္လိပ်မှ ြမန်မာသို့ အလိုအေလျာက် ဘာသာြပန်ေသာ စနစ်တခု တည်ေဆာက်မည်ဆုိပါလျှင် သုညနှင့် ဝလံုးတို့ ဆက်စပ်ေသာ ေနရာများတွင် အေြဖသည် အြမဲမှားမည် ြဖစ်ပါသည်။
Unicode Standard သည် encoding တခု တနည်းအားြဖင့် အက္ခရာများကို ဂဏန်းသတ်မှတ်ေပးြခင်းသာ ြဖစ်ေသာ်လည်း ၎င်းသတ်မှတ်ချက်အတိုင်း လိုက်နာြပီး ြမန်မာစာစနစ်တခု ဖန်တီးရန်မှာ ေဖာင့်တခုတည်းြဖင့် မြဖစ်နိုင်ပါ။ ြမန်မာစာလံုးများကို screen ေပါ်တွင် ေပါ်နိုင်ရန် Rendering Engine ၊ ၎င်းနှင့်အလုပ်လုပ်နိုင်ေသာ Smart Font နှင့် ြမန်မာစာကို ရိုက်ရန် Input Engine တို့ လိုအပ်ပါသည်။ ဥပမာ ‘တက္ကသိုလ်’ တွင် ပါေသာ ‘က’ နှစ်လံုးတွင် မည်သည့် ‘က’ သည် ‘’ ြဖစ်မည်ကို Smart Font ထဲတွင် ေရးသားရပါသည်။ ၎င်းအချက်အလက်ကို Rendering Engine က သိရှိြပီး screen တွင် မှန်ကန်ေသာ ပံုစံကို ြပေပးနုိင်မည် ြဖစ်ပါသည်။ ယေန့ အသံုးြပုေနေသာ ကွန်ြပူတာစနစ် (OS) များ အားလံုးတွင် Rendering System များ တပါတည်း ပါရှိပါသည်။ ဥပမာ ဝင်းဒိုးကွန်ြပူတာများတွင် OpenType Rendering Engine ပါရှိပါသည်။ သို့ရာတွင် မိုဘုိင်းလ်ဖုန်းများနှင့် ကွန်ြပူတာ (PC) ထက်နိမ့်ေသာ ကွန်ြပူတာများတွင် အဆုိပါ Rendering Engine များ မပါရှိြကေသးေသာေြကာင့် ြမန်မာစာ ယူနီကုတ် အသံုးြပုရန် မြဖစ်နုိင်ေသးပါ။ ထိုအချိန်မျုိးတွင် Fake Unicode Font များကို အသံုးြပုနိုင်ပါသည်။ စာရိုက်ရာတွင်လည်း ယခင် ASCII စနစ်များတွင် ‘u’ ကို နှိပ်ြပီး ယူနီကုတ်ဂဏန်းများ သိမ်းရန်မှာမူ Input Engine လိုအပ်ပါသည်။ ASCII စနစ်များနှင့် Fake Unicode Font များတွင် ‘ေလ’ ကို ‘ေ’ + ‘လ’ ဟု သိမ်းဆည်းေသာ်လည်း Unicode Standard တွင် ‘ေလ’ ကို ‘လ’ + ‘ေ’ ဟု သိမ်းဆည်းပါသည်။ အေြကာင်းမှာ စကားလံုးအားလံုး၏ အေြခခံမှာ ဗျည်းစာလံုးများြဖစ်ေသာေြကာင့် ထိုသို့ ဗျည်းကို ေရှ့ဆံုးမှ သိမ်းမှသာ sorting/searching အဆင်ေြပနုိင်မည် ြဖစ်ေသာေြကာင့် ြဖစ်ပါသည်။ ထို့ေြကာင့် Input Engine မှ ကီးဘုတ်ေပါ်တွင် ရိုက်ေသာ စာလံုးများကို ယူနီကုတ် စံအတိုင်း ကွန်ြပူတာက သိမ်းဆည်းေအာင် လုပ်ေဆာင်ေပးြပီး ၎င်းစာများကို screen ေပါ်တွင် မှန်ကန်စွာ ေပါ်ေအာင် Rendering Engine မှ Smart Font ကို သံုးြပီး လုပ်ေဆာင်ြခင်း ြဖစ်ပါသည်။
လက်ရှိ Unicode Standard ြမန်မာစာစနစ်များမှာ -
- Myanmar2, Myanmar3 (OpenType Font, Keyman Input Engine)
- Paduak (OpenType + Graphite Font for Linux and Windows, Keyman Input Engine)
- Parabaik (OpenType font)
- MyMyanmar (Universal Font for Linux, Windows and Mac, MyInput Engine)
- MyMyanmar Developed Unicode Fonts from ASCII Fonts. (M-Myanmar Unicode, CE Unicode, Art House Unicode ...)
- AyeYar
Myanmar 2, 3 ေဖာင့်များကို အစိုးရရံုးများတွင် အသံုးြပုရန် အခမဲ့ ေပးထားပါသည်။ ပိေတာက်ေဖာင့်သည် Open Source Community ြကုိးပမ်းမှုတခုြဖစ်ြပီး အခမဲ့ ရရှိနိုင်ပါသည်။ MyMyanmar အား အခမဲ့ရရှိေသာ အင်တာနက် ဗားရှင်းအြဖစ်လည်းေကာင်း၊ ေရာင်းချလျက်ရှိေသာ DVD Software ဗားရှင်းအြဖစ်လည်းေကာင်း ရရှိနုိင်ပါသည်။ အင်တာနက် ဗားရှင်းသည် အင်တာနက်ရှိမှ အသံုးြပု၍ ရမည်ြဖစ်ြပီး ဝယ်ယူေသာ ဗားရှင်းနှင့် စွမ်းေဆာင်ရည် မကွာြခားပါ။ MyMyanmar မှ ယခင် ASCII ေဖာင့်များစွာ၏ လုပ်ပိုင်ခွင့်များကို ရယူြပီး ၎င်းစာလံုးပံုစံများကို Unicode Standard Font များ ြဖစ်ေအာင် ဖန်တီးထားပါသည်။ ၎င်းတို့တွင် အခမဲ့ရေသာ ေဖာင့်များသည် အခမဲ့ရမည်ြဖစ်ြပီး စီးပွားြဖစ်ေဖာင့်များလည်း ပါဝင်ပါသည်။ ၎င်းတို့ကို MyInput သို့မဟုတ် Myanmar 2, 3 Keyman စနစ်များနှင့် တဲွသံုးနုိင်ပါသည်။
ယူနီကုတ်စနစ်များသည် မည်သူေရးေသာေဖာင့်ြဖစ်ေစ၊ မည်သည့်စနစ်ြဖစ်ေစ ဖလှယ်အသံုးြပုနိုင်စွမ်း ရှိပါသည်။ ဥပမာ MyMyanmar နှင့် ရိုက်ထားေသာ စာများကို အစိုးရရံုးများအတွက် Myanmar2, Myanmar3 ြဖင့် အသံုးြပုနုိင်သလို ပိေတာက်နှင့် ရိုက်ထားေသာ စာများကိုလည်း MyMyanmar နှင့်လည်းေကာင်း၊ အြခား ယူနီကုတ်ေဖာင့်များနှင့်လည်းေကာင်း ဖတ်ရှုနိုင်ပါသည်။
ေဖာင့်တခု သို့မဟုတ် စနစ်တခုကို ယူနီကုတ် ဟုတ်မဟုတ် စစ်ေဆးရန်မှာ လွယ်ကူပါသည်။ ထုိေဖာင့်စနစ်ြဖင့် စာအနည်းငယ်ရိုက်ြပီး အထက်တွင်ပါေသာ ယူနီကုတ်စနစ်တခုခုနှင့် ဖွင့်ြကည့်နုိင်ပါက Unicode Standard နှင့် ကိုက်ညီေသာ ေဖာင့်၊ စနစ် ြဖစ်ေြကာင်း သိရှိနိုင်ပါသည်။ အထက်တွင် ေဖာ်ြပထားေသာ စာရင်းတွင် ပါဝင်သည့် ေဖာင့်များမှအပ အြခားေဖာင့်များသည် Unicode Standard နှင့် ကိုက်ညီေလ့မရှိြကပါ။ ထုိ့ေြကာင့် ၎င်းတို့ကို သံုးမည်ဆုိလျှင် စနစ်အချင်းချင်း ဖလှယ်အသံုးြပုနုိင်စွမ်း မရှိရံုသာမက အနာဂတ်တွင် တွင်ကျယ်လာမည့် ှSearch Engine များ၊ e-Government စနစ်များ၊ လုပ်ငန်းသံုး ကွန်ြပူတာစနစ်များ၊ ဝက်ဘ်ဆုိက်ေပါ်တယ်များတွင် ြမန်မာစာသည် စာလံုးေပါ်ရံုမှလဲွ၍ အြခားဘာသာများတွင် အသံုးြပုေနြကေသာ စွမ်းေဆာင်ရည်များ ရရှိနုိင်ေတာ့မည် မဟုတ်ပါ။ ထို့ေြကာင့် ြဖစ်နုိင်လျှင် Unicode Standard စနစ်များကိုသာ သံုးစဲွသင့်ပါသည်။
ထူးြမင့်ေနာင်
(ထူးြမင့်ေနာင်သည် Unicode Consortium ၏ အဖဲွ့ဝင်ြဖစ်ြပီး ဝီကီပိဒိယ ြမန်မာဘာသာအပိုင်းတွင် System Operator ြဖစ်ပါသည်။ Technomation Studios နှင့် MyMyanmar Projects တို့တွင် အမှုေဆာင် ဒါရိုက်တာအြဖစ် တာဝန်ထမ်းေဆာင်လျက်ရှိပါသည်။)
3 comments:
ထူးြမင့်ေမာင် လား ထူးြမင့်ေနာင်လား ကျွန်ပျူတာလို့ေရးရတာမသိဘူးလားစာေရးတာေလးမှန်ေအာင်လုပ်ပါဦး
ေကျးဇူးတင်ပါသည်။
ေအာင်ြမင်ပါေစ။
Post a Comment