content top

Fake Unicode Encoding များ​နှင့်​Unicode​Standard

Fake Unicode Encoding များ​

Unicode Standard တွင် အထက်ပါ စာလံုး​အပိုများ​ မပါြခင်း​က ြမန်မာ​ေဖာင့်​​ေရး​သူများ​အတွက် Unicode Standard ကို သံုး​စဲွရန် အခက်အခဲ ြဖစ်​ေစခဲ့​ပါသည်။ ဥပမာ တက္ကသိုလ်၏ ကြကီး​နှစ်လံုး​တွင် အ​ေပါ်ကြကီး​သည်လည်း​ 4096 ၊ ​ေအာက်ကြကီး​သည်လည်း​ 4096 ြဖစ်ြပီး​ ‘က’ နှင့်​ ‘ka sit’ စာလံုး​ ဒီဇုိင်း​နှစ်မျုိး​ကို 4096 တ​ေနရာထဲတွင် ​ေရး​၍မရပါ။ ယခင် ASCII​ တွင် ရသည်မှာ ကြကီး​နှစ်လံုး​သည် ဂဏန်း​မတူ​ေသာ​ေြကာင့်​ ဂဏန်း​နှစ်​ေနရာတွင် အသံုး​ချရန် လိုအပ်ပါသည်။ ထိုသို့​​ေသာ နည်း​ပညာများ​ကို အသံုး​မချနိုင်ခင်တွင် အချုိ့​​ြမန်မာ​ေဖာင့်​ ​ေရး​သူများ​က ​ေဆး​ြမီး​တိုတခုကို စတင်အသံုး​ချခဲ့​ြကပါသည်။ ​၎င်း​​မှာ ြမန်မာတုိင်း​ရင်း​ဘာသာများ​အတွက် Unicode Consortium က သတ်မှတ်ထား​​ေသာ ဂဏန်း​​ေနရာများ​တွင် ASCII မှ စာလံုး​အပုိများ​ ထည့်​ြကြခင်း​ ြဖစ်ပါသည်။ ဥပမာ ‘တက္ကသိုလ်’ တွင် ‘ka sit’ နှင့်​ ‘က’ ဂဏန်း​တူရမည် ြဖစ်​ေသာ်လည်း​ ‘ka sit’ ကို တုိင်း​ရင်း​သား​စာလံုး​ ‘-’ ၏ ဂဏန်း​​ေနရာတွင် ယခင် ASCII ​ေဖာင့်​များ​ ‘A’ ​ေနရာတွင် ‘က’ ထား​သလို သွား​ထား​ြကပါသည်။ ထိုသို့​လုပ်ြခင်း​ြဖင့်​ Rendering Engine​ များ​ မလိုဘဲ ြမန်မာစာကို သံုး​နုိင်လာခဲ့​ပါသည်။ သို့​​ေသာ် ထိုသို့​အသံုး​ြပုနုိင်ြခင်း​သည် ယူနီကုတ်ဟု အမည်​ေပး​ြက​ေသာ်လည်း​ တကယ်တမ်း​တွင် Unicode Standard​ ၏ အနှစ်သာရများ​ လံုး​ဝ ​ေပျာက်ဆံုး​​ေစပါသည်။ တကယ်တမ်း​ ​၎င်း​​​ေဖာင့်​များ​သည်​ Fake Unicode Font​ များ​ (သို့​မဟုတ်) Unicode Standard ကုိ ချုိး​​ေဖာက်​ေသာ ​ေဖာင့်​များ​သာ ြဖစ်ပါသည်။ သို့​ရာတွင် ​၎င်း​​​ေဖာင့်​များ​သည် ASCII​ ​ေဖာင့်​များ​ထက် အား​သာချက်တခု ရှိပါသည်။ ​၎င်း​​မှာ ကွန်ြပူတာမှ ‘က’ ကို ‘u’ အြဖစ် သိမ်း​ဆည်း​မှု မြပုြခင်း​ ြဖစ်ပါသည်။ ဤဆိုပါ အချက်​ေြကာင့်​ Unicode Font​ များ​သည် အင်တာနက်​ေပါ်တွင် ဝက်ဘ်ဆုိက်များ​တင်ြခင်း​နှင့်​ ကွန်ြပူတာတွင် ဖိုင်များ​ကို အမည်​ေပး​ြခင်း​ စသည်တို့​ကို ရရှိလာ​ေသာ်လည်း​ encoding standard​ မရှိြခင်း​၊ ​ေဖာင့်​တခုနှင့်​တခု ​ေရး​သား​ထား​​ေသာ စာများ​ ဖလှယ်၍ သံုး​နုိင်မှု မရှိြခင်း​ စ​ေသာ ASCII ​ေခတ်က ရှိခဲ့​​ေသာ အား​နည်း​ချက်များ​အား​လံုး​ မ​ေပျာက်မပျက် ဆက်လက်တည်ရှိ​ေနပါသည်။ ထိုသို့​​ေသာ ​ေဖာင့်​များ​အား​ Unicode Standard​ ကို အသံုး​မြပုနိုင်​ေသာ ​ေနရာများ​တွင် ယာယီ ြမန်မာစာ စာလံုး​​ေပါ်​ေစရန်သာ အသံုး​ြပုသင့်​ပါသည်။


Fake Unicode Font များ​သည် အနီ​ေရာင်ြပထား​​ေသာ တုိင်း​ရင်း​သား​ စာလံုး​များ​​ေနရာတွင် ASCII ​ေဖာင့်​များ​မှ လိုအပ်​ေသာ စာလံုး​များ​ကို ထည့်​သွင်း​အသံုး​ြပုြကပါသည်။


[caption id="attachment_105" align="aligncenter" width="501" caption="Unicode Chart for Myanmar ---- Unicode Consortium. Modified to show a purpose."]Unicode Chart for Myanmar ---- Unicode Consortium. Modified to show a purpose.[/caption]

Unicode မဟုတ်​ေသာ encoding များ​မှာ -




  • MyaZedi Unicode

  • TPartial

  • XPartial

  • BIT

  • ZawGyi Unicode


အထက်ပါ​ Fake Unicode ​ေဖာင့်​များ​ကို အသံုး​ြပုြခင်း​ြဖင့်​ ​ေအာက်ပါ ဆိုး​ကျုိး​များ​ကို ရရှိနုိင်မည် ြဖစ်ပါသည်။


တုိင်း​ရင်း​သား​ ဘာသာစကား​များ​ အသံုး​ြပုရန် ြပဿနာရှိြခင်း​

တိုင်း​ရင်း​သား​များ​အတွက် သတ်မှတ်ထား​​ေသာ စာလံုး​များ​ကို လဲလှယ်အသံုး​ြပုထား​ြခင်း​ ြဖစ်​ေသာ​ေြကာင့်​ ဤ​ေဖာင့်​များ​ကို ဆက်လက်အသံုး​ြပုပါက ​ေနာင်တချိန်တွင် ရှမ်း​ကွန်ြပူတာစနစ်၊ မွန်ကွန်ြပူတာစနစ် စ​ေသာ တုိင်း​ရင်း​သား​ စာ​ေပများ​ကို ကွန်ြပူတာ​ေပါ်တွင် အသံုး​ချနိုင်ရန် ခက်ခဲသွား​မည် ြဖစ်ပါသည်။


ြမန်မာစာ​ Searching အသံုး​မြပုနုိင်ြခင်း​

‘က’ နှင့်​ ‘ka sit’ ကိုပင် ကွန်ြပူတာက အတူတူြဖစ်သည်ဟု မသိပါက ​ေဒတာအချက်အလက်များ​စွာ ပါ​ေသာ စနစ်များ​တွင် ကျွနု်ပ်တို့​လိုချင်သည်ကို မှန်ကန်တိကျစွာ ရှာ​ေဖွနိုင်မည် မဟုတ်ပါ။ ဥပမာ အင်တာနက်တွင် ကျွနု်ပ်တို့​ ြမန်မာလို ရှာ​ေဖွလို့​ ရပါသလား​။ ရှာ​ေဖွ၍ ရလာ​ေသာ ရလဒ်များ​သည် ရာခုိင်နှုန်း​အနည်း​ငယ်မျှ​ေသာ မှန်ကန်မည်ြဖစ်ြပီး​ ကျန်အချက်အလက်များ​သည် ​ေပျာက်ဆံုး​​ေနမည်ြဖစ်သည်။


ြမန်မာစာ အစီအစဉ်များ​ လဲွမှား​နုိင်ြခင်း​

‘တက္ကသိုလ်’ နှင့်​ ‘တက်ကသုိလ်’ သည် အတူတူပင်ြဖစ်သည်ကို ကွန်ြပူတာမှ မသိနုိင်ပါက ြမန်မာစာလံုး​များ​ကို ြကီး​စဉ်ငယ်လိုက် စီစဉ်နုိင်မည် မဟုတ်ပါ။ အ​ေြခခံ ြကီး​စဉ်ငယ်လိုက် စီစဉ်ြခင်း​ကို မလုပ်နုိင်ပါက ပိုမိုြကီး​များ​ကျယ်ြပန့်​​ေသာ စနစ်များ​တွင် စီစဉ်ြခင်း​များ​ လုပ်​ေဆာင်နုိင်မည် မဟုတ်ပါ။ ဥပမာ အင်တာနက်တွင် ‘University’ ဝက်ဘ်ဆိုဒ်များ​ကို ရရှိမည် ြဖစ်ပါသည်။ ‘တက္ကသိုလ်’ ဟု ရှာ၍ ထွက်လာ​ေသာ ြဖစ်နုိင်​ေြခနည်း​​ေသာ ဝက်ဘ်ဆုိက်များ​ကို ရရှိမည် ြဖစ်ပါသည်။ အြခား​စနစ်များ​ ဥပမာ Banking, e-Government, e-Commerce စနစ်များ​တွင်လည်း​ ရလဒ်များ​သည် ​ေသချာတိကျြခင်း​ ရှိနုိင်မည် မဟုတ်ပါ။


ကွန်ြပူတာစနစ်များ​တွင် အံမဝင်ြခင်း​

နိုင်ငံတကာမှ ​ေရး​သား​ထား​​ေသာ ​ေဆာ့​ဖ်ဝဲများ​ ဥပမာ - စီမံခန့်​ခဲွ​ေရး​ ​ေဆာ့​ဖ်ဝဲများ​၊ အ​ေရာင်း​​ေဆာ့​ဖ်ဝဲများ​ စသည်တို့​သည် နိုင်ငံတကာမှ ဘာသာမျုိး​စံုနှင့်​ အသံုး​ြပုနုိင်​ေလ့​ ရှိြကပါသည်။ ထိုသို့​ အသံုး​ြပုရန် အဆိုပါ ​ေဆာ့​ဖ်ဝဲများ​ကို ဘာသာတခုစီအတွက် သီး​ြခား​ြပင်ဆင်ရန် မလိုအပ်သည်မှာ Unicode Standard ကို အသံုး​ြပု​ေသာ​ေြကာင့်​ ြဖစ်ပါသည်။ အကယ်၍ ြမန်မာစာအတွက်​ Fake Unicode များ​ကို သံုး​မည်ဆုိလျှင် ထို​ေဆာ့​ဖ်ဝဲများ​ကို ြမန်မာဘာသာြဖင့်​ သံုး​ရန် ခက်ခဲသွား​မည် ြဖစ်ပါသည်။


Data Corruption ြဖစ်နုိင်ြခင်း​

ASCII ​ေဖာင့်​များ​တွင် သုည နှင့်​ ဝလံုး​သည် ပံုစံတူ​ေသာ​ေြကာင့်​ နှစ်လံုး​စလံုး​ကို ဂဏန်း​ ၃ဝ အြဖစ် သတ်မှတ်ထား​ပါသည်။ ထို့​​ေြကာင့်​ ကွန်ြပူတာသည် မည်သည့်​နည်း​နှင့်​မျှ ဂဏန်း​တူ​ေန​ေသာ ထိုသုညနှင့်​ ဝလံုး​ကို ခဲွြခား​သိရှိနိုင်မည် မဟုတ်ပါ။ ASCII နှင့်​ ​ေရး​ထား​​ေသာ စာများ​ကို သီး​သန့်​ြပုလုပ်ထား​​ေသာ ​ေဆာ့​ဖ်ဝဲများ​နှင့်​ Unicode Standard သို့​ ​ေြပာင်း​လဲနုိင်​ေသာ်လည်း​ သုညနှင့်​ ဝလံုး​ သံုး​ထား​​ေသာ ​ေနရာများ​တွင် အချက်အလက်များ​သည် မှန်ကန်မှု ရှိမည် မဟုတ်ပါ။ အချို့​​​ေသာ Fake Unicode Font များ​တွင်လည်း​ သုညနှင့်​ ဝလံုး​ကို ခဲွြခား​ထား​​ေလ့​ မရှိြကပါ။ အချက်အလက်များ​စွာ ထည့်​သွင်း​ထား​​ေသာ​ database စနစ်များ​တွင် အချက်အလက်များ​သို့​ ထည့်​သွင်း​ထား​​ေသာ အချက်အလက်များ​ မမှန်ကန်ြခင်း​ကို​ data corruption ဟု ​ေခါ်ပါသည်။ ဥပမာ ကွန်ြပူတာက အဂင်္လိပ်မှ ြမန်မာသို့​ အလိုအ​ေလျာက် ဘာသာြပန်​ေသာ စနစ်တခု တည်​ေဆာက်မည်ဆုိပါလျှင် သုညနှင့်​ ဝလံုး​တို့​ ဆက်စပ်​ေသာ ​ေနရာများ​တွင် အ​ေြဖသည် အြမဲမှား​မည် ြဖစ်ပါသည်။


Unicode​ Standard

Unicode Standard သည် encoding တခု တနည်း​အား​ြဖင့်​ အက္ခရာများ​ကို ဂဏန်း​သတ်မှတ်​ေပး​ြခင်း​သာ ြဖစ်​ေသာ်လည်း​ ​၎င်း​​သတ်မှတ်ချက်အတိုင်း​ လိုက်နာြပီး​ ြမန်မာစာစနစ်တခု ဖန်တီး​ရန်မှာ ​ေဖာင့်​တခုတည်း​ြဖင့်​ မြဖစ်နိုင်ပါ။ ြမန်မာစာလံုး​များ​ကို​​ screen ​ေပါ်တွင် ​ေပါ်နိုင်ရန် Rendering Engine ၊ ​၎င်း​​နှင့်​အလုပ်လုပ်နိုင်​ေသာ​ Smart Font နှင့်​ ြမန်မာစာကို ရိုက်ရန် Input Engine တို့​ လိုအပ်ပါသည်။ ဥပမာ ‘တက္ကသိုလ်’ တွင် ပါ​ေသာ ‘က’ နှစ်လံုး​တွင် မည်သည့်​ ‘က’ သည် ‘ka sit’ ြဖစ်မည်ကို​ Smart Font ထဲတွင် ​ေရး​သား​ရပါသည်။ ​၎င်း​​အချက်အလက်ကို Rendering Engine က သိရှိြပီး​​ screen တွင် မှန်ကန်​ေသာ ပံုစံကို ြပ​ေပး​နုိင်မည် ြဖစ်ပါသည်။ ယ​ေန့​ အသံုး​ြပု​ေန​ေသာ ကွန်ြပူတာစနစ် (OS) များ​ အား​လံုး​တွင် Rendering System များ​ တပါတည်း​ ပါရှိပါသည်။ ဥပမာ ဝင်း​ဒိုး​ကွန်ြပူတာများ​တွင် OpenType Rendering Engine ပါရှိပါသည်။ သို့​ရာတွင် မိုဘုိင်း​လ်ဖုန်း​များ​နှင့်​ ကွန်ြပူတာ (PC) ထက်နိမ့်​​ေသာ ကွန်ြပူတာများ​တွင် အဆုိပါ Rendering Engine များ​ မပါရှိြက​ေသး​​ေသာ​ေြကာင့်​ ြမန်မာစာ ယူနီကုတ် အသံုး​ြပုရန် မြဖစ်နုိင်​ေသး​ပါ။ ထိုအချိန်မျုိး​တွင် Fake Unicode Font များ​ကို အသံုး​ြပုနိုင်ပါသည်။ စာရိုက်ရာတွင်လည်း​ ယခင် ASCII စနစ်များ​တွင် ‘u’ ကို နှိပ်ြပီး​ ယူနီကုတ်ဂဏန်း​များ​ သိမ်း​ရန်မှာမူ Input Engine လိုအပ်ပါသည်။ ASCII စနစ်များ​နှင့်​ Fake Unicode Font များ​တွင် ‘​ေလ’ ကို ‘​ေ’ + ‘လ’ ဟု သိမ်း​ဆည်း​​ေသာ်လည်း​ Unicode Standard တွင် ‘​ေလ’ ကို ‘လ’ + ‘​ေ’ ဟု သိမ်း​ဆည်း​ပါသည်။ အ​ေြကာင်း​မှာ စကား​လံုး​အား​လံုး​၏ အ​ေြခခံမှာ ဗျည်း​စာလံုး​များ​ြဖစ်​ေသာ​ေြကာင့်​ ထိုသို့​ ဗျည်း​ကို ​ေရှ့​​ဆံုး​မှ သိမ်း​မှသာ​ sorting/searching အဆင်​ေြပနုိင်မည် ြဖစ်​ေသာ​ေြကာင့်​ ြဖစ်ပါသည်။ ထို့​​ေြကာင့်​ Input Engine မှ ကီး​ဘုတ်​ေပါ်တွင် ရိုက်​ေသာ စာလံုး​များ​ကို ယူနီကုတ် စံအတိုင်း​ ကွန်ြပူတာက သိမ်း​ဆည်း​​ေအာင် လုပ်​ေဆာင်​ေပး​ြပီး​ ​၎င်း​​စာများ​ကို​ screen ​ေပါ်တွင် မှန်ကန်စွာ ​ေပါ်​ေအာင် Rendering Engine မှ​ Smart Font ကို သံုး​ြပီး​ လုပ်​ေဆာင်ြခင်း​ ြဖစ်ပါသည်။


လက်ရှိ Unicode Standard ြမန်မာစာစနစ်များ​မှာ -



  • Myanmar2, Myanmar3 (OpenType Font, Keyman Input Engine)

  • Paduak (OpenType + Graphite Font for Linux and Windows, Keyman Input Engine)

  • Parabaik (OpenType font)

  • MyMyanmar (Universal Font for Linux, Windows and Mac, MyInput Engine)

  • MyMyanmar Developed Unicode Fonts from ASCII Fonts. (M-Myanmar Unicode, CE Unicode, Art House Unicode ...)

  • AyeYar


Myanmar 2,​ 3 ​ေဖာင့်​များ​ကို အစိုး​ရရံုး​များ​တွင် အသံုး​ြပုရန် အခမဲ့​ ​ေပး​ထား​ပါသည်။ ပိ​ေတာက်​ေဖာင့်​သည် Open Source Community ြကုိး​ပမ်း​မှုတခုြဖစ်ြပီး​ အခမဲ့​ ရရှိနိုင်ပါသည်။ MyMyanmar အား​ အခမဲ့​ရရှိ​ေသာ အင်တာနက် ဗား​ရှင်း​အြဖစ်လည်း​​ေကာင်း​၊ ​ေရာင်း​ချလျက်ရှိ​ေသာ​ DVD Software ဗား​ရှင်း​အြဖစ်လည်း​​ေကာင်း​ ရရှိနုိင်ပါသည်။ အင်တာနက် ဗား​ရှင်း​သည် အင်တာနက်ရှိမှ အသံုး​ြပု၍ ရမည်ြဖစ်ြပီး​ ဝယ်ယူ​ေသာ ဗား​ရှင်း​နှင့်​ စွမ်း​​ေဆာင်ရည် မကွာြခား​ပါ။ MyMyanmar မှ ယခင် ASCII ​ေဖာင့်​များ​စွာ၏ လုပ်ပိုင်ခွင့်​များ​ကို ရယူြပီး​ ​၎င်း​​စာလံုး​ပံုစံများ​ကို Unicode Standard Font များ​ ြဖစ်​ေအာင် ဖန်တီး​ထား​ပါသည်။ ​၎င်း​​တို့​တွင် အခမဲ့​ရ​ေသာ ​ေဖာင့်​များ​သည် အခမဲ့​ရမည်ြဖစ်ြပီး​ စီး​ပွား​ြဖစ်​ေဖာင့်​များ​လည်း​ ပါဝင်ပါသည်။ ​၎င်း​​တို့​ကို MyInput သို့​မဟုတ် Myanmar 2, 3 Keyman စနစ်များ​နှင့်​ တဲွသံုး​နုိင်ပါသည်။


ယူနီကုတ်စနစ်များ​သည် မည်သူ​ေရး​​ေသာ​ေဖာင့်​ြဖစ်​ေစ၊ မည်သည့်​စနစ်ြဖစ်​ေစ ဖလှယ်အသံုး​ြပုနိုင်စွမ်း​ ရှိပါသည်။ ဥပမာ MyMyanmar နှင့်​ ရိုက်ထား​​ေသာ စာများ​ကို အစိုး​ရရံုး​များ​အတွက် Myanmar2, Myanmar3 ြဖင့်​ အသံုး​ြပုနုိင်သလို ပိ​ေတာက်နှင့်​ ရိုက်ထား​​ေသာ စာများ​ကိုလည်း​ MyMyanmar နှင့်​လည်း​​ေကာင်း​၊ အြခား​ ယူနီကုတ်​ေဖာင့်​များ​နှင့်​လည်း​​ေကာင်း​ ဖတ်ရှုနိုင်ပါသည်။


​ေဖာင့်​တခု သို့​မဟုတ် စနစ်တခုကို ယူနီကုတ် ဟုတ်မဟုတ် စစ်​ေဆး​ရန်မှာ လွယ်ကူပါသည်။ ထုိ​ေဖာင့်​စနစ်ြဖင့်​ စာအနည်း​ငယ်ရိုက်ြပီး​ အထက်တွင်ပါ​ေသာ ယူနီကုတ်စနစ်တခုခုနှင့်​ ဖွင့်​ြကည့်​နုိင်ပါက Unicode Standard နှင့်​ ကိုက်ညီ​ေသာ ​ေဖာင့်​၊​ စနစ် ြဖစ်​ေြကာင်း​ သိရှိနိုင်ပါသည်။ အထက်တွင် ​ေဖာ်ြပထား​​ေသာ စာရင်း​တွင် ပါဝင်သည့်​ ​ေဖာင့်​များ​မှအပ အြခား​​ေဖာင့်​များ​သည် Unicode Standard နှင့်​ ကိုက်ညီ​ေလ့​မရှိြကပါ။ ထုိ့​​ေြကာင့်​ ​၎င်း​​တို့​ကို သံုး​မည်ဆုိလျှင် စနစ်အချင်း​ချင်း​ ဖလှယ်အသံုး​ြပုနုိင်စွမ်း​ မရှိရံုသာမက အနာဂတ်တွင် တွင်ကျယ်လာမည့်​ ှSearch Engine များ​၊ e-Government စနစ်များ​၊ လုပ်ငန်း​သံုး​ ကွန်ြပူတာစနစ်များ​၊ ဝက်ဘ်ဆုိက်​ေပါ်တယ်များ​တွင် ြမန်မာစာသည် စာလံုး​​ေပါ်ရံုမှလဲွ၍ အြခား​ဘာသာများ​တွင် အသံုး​ြပု​ေနြက​ေသာ စွမ်း​​ေဆာင်ရည်များ​ ရရှိနုိင်​ေတာ့​မည် မဟုတ်ပါ။ ထို့​​ေြကာင့်​ ြဖစ်နုိင်လျှင် Unicode Standard စနစ်များ​ကိုသာ သံုး​စဲွသင့်​ပါသည်။


ထူး​ြမင့်​​ေနာင်


(ထူး​ြမင့်​​ေနာင်သည် Unicode Consortium ၏ အဖဲွ့​ဝင်ြဖစ်ြပီး​ ဝီကီပိဒိယ ြမန်မာဘာသာအပိုင်း​တွင် System Operator ြဖစ်ပါသည်။ Technomation Studios နှင့်​ MyMyanmar Projects တို့​တွင် အမှု​ေဆာင် ဒါရိုက်တာအြဖစ် တာဝန်ထမ်း​​ေဆာင်လျက်ရှိပါသည်။)

3 comments:

eieiygn said...

ထူး​ြမင့်​​ေမာင် လား​ ထူး​ြမင့်​​ေနာင်လား​ ကျွန်ပျူတာလို့​​​ေရး​ရတာမသိဘူး​လား​စာ​ေရး​တာ​ေလး​မှန်​ေအာင်လုပ်ပါဦး​

Soe Htet Aung said...

​ေကျး​ဇူး​တင်ပါသည်။
​ေအာင်ြမင်ပါ​ေစ။

monfonts said...
This comment has been removed by the author.

Post a Comment

 

content top