content top

Encoding​ဆို​သည်​မှာ …?

Encoding ဆိုသည်မှာ


ကွန်ြပူတာသည် ကျွနု်ပ်တို့​လူအများ​ နား​လည်သလို ဘာသာစကား​များ​၊ စာလံုံး​များ​ကို နား​လည်သိရှိနုိင်ြခင်း​ မရှိပါ။ အ​ေြခခံအကျဆံုံး​အဆင့​်တွင် ကွန်ြပူတာများ​သည် ဂဏန်း​များ​ကို သိမ်း​နုိင်၊ တွက်ချက်နိုင်ြခင်း​ စွမ်း​ရည်သာ ရှိြကပါသည်။ ထုိ့​​ေြကာင့​် ဘာသာစကား​များ​၏ အက္ခရာများ​ကို ကွန်ြပူတာများ​တွင် သံုး​နုိင်ရန်အတွက်လည်း​ အက္ခရာတလံုး​ချင်း​စီကို ဂဏန်း​များ​အြဖစ် သတ်မှတ်ရပါသည်။ ဥပမာ အဂင်္လိပ်အက္ခရာ ​ေအ ‘A’ ကို 41 ဟု သတ်မှတ်ပါသည်။ ထိုသို့​ သတ်မှတ်မှသာ ကွန်ြပူတာက ကျွနု်ပ်တို့​သံုံး​​ေသာ စာ​ေပများ​ကို သိမ်း​ဆည်း​နိုင်ြခင်း​၊ ပရင်တာထုတ်နုိင်ြခင်း​၊ ၀က်ဘ်ဆုိက်များ​တွင် ဖတ်ရှုနုိင်ြခင်း​ စသည်တို့​ကို ​ေဆာင်ရွက်နိုင်ြခင်း​ ြဖစ်ပါသည်။ သို့​​ေသာ်လည်း​ ဘာသာအသီး​သီး​၏ အက္ခရာအသီး​သီး​ကို မည်သည့​်ဂဏန်း​အြဖစ် သိမ်း​မည်ဆို​ေသာ သတ်မှတ်ချက်သည် တနုိင်ငံနှင့​် တနုိင်ငံ၊ ကွန်ြပူတာစနစ် တခုနှင့​်တခု၊ ​ေဆာ့​ဝဲတခုနှင့​်တခု မတူညီခဲ့​ြကပါ။ ဥပမာ အဂင်္လိပ်ဘာသာစကား​တွင်ပင် အက္ခရာများ​ကုိ ANSI Encoding, ASCII Encoding, MacRoman Encoding စသည်ြဖင့​် အမျုိး​မျုိး​ သတ်မှတ်ခဲ့​ြကပါသည်။ ထို့​​ေြကာင့​် Encoding​ ဆိုသည်မှာ မည်သည့​်အက္ခရာကို မည်သည့​်ဂဏန်း​သတ်မှတ်သည်ဆို​ေသာ သတ်မှတ်ချက်တခု သက်သက်ပင် ြဖစ်ပါသည်။ ASCII Encoding​ တွင် ‘A’ သည် 41 ြဖစ်ြပီး​ ‘Z’ သည် 90 ြဖစ်ပါသည်။


Encoding Standards​ ​ဆို​သည်​မှာ


ဘာသာစကား​တခုတည်း​ကိုပင် အမျုိး​မျုိး​​ေသာ ဂဏန်း​သတ်မှတ်ချက်များ​နှင့​် သိမ်း​ဆည်း​ြက​ေသာ​ေြကာင့​် ကွန်ြပူတာ တခုနှင့​်တခု၊ ​ေဒသတခုနှင့​်တခု အချက်အလက်များ​ (စာများ​) ​ေပး​ပို့​သည့​်အခါ encoding​ မတူညီ​ေသာ​ေြကာင့​် တ​ေနရာမှ အချက်အလက်ကို အြခား​တ​ေနရာမှ ဖတ်၍မရြခင်း​ ြပဿနာများ​ ​ေြပလည်​ေစရန်အတွက် International အဖဲွ့​အစည်း​များ​သည် စံသတ်မှတ်ချက်များ​ သတ်မှတ်ြပီး​ အ​ေကာင်အထည်​ေဖာ်ခဲ့​ြကပါသည်။ ပထမဦး​ဆံုး​ ထွက်​ေပး​လာ​ေသာ စံသတ်မှတ်ချက်မှာ အဂင်္လိပ်ဘသာသာစကား​အတွက်ြဖစ်ြပီး​ ​၎င်း​​ကို ASCII​ ဟု ​ေခါ်ပါသည်။ ထိုအချိန်မှစ၍ တကမ္ဘာလံုး​တွင် အဂင်္လိပ်စာကို ASCII encoding နှင့​်သာ သိမ်း​ဆည်း​ြက​ေသာ​ေြကာင့​် စနစ်မတူြခင်း​၊ ​ေဖာင့​်မတူြခင်း​ ြပဿနာများ​ ကင်း​​ေဝး​ခဲ့​ြကပါသည်။ ထို့​​ေနာက် အဂင်္လိပ်ဘာသာစကား​ကဲ့​သို့​ပင် တကမ္ဘာလံုး​မှ ဘာသာစကား​အား​လံုး​၏ အက္ခရာများ​ကို စံသတ်မှတ်နိုင်ရန်အတွက် ISO​ နှင့​် Unicode Consortium အဖဲွ့​အစည်း​များ​ ဖဲွ့​စည်း​၍ ြကုိး​ပမ်း​လုပ်​ေဆာင်ခဲ့​ြကပါသည်။ Unicode Standard​ သည် အဆိုပါ ISO​ နှင့​် Unicode Consortium​ တို့​၏ ြကုိး​ပမ်း​မှုများ​မှ ရလဒ်ပင် ြဖစ်ပါသည်။ တကမ္ဘာလံုး​တွင် လက်ရှိသံုး​​ေန​ေသာ Encoding စနစ်သည် Unicode Standard​ ပင် ြဖစ်ပါသည်။


ြမန်မာစာ encoding များ​


ASCII​ ​ေခတ်တွင် ြမန်မာစာ encoding များ​ ရှိခဲ့​​ေသာ်လည်း​​ Standard​ အြဖစ် သတ်မှတ်နုိင်ြခင်း​ မရှိခဲ့​ပါ။ ထိုအချိန်က ြမန်မာစာ encoding များ​မှာ အဂင်္လိပ်စာ စာလံုး​များ​ကို အ​ေြခခံ​ေသာ စနစ်များ​သာ ြဖစ်ခဲ့​ပါသည်။ ဥပမာ ကွန်ြပူတာ ကီး​ဘုတ်တွင် ‘u’ ကို နှိပ်လုိက်လျှင် ကြကီး​ ​ေပါ်နိုင်ရန် ​ေဖာင့​်ထဲတွင်ရှိ​ေသာ ‘u’ ၏ စာလံုး​ပံုစံဒီဇုိင်း​ကို ‘က’ ြဖစ်​ေအာင် ြပင်ဆင်ထား​​ေသာ ​ေဖာင့​်များ​သာ ထွက်​ေပါ်ခဲ့​ပါသည်။ ထို့​​ေြကာင့​် ကွန်ြပူတာစကရင်​ေပါ်တွင် ကြကီး​​ေပါ်​ေသာ်လည်း​ ကွန်ြပူတာက အမှန်တကယ် မှတ်သား​သိမ်း​ဆည်း​ထား​သည်မှာ အဂင်္လိပ်အက္ခရာ ‘u’ သာ ြဖစ်ပါသည်။ ထုိ့​​ေြကာင့​် ​၎င်း​​စနစ်များ​သည် စာပံုနှိပ်လုပ်ငန်း​မှအပ အြခား​လုပ်ငန်း​များ​တွင် တွင်ကျယ်လာြခင်း​ မရှိပါ။ ASCII encoding ြဖင့​် ြမန်မာစနစ်များ​ကို ‘​ေဖာင့​်’ များ​ဟုသာ ​ေခါ်ခဲ့​ြကပါသည်။ ​ေရး​သား​သူမတူ​ေသာ ASCII ​ေဖာင့​်အမျုိး​မျုိး​သည် အဂင်္လိပ်အက္ခရာအမျုိး​မျုိး​ကို ​ေနရာလဲခဲ့​​ေသာ​ေြကာင့​် တခုနှင့​်တခု မတူညီြကပါ။ ထို့​​ေြကာင့​် English ASCII လို စနစ်အား​လံုး​၊ ​ေနရာအား​လံုး​တွင် တသတ်မှတ်တည်း​ သံုး​နုိင်​ေသာ ြမန်မာစာ ASCII စနစ်လည်း​ မရှိခဲ့​ပါ။ ASCII Encoding/Font များ​မှာ




  • Avalaser (Mac only)

  • CE

  • Academy

  • M-Myanmar

  • Ava

  • Win Myanmar: Win Innwa, Win Hakha, Win Thanlwin, etc

  • W Art House, A Art House


ထို့​​ေနာက်တွင် ISO/Unicode Consortium မှ ြမန်မာဘာသာကို Unicode Standard​ ထဲတွင် ထည့​်သွင်း​နုိင်ခဲ့​ပါသည်။ သို့​ရာတွင် Unicode Standard Encoding​ ဆိုသည်မှာ အက္ခရာများ​ကို ဂဏန်း​သတ်မှတ်​ေပး​ြခင်း​ ြဖစ်​ေသာ်လည်း​ ြမန်မာစာ​ေဖာင့​်​ေရး​သူများ​ နား​လည်ထား​​ေသာ အဂင်္လိပ်အက္ခရာများ​ကို ြမန်မာစာနှင့​် လဲမည်ဆို​ေသာ အယူအဆနှင့​် လံုး​ဝ ဆန့​်ကျင်ဘက် ကွာြခား​ပါသည်။ ASCII ​ေဖာင့​်များ​တွင် ‘က’ တလံုး​အတွက် ​၎င်း​​နှင့​် ပံုသဏ္ဌာန်ကိုလိုက်ြပီး​ ဂဏန်း​များ​ကို ကိုယ်စား​ြပုပါသည်။ ဥပမာ ဝင်း​အင်း​ဝတွင် ‘က’ အတွက် 75 နှင့​် ‘ka sit’ အတွက် 250 ဟု မှတ်သား​ပါသည်။ ယူနီကုတ်တွင် ‘က’ သည် 4096 ြဖစ်ြပီး​ ‘ka sit’ သည်လည်း​​ 4096 ြဖစ်ပါသည်။ ထို့​​ေြကာင့​် ASCII​ မှာလို ‘က’ ၏ စာလံုး​ဒီဇိုင်း​​ေရး​ရန် တ​ေနရာ၊ ‘ka sit’ အတွက် တ​ေနရာ မရှိပါ။ အ​ေြခအ​ေနကိုလိုက်၍ ‘က’ နှင့​် ‘ka sit’ ကို အလို​ေလျာက် ​ေြပာင်း​လဲနုိင်သည့​် Rendering System ​ေခါ် နည်း​ပညာြဖင့​် လုပ်​ေဆာင်ရမည် ြဖစ်ပါသည်။ ထုိ့​မှသာ ကျွနု်ပ်တို့​ ကွန်ြပူတာတွင် သံုး​​ေန​ေသာ​ Database​ များ​၊ အီး​​ေမး​လ်များ​၊​ Search Engine များ​၊ ကွန်ြပူတာသံုး​စနစ်များ​ (e-government, Baking, POS, etc) သည် မှန်ကန်တိကျစွာ အလုပ်လုပ်နုိင်မည် ြဖစ်ပါသည်။ ‘က’ နှင့​် ‘ka sit’ သည် ဂဏန်း​နှစ်ခုကိုသာ ကိုယ်စား​ြပုပါလျှင် ကွန်ြပူတာအား​ ‘တက္ကသိုလ်’ တွင် ‘က’ ဘယ်နှလံုး​ ပါသလဲ​ေမး​ပါက ‘ka sit’ ကို ‘က’ မှန်း​ မသိဘဲ၊ ‘က’ တလံုး​သာပါသည်ဟု အ​ေြဖထွက်ပါလိမ့​်မည်။ ​၎င်း​​အ​ေြဖသည်​ Database​ များ​၊ အီး​​ေမး​စနစ်များ​၊ Search Engine များ​တွင် များ​စွာ ထိခိုက်​ေစနုိင်ပါသည်။ ဥပမာ သင်ရှာလို​ေသာ အချက်အလက်များ​ တိကျစွာ မရှာ​ေဖွနိုင်ြခင်း​၊ အက္ခရာစဉ်ြခင်း​ အပါအဝင် အချက်အလက်များ​ကို စီစဉ်နိုင်မ၍ မရှိြခင်း​မှစ၍ စနစ်တခုလံုး​ အလုပ်​ေသချာစွာ မလုပ်နိုင်ြခင်း​ အထိ မလိုလား​အပ်​ေသာ ဆိုး​ကျုိး​များ​စွာ ရရှိနိုင်မည် ြဖစ်ပါသည်။ ထို့​​ေြကာင့​် Unicode Standard တွင် ‘က’ သည် ဂဏန်း​တခုတည်း​အြဖစ်​ေသာ သတ်မှတ်ပါသည်။ ထိုနည်း​တူ ASCII ​ေဖာင့​်များ​တွင် ​ေတွ့​ရ​ေသာ ရရစ်အြကီး​အ​ေသး​ အမျုိး​မျုိး​၊ ​ေအာက်ြမစ်အမျုိး​မျုိး​၊ တ​ေချာင်း​ငင်အမျုိး​မျုိး​တို့​ မရှိ​ေတာ့​ပါ။ အား​လံုး​မှာ သတ်မှတ်ထား​​ေသာ စံအတိုင်း​ တခုစီသာ ရှိပါသည်။ ​၎င်း​​အက္ခရာများ​ မည်သည့​်ပံုစံ​ေပါ်မည်ဆို (ဥပမာ တ​ေချာင်း​ငင် တိုမည်၊ ရှည်မည်) ကို ကွန်ြပူတာစနစ်များ​က လုပ်​ေဆာင်​ေပး​မည် ြဖစ်ပါသည်။


ထူး​ြမင့​်​ေနာင်


၁၉​၊​​ ၂​၊​​ ၂ဝ၁​ဝ


(ထူး​ြမင့​်​ေနာင်သည် Unicode Consortium ၏ အဖဲွ့​ဝင်ြဖစ်ြပီး​ ဝီကီပိဒိယ ြမန်မာဘာသာအပိုင်း​တွင် System Operator ြဖစ်ပါသည်။ Technomation Studios နှင့​် MyMyanmar Projects တို့​တွင် အမှု​ေဆာင် ဒါရိုက်တာအြဖစ် တာဝန်ထမ်း​​ေဆာင်လျက်ရှိပါသည်။)

Fake Unicode Encoding များ​နှင့်​Unicode​Standard

Fake Unicode Encoding များ​

Unicode Standard တွင် အထက်ပါ စာလံုး​အပိုများ​ မပါြခင်း​က ြမန်မာ​ေဖာင့်​​ေရး​သူများ​အတွက် Unicode Standard ကို သံုး​စဲွရန် အခက်အခဲ ြဖစ်​ေစခဲ့​ပါသည်။ ဥပမာ တက္ကသိုလ်၏ ကြကီး​နှစ်လံုး​တွင် အ​ေပါ်ကြကီး​သည်လည်း​ 4096 ၊ ​ေအာက်ကြကီး​သည်လည်း​ 4096 ြဖစ်ြပီး​ ‘က’ နှင့်​ ‘ka sit’ စာလံုး​ ဒီဇုိင်း​နှစ်မျုိး​ကို 4096 တ​ေနရာထဲတွင် ​ေရး​၍မရပါ။ ယခင် ASCII​ တွင် ရသည်မှာ ကြကီး​နှစ်လံုး​သည် ဂဏန်း​မတူ​ေသာ​ေြကာင့်​ ဂဏန်း​နှစ်​ေနရာတွင် အသံုး​ချရန် လိုအပ်ပါသည်။ ထိုသို့​​ေသာ နည်း​ပညာများ​ကို အသံုး​မချနိုင်ခင်တွင် အချုိ့​​ြမန်မာ​ေဖာင့်​ ​ေရး​သူများ​က ​ေဆး​ြမီး​တိုတခုကို စတင်အသံုး​ချခဲ့​ြကပါသည်။ ​၎င်း​​မှာ ြမန်မာတုိင်း​ရင်း​ဘာသာများ​အတွက် Unicode Consortium က သတ်မှတ်ထား​​ေသာ ဂဏန်း​​ေနရာများ​တွင် ASCII မှ စာလံုး​အပုိများ​ ထည့်​ြကြခင်း​ ြဖစ်ပါသည်။ ဥပမာ ‘တက္ကသိုလ်’ တွင် ‘ka sit’ နှင့်​ ‘က’ ဂဏန်း​တူရမည် ြဖစ်​ေသာ်လည်း​ ‘ka sit’ ကို တုိင်း​ရင်း​သား​စာလံုး​ ‘-’ ၏ ဂဏန်း​​ေနရာတွင် ယခင် ASCII ​ေဖာင့်​များ​ ‘A’ ​ေနရာတွင် ‘က’ ထား​သလို သွား​ထား​ြကပါသည်။ ထိုသို့​လုပ်ြခင်း​ြဖင့်​ Rendering Engine​ များ​ မလိုဘဲ ြမန်မာစာကို သံုး​နုိင်လာခဲ့​ပါသည်။ သို့​​ေသာ် ထိုသို့​အသံုး​ြပုနုိင်ြခင်း​သည် ယူနီကုတ်ဟု အမည်​ေပး​ြက​ေသာ်လည်း​ တကယ်တမ်း​တွင် Unicode Standard​ ၏ အနှစ်သာရများ​ လံုး​ဝ ​ေပျာက်ဆံုး​​ေစပါသည်။ တကယ်တမ်း​ ​၎င်း​​​ေဖာင့်​များ​သည်​ Fake Unicode Font​ များ​ (သို့​မဟုတ်) Unicode Standard ကုိ ချုိး​​ေဖာက်​ေသာ ​ေဖာင့်​များ​သာ ြဖစ်ပါသည်။ သို့​ရာတွင် ​၎င်း​​​ေဖာင့်​များ​သည် ASCII​ ​ေဖာင့်​များ​ထက် အား​သာချက်တခု ရှိပါသည်။ ​၎င်း​​မှာ ကွန်ြပူတာမှ ‘က’ ကို ‘u’ အြဖစ် သိမ်း​ဆည်း​မှု မြပုြခင်း​ ြဖစ်ပါသည်။ ဤဆိုပါ အချက်​ေြကာင့်​ Unicode Font​ များ​သည် အင်တာနက်​ေပါ်တွင် ဝက်ဘ်ဆုိက်များ​တင်ြခင်း​နှင့်​ ကွန်ြပူတာတွင် ဖိုင်များ​ကို အမည်​ေပး​ြခင်း​ စသည်တို့​ကို ရရှိလာ​ေသာ်လည်း​ encoding standard​ မရှိြခင်း​၊ ​ေဖာင့်​တခုနှင့်​တခု ​ေရး​သား​ထား​​ေသာ စာများ​ ဖလှယ်၍ သံုး​နုိင်မှု မရှိြခင်း​ စ​ေသာ ASCII ​ေခတ်က ရှိခဲ့​​ေသာ အား​နည်း​ချက်များ​အား​လံုး​ မ​ေပျာက်မပျက် ဆက်လက်တည်ရှိ​ေနပါသည်။ ထိုသို့​​ေသာ ​ေဖာင့်​များ​အား​ Unicode Standard​ ကို အသံုး​မြပုနိုင်​ေသာ ​ေနရာများ​တွင် ယာယီ ြမန်မာစာ စာလံုး​​ေပါ်​ေစရန်သာ အသံုး​ြပုသင့်​ပါသည်။


Fake Unicode Font များ​သည် အနီ​ေရာင်ြပထား​​ေသာ တုိင်း​ရင်း​သား​ စာလံုး​များ​​ေနရာတွင် ASCII ​ေဖာင့်​များ​မှ လိုအပ်​ေသာ စာလံုး​များ​ကို ထည့်​သွင်း​အသံုး​ြပုြကပါသည်။


[caption id="attachment_105" align="aligncenter" width="501" caption="Unicode Chart for Myanmar ---- Unicode Consortium. Modified to show a purpose."]Unicode Chart for Myanmar ---- Unicode Consortium. Modified to show a purpose.[/caption]

Unicode မဟုတ်​ေသာ encoding များ​မှာ -




  • MyaZedi Unicode

  • TPartial

  • XPartial

  • BIT

  • ZawGyi Unicode


အထက်ပါ​ Fake Unicode ​ေဖာင့်​များ​ကို အသံုး​ြပုြခင်း​ြဖင့်​ ​ေအာက်ပါ ဆိုး​ကျုိး​များ​ကို ရရှိနုိင်မည် ြဖစ်ပါသည်။


တုိင်း​ရင်း​သား​ ဘာသာစကား​များ​ အသံုး​ြပုရန် ြပဿနာရှိြခင်း​

တိုင်း​ရင်း​သား​များ​အတွက် သတ်မှတ်ထား​​ေသာ စာလံုး​များ​ကို လဲလှယ်အသံုး​ြပုထား​ြခင်း​ ြဖစ်​ေသာ​ေြကာင့်​ ဤ​ေဖာင့်​များ​ကို ဆက်လက်အသံုး​ြပုပါက ​ေနာင်တချိန်တွင် ရှမ်း​ကွန်ြပူတာစနစ်၊ မွန်ကွန်ြပူတာစနစ် စ​ေသာ တုိင်း​ရင်း​သား​ စာ​ေပများ​ကို ကွန်ြပူတာ​ေပါ်တွင် အသံုး​ချနိုင်ရန် ခက်ခဲသွား​မည် ြဖစ်ပါသည်။


ြမန်မာစာ​ Searching အသံုး​မြပုနုိင်ြခင်း​

‘က’ နှင့်​ ‘ka sit’ ကိုပင် ကွန်ြပူတာက အတူတူြဖစ်သည်ဟု မသိပါက ​ေဒတာအချက်အလက်များ​စွာ ပါ​ေသာ စနစ်များ​တွင် ကျွနု်ပ်တို့​လိုချင်သည်ကို မှန်ကန်တိကျစွာ ရှာ​ေဖွနိုင်မည် မဟုတ်ပါ။ ဥပမာ အင်တာနက်တွင် ကျွနု်ပ်တို့​ ြမန်မာလို ရှာ​ေဖွလို့​ ရပါသလား​။ ရှာ​ေဖွ၍ ရလာ​ေသာ ရလဒ်များ​သည် ရာခုိင်နှုန်း​အနည်း​ငယ်မျှ​ေသာ မှန်ကန်မည်ြဖစ်ြပီး​ ကျန်အချက်အလက်များ​သည် ​ေပျာက်ဆံုး​​ေနမည်ြဖစ်သည်။


ြမန်မာစာ အစီအစဉ်များ​ လဲွမှား​နုိင်ြခင်း​

‘တက္ကသိုလ်’ နှင့်​ ‘တက်ကသုိလ်’ သည် အတူတူပင်ြဖစ်သည်ကို ကွန်ြပူတာမှ မသိနုိင်ပါက ြမန်မာစာလံုး​များ​ကို ြကီး​စဉ်ငယ်လိုက် စီစဉ်နုိင်မည် မဟုတ်ပါ။ အ​ေြခခံ ြကီး​စဉ်ငယ်လိုက် စီစဉ်ြခင်း​ကို မလုပ်နုိင်ပါက ပိုမိုြကီး​များ​ကျယ်ြပန့်​​ေသာ စနစ်များ​တွင် စီစဉ်ြခင်း​များ​ လုပ်​ေဆာင်နုိင်မည် မဟုတ်ပါ။ ဥပမာ အင်တာနက်တွင် ‘University’ ဝက်ဘ်ဆိုဒ်များ​ကို ရရှိမည် ြဖစ်ပါသည်။ ‘တက္ကသိုလ်’ ဟု ရှာ၍ ထွက်လာ​ေသာ ြဖစ်နုိင်​ေြခနည်း​​ေသာ ဝက်ဘ်ဆုိက်များ​ကို ရရှိမည် ြဖစ်ပါသည်။ အြခား​စနစ်များ​ ဥပမာ Banking, e-Government, e-Commerce စနစ်များ​တွင်လည်း​ ရလဒ်များ​သည် ​ေသချာတိကျြခင်း​ ရှိနုိင်မည် မဟုတ်ပါ။


ကွန်ြပူတာစနစ်များ​တွင် အံမဝင်ြခင်း​

နိုင်ငံတကာမှ ​ေရး​သား​ထား​​ေသာ ​ေဆာ့​ဖ်ဝဲများ​ ဥပမာ - စီမံခန့်​ခဲွ​ေရး​ ​ေဆာ့​ဖ်ဝဲများ​၊ အ​ေရာင်း​​ေဆာ့​ဖ်ဝဲများ​ စသည်တို့​သည် နိုင်ငံတကာမှ ဘာသာမျုိး​စံုနှင့်​ အသံုး​ြပုနုိင်​ေလ့​ ရှိြကပါသည်။ ထိုသို့​ အသံုး​ြပုရန် အဆိုပါ ​ေဆာ့​ဖ်ဝဲများ​ကို ဘာသာတခုစီအတွက် သီး​ြခား​ြပင်ဆင်ရန် မလိုအပ်သည်မှာ Unicode Standard ကို အသံုး​ြပု​ေသာ​ေြကာင့်​ ြဖစ်ပါသည်။ အကယ်၍ ြမန်မာစာအတွက်​ Fake Unicode များ​ကို သံုး​မည်ဆုိလျှင် ထို​ေဆာ့​ဖ်ဝဲများ​ကို ြမန်မာဘာသာြဖင့်​ သံုး​ရန် ခက်ခဲသွား​မည် ြဖစ်ပါသည်။


Data Corruption ြဖစ်နုိင်ြခင်း​

ASCII ​ေဖာင့်​များ​တွင် သုည နှင့်​ ဝလံုး​သည် ပံုစံတူ​ေသာ​ေြကာင့်​ နှစ်လံုး​စလံုး​ကို ဂဏန်း​ ၃ဝ အြဖစ် သတ်မှတ်ထား​ပါသည်။ ထို့​​ေြကာင့်​ ကွန်ြပူတာသည် မည်သည့်​နည်း​နှင့်​မျှ ဂဏန်း​တူ​ေန​ေသာ ထိုသုညနှင့်​ ဝလံုး​ကို ခဲွြခား​သိရှိနိုင်မည် မဟုတ်ပါ။ ASCII နှင့်​ ​ေရး​ထား​​ေသာ စာများ​ကို သီး​သန့်​ြပုလုပ်ထား​​ေသာ ​ေဆာ့​ဖ်ဝဲများ​နှင့်​ Unicode Standard သို့​ ​ေြပာင်း​လဲနုိင်​ေသာ်လည်း​ သုညနှင့်​ ဝလံုး​ သံုး​ထား​​ေသာ ​ေနရာများ​တွင် အချက်အလက်များ​သည် မှန်ကန်မှု ရှိမည် မဟုတ်ပါ။ အချို့​​​ေသာ Fake Unicode Font များ​တွင်လည်း​ သုညနှင့်​ ဝလံုး​ကို ခဲွြခား​ထား​​ေလ့​ မရှိြကပါ။ အချက်အလက်များ​စွာ ထည့်​သွင်း​ထား​​ေသာ​ database စနစ်များ​တွင် အချက်အလက်များ​သို့​ ထည့်​သွင်း​ထား​​ေသာ အချက်အလက်များ​ မမှန်ကန်ြခင်း​ကို​ data corruption ဟု ​ေခါ်ပါသည်။ ဥပမာ ကွန်ြပူတာက အဂင်္လိပ်မှ ြမန်မာသို့​ အလိုအ​ေလျာက် ဘာသာြပန်​ေသာ စနစ်တခု တည်​ေဆာက်မည်ဆုိပါလျှင် သုညနှင့်​ ဝလံုး​တို့​ ဆက်စပ်​ေသာ ​ေနရာများ​တွင် အ​ေြဖသည် အြမဲမှား​မည် ြဖစ်ပါသည်။


Unicode​ Standard

Unicode Standard သည် encoding တခု တနည်း​အား​ြဖင့်​ အက္ခရာများ​ကို ဂဏန်း​သတ်မှတ်​ေပး​ြခင်း​သာ ြဖစ်​ေသာ်လည်း​ ​၎င်း​​သတ်မှတ်ချက်အတိုင်း​ လိုက်နာြပီး​ ြမန်မာစာစနစ်တခု ဖန်တီး​ရန်မှာ ​ေဖာင့်​တခုတည်း​ြဖင့်​ မြဖစ်နိုင်ပါ။ ြမန်မာစာလံုး​များ​ကို​​ screen ​ေပါ်တွင် ​ေပါ်နိုင်ရန် Rendering Engine ၊ ​၎င်း​​နှင့်​အလုပ်လုပ်နိုင်​ေသာ​ Smart Font နှင့်​ ြမန်မာစာကို ရိုက်ရန် Input Engine တို့​ လိုအပ်ပါသည်။ ဥပမာ ‘တက္ကသိုလ်’ တွင် ပါ​ေသာ ‘က’ နှစ်လံုး​တွင် မည်သည့်​ ‘က’ သည် ‘ka sit’ ြဖစ်မည်ကို​ Smart Font ထဲတွင် ​ေရး​သား​ရပါသည်။ ​၎င်း​​အချက်အလက်ကို Rendering Engine က သိရှိြပီး​​ screen တွင် မှန်ကန်​ေသာ ပံုစံကို ြပ​ေပး​နုိင်မည် ြဖစ်ပါသည်။ ယ​ေန့​ အသံုး​ြပု​ေန​ေသာ ကွန်ြပူတာစနစ် (OS) များ​ အား​လံုး​တွင် Rendering System များ​ တပါတည်း​ ပါရှိပါသည်။ ဥပမာ ဝင်း​ဒိုး​ကွန်ြပူတာများ​တွင် OpenType Rendering Engine ပါရှိပါသည်။ သို့​ရာတွင် မိုဘုိင်း​လ်ဖုန်း​များ​နှင့်​ ကွန်ြပူတာ (PC) ထက်နိမ့်​​ေသာ ကွန်ြပူတာများ​တွင် အဆုိပါ Rendering Engine များ​ မပါရှိြက​ေသး​​ေသာ​ေြကာင့်​ ြမန်မာစာ ယူနီကုတ် အသံုး​ြပုရန် မြဖစ်နုိင်​ေသး​ပါ။ ထိုအချိန်မျုိး​တွင် Fake Unicode Font များ​ကို အသံုး​ြပုနိုင်ပါသည်။ စာရိုက်ရာတွင်လည်း​ ယခင် ASCII စနစ်များ​တွင် ‘u’ ကို နှိပ်ြပီး​ ယူနီကုတ်ဂဏန်း​များ​ သိမ်း​ရန်မှာမူ Input Engine လိုအပ်ပါသည်။ ASCII စနစ်များ​နှင့်​ Fake Unicode Font များ​တွင် ‘​ေလ’ ကို ‘​ေ’ + ‘လ’ ဟု သိမ်း​ဆည်း​​ေသာ်လည်း​ Unicode Standard တွင် ‘​ေလ’ ကို ‘လ’ + ‘​ေ’ ဟု သိမ်း​ဆည်း​ပါသည်။ အ​ေြကာင်း​မှာ စကား​လံုး​အား​လံုး​၏ အ​ေြခခံမှာ ဗျည်း​စာလံုး​များ​ြဖစ်​ေသာ​ေြကာင့်​ ထိုသို့​ ဗျည်း​ကို ​ေရှ့​​ဆံုး​မှ သိမ်း​မှသာ​ sorting/searching အဆင်​ေြပနုိင်မည် ြဖစ်​ေသာ​ေြကာင့်​ ြဖစ်ပါသည်။ ထို့​​ေြကာင့်​ Input Engine မှ ကီး​ဘုတ်​ေပါ်တွင် ရိုက်​ေသာ စာလံုး​များ​ကို ယူနီကုတ် စံအတိုင်း​ ကွန်ြပူတာက သိမ်း​ဆည်း​​ေအာင် လုပ်​ေဆာင်​ေပး​ြပီး​ ​၎င်း​​စာများ​ကို​ screen ​ေပါ်တွင် မှန်ကန်စွာ ​ေပါ်​ေအာင် Rendering Engine မှ​ Smart Font ကို သံုး​ြပီး​ လုပ်​ေဆာင်ြခင်း​ ြဖစ်ပါသည်။


လက်ရှိ Unicode Standard ြမန်မာစာစနစ်များ​မှာ -



  • Myanmar2, Myanmar3 (OpenType Font, Keyman Input Engine)

  • Paduak (OpenType + Graphite Font for Linux and Windows, Keyman Input Engine)

  • Parabaik (OpenType font)

  • MyMyanmar (Universal Font for Linux, Windows and Mac, MyInput Engine)

  • MyMyanmar Developed Unicode Fonts from ASCII Fonts. (M-Myanmar Unicode, CE Unicode, Art House Unicode ...)

  • AyeYar


Myanmar 2,​ 3 ​ေဖာင့်​များ​ကို အစိုး​ရရံုး​များ​တွင် အသံုး​ြပုရန် အခမဲ့​ ​ေပး​ထား​ပါသည်။ ပိ​ေတာက်​ေဖာင့်​သည် Open Source Community ြကုိး​ပမ်း​မှုတခုြဖစ်ြပီး​ အခမဲ့​ ရရှိနိုင်ပါသည်။ MyMyanmar အား​ အခမဲ့​ရရှိ​ေသာ အင်တာနက် ဗား​ရှင်း​အြဖစ်လည်း​​ေကာင်း​၊ ​ေရာင်း​ချလျက်ရှိ​ေသာ​ DVD Software ဗား​ရှင်း​အြဖစ်လည်း​​ေကာင်း​ ရရှိနုိင်ပါသည်။ အင်တာနက် ဗား​ရှင်း​သည် အင်တာနက်ရှိမှ အသံုး​ြပု၍ ရမည်ြဖစ်ြပီး​ ဝယ်ယူ​ေသာ ဗား​ရှင်း​နှင့်​ စွမ်း​​ေဆာင်ရည် မကွာြခား​ပါ။ MyMyanmar မှ ယခင် ASCII ​ေဖာင့်​များ​စွာ၏ လုပ်ပိုင်ခွင့်​များ​ကို ရယူြပီး​ ​၎င်း​​စာလံုး​ပံုစံများ​ကို Unicode Standard Font များ​ ြဖစ်​ေအာင် ဖန်တီး​ထား​ပါသည်။ ​၎င်း​​တို့​တွင် အခမဲ့​ရ​ေသာ ​ေဖာင့်​များ​သည် အခမဲ့​ရမည်ြဖစ်ြပီး​ စီး​ပွား​ြဖစ်​ေဖာင့်​များ​လည်း​ ပါဝင်ပါသည်။ ​၎င်း​​တို့​ကို MyInput သို့​မဟုတ် Myanmar 2, 3 Keyman စနစ်များ​နှင့်​ တဲွသံုး​နုိင်ပါသည်။


ယူနီကုတ်စနစ်များ​သည် မည်သူ​ေရး​​ေသာ​ေဖာင့်​ြဖစ်​ေစ၊ မည်သည့်​စနစ်ြဖစ်​ေစ ဖလှယ်အသံုး​ြပုနိုင်စွမ်း​ ရှိပါသည်။ ဥပမာ MyMyanmar နှင့်​ ရိုက်ထား​​ေသာ စာများ​ကို အစိုး​ရရံုး​များ​အတွက် Myanmar2, Myanmar3 ြဖင့်​ အသံုး​ြပုနုိင်သလို ပိ​ေတာက်နှင့်​ ရိုက်ထား​​ေသာ စာများ​ကိုလည်း​ MyMyanmar နှင့်​လည်း​​ေကာင်း​၊ အြခား​ ယူနီကုတ်​ေဖာင့်​များ​နှင့်​လည်း​​ေကာင်း​ ဖတ်ရှုနိုင်ပါသည်။


​ေဖာင့်​တခု သို့​မဟုတ် စနစ်တခုကို ယူနီကုတ် ဟုတ်မဟုတ် စစ်​ေဆး​ရန်မှာ လွယ်ကူပါသည်။ ထုိ​ေဖာင့်​စနစ်ြဖင့်​ စာအနည်း​ငယ်ရိုက်ြပီး​ အထက်တွင်ပါ​ေသာ ယူနီကုတ်စနစ်တခုခုနှင့်​ ဖွင့်​ြကည့်​နုိင်ပါက Unicode Standard နှင့်​ ကိုက်ညီ​ေသာ ​ေဖာင့်​၊​ စနစ် ြဖစ်​ေြကာင်း​ သိရှိနိုင်ပါသည်။ အထက်တွင် ​ေဖာ်ြပထား​​ေသာ စာရင်း​တွင် ပါဝင်သည့်​ ​ေဖာင့်​များ​မှအပ အြခား​​ေဖာင့်​များ​သည် Unicode Standard နှင့်​ ကိုက်ညီ​ေလ့​မရှိြကပါ။ ထုိ့​​ေြကာင့်​ ​၎င်း​​တို့​ကို သံုး​မည်ဆုိလျှင် စနစ်အချင်း​ချင်း​ ဖလှယ်အသံုး​ြပုနုိင်စွမ်း​ မရှိရံုသာမက အနာဂတ်တွင် တွင်ကျယ်လာမည့်​ ှSearch Engine များ​၊ e-Government စနစ်များ​၊ လုပ်ငန်း​သံုး​ ကွန်ြပူတာစနစ်များ​၊ ဝက်ဘ်ဆုိက်​ေပါ်တယ်များ​တွင် ြမန်မာစာသည် စာလံုး​​ေပါ်ရံုမှလဲွ၍ အြခား​ဘာသာများ​တွင် အသံုး​ြပု​ေနြက​ေသာ စွမ်း​​ေဆာင်ရည်များ​ ရရှိနုိင်​ေတာ့​မည် မဟုတ်ပါ။ ထို့​​ေြကာင့်​ ြဖစ်နုိင်လျှင် Unicode Standard စနစ်များ​ကိုသာ သံုး​စဲွသင့်​ပါသည်။


ထူး​ြမင့်​​ေနာင်


(ထူး​ြမင့်​​ေနာင်သည် Unicode Consortium ၏ အဖဲွ့​ဝင်ြဖစ်ြပီး​ ဝီကီပိဒိယ ြမန်မာဘာသာအပိုင်း​တွင် System Operator ြဖစ်ပါသည်။ Technomation Studios နှင့်​ MyMyanmar Projects တို့​တွင် အမှု​ေဆာင် ဒါရိုက်တာအြဖစ် တာဝန်ထမ်း​​ေဆာင်လျက်ရှိပါသည်။)

ြမန်မာစာစနစ် တူညီစွာ သံုး​စွဲ​ေရး​ဆိုတာ

ြမန်မာစာစနစ်​ တူညီစွာသံုး​စွဲ​ေရး​​ ဆိုတာ ကွျန်​ေတာ်တို ့​ လွန်ခဲ့​တဲ့​ နှစ်​ ၂၀​ ​ေကျာ်​ေလာက်​ ကတည်း​က​ မက်ခဲ့​တဲ့​ အိပ်မက်ပါ။ ascii ​ေတွ ​ေပါ်လာြပီး​ စာလံုး​​ မတူတဲ့​​ ဒုက္ခကို အ​ေစာြကီး​​ ကတည်း​က ခံခဲ့​ြကရသူ​ေတွပါ။ အ​ေြကာင်း​​ေြကာင်း​​ေသာ အ​ေြကာင်း​တို့​ကို အ​ေြကာင်း​ြပုြပီး​​ သကာလ ဘယ်သူမှ ြမန်မာစာ ascii standard ကို ပတ်ဝန်း​ကျင်​ နိုင်ငံများ​​ နည်း​တူ ြဖစ်​ေအာင်​ မလုပ်​ နိုင်ခဲ့​ြကပါဘူး​။ လွန်ခဲ့​တဲ့​ ၁၀​ နှစ် ကွန်ပျုတာ​ အသင်း​​ေတွ ဖွဲ့​ြပီး​​ ကာစမှာ CICC ( Center of the international Cooperation for Computerization) JAPAN က​ေနြပီး​ ၄​ ြကိမ်​ေြမာက် AFSIT ( Asia Forum for Standardization of Information Technology) နဲ့​ language Forum ကို ၁၉၉၈ မှာ ြပည်လမ်း​က IBC မှာ လုပ်​ ခဲ့​ြကပါ​ေသး​တယ်။ ၁၉၉၂​ ​ေလာက်ကတည်း​က windows ​ေပါ်မှာ​ ​ေခတ်စား​လာတဲ့​ ြမန်မာစာကို standard လုပ်ဖို ့​မ​ေအာင်ြမင်​ ခဲ့​ြကပါဘူး​။ ပွစိတက် ရှုပ်ရှက်ခတ်​ေနတဲ့​ ​ေဖာင့်​​ သိမ်း​ဆည်း​မှု​ေတွရဲ့​​ ဒုက္ခဟာ အင်မတန်ဆိုး​ပါတယ်။ ​ေနာက်ပိုင်း​မှာ unicode စနစ်​ အား​​ေကာင်း​လာချိန် ြမန်မာစာ​ အတွက် ​ေနရာမှာ နိုင်ငံြခား​သား​​ တစ်​ေယာက်တင်ထား​တာ ကို ြမန်မာြပည်က​ တဝန်ရှိသူ​ေတွ​ သွား​​ေရာက်​ ​ေဆွး​​ေနွး​ြပီး​ ပထမဦး​ဆံုး​ standard ကို 4.1 မှာ စပါလာပါတယ်။


ကွျန်​ေတာ်​ နား​လည်​ သ​ေလာက်​ေြပာရရင် Unicode ဟာ ဘာသာ​ စကား​တိုင်း​​ အတွက် သူ​ေနရာ​ သူ​ေပး​ထား​ြပီး​ စာလံုး​​ တစ်လံုး​ဟာ အ​ေြခအ​ေန​ အရ ​ေရး​ထံုး​​ အရ ပံုသဏ္ဍန်​ ​ေြပာင်း​တာ​ေတွကို တန်ဘိုး​​ တစ်ခုနဲ့​ သိမ်း​ခွင့်​​ မ​ေပး​ဘဲ မူရင်း​​ စာလံုး​​ေတွသာ​ သိမ်း​ခွင့်​ြပုထား​တဲ့​ မူရှိပါတယ် roman မှာ garma လား​မသိဘူး​ အလယ်မှာနဲ့​ ​ေရှ့​မှာ ပံုစံ​ မတူပါဘူး​။ ြမန်မာစာမှာဆို ရရစ်​ေတွပါ အများ​ြကီး​​ ပံုကွဲ​ေပမဲ့​ တန်ဘိုး​​ တခုထဲပါ။ အဲဒီမူကို​ အ​ေြကာင်း​ြပြပီး​ ြမန်မာစာမှာ ပင့်​​ ရစ်​ ဆွဲ​ ထိုး​​ ပါ​ မလာပါဘူး​။ အ​ေြကာင်း​က ပင့်​ရစ်ဆွဲထိုး​ဟာ ရ​ ယ​ ဝ​ ဟ ​ေတွကို ထပ်​ ထား​တယ်လို့​​ အ​ေြကာင်း​​ ြပပါတယ်။ အဲဒီဟာဟာ ြမန်မာ​ ပါဋိမှာ လံုး​ဝ အတိအကျကို​ မှန်ပါတယ်။ roman pali နဲ့​ ြမန်မာ​ ပါဋိ​ အ​ေြပာင်း​မှာ ြကည့်​ရင် ဒီ​ အတိုင်း​ပါဘဲ ဒီမှာတင် တဝက်တပျက်သာ​ သိတဲ့​ နိုင်ငံြခား​သား​​ေတွက ြမန်မာစာကို ြမန်မာ​ အက္ခရာသံုး​​ ပါဋိနဲ့​​ အတူတူ​ မှတ်ထင်ခဲ့​ြကပါတယ်။ တကယ်​ေတာ့​ ပါဋိမှာ အသတ်​ ဆိုတာမရှိပါဘူး​ အသံကို​ အ​ေြခခံတဲ့​​ စနစ်​ ြပီြပီ ဗျည်း​ရှိရင်​ သရပါရမယ် မပါရင် အထပ်ဘဲ ဆိုတဲ့​ စနစ်​ ကိုသံုး​တယ်။ ြပီး​​ေတာ့​ ဗျည်း​ ၃၂လံုး​ သရ ၈လံုး​ နိဂဟိတ် ၁လံုး​ဘဲ ပါတယ်။ ြမန်မာမှာလို ​ေနာက်ထိုး​ြပင် မရှိဘူး​ အသတ်​ မရှိဘူး​ ​ေ-ာ နဲ့​ ​ေ-ာ် မရှိဘူး​။ အဲဒီ​ေတာ့​​ ဘာြဖစ်ကုန်လဲ​ ဆို​ေတာ့​ (အြမန်)​ ဆိုတဲ့​စာလံုး​ကို ( အရ် မန်) လို့​​ သိမ်း​တာခံရတယ် တကယ်​ေတာ့​ ( အ + ြမ+ -န်) ြဖစ်ရမှာ ဆိုလိုတာက ပါဋိလို ဗျည်း​+သရ မဟုတ်ဘဲ ြမန်မာက ဗျည်း​+ဗျည်း​တွဲ+သရ+အသတ် ြဖစ်​ေနလို့​ဘဲ။ ဘာဘဲ​ေြပာ​ေြပာ ြဖစ်​ေအာင်​ ​ေရး​ရင်​ေတာ့​ ြဖစ်တယ်လို​ ဆို​ေပမဲ့​ ​ေနာင် ​ေခတ်​ အဆက်ဆက် သံုး​ရမယ့်​ ြပင်​ မရ​ေတာ့​မဲ့​ standard ြကီး​မှာ unicode rule ြဖစ်တဲ့​ မူရင်း​​ တန်ဘိုး​ဆိုတာနဲ့​ မကိုက်လို့​ လက်မခံတာဟာ ကိုယ့်​​ တိုင်း​ြပည်​ ကိုယ့်​လူမျိုး​​ အတွက် ြမန်မာစာအ​ ​ေြကာင်း​ကို ြမန်မာလို​ ​ေြပာမရလို အဂင်္လိပ်လို​ ြပိုင်ြငင်း​တာ မနိုင်လို ့​ အ​ေလျာ့​​ ​ေပး​တာမျိုး​နဲ့​​ေတာ့​ လက်မခံနိုင်ဘူး​။ ဆိုလိုတာ မြငိမ်​ေလာက်​ေသး​ဘူး​​ လို့​တွက်တယ်။


တဖက်မှာလဲ ြမန်မာစာ digitalization process ​ေတွအရ တခုခုကို​ သံုး​မှရမဲ့​ ​ေတာင်း​ဆိုလာတဲ့​ အချိန်ကို​ ​ေရာက်ြပီ။ ​ေနာက်​ ြပဿနာတခုက အခု​ ​ေခတ်စက်​ေတွလို rander က အလိုလို​ မရဘူး​ usb10.dll ဆိုတဲ့​ uniscript က စက်​ေတွတိုင်မှာမရှိသလို အလွယ်တကူထည​ ့်​မရခဲ့​ဘူး​။ နိုင်ငံ​ေတာ်က ဒါမှမဟုတ် အဖွဲ့​အစည်း​တခုက တရား​ဝင်​ သံုး​စွဲစရာ ​ေဖာင်စနစ် မရှိခင်မှာ ​ေဇာ်ဂျီကို​ စသံုး​စွဲလာခဲ့​ရတာပါ။ standard သံုး​ရတဲ့​​ အချိန်​ေစာင့်​ရင်း​ ဆိုြပီး​ သံုး​ခဲ့​ြကတာြဖစ်လို့​ ယာယီ​ ဆိုတာ​ေတာ့​​ အား​လံုး​​ သိြကပါတယ်။ ဘယ်သူကမှ​ ဇွတ်တိုက် မသံုး​ခိုင်း​ပါဘူး​၊ ​ေဇာ်ဂျီ​ ​ေပါ်ြပီး​မှ myanmar1 ထွက်လာတယ် တရား​ဝင်​ အစိုး​ရသံုး​​ သတ်မှတ်တယ် ​ေနာက် ​ေနြပည်​ေတာ်က စက်​ ၃၀ စသံုး​ဖို ့​ computer အဖွဲ့​ချုပ်က ပညာရှင်များ​စွာ​ လွတ်ြပီး​​ အခိျန်ယူ install လုပ်ခဲ့​ြကရတယ် သင်တန်း​​ေတွ​ ​ေပး​ခဲ့​ြကရတယ်။ ဆိုလိုတာ လွယ်လွယ်သံုး​ဖို ့​ခက်ခဲ​ ခဲ့​ သလို အချို့​​ စာလံုး​​ေတွ​ သံုး​မရတာ​ေတွ​ေြကာင့်​ ြပင်ဆင်​ ရမယ်ဆိုတာ ​ေပါ်လာတယ်။ ပင့်​ရစ်ဆွဲထိုး​ ထည့်​ဖို ့​ လုပ်လာြကတယ်။ ြမန်မာစာ​ေတွ သံုး​တဲ့​ အလုပ်​ေတွအတွက် ဒါ​ေတွကို​ေစာင့်​​ေနရင် ​ေနှာင့်​​ေနှး​​ နိုင်တာ​ေြကာင့်​ ​ေဇာ်ဂျီနဲ့​ ဘဲ သံုး​ခဲ့​တယ် ​ေဇာ်ဂျီဟာ သူ့​အရင်ထွက်တဲ့​ standard ထဲက storage ကိုလိုက်နာြပီး​ rander စက်တိုင်း​နဲ့​​ မ​ေြပလည်တာကို​ ​ေြဖရှင်း​ထား​ယံုဆိုတာ သိ​ေပမဲ့​ အချိန်မ​ေရွး​ data ​ေတွကို​ေြပာင်း​လိုရတယ် ဆိုတာနဲ့​ ​ေစာင့်​စား​ရင်း​သံုး​​ေနတဲ့​သ​ေဘာထက်မပိုပါဘူး​။
​ေဇာ်ဂျီ ၅.၁ ထွက်လာဖို့​က​ေတာ့​ 5.1 ဟာ storage သာ standard လုပ်ထား​​ေပး​ြပီး​ encode , decode အတွက် white paper ​ေတွ standard ​ေတွမရှိလို ့​ အခု​ေတာင် 5.1 data ​ေတွကို myanmar 3, ပိ​ေတာက် ပရပိုက် mymyanmar ​ေတွမှာ တခုမှာ အမှန်​ေပါ်ရင် ​ေနာက်တခုမှာ​ လွဲ​ေနတာ​ေတွ ရှိ​ေနပါ​ေသး​တယ်။ ဒါ​ေတွ အဆင်​ေြပဖို ့​ ​ေဇာ်ဂျီက ဗီလိမ်​ အ​ေန နဲ့​​ တွန်း​အား​​ မ​ေပး​ရင် ဘယ်​ေတာ့​မှြပီး​မှာ​ မဟုတ်ဘူး​လို့​ြမင်ပါတယ်။


​ေဇာ်ဂျီဟာ internet ​ေပါ်မှာ အသံုး​​ ဘယ်​ေလာက်များ​များ​ ascii နဲ့​ DTP market ကို မဝင်နိုင်မ​ေြပာင်း​နိုင်ခဲ့​ပါဘူး​။ နယ်သစ်မှာသာ ​ေနခဲ့​ရပါတယ်။ ြမန်မာ စာအုပ်​ေတွ အချက်အလက်​ေတွဟာ prnter မှာ လှလှပပထွက်ဖို ့​ standard မရှိတဲ့​ ascii ​ေတွ​ေပါ်မှာဘဲ​ မှီ​ေနတာကို လံုး​ဝ​ မသက်​ေရာက်နိုင်ခဲ့​ပါဘူး​။ ဘာလို့​လဲဆို​ေတာ့​ ဘယ်သူကိုမှ​ ဇွတ်မသံုး​ခိုင်း​ပါဘူး​ အဆင်​ေြပ​ သလိုသံုး​​ေနြကတာပါ။ ဒါ​ေပမဲ့​ MS Office လို စတာ​ေတွမှာ ​ေဖာင့်​ရှိရင် myanmar1 ​ေရာ 5.1 ​ေရာ ​ေဇာ်ဂျီ​ေရာ အ​ေနှာက်အယှက်​ မရှိသံုး​နိုင်တာ​ အ​ေသအချာပါ။ တခါတရံ​ ​ေဇာ်ဂျီ​ မသံုး​​ေအာင်​ ချိမ်း​​ေြခာက်တဲ့​အ​ေနတဲ့​ default ကို​ေြပာင်း​ြပီး​​ မရ​ေအာင်​ လုပ်တာ​ေတွ မပါခဲ့​ရင်ပါ။
၅.၁ ကို ြကိုဆိုပါတယ် တခု​ေတာ့​ရှိတယ် တကယ်​ သံုး​လို့​ရြက​ေအာင် လုပ်​ေပး​ဖို ့​လိုပါမယ်။ ​ေဇာ်ဂျီ​ သမား​​ေတွ​ ​ေြပာင်း​သံုး​​ ​ေစချင်ရင် ဘာပို​ သာမလဲ​ ဆိုတဲ့​ စည်း​ရံုး​မှုရယ် မိုက်ဂ​ေရး​ရှင်း​​ ကိစ္စ​ေတွရယ် နဲ့​မဆွဲ​ေဆာင်ရင် မြဖစ်နိုင်ပါဘူး​။ နှစ်​ေပါင်း​များ​စွာ ပျိုး​​ေထာင်ထား​တဲ့​ အချက်အလက်​ေတွကို customer service အြမင်နဲ့​ မြကည်ဘဲ မင်း​တို့​ သံုး​တာတလွဲြကီး​ အဲဒါ​ေြကာင့်​ မင်း​လုပ်ထား​​ သမှျ​ သွား​ြပီဆိုတဲ့​ သ​ေဘာနဲ့​ ဆရာြကီး​​ ဝင်လုပ်ရင် အများ​စု​ မ​ေြပာင်း​မှာ​ ​ေသချာပါတယ်။


ကမ္ဘာမှာ ​ေနရာတိုင်း​မှာ standard ​ေတွအများ​ြကီး​ပါ လိုက်နာရင်​ ဘယ်​ေလာက်​ အြကိုး​​ ရှိမယ်ဆိုတာနဲ့​ဘဲ စည်း​ရံုး​​ ဆွဲ​ေဆာင်​ေနြကပါတယ်။ ဘာမှ​ ထူး​​ေအာင်လုပ်​ မ​ေပး​နိုင်ဘဲနဲ့​ ငါမ​ေအာင်ြမင်တာ​ သူ​ေြကာင့်​ဆိုြပီး​ ပတ်ရမ်း​တဲ့​​ နည်း​ဟာ အလုပ်ြဖစ်မယ်​ မထင်ပါ။ ကွျန်​ေတာတို့​က ​ေစာင့်​ြကည့်​​ေနတဲ့​ ​ေနရာမှာဘဲရှိပါတယ်။ တခု​ေတာ့​ရှိတယ် ​ေဆး​မှင်ရည်​ စုတ်ထိုး​ ဆိုတာထက် ပိုဖျက်ရခက်တဲ့​ standard ဆိုတာြကီး​ကို ြပီး​ြပီး​​ေရာ​ မစမ်း​သပ်ဘဲ အြမန် လုပ်ချပစ်သင့်​​ သလား​​ ဆိုတာပါဘဲ။ ၄.၁​ ​ြဖစ်​တဲ့​​ myanmar1 မှာ သခင်္န်း​စာယူသင့်​တယ်။


http://www.myanmaritpro.com/profiles/blog/show?id=1445004%3ABlogPost%3A83518&page=2#comments

ကို​ရဲ​ြမတ်​သူ​ရဲ့​Standard​အ​ေပါ်​သ​ေဘာ​ထား​

ကွျန်​ေတာ်​ေဖာင်လုပ်သူြမန်မာစာထွင်သူမဟုတ်ပါ။ သို့​​ေသာ် ြမန်မ​​ာ ြဖစ်ြပီး​ ြမန်မာစာကို​ ချစ်ပါသည်။ ြမန်မာစာ​ ​ေသမည် အ​ေရး​မပါ​ အ​ေရး​မြကီး​​ ဆိုလျင် စတန်း​ဒတ်ကိုလဲ​ ​ေမျာ်စရာ​ မလို​ေတာ့​ဟု​ ထင်ပါသည်။ ပတ်ဝန်း​ကျင်ကို​ ကွျန်​ေတာ်ြမင်တာက အ​ြခား​​သူ​​ေတွ​နဲ့​​​ ြခား​နား​​ေကာင်း​​ ြခား​နား​​ နိုင်ပါတယ်။ Globalization ​ေခတ်မှာ wave ​ေတွ​ တက်လာပါသည် အဆင်သင့်​​ ြဖစ်သည်​ ြဖစ်​ေစ မြဖစ်သည်​ ြဖစ်​ေစ ရိုက်ခတ်တတ်​ ပါတယ်။ ဂျပန် တရုပ် ယိုး​ဒယား​​ေတွမှာ သူဘာသာ အတွက် အများ​ြကီး​​ ြပင်ဆင်ြပီး​ ပါဝင်​ ခဲ့​ြက​ တာ​ေတွခဲ့​ရတယ်။ ြမန်မာ​ အင်အား​မှာ ြမန်မာ​ေတွ​ ကျန်ခဲ့​လို့​ရမှာလား​​ ဆိုတာ​ စဉ်း​စား​စရာပါ။ local content မဖွံ့​ြဖိုး​ဘဲ ဘယ်လို​ လုပ်မလဲ​ ဆိုတာလဲ တွက်ရပါတယ်။


ကွန်ပျူတာကို ြမန်မာ​ မီနူး​​ေတွနဲ့​​ သံုး​တာ​ ကွျန်​ေတာ်လဲ​ စိတ်​ မဝင်စား​ပါဘူး​။ သို ့​​ေသာ် ြမန်မာ​ေတွရဲ့​ ​ေရှး​​ေခတ်​ အဆက်ဆက်က အချက်အလက်​ေတွ က ကွျန်​ေတာ်​ အ​ေပျာက်​ မခံနိုုင်ပါဘူး​။ ကိုယ့်​​ အမျိုး​​ ဘာသာ​ သာဿနာကို ထိမ်း​တာ ကွျန်​ေတာ်​ တဦး​ထဲ​ အြမင်မှာ ​ေငွရှာတာ လခ​ေကာင်း​တာ ရာထူး​ြကီး​တာ​ ထက် ပိုမက်မိလို့​​ လုပ်​ေနတာပါ။ Standard က အ​ေရး​ြကီး​တာ လက်ခံပါတယ် 4.1 လဲ Standard ပါ​၊​ 5.1 ​ေြပာင်း​လို့​ အလကား​​ ြဖစ်သွား​ရင် 6.1 ​ေြပာင်း​ရင်​ေရာ 5.1 အလကား​​ ြဖစ်သွား​ဦး​မှာလား​​ ​ေမး​ဖို ့​ရှိပါတယ်။ ြမန်မာစာ​ ဒီလို​ မတည်ြငိမ်ရင် ြဖစ်မလား​။ တည်ြငိမ်မယ်​ ဆိုရင် လဲ တကယ်​ အ​ေကာင်း​ဆံုး​​ တခုနဲ့​ဘဲ​ တည်ြငိမ်​ ​ေစချင်လို့​ လို​ေနတာ​ေတွ​ ထည့်​​ေစဖို ့​ ြပုြပင်တာ​ေတွ စနစ်ကျဖို့​​ ြပန်​ ​ေဆွး​​ေနွး​​ေနတာ၊ ကွျန်​ေတာ်​ တို ့​မှာ သင်ပုန်း​ြကီး​ရှိတယ် စနစ်ရှိတယ် ကွန်ပျုတာ​ ​ေြပာင်း​ရင် အပျက်ခံမှာလား​​ ဆိုတာ​ေတွ​ ရှိတယ်။ ခံသင်ရင် ခံရမှာဘဲ​ ဆိုရင် ​ေဇာ်ဂျီကလဲ လိုက်သင့်​မှ​ လိုက်မှာဘဲ ၊ ​ေနာက်​ေဇာ်ဂျီ​ သံုး​​ေနသူ​ေတွက ကွျန်​ေတာ်​ သံုး​ခိုင်း​တာ​ လိုက်သံုး​ရ​ေအာင် ပါဝါ​ ကွျန်​ေတာ်မှာလဲ​ မရှိဘူး​၊ 5.1 သံုး​ြက​ေစ ပံု/------- ဆိုလို့​​ များ​ရမယ်​ ထင်​ေနလို့​လား​။ ြဖစ်သင့်​တာက တကယ်​ေကာင်း​​ေအာင် လုပ် တကယ် အား​ကိုး​ရရင် အလုပ်ြပတာ​ေတွ မဟုတ်ဘဲ​ တကယ်​ လုပ်ြပ​ နိုင်ရင် သံုး​သူသူ့​ဟာ​ သူ​ေရွး​မှာဘဲ။ ကွျန်​ေတာ်​ အ​ေနနဲ့​က​ေတာ့​ ြမန်မာ​ အချက်အလက်​ေတွ အ​ေပါ်မှာ​ ရှိ​ေစချင်တယ် ဘယ်လိုဘဲ​ ရှိရှိ ဘယ်လို​ ရှာရင်​ေတွ့​​ေတွ့​။ ၊ ဒါ​ေတွကို မညီလို့​​ မရှိ​ေစရ​ ဆိုရင်​ေတာ့​ ကာကွယ်ရမှာဘဲ။


migration မလုပ်ဘဲ ဘာသာ​ စကား​​ ​ေြပာင်း​တယ်​ ဆိုတာ​ မရှိဘူး​။


​ေလာ​ေလာဆယ် standard ြဖစ်မှာ ရှာ​ေပး​မယ်လို့​​ မစား​ရ​ ဝခမန်း​​ ​ေြပာြကတယ် ဘာစာလံုး​​ စာရင်း​မှ​ ဘယ်သူမှ​ ဝိုင်း​​ေရး​ြပီး​ မြပုစုထား​ဘူး​ ရှိ​ေနလဲ​ တချို့​အဖွဲ့​​ေတွ အများ​​ မသိ​ေအာင်​ အတွင်း​မှာ​ ထား​တယ်။ အဲဒီလိုနဲ့​ ဘယ်သူက search index ြဖစ်လာ​ေစမှာတုန်း​။ ခုဘာြဖစ်လဲ google က Ngram stat သံုး​ြပီး​ အင်တာနက်​ အသံုး​များ​​ စနစ်နဲ့​ စာလံုး​​ေတွ​ ချလိုက်​ေတာ့​ ၉၀%​ ​ေကျာ်တဲ့​​ ​ေဇာ်ဂျီဘဲ ရှာရ​ေနတယ်။ sorting ရမယ်​ ြမူဆွယ်တယ် လက်​ေတွ ့​ ဘာမှ​ မထူး​ဘူး​။ နည်း​ပညာ​ မကူရင် ဘယ်ဟာမှ အလိုလို​ မရသလို ကူရင် အား​လံုး​​ လုပ်ရတယ်။ Agree to disagree အရ လွတ်လပ်စွာ​ သ​ေဘာ​ ကွဲလွဲလို့​​ ရပါတယ်။ အြမင်ြခင်း​​ က​ေတာ့​ တူမှာမဟုတ်ပ့​ါဘူး​။ တခု​ေတာ့​​ စဉ်း​စား​ရမှာက ရိုက်ညီ​ေနာင်​ တီထွင်တဲ့​​ ​ေလယာဉ်က အခု​ေခတ် ခတ်စုတ်စုတ်​ ​ေလယာဉ်​ေလာက်​ ​ေကာင်း​မှာ​ မဟုတ်ဘူး​၊ သူ​ေခတ်နဲ့​​ သူြဖစ်လာတာ အား​လံုး​​ ဆရာြကီး​​ လုပ်ြပီး​ အဆံုး​အြဖတ်​ေပး​သူ​ ​ေနရာမှာ​ မ​ေနဘဲ လို​ေတနာ​ေတွ ရှာဖို ့​ ပို​ေကာင်း​​ေအာင်​ လုပ်ဖို ့​ အ​ေြဖရှာဖို ့​ကို စစဉ်း​စား​ရင် ​ေတာ့​ ရိုက်ညီ​ေနာင်တဲ့​​ ​ေကာင်း​တာ​ ြဖစ်လာမှာဘဲ အြဖစ်​ မရှိတာ​ေတွကို ​ေတွ့​ရာ​ လူ​ အြပစ်ပံုချြပီး​ ဆင်​ေြခ​ေပး​​ လက်ြငိုး​​ ဝိုင်ထိုး​​ ​ေနလို​ေတာ့​ ဘာအ​ေြဖမှ​ မထွက်ဘူး​။ နည်း​ပညာက solution ကို ပန့်​ပိုး​သင့်​တာ ။ ကွျန်​ေတာ့်​ထက် ပိုသိ ပိုတတ်တဲ့​​ ပညာရှင်​ေတွ အများ​ြကီး​ဘဲ ဘာလို့​ ​ေကာင်း​တာ​ေတွက ထပ်မ​ေပါ်​ လာရတာတုန်း​ ကွျန်​ေတာ်​ ​ေတာ့​​​ အား​မရဘူး​။


​ေနာက်တခု​ ​ေြပာချင်တာက တချိန်က ယဉ်​ေကျး​မှု့​​ ​ေတာ်လှန်​ေရး​မှာ အြပင်​ေရာက်သွား​တဲ့​ တရုတ်​ေတွ တရုပ်​ အြဖစ်နဲ့​ ဆက်ရှိ​ ​ေနနိုင်လို ့​ အခု​ တရုပ်ြပည်ြကီး​​ ြပန်တာက်လာတာ လိှုင်း​​ရိုက်တာ ကို လည်စင်း​ခံရင် လူမျိုး​ပါ​ ​ေပျာက်သွား​​ လိမ့်​မယ်။ ြမန်ြပည်မှာ ကွျန်ပျူတာ​ ဘယ်နှစ်​ေယာက်​ သံုး​တာ ဆိုတာထက် ၂၀၀၁ က စြပီး​ နှစ်စဉ်​ တိုး​တဲ့​နှံုး​ ကမ္ဘာမှာ ြမန်မာ​ အြမန်ဆံုး​ ​ေနာက် ြပည်ပ​ ြမန်မာမှာ ယိုး​ဒယား​မှာ ြမန်မာ ၃-၄ သန်း​ရှိတယ် ၇၀% ဖုန်း​ရှိြပီး​ ၂၀% ကွန်ပျူတာ​ သံုး​တယ် စကင်္ာပူမှာ တရား​ဝင်​ လုပ်ကိုင်သူ ၄၀၀၀၀ ​ေကျာ်ရှိြပီး​ ​ေကျာင်း​သား​​ေရာ အြခား​​ေပါင်း​ရင် ၁​ သိန်း​​ ​ေကျာ်တယ် ၆၀%​ က သံုး​နိုင်တယ် မ​ေလး​မှာ ြမန်မာ​ ၆​ သိန်း​​ ​ေကျာ်ရှိတယ် ၂၀% ဘဲထား​ ဂျပန် မှာလဲ​ သံုး​နိုင်​ သူများ​တယ် ထိုင်ဝမ်မှာ ၁​ သိန်း​​ေကျာ်​ ရှိြပီး​ ၅၀% က အသာ​ေလး​သံုး​နိုင်တယ်။ ဥ​ေရာပ ဒူဘိုင်း​ ကိုရီး​ယား​ အ​ေမရိက ​ေအာ်ဇီမှာလဲ အများ​ြကီး​ဘဲ သိထား​ဖို ့​က အင်တာနက်သံုး​​ ြမန်မာ​ေတွမှာ အလုပ်အြပင် အြခား​ လိုအပ်ချက်​ေတွ​ ရှိတယ် ကိုယ့်​စာနဲ့​မှ​ ကိုယ်​ အဆင်​ေြပတာ​ေတွ​ အများ​ြကီး​ဘဲ။ ​ေနွး​​ေထွး​မှု​ေတွ စိတ်​ ခံစား​ချက်​ေတွ ဖလှယ်ရာမှာ ကိုယ်ြဖစ်တည်မှု​ ဂုဏ်ယူရာမှာ ဘာသာ​ စကား​​ မရှိလို့​မရဘူး​။


လမ်း​ထိပ်မှာ မုန့်​ဟင်း​ခါး​​ ဆိုင်ရှိတာ မုန်ဟင်း​ခါး​​ စား​သူ​ေတွ​ အတွက်လိုဘဲ ကွျန်​ေတာ်​ ြမန်မာစာ​ေတွ အ​ေပါ်မှာ​ ရှိ​ေစချင်တာ လိုအပ်​ ​ေနသူ​ အတွက် စိတ်မဝင်စား​ရင် ​ေတာ့​ လာ​ မသံုး​နဲ့​​ေပါ့​။ သို့​​ေသာ် အင်တာနက်သံုး​သူ​ တသန်း​​ မြပည့်​လို့​ မလုပ်ဘူး​​ ဆိုတာ​ေတာ့​​ မရှိဘူး​။ နှစ်​ေပါင်း​​ များ​စွာသမိုင်း​ရှိတဲ့​​ အချက်အလက်​ေတွ ​ေကျး​ဇူး​ြကီး​တဲ့​​ ဘာသာ​ေရး​​ အဆံုး​အမ​ေတွ မ​ေပျာက်ဖို ့​ ကိုယ့်​​ ယံုြကည်ချက်နဲ့​​ ကိုယ်လုပ်​ ​ေနတာပါ။ ကွျန်ပျူတာ​ တတ်ချင် အဂံလိပ်စာ​ သင်ပါဆိုတဲ့​မူ​ ကို​ေတာ့​​ လက်ခံပါတယ်။ ြမန်မစာ​ေတာ့​ ကွျန်​ေတာ်​ေသသည်​ အထိ​ေတာ့​ အ​ေပျာက်မခံနိုင်သလို ​ေပျာက်မယ်လဲ​ မထင်​ေသး​ပါဘူး​။ ဘာလို့​လဲဆို​ေတာ့​ ကွျန်​ေတာ်က အဂင်္လိပ်စာ​ ညံ့​တယ်။



http://www.myanmaritpro.com/profiles/blog/show?id=1445004%3ABlogPost%3A83518&page=2#comments

Unicode is a Code?

Unicode is a Code and that is why it's called UniCode in the first place.

by Ravi Chhabra on July 17, 2009 at 6:08am






[caption id="attachment_68" align="aligncenter" width="502" caption="Unicode is a Code"]Unicode is a Code[/caption]

(http://www.myanmaritpro.com/forum/topics/1445004:Topic:143672?commentId=1445004%3AComment%3A143866)

ယူနီကုဒ် ဆုိတာ​ဘာ​လဲ​?



ကွန်ပျူတာတွင် ယူနီကုဒ်သည် ကမ္ဘာ​ေပါ်ရှိ စာ​ေရး​စနစ် (writting system) အား​လံုး​နီး​ပါး​ ပါရှိြပီး​ ကွန်ပျူတာများ​နှင့​် လုိက်​ေရာညီ​ေထွ ရှိ​ေစ​ေရး​အတွက် သက်မှတ်ထား​​ေသာ စက်မှုစံ (industry standard) တစ်ခုြဖစ်သည်။ Universal Character Set စံ နှင်အတူ ယူနီကုဒ်စံ သည် အက္ခရာ​ေပါင်း​ ၁၀၀ ၀၀၀ ​ေကျာ်ပါ​ေသာ စာအုပ် ထုတ်​ေဝခဲ့​သည်။

ထုိစံစာအုပ်တွင် ကုိး​ကား​ရန် ဇယား​များ​၊ encoding နည်း​စဥ်များ​၊ character encoding စံများ​၊ အက္ခရာ၏ သ​ေဘာသဘာဝများ​ (ဥပမာ စာလံုး​ြကီး​၊ စာလံုး​​ေသး​)၊ အ​ေထာက်အကူြပု computer file များ​၊ အြခား​ သက်ဆုိင်ရာများ​ (အက္ခရာသ​ေဘာ၊ normalization ဥပ​ေဒ၊ ခဲွြခင်း​၊ ​ေပါင်း​ြခင်း​၊ rendering နှင် နှစ်ဖက်သွား​ စာများ​၏ အစဥ်၊ ဘယ်ညာ သ​ေဘာများ​၊ စသည့​်) ပါရှိသည်။

အြမတ်မယူ အသင်း​အဖွဲ့​ ြဖစ်​ေသာ Unicode Consortium သည် ယူနီကုဒ် ရှင်သန်တုိး​တက်​ေရး​အတွက် ြကိုး​စား​မှုတွင် ရှိြပီး​ character encoding အား​လံုး​ကုိ ယူနီကုဒ် ြဖင့​်အစား​ထုိး​သွား​ရန် ရည်ရွယ်သည်။ ယူနီကုဒ် ၏ Unicode Transformation Format (UTF) scheme များ​တွင် ရှိြပီး​ encoding နည်း​များ​သည် ဘာသာစံု (multilingual) အတွက် လုိအပ်လျက်ရှိသည်။

ဘာသာစံု ပါဝင်​ေသာ ယူနီကုဒ် ၏ ​ေအာင်ြမင်မှု​ေြကာင့​် computer software ကုိ internationalization and localization လုပ်ရာတွင် များ​စွာ အသံုး​ချလျက်ရှိသည်။ ယူနီကုဒ်စံစနစ်ကုိ ယခု ​ေပါ်​ေပါက်​ေန​ေသာ XML၊ Java programming language၊ Microsoft .NET Framework နှင့​် ​ေခတ်​ေပါ် operating system များ​တွင် အသံုး​ချလျက်ရှိသည်။

ယူနီကုဒ်စံစနစ်ကုိ အသံုး​ြပုရာတွင် character encoding မျုိး​စံု အသံုး​ြပုနုိင်သည်။ အသံုး​အများ​ဆံုး​မှာ UTF-8 (1 byte ကုိ ASCII အက္ခရာ အတွက် နှင့​် ၄ byte အထိ ကျန် ​ေနများ​ကုိ အြခား​ အက္ခရာ အတွက်)၊ မသံုး​​ေတာ့​​ေသာ UCS-2 (2 bytes ကုိ အက္ခရာ အား​လံုး​အတွက် သုိ့​​ေသာ် ယူနီကုဒ် အက္ခရာ အား​လံုး​မပါ) နှင့​် UTF-16 (၄ bytes သံုး​ြပီး​ UCS-2 ကုိ ထက်ဆင့​်၍ ကျန်ရှိ​ေန​ေသး​​ေသာ ယူနီကုဒ် အက္ခရာ များ​ကုိ ထည့​်သွင်း​) ြဖစ်ြကသည်။

အစဦး​ နှင့​် တုိး​တက်​ေြပာင်း​လဲြခင်း​

ယူနီကုဒ်သည် ​ေရှး​ရုိး​ သံုး​လာခဲ့​ြက​ေသာ စာလံုး​ သိမ်း​ဆည်း​ပံု (character encoding) များ​၊ ISO 8859 စံ များ​ ကုိ ကျယ်ကျယ်ြပန့်​ြပန့်​ သတ်မှတ်လုိသည်။ ISO 8859 စံ သည် နုိင်ငံ​ေပါင်း​များ​စွာ၏ အသံုး​အနှုန်း​များ​ ကုိ သတ်မှတ်နုိင်ခဲ့​​ေသာ်လည်း​ တစ်ခုနှင့​်တစ်ခု ​ေြပာင်း​လဲ၍ (incompatible) သံုး​နှုန်း​မရ​ေပ။ များ​စွာ​ေသာ ​ေရှး​ရုိး​ရာ စာလံုး​ သိမ်း​ဆည်း​ပံု၏ ​ေတွ့​​ေနကျ ြပသနာမှာ ဘာသာနှစ်မျုိး​ ရရန် ြပုလုပ်ြခင်း​ (များ​​ေသာအား​ြဖင့​် Roman characters နှင် ​ေဒသစာ) တွင် ဘာသာမျုိး​စံု အတွက်မပါ​ေပ။

ယူနီကုဒ်သည် သ​ေဘာအား​ြဖင့​် စာလံုး​ပံု (glyph) များ​ကုိ ထက် အ​ေြခခံ စာလံုး​ (character) များ​ — graphemes and grapheme-like units — ကုိ သိမ်း​ဆည်း​ထား​သည်။ တရုတ်စာတွင် အ​ေြခခံ စာလံုး​ နှင် စာလံုး​ပံု တုိ့​ကုိခဲွြခား​ရန် ခက်ခဲသည်။

စာများ​ကုိ တွက်ချက်ြခင်း​ (text processing) တွင် ယူနီကုဒ်သည် စာလံုး​တုိင်း​အတွက် အတုမရှိ​ေသာ စာခွက် (code point) — စာလံုး​ပံု အစား​ နံပါတ်တစ်ခု — ရှိ​ေရး​ တာဝန်ယူသည်။ တစ်နည်း​အား​ြဖင့​် ယူနီကုဒ်သည် စာလံုး​များ​ကုိ မူရင်း​သဘာဝ (an abstract way) ကုိကုိယ်စား​ြပုြပီး​ ပံု​ေဖာ်ရန် အတွက်ကုိမူ (အရွယ်၊ ပံု၊ ​ေဖာင့​် (သုိ့​) သဏ္ဍာန်) software (web browser, word processor) ၏တာဝန်အြဖစ် ချန်ထား​ခဲ့​သည်။ ထုိမှျရှင်း​လင်း​​ေသာ ြကိုး​စား​မှုပင် ရှုပ်​ေထွး​ရ​ေသာ အ​ေြကာင်း​မှာ ယူနီကုဒ် ဒီဇုိင်း​ြပုသူများ​ ယူနီကုဒ် ကျယ်ြပန့်​စွာ အသံုး​ြပု​ေရး​ ြကိုး​ပမ်း​မှုတွင် သ​ေဘာတူညီမှု မရနုိင်ြခင်း​တုိ့​​ေြကာင့​်ြဖစ်သည်။

ယူနီကုဒ်၏ ပဋ္ဌမ ၂၅၆ လံုး​မှာ ISO 8859-1 နှင့​် တူ​ေသာ​ေြကာင့​် ရှိြပီး​ အ​ေနာက်နုိင်ငံမှ စာများ​အတွက် အခက်အခဲ မရှိ​ေပ။ များ​စွာ​ေသာ အတူတူ စာလံုး​များ​ကုိ မတူ​ေသာ စာခွက်များ​တွင် သက်မှတ်ြခင်း​မှာ ရှိြပီး​ စာလံုး​ သိမ်း​ဆည်း​ပံု နှင့​် အဆင်​ေြပ​ေစရန် ြဖစ်သည်။ ထုိ့​​ေြကာင့​် ရှိြပီး​စာ များ​မှ ယူနီကုဒ်ကုိ ​ေြပာင်း​ရာတွင် မှား​ယံင်း​မှု မရှိနုိင်​ေပ။

သမုိင်း​

ယူနီကုဒ် သမုိင်း​ကုိ ၁၉၈၇ ခု Xerox မှ Joe Becker နှင့​် Apple မှ Lee Collins and Mark Davis တုိ့​က အြပည်ြပည်ဆုိင်ရာ စာလံုး​ စနစ် ြဖစ်နုိင်​ေြခကုိ စတင် စူး​စမ်း​ခဲ့​သည်။ ထုိနှစ် ြသဂုတ်လတွင် Joe Becker သည်
international/multilingual text character encoding system, tentatively called Unicode.

စာတမ်း​ကုိ ထုတ်​ေဝခဲ့​သည်။ Unicode 88 ​ေခါင်း​စဥ်ရှိ​ေသာ ထုိစာတန်း​၏ ၁၆ ဘစ် (bit) အ​ေြခြပု စာလံုး​ မုိဒယ်တွင် Unicode is intended to address the need for a workable, reliable world text encoding. Unicode could be roughly described as "wide-body ASCII" that has been stretched to 16 bits to encompass the characters of all the world's living languages. In a properly engineered design, 16 bits per character are more than sufficient for this purpose.ဟု​ေဖါ်ြပခဲ့​သည်။ မူလ ၁၆ ဘစ် (bit) အ​ေြခြပု စာလံုး​ မုိဒယ်သည် ယခု သံုး​စွဲ​ေန​ေသာ စာ​ေရး​စနစ် များ​ကုိသာ စဥ်း​စား​ခဲ့​သည်။ သုိ့​​ေသာ ယခုသံုး​​ေန​ေသာ စာလံုး​များ​မှာ
Unicode gives higher priority to ensuring utility for the future than to preserving past antiquities. Unicode aims in the first instance at the characters published in modern text (e.g. in the union of all newspapers and magazines printed in the world in 1988), whose number is undoubtedly far below 214 = 16,384. Beyond those modern-use characters, all others may be defined to be obsolete or rare; these are better candidates for private-use registration than for congesting the public list of generally-useful Unicodes.

ဟု သံုး​သပ်ခဲ့​သည်။ ဆုိလုိသည်မှာ ​ေရှး​စာနှင့​် အသံုး​များ​​ေသာ စာလံုး​များ​ပါ ယူနီကုဒ် တွင် ပါဝင်ရန်လုိအပ်ခဲ့​သည်။
From Myanmar Online Encyclopedia

ြမန်မာ ယူနီကုဒ် ဆိုသည်မှာ



ြမန်မာအက္ခရာတစ်လံုး​ချင်း​စီအတွက် သီး​ြခား​သတ်မှတ်​ေပး​ထား​​ေသာ တိကျသည့​် ဘံုသံုး​စနစ် (U 1000 မှ U 109F အတွင်း​ရှိ အက္ခရာများ​)

ယူနီကုဒ် (Unicode) ဆိုသည်မှာ နိုင်ငံနှင့​်လူမျိုး​တိုင်း​တွင် အသံုး​ြပုလျက်ရှိ​ေသာ အက္ခရာစာလံုး​များ​အတွက်

  • မည်သည့​် Platform တွင် ြဖစ်​ေစ

  • မည်သည့​် Program တွင် ြဖစ်​ေစ

  • မည်သည့​် ဘာသာစကား​ language တွင် ြဖစ်​ေစ


သီး​ြခား​သတ်မှတ်​ေပး​ထား​သည့​် နံပါတ်များ​ြဖစ်သည်။ ယူနီကုဒ် ဆိုသည်မှာ ကမ္ဘာသံုး​ဘာသာစကား​ အား​လံုး​မှ အက္ခရာစာလံုး​ တစ်လံုး​တိုင်း​အတွက် တိကျ​ေသာ နံပါတ် တစ်လံုး​တည်း​သာ သတ်မှတ်​ေပး​​ေသာ ဘံုသံုး​စနစ်ဟူ၍လည်း​ ​ေခါ်ဆိုြကသည်။

Unicode => Universal Character Encoding Unicode Consotium ​ေခါ် NGO အဖွဲ့​အစည်း​မှ တစ်ကမ္ဘာလံုး​ရှိ ဘာသာစကား​များ​ကို သိမ်း​ဆည်း​နိုင်ရန်/ စာသား​များ​ဖလှယ်နိုင်ရန် တီထွင်ထား​​ေသာ 16 bit character code set standard ြဖစ်သည်။ ISO (International Standard Organization) က ယင်း​ကို ISO-10646 ဟု သတ်မှတ်​ေပး​သည်။

Unicode ြဖင့​် ဘာသာစကား​​ေပါင်း​ များ​စွာကို Font တခုတည်း​တွင် ထည့​်သွင်း​နိုင်ြပီး​ မည်သည့​် ကွန်ပျူတာစနစ်တွင်မဆို အသံုး​ြပုနိုင်ရမည်ြဖစ်သည်။ Computer ဆိုသည်က ကိန်း​ဂဏန်း​များ​ကိုသာ သိသည်ဟု ​ေယဘုယျအား​ြဖင့​် ​ေြပာနိုင်သည်။ ကွန်ပျူတာတွင် ဖတ်မှတ််ြခင်း​၊ သိမ်း​ဆည်း​ြခင်း​များ​ကို ကိန်း​ဂဏန်း​များ​ြဖင့​်သာ ြပုလုပ်နိုင်သည်။ ယူနီကုဒ်ကို မတီထွင်မီက ကိန်း​ဂဏန်း​တစ်ခုကို သိရှိနိုင်ရန်အတွက် လှျို့​၀ှက်ကိန်း​စနစ်များ​စွာကို အသံုး​ြပုြကရသည်။ ဘာသာစကား​ တစ်ခုအတွက် ြပည့​်စံုလံု​ေလာက်​ေသာ encoding စနစ်များ​ မရှိ​ေပ။

History of Myanmar Unicode

ASCII code ​ေပါ်တွင် ြမန်မာစာကို encode လုပ်၍ အသံုး​ြပုခဲ့​ြကသည်။ အဂင်္လိပ် Character set ယာယီ ငှား​သံုး​ခဲ့​ြကြခင်း​ြဖစ်သည်။ ဥပမာ- ြမန်မာစာ “က” သည် အဂင်္လိပ်အက္ခရာ U (ASCII code point 117) ​ေပါ်တွင် encode လုပ်ထား​ြခင်း​ြဖစ်သည်။ သို့​​ေသာ် ယူနီကုဒ်တွင် “က” နှင့​် "u" သည် အက္ခရာတစ်ခုစီ ကွဲြပား​​ေနသည်။ ကွန်ပျူတာက စံတစ်ခုကို သိလာမှသာ တစ်ကမ္ဘာလံုး​ မည်သည့​်ကွန်ပျူတာကမဆို ြမန်မာစာကို နား​လည်လာပါမည်။ ကွန်ပျူတာက လက်ခံနိုင်သည့​် စံ ဆိုသည်မှာ ကြကီး​ကို U+1000 နှင့​် ခ​ေခွး​ကို U + 1001 အြဖစ် ကုတ်အ​ေနြဖင့​် ပံု​ေသ သတ်မှတ်​ေပး​ရပါလိမ့​်မည်။ သတ်မှတ်ရံုသာမက တစ်ကမ္ဘာလံုး​ရှိ Software Developer များ​ သိ​ေစရန်နှင့​် တ​ေြပး​ညီအသံုး​ြပုနိုင်​ေစရန် သတ်မှတ်ြပီး​ ​ေြကညာထား​ြကရပါလိမ့​်မည်။ ထိုသို့​ သတ်မှတ်​ေြကညာမှုကို ISO က စံထား​ြပီး​သတ်မှတ်​ေပး​သည်။

ယူနီကုတ် ၁.၀ တွင် ယခုလက်ရှိသံုး​​ေန​ေသာ ြမန်မာယူနီကုတ်သည် တိဘက်ဘာသာစကား​​ေအာက်တွင် ရှိခဲ့​ဲသည်။ ယူနီကုတ် ၁.၁ တွင် ယူနီကုတ်တွင် ြမန်မာဘာသာကိုဖယ်ထုတ်ခဲ့​ဲပီး​ ၂.၀ တွင် အြခား​ ကုတ်နံပါတ်များ​​ေအာက်တွင် ြပန်လည်ထည့​်သွင်း​ခဲ့​သည်။

၁၉၉၅ မတ်လ ၁၂ ရက်တွင် မိုက်ကယ်အီဗာဆင်မှ ယူနီကုတ် WG2 တွင် Title: Names of Burmese characters: comment on Unicode Technical Report #1 အမည်ြဖင့​်စာတမ်း​တစ်​ေစာင် စတင်တင်သွင်း​ခဲ့​သည်။

၁၉၉၆ တွင် မိုက်ကယ်အီဗာဆင်မှ proposal စတင်တင်သွင်း​ခဲ့​သည်။

၁၉၉၈ တွင် မိုက်ကယ်အီဗာဆင်မှပင် ammendment တင်သွင်း​ခဲ့​သည်။

၁၉၉၈ ဇူလိုင် ၂၄ တွင် ကို​ေဇာ်ထွဋ်မှ Response to Myanmar Proposal N1729 (Expert Contribution to Unicode Consortium) ကို​ေရး​သား​ခဲ့​သည်။

၁၉၉၈ ​ေအာက်တိုဘာတွင် UK London ၌ ကျင်း​ပ​ေသာ WG 2 meeting 35 သို့​ ြမန်မာနိုင်ငံမှ ​ေဒါက်တာ​ေအာင်​ေမာ် (CE) ၊ ဦး​ခင်​ေမာင်လွင် (ကွန်ပျူတာပညာရှင်အသင်း​)၊ ​ေဒါက်တာ​ေကျာ်သိန်း​ (ကွန်ပျူတာတက္ကသို်လ်)၊ ဦး​​ေသာင်း​တင် (KMD) နှင့​် ဦး​သိန်း​ထွဋ် (Geocomp) တို့​သည် ​ေလ့​လာသူအြဖစ်တက်​ေရာက်ကာ ြမန်မာစာအ​ေြကာင်း​ကို ြပည့​်စံုစွာတင်ြပခဲ့​ြပီး​ ြမန်မာယူနီကုတ်ကို ြမန်မာလူမျိုး​ပညာရှင်များ​လက်သို့​ စတင် မျိုး​​ေစ့​ချ​ေပး​ခဲ့​သည်။ဤ​ေဆွး​​ေနွး​ပွဲတွင် ြမန်မာပညာရှင်များ​ကိုယ်တိုင် တက်​ေရာက်​ေဆွး​​ေနွး​ခဲ့​ြခင်း​ မြပုနိုင်ပါက ယခုအချိန်တွင် ြမန်မာလူမျိုး​များ​သည် ြမန်မာစာကို ြပင်ပမှသာ​ေလ့​လာတတ်​ေြမာက်ထား​​ေသာ နိုင်ငံြခား​ပညာရှင်များ​၏ proposal ြဖင့​် ​ေပါ်ထွက်လာမည့​် ြမန်မာယူနီကုတ်ကိုသာ အသံုး​ြပုြကရမည်ဟု ယူဆနိုင်သည်။

အ​ေြခခံ ြမန်မာယူနီကုတ် Unicode Character Code 3.0 ကို 1998 ခုနှစ်တွင် သတ်မှတ်အတည်ြပု ြပဋ္ဌာန်း​ခဲ့​ြပီး​ြဖစ်ပါသည်။ သို့​​ေသာ် ထိုအချိန်တွင် ယူနီကုတ်ကို လိုက်လံအ​ေကာင်အထည်​ေဖာ် တီထွင်​ေဆာင်ရွက်မည့​်သူ တစ်ဦး​မှျ ြမန်မာနိုင်ငံတွင် မရှိခဲ့​​ေပ။ 1999 ခုနှစ် ​ေနာက်ပိုင်း​မှ 2002 ခုနှစ်အထိ ြမန်မာစာ ယူနီကုတ်ကို သံုး​စွဲနိုင်​ေအာင် လုပ်​ေဆာင်​ေနသူများ​ကို ​ေလ့​လာြကည့​်ရာတွ Graphite enabled Padauk မှ လွဲြပီး​ အြခား​ မည်သူတစ်ဦး​တစ်​ေယာက်မှျ မရှိခဲ့​ပါ။

ြမန်မာစာကို ယူနီကုတ်အြဖစ် သတ်မှတ်​ေပး​ခဲ့​စဥ်က ယူနီကုတ် Consotium အဖွဲ့​ြကီး​တွင် ြမန်မာစာကို ​ေကာင်း​စွာ တတ်ကျွမ်း​သူ မရှိသည့​်အြပင် ြမန်မာနိုင်ငံတွင်လည်း​ Unicode related technologies များ​ကို နား​လည်သူ တစ်ဦး​မှျ ထွက်​ေပါ်လာြခင်း​ မရှိ​ေသး​သြဖင့​် ယူနီကုတ်ဆိုသည်မှာ ချိုနှင့​်လား​ ြပန်​ေမး​ရမည့​် အချိန်ြဖစ်သည်။ ​ေပး​ကား​​ေပး​၏၊ မရ​ေသး​သည့​်သ​ေဘာြဖစ်ခဲ့​ပါသည်။

2002 ခုနှစ်၊ ဒီဇင်ဘာလ ​ေရာက်မှ ကို​ေငွထွန်း​ က ြမ​ေစတီ ယူနီကုတ် စနစ်ကို တီထွင်နိုင်ခဲ့​ြပီး​ 2003 ခုနှစ်၊ ဇန်န၀ါရီလတွင် etrademyanmar.com ၌ ပထမဦး​ဆံုး​ စတင် အသံုး​ြပုနိုင်ခဲ့​သည်။ ကို​ေငွထွန်း​သည် ြမ​ေစတီယူနီကုတ်ကို ရန်ကုန်ြမို့​ရှိ စာချုပ်စာတမ်း​များ​ မှတ်ပံုတင်ရံုး​တွင် ကုန်အမှတ်တံဆိပ် မှတ်ပံုတင်ြပီး​ တရား​၀င်သံုး​စွဲခဲ့​​ေြကာင်း​ သိရှိရသည်။

သို့​ရာတွင် ထိုစဥ်က ြမန်မာယူနီကုတ်စနစ်မှာ Virama စနစ်​ေပါ်တွင်အ​ေြခခံထား​​ေသာ​ေြကာင့​် ြမ​ေစတီယူနီကုတ်စနစ်မှာ ယူနီကုတ်စံကို အြပည့​်အ၀လိုက်နာထား​​ေသာ စနစ်ဟု မဆိုနိုင်​ေပ။ ထိုြပင် ထိုစဥ်က ြမ​ေစတီယူနီကုတ်စနစ်မှာ အဆမတန်​ေဈး​ြကီး​ြခင်း​ အသံုး​ြပုခွင့​်လိုင်စင်မှာလည်း​ ယခုလက်ရှိ​ေပါ်ထွက်လာ​ေသာ လိုင်စင်များ​ကဲ့​သို့​ Open Source လိုင်စင်များ​ မဟုတ်ြခင်း​ စသည့​် အချက်များ​​ေြကာင့​် ကျယ်ကျယ်ြပန့်​ြပန့​် သံုး​စွဲနိုင်ခဲ့​ြခင်း​ မရှိခဲ့​ပါ။

2002 ခုနှစ်တွင် ြမန်မာနိုင်ငံ၌ အတည်မြပုနိုင်​ေသး​သည့​် ယူနီကုတ်စနစ်ကို ြမန်မာနိုင်ငံ ကွန်ပျူတာအသင်း​ချုပ်မှ တာ၀န်ယူ လုပ်​ေဆာင်ြကရန် ၀ိုင်း​၀န်း​ တိုက်တွန်း​ြကပါသည်။ ယူနီကုတ်စနစ်ကို နိုင်ငံ​ေတာ်စံတစ်ခုအ​ေနြဖင့​် အသံုး​ြပုနိုင်​ေရး​အတွက် လုပ်ငန်း​စတင်ရန် ဘဏ္ဍာ​ေရး​အ​ေထာက်အပံ့​များ​ စတင်ရှာ​ေဖွခဲ့​ြကသည်။ နိုင်ငံ​ေတာ်အြကီး​အကဲများ​သည် ြမန်မာ့​စံယူနီကုတ်ြဖစ်​ေြမာက်​ေရး​အတွက် ကျပ်သိန်း​ ၅၀ ကို စတင်​ေထာက်ပံ့​​ေပး​ခဲ့​ပါသည်။ ဤသို့​ြဖင့​် Myanmar Unicode and NLP Research Centre သည် ြမန်မာနိုင်ငံ ကွန်ပျူတာ သင်း​ချုပ်ြကီး​၏ အစီအမံြဖင့​် ဖွဲ့​စည်း​နိုင်ခဲ့​သည်။ NLP အဖွဲ့​ြကီး​သည် 2002 ခုနှစ်မှစြပီး​ နိုင်ငံ​ေတာ်အတွက် ယူနီကုတ်တာ၀န်များ​ကို အချိန်ြပည့​် စတင်တာ၀န်ယူ လုပ်​ေဆာင်ခဲ့​သည် ဟု ဆိုနိုင်သည်။

From Myanmar Online Encyclopedia

Review on Myanmar Unicode 5.1 & Suggestion

[caption id="attachment_61" align="aligncenter" width="402" caption="Review on Myanmar Unicode 5.1 & Suggestion"]Review on Myanmar Unicode 5.1 & Suggestion[/caption]

အသတ် နှင့်​ ​ေရှ့​ထိုး​ကိစ္စ


ယူနီကုဒ် ၅.၁ အထိ အသတ်နဲ့​ ​ေရှ့​ထိုး​ကို တန်ဖိုး​အတူတူ ​ေပး​ထား​တာ ​ေတွ့​ရပါတယ်။ အသတ်နဲ့​ ​ေရှ့​ထိုး​ဟာ အခုမှသာ ခပ်ဆင်ဆင် ြဖစ်​ေန​ေပမယ့်​ တကယ်က မတူပါဘူး​။ ဒါ့​အြပင် အသံုး​ြပုမှုြခင်း​လည်း​ မတူပါဘူး​။ အသတ်ဟာ ဗျည်း​တစ်လံုး​ရဲ့​ အသံကို သတ်ပစ်လိုက်တာ ြဖစ်ပါတယ်။ ဗျည်း​မှာ တွဲကပ်တဲ့​ သရအသံကို သတ်ပစ်လိုက်တာ လို့​လည်း​ ​ေြပာလို့​ရတယ်။ ​ေရှ့​ထိုး​က​ေတာ့​ အသံရှည် ဆွဲရာမှာ အသံုး​ြပုတာပါ။ ​ေရှ့​ထိုး​ဟာ သီး​ြခား​ တစ်လံုး​ထဲ မရပ်တည်နိုင်ပါဘူး​။ တကယ်တမ်း​ သူက (​ေ-ာ်) ​ေအာ်သရပါ။ (​ေ-ာ) သရမှာ သံရှည်ကို ြပချင်တဲ့​အခါ သံ​ေြပာင်း​ြပြဖစ်တဲ့​ ဝစ္စနှစ်လံုး​​ေပါက် (:) ကပ်မလိုက်နိုင်တဲ့​ အတွက် ​ေရှ့​ထိုး​နဲ့​ ြပတယ်လို့​ ယူဆရပါတယ်။ ​ေရှ့​ထိုး​လို့​ နာမည် တပ်လိုက်တာကလည်း​ အသတ်နဲ့​ မတူဘူး​ဆိုတာ ​ေြပာချင်လို့​ ြဖစ်ပါတယ်။


ဿ (U+103F) နဲ့​ (ဋ္ဌ)


ဿ (သြကီး​) ဟာ (သ်+သ) ​ေပါင်း​ထား​တဲ့​ အက္ခရာပါ။ ​ေယဘုယျအ​ေနနဲ့​ ပံုစံတူ အက္ခရာ နှစ်လံုး​ အဲဒီလို ​ေရှ့​​ေနာက် တွဲဆက်လာရင် အထပ် ြဖစ်သွား​တတ်ပါတယ်။ ဥပမာ (ဥက္ကဋ္ဌ)။ ဿကို ဒီ​ေန့​​ေခတ်မှာလည်း​ အသံုး​ြပု​ေနဆဲမို့​ ယူနီကုဒ်မှာ ထည့်​သွင်း​တာကို ဘာမှ မ​ေြပာလို​ေပမယ့်​ ဿ ကို ထည့်​ထား​ြပီး​​ေတာ့​ (ဋ္ဌ) ဆိုတာကို​ေတာ့​ ထည့်​ထား​တာ မ​ေတွ့​ရပါဘူး​။ ဒီ (ဋ္ဌ)ဟာလည်း​ အခုနက ဿြကီး​လိုပဲ ချံု့​ထား​တဲ့​ စာလံုး​ပါ။ ဋ်+ဌ=ဋ္ဌ ြဖစ်ပါတယ်။ ဒါ​ေြကာင့်​ ြဖုတ်မယ်ဆိုရင် နှစ်ခုစလံုး​ြဖုတ်၊ ထည့်​မယ်ဆိုရင်လည်း​ ဒါကို​ေတာ့​ ချန်ခဲ့​တာ အဓိပ္ပာယ် မရှိပါဘူး​။


​ေသး​​ေသး​တင်


​ေသး​​ေသး​တင်ကို ဒီယူနီကုဒ်မှာ Various Sign ထဲထည့်​ထား​တာ ​ေတွ့​ရပါတယ်။ ပညာ​ေရး​ ဝန်ြကီး​ဌာနက ထုတ်​ေဝတဲ့​ ြမန်မာသဒ္ဒါစာအုပ် စာမျက်နှာ ၂မှာ ​ေသး​​ေသး​တင်ကို သင်ရိုး​သရနဲ့​ သရသ​ေကင်္တထဲ ထည့်​ထား​ပါတယ်။ အ​ေြခခံ သရထဲ​ေတာ့​ ထည့်​မထား​ြပန်ဘူး​။ ဒါ​ေပမယ့်​ အခု​ေနာက်ဆံုး​ထုတ် ြမန်မာအဘိဓာန်စာအုပ်ထဲမှာ​ေတာ့​ အံ (​ေသး​​ေသး​တင်)ကို သရထဲ ထည့်​ပါတယ်။ (စာ-ထ၊ ၅၀) အဲဒီမှာ အ​ေြခခံသရကို အ၊ အာ၊ အိ၊ အီ၊ အု၊ အူ၊ ​ေအ၊ အဲ၊ ​ေအာ၊ ​ေအာ်၊ အံ၊ အို ဆိုြပီး​ သရ ၁၂လံုး​ ြပပါတယ်။ အဲဒီ အ​ေြခခံ သရ ၁၂လံုး​ကိုမှ မူတည်ြပီး​ Tone Mark ​ေအာက်ြမစ်နဲ့​၊ ဝိသဇ္ဇနီ (း​) ပွား​ြပီး​လည်း​​ေကာင်း​၊ အသတ်ဗျည်း​များ​နဲ့​ အ​ေရး​ပွား​၍လည်း​​ေကာင်း​ လိုအပ်သလို ချဲ့​ထွင် အသံုး​ြပုနိုင်တယ်လို့​ ဆိုပါတယ်။ ဒါ​ေြကာင့်​ ​ေသး​​ေသး​တင်ဟာ (အံ)သရ သာ ြဖစ်ရပါမယ်။ Various Sign ထဲထည့်​ြပီး​ တြခား​ Tone Mark လို မထား​သင့်​ပါဘူး​။ (​ေသး​​ေသး​တင်ကို (မ်)နဲ့​ သွား​သွား​ တူခိုင်း​​ေနတဲ့​ ကိစ္စကလည်း​ ြမန်စာစာ​ေပမှာ အြပတ်ရှင်း​ရှင်း​လင်း​လင်း​ လုပ်သင့်​တဲ့​ ကိစ္စတစ်ခုပါ) ကွန်ပျူတာစနစ်ကို တက်လှမ်း​မယ်ဆိုရင် ဟိုလိုလို ဒီလိုလို​ေတွ လုပ်လို့​မရပါဘူး​။ အံု (အ ​ေသး​​ေသး​တင် တစ်​ေချာင်း​ငင်) ဟာ အုမ် (အ တစ်​ေချာင်း​ငင် မသတ်) နဲ့​ ကွဲြပား​တာ ​ေတွ့​နိုင်ပါတယ်။ ​ေနာက်ြပီး​​ေတာ့​ ြမန်မာစာလံုး​ တစ်လံုး​တိုင်း​ရဲ့​ အဆံုး​စွန်ဟာ Diacritic (Tone Mark) လို့​ ​ေြပာလို့​ရပါတယ်။ တကယ်လို့​ ​ေသး​​ေသး​တင်ကို Tone Mark လိုလို လုပ်မယ်ဆိုရင် ​ေသး​​ေသး​တင် တစ်​ေချာင်း​ငင်ဆိုတာ အဓိပ္ပာယ် မဲ့​ပါလိမယ့်​မယ်။ (ဟိုး​တုန်း​က နိဂ္ဂဟိတ် ( - ံ) ကို ဗျည်း​ထဲမှာ ထည့်​ြကတယ်။ အဲဒီလို ဗျည်း​ထဲမှာ ထည့်​ထား​တဲ့​အတွက် သူ့​ကို သရထဲမှာ ထည့်​မတွက်ဘူး​။ အဲဒါကို ဗျည်း​က​ေန ထုတ်လိုက်တဲ့​​ေနာက်ပိုင်း​ အ​ေြခခံ သရအ​ေနနဲ့​ သတ်မှတ်ခဲ့​ြကတာ ြကာလှပါြပီ)


၎င်း​


ြမန်မာ ယူနီကုဒ်မှာ (၎င်း​)ကို (၎င်း​) တစ်လံုး​ထဲ ခွဲ​ေရး​ထား​တာ ​ေတွ့​ရပါတယ်။ ဒီ ၎င်း​ ြပဿနာဟာလည်း​ ဆရာြကီး​ ဦး​​ေဖ​ေမာင်တင်တို့​ ​ေခတ်ကတည်း​က အ​ေတာ်ရှင်း​ယူခဲ့​ရတဲ့​ ြပဿနာ တစ်ခုပါ။ လည်း​​ေကာင်း​ကို ချံု့​​ေရး​ြကရာက အဲဒီ ၎င်း​ ြပဿနာ စလာတာပါပဲ။ ယူနီကုဒ်မှာ (၎င်း​)ဆိုတာကို (၎င်း​) နဲ့​ (င်း​) ဆိုြပီး​ ခွဲထား​တာက​ေတာ့​ လံုး​ဝ အဓိပ္ပာယ် မရှိဘူး​ ထင်ပါတယ်။ ဒါဆို (၎င်း​) အဲဒီ တစ်လံုး​ထဲကို ဘယ်လို အသံထွက်ရမလဲ ဆိုတာ ရှိလာပါြပီ။ ငသတ် ဝစ္စ​ေပါက် မပါတဲ့​အတွက် (လည်း​​ေကာ)လို့​ ထွက်ရမှာလား​။ ငသတ် ဝစ္စ​ေပါက် ထည့်​ပါမှ လည်း​​ေကာင်း​လို့​ အသံြပည့်​ ထွက်မှာလား​။ (​ေလး​ဂဏန်း​) ဆိုရင်လည်း​ အသစ်သွင်း​စရာ မလိုဘူး​ ထင်ပါတယ်။ ြဖစ်သင့်​တာက​ေတာ့​ အဲဒီ (၎င်း​) ကို (ဿ)လို သီြခား​အ​ေရး​ရှိတဲ့​ စာလံုး​အ​ေနနဲ့​ ြပသင့်​ပါတယ်။ (Unicode 4.1 မှာတုန်း​က အခုလို မခွဲဘဲ တစ်လံုး​ အ​ေနနဲ့​ ထား​ရာက အခုကျမှ ခွဲထုတ်လိုက်တာ ြဖစ်ပါတယ်)



uni1035
uni1035

ဒီစာလံုး​ကို ယူနီကုဒ်မှာ (1035) Myanmar Vowel Sign E Above ဆိုြပီး​ ြပထား​တယ်။ အဲဒီ စာလံုး​ကို သက္ကတဘာသာနဲ့​ ​ေရး​ထား​တဲ့​ ရာဇမတ္တဏ်ကျမ်း​မှာ ကျွန်​ေတာ် အများ​အြပား​ ​ေတွ့​ဖူး​ပါတယ်။ အနီး​စပ်ဆံုး​ ရှာြကည့်​ချင်ရင်​ေတာ့​ ြမန်မာအဘိဓာန် စာမျက်နှာ (ထ) ဠ် ဆိုတဲ့​ ​ေနရာမှာ ြကည့်​နိုင်ပါတယ်။ ြပုဗ္ဗာသာဠ် ဆိုတဲ့​ စကား​လံုး​ရဲ့​ မူရင်း​ သက္ကတစာကို အဲဒီ သ​ေဝထိုး​ အ​ေပါ်တင်ြပီး​ ​ေရး​ပါတယ်။ အဲဒါဟာ ြမန်မာစာလံုး​ မဟုတ်ပါဘူး​။ သရဆို​ေတာ့​ သရအသစ်များ​လား​ဆိုြပီး​ မျက်စိ​ေတာင် လည်သွား​ပါတယ်။ (​ေရှ့​ထိုး​)ကို ​ေြပာချင်တာလား​လို့​လည်း​ ​ေတွး​မိပါ​ေသး​တယ်။ ဒါ​ေပမယ့်​လည်း​ မဟုတ်ြပန်ဘူး​။ တစ်ချိန်က ရှိခဲ့​ဖူး​တယ် ဆိုရင်​ေတာင် ​ေနာက်ပိုင်း​ လံုး​ဝမသံုး​​ေတာ့​တဲ့​ အရာြကီး​ပါ။ ဘာြဖစ်လို့​ ြမန်မာသရထဲ အတင်း​ထည့်​ထား​တယ် ဆိုတာကို နား​မလည်နိုင်ပါဘူး​။ တကယ်လို့​ အသံုး​လိုတိုင်း​ ယူနီကုဒ်မှာ လိုက်ထည့်​​ေနမယ် ဆိုရင်လည်း​ တြခား​ထည့်​စရာ​ေတွ အများ​ြကီး​ တိုး​လာပါလိမ့်​မယ်။



ဦ ဆိုတဲ့​ သရကို ယူနီကုဒ်တန်ဖိုး​ 1026 သီး​ြခား​​ေပး​ထား​တယ်။ ြပီး​​ေတာ့​ သူ့​​ေအာက်မှာ ဒါဟာ (ဥ)+(- ီ) နဲ့​ အတူတူပါပဲလို့​လည်း​ ​ေြပာထား​​ေသး​တယ်။ ဦဟာ သူ့​တစ်လံုး​ထဲ သီး​ြခား​ရှိတဲ့​ အြမင်ပံုစံပါ။ လံုး​ြကီး​တင်ဆန်ခတ်နဲ့​ ​ေပါင်း​ထား​တာ​ေတာ့​ မဟုတ်ပါဘူး​။ (Normalization လုပ်ချင်လို့​ အတူတူပဲလို့​ သတ်မှတ်ထား​တာလား​လို့​လည်း​ ​ေတွး​မိပါ​ေသး​တယ်) အသံထွက်တဲ့​အခါ အူ ဆိုတဲ့​ အသံကို ထွက်ပါတယ်။



ဒီသရက​ေတာ့​ မကာရ​ေလာပအ​ေကျာ် ခင်ြကီး​​ေဖျာ် တီထွင်လိုက်လို့​ ြဖစ်လာတာပါ။ ဒီတစ်လံုး​ထဲ မဟုတ်ပါဘူး​။ (အို) သရကိုလည်း​ သူပဲ စတီထွင်ခဲ့​တာပါ။ ဒါ​ေပမယ့်​ သူ့​သရဟာ ၁၁လံုး​ပဲ ရှိတယ်။ ဘာြဖစ်လို့​လဲ ဆို​ေတာ့​ (- ံ)ကို ဗျည်း​ထဲ သွား​ထည့်​ထား​လို့​ပါ။ တကယ်​ေတာ့​ ဩသရကို (​ေ-ာ်) ကပ်တယ်ဆိုတာ အဓိပ္ပာယ်ကို မရှိပါဘူး​။ ဘာြဖစ်လို့​လည်း​ဆို​ေတာ့​ ဩ ကိုယ်နှိုက်က မှီခိုကင်း​တဲ့​သရ ြဖစ်​ေနလို့​ပါပဲ။ ြဖစ်နိုင်တာက ခင်ြကီး​​ေဖျာ်ဟာ အသံထွက်အတွက် (​ေအာ်) သရကို ထည့်​သွင်း​ချင်လို့​ ဩ မှာ အနက်ထင်​ေအာင် ပူး​ြပလိုက်ပံု ရပါတယ်။ ဪ ဆိုတာ တကယ်​ေတာ့​ ြမန်မာမှုြပုရင် ​ေအာ် နဲ့​ အတူတူပါပဲ။ အထက်က (ဦ)မှာတုန်း​က (ဥ)နဲ့​(- ီ) ​ေပါင်း​တာနဲ့​ အတူတူပဲလို့​ ြပ​ေပမယ့်​ ဒီ ဪကျ​ေတာ့​ ဘာမှမ​ေတွ့​ရြပန်ဘူး​။ အထက်ကလို သ​ေဝထိုး​+ဩ+​ေရး​ချ+​ေရှ့​ထိုး​ လာရင်​ေရာ အတူတူပဲလို့​ သတ်မှတ်မှာလား​။ သ+ရရစ် ဆိုရင်လည်း​ ဩနဲ့​ အတူတူပဲလို့​ သတ်မှတ်မှာလား​။


တကယ်ဆို အဲဒီ သရ​ေတွကို တစ်လံုး​ချင်း​စီ အ​ေနနဲ့​ မြမင်သင့်​ပါဘူး​။ က+(​ေအာသရ)=​ေကာ၊ ခ+(​ေအာသရ)=​ေခါ ြဖစ်ပါတယ်။ သ​ေဝထိုး​+ဗျည်း​+​ေရး​ချ လို့​ကျွန်​ေတာ့်​ အြမင်အရဆို မသတ်မှတ်ချင်ပါဘူး​။ တကယ်လို့​ အထက်ကလို (​ေ-ာ)(​ေ-ာ်) ( -ို) (- ံု) အတွဲအ​ေနနဲ့​ ထား​လိုက်မယ်ဆိုရင် ြမန်မာအက္ခရာ​ေတွဟာ ပိုလို့​ အဓိပ္ပာယ် ရှိလာမယ်လို့​ ထင်ပါတယ်။ ြပီး​​ေတာ့​ ပိုြပီး​လည်း​ လွယ်ကူလာပါလိမ့်​မယ်။


အြကံြပုချက်


​ေနာက်ဆံုး​ အြကံြပုချက်ကို ​ေရး​ချင်ပါတယ်။ ကုဒ်​ေတွကို မှန်ကန်ပါတယ်ဆိုြပီး​ ပညာရှင်​ေတွ လွယ်လွယ်နဲ့​ လက်မှတ် မထိုး​သင့်​ပါဘူး​။ အြပန်ြပန် အလှန်လှန် စစ်​ေဆး​ြပီး​မှ လက်ခံသင့်​ပါတယ်။ ြမန်မာယူနီကုဒ် ၃နဲ့​ ပတ်သက်ြပီး​ ​ေဒတာ​ေတွ အများ​အြပား​ မရှိ​ေသး​ပါဘူး​။ ရှိရင်လည်း​ အလွယ်တကူ Convert လုပ်နိုင်တဲ့​ အ​ေြခအ​ေနမှာ ရှိပါတယ်။ တချို့​ မှား​​ေနတာ​ေတွကို သိသိြကီး​နဲ့​ ပစ်မထား​သင့်​ပါဘူး​။ လုပ်ြပီး​သား​ြကီး​ ြဖစ်​ေနလို့​လည်း​ မြပင်ဘဲ မ​ေနသင့်​ပါဘူး​။ ဒါဟာ တမျိုး​သား​လံုး​နဲ့​ သက်ဆိုင်တဲ့​ ကိစ္စပါ။ ​ေနာင်ကာလြကာရှည် နှစ်​ေပါင်း​များ​စွာ အသံုး​ြပုြကရမယ့်​ဟာလည်း​ ြဖစ်ပါတယ်။ အလွန်ကို အ​ေရး​ြကီး​ပါတယ်။ ြပီး​​ေတာ့​ အထက်ကပံုမှာလို ယူနီကုဒ်ဇယား​ဟာ အက္ခရာ​ေတွဟာ ​ေရာ​ေနပါတယ်။ ယူနီကုဒ် စစလုပ်ချင်း​တုန်း​က ချန်ထား​တဲ့​ အကွက်​ေတွကို လိုက်ြဖည့်​ရင်း​ ​ေရာ​ေထွး​ကုန်တာ ြဖစ်ပါလိမ့်​မယ်။ ဗမာ အက္ခရာ​ေတွထဲ မွန်​ေတွ၊ ရှမ်း​​ေတွ၊ ကရင်​ေတွ ​ေရာက်​ေနတယ်။ တကယ်ဆို စနစ်တကျ သူ့​အစုနဲ့​သူ ရှိသင့်​ပါတယ်။ ဒါ​ေြကာင့်​မို့​ အချိန်မ​ေနှာင်း​ခင် လုပ်နိုင်တဲ့​သူ​ေတွ လုပ်နိုင်ြက​ေစဖို့​ ကျွန်​ေတာ်အ​ေနနဲ့​ သိထား​သမျှ၊ သံသယ ရှိ​ေနတာ မှန်သမျှကို အြပုသ​ေဘာနဲ့​ အြကံြပု ​ေရး​သား​ပါတယ်။ (ြမန်မာယူနီကုဒ်နဲ့​ ဗမာစာ​ေရာ၊ တိုင်း​ရင်း​သား​စာ​ေတွနဲ့​ပါ ​ေဒတာ အများ​ြကီး​ မရှိ​ေသး​ခင်မှာ စနစ်တကျ သပ်သပ်ရပ်ရပ်ြဖစ်​ေအာင် ြပန်လည် စီသင့်​တယ်လို့​ အ​ေလး​အနက် တိုက်တွန်း​ပါတယ်)။


ကွန်ပျူတာသမား​ဟာ ဘယ်​ေလာက် ကွန်ပျူတာမှာ ​ေတာ်​ေတာ် ြမန်မာစာကို သမရိုး​ကျ သိရံု​ေလာက်နဲ့​ ဒါကို လုပ်လို့​ မရပါဘူး​။ ြမန်မာစာ ပညာရှင် အ​ေနနဲ့​လည်း​ ဘယ်​ေလာက်ပဲ ြမန်မာစာကို ထံုး​လို​ေချ ​ေရလို​ေနှာက် ကွန်ပျူတာရဲ့​ လည်ပတ်ပံု၊ လုပ်ငန်း​​ေဆာင်ရွက်ပံု သ​ေဘာတရား​​ေတွကို မသိရင် ဒါကို လုပ်လို့​ မရြပန်ဘူး​။ အဲဒီနှစ်ခုကို ညီညီမျှမျှ ​ေပါင်း​နိုင်မှ ကွန်ပျူတာမှာ ြမန်မာစာစနစ်ကို အကျယ်တဝင့်​ စနစ်ကျကျ အသံုး​ြပုနိုင်ပါလိမ့်​မယ်။ ​ေနာက်ပိုင်း​ ဘာသာ​ေဗဒ ပညာရှင်​ေတွလည်း​ အ​ေရး​ပါတဲ့​ ကဏ္ဍက​ေန ပါလာရပါဦး​မယ်။ အ​ေရး​အြကီး​ဆံုး​ တစ်ချက်ပဲ ရှိတယ်။ အချင်း​ချင်း​ြကား​ ရှင်း​ရှင်း​လင်း​လင်း​နဲ့​ လိုအပ်တာကို နား​လည်သ​ေဘာ​ေပါက်​ေအာင် ​ေြပာြပနိုင်ဖို့​ အတွက်က​ေတာ့​ ကိုယ့်​ဘက်က ဝမ်း​စာြပည့်​​ေအာင် ြပင်ဆင်ထား​ဖို့​ လိုပါလိမ့်​မယ်။ ကွန်ပျူတာ​ေခတ်ပဲ ြမန်မာစာက နည်း​ပညာကို လိုက်နာရမှာ​ေပါ့​ ဆိုတဲ့​ အိုင်ဒီယာမျိုး​ ​ေတွကို​ေတာ့​ ကျွန်​ေတာ်တို့​ ရဲရဲြကီး​ ဆန့်​ကျင်ပစ်ရပါလိမ့်​မယ်။


​ေလး​စား​စွာ


ညီလင်း​ဆက်
01 March 2009


မှတ်ချက်။ ဒီသံုး​သပ်ချက်ထဲမှာ ဗမာစာ သီး​သန့်​ အပိုင်း​ကိုပဲ ထုတ်နှုတ်​ေဝဖန် အြကံြပုပါတယ်။ အြခား​တိုင်း​ရင်း​သား​ အက္ခရာ​ေတွ မပါ​ေသး​ပါဘူး​။ အြကမ်း​ထွက်တဲ့​ ယူနီကုဒ် ၅.၂ မူြကမ်း​မှာလည်း​ ထူြခား​တဲ့​ ြပင်ဆင်မှု​ေတွကို မ​ေတွ့​မိ​ေသး​ပါဘူး​။ ​ေနာက်ြပီး​​ေတာ့​ ယူနီကုဒ် ၅.၁ စနစ် တစ်ခုတည်း​ အ​ေပါ်မှာ အ​ေြခခံထား​တယ် ဆိုတဲ့​ ြမန်မာသရီး​၊ မိုင်ြမန်မာ၊ ပရပိုဒ်၊ ပိ​ေတာက် စတာ​ေတွဟာ တစ်ခုနဲ့​ တစ်ခု ​ေြပာင်း​ရာမှာ တူ​ေနရမယ့်​အစား​ Rendering မတူတာ​ေြကာင့်​ တလွဲ​ေတွ ထွက်လာတတ်တာကိုလည်း​ စနစ်တကျ ြဖစ်​ေစချင်ပါ​ေသး​တယ်။ သိပ်မြကာခင်မှာ ​ေဇာ်ဂျီ အသံုး​ြပုရြခင်း​ရဲ့​ အား​နည်း​ချက် ​ေတွကိုလည်း​ သံုး​သပ်ြကည့်​ ပါဦး​မယ်။


အထက်က ကိစ္စ​ေတွမှာ ကျွန်​ေတာ့်​အယူအဆ မှား​တယ်ဆိုရင် ဘယ်လိုမှား​တယ် ဆိုတာကို တတ်ကျွမ်း​သူ ဆရာများ​က အမှန်ြပင်​ေပး​ပါလို့​ ​ေတာင်း​ဆိုချင်ပါတယ်။



ညီလင်း​ဆက် (http://blog.nyilynnseck.com/2009/02/review-on-myanmar-unicode-51-suggestion.html)

ASCII Font အ​ေြကာင်း​

ြမန်မာနိုင်ငံမှာကွန်ပျူတာ​ေတွကို သံုး​ြက​ေတာ့​ကွန်ပျူတာမှာ International Language ြဖစ်တဲ့​ English ကိုပဲသံုး​​ေနရာက​ေန ကိုယ့်​နိုင်ငံအတွက် ကိုယ့်​စာ​ေတွကို ကွန်ပျူတာမှာ ြမင်ချင်လာြကတယ်။ အဲဒီအချိန်မှာ ကွန်ပျူတာမှာ သံုး​​ေနြကတာ Latin စာ​ေတွ​ေလ။ အဲဒီ Latin စာ​ေတွကိုကွန်ပျူတာထဲမှာ ASCII (American Standard Code for Information Interchange) စနစ်ကိုသံုး​ြပီး​သိမ်း​တယ်။





ASCII​ ​စ​နစ်​သံုး​​​ ​စာ​လံုး​​​ြဖင့်​​​ ​ပံု​​ေဖါ်​ထား​​မှု​တ​ခု
ASCII​ ​စ​နစ်​သံုး​​​ ​စာ​လံုး​​​ြဖင့်​​​ ​ပံု​​ေဖါ်​ထား​​မှု​တ​ခု


သူတို့​ Latin စာအတွက် ကုဒ်​ေတွ သတ်မှတ်ထား​​ေပမယ့်​ ြမန်မာစာအတွက်က ကုဒ်မှမသတ်မှတ်ထား​​ေသး​တာ။ ကုဒ်မရှိလဲ ြမန်မာစာြမင်ချင်​ေတာ့​ ခုနက​ေြပာတဲ့​ Latin စာ​ေတွသိမ်း​တဲ့​ ASCII စနစ်ကိုပဲသံုး​ရ​ေတာ့​တယ်။ အဲဒီလိုနဲ့​ပဲ ASCII စနစ်ကိုသံုး​တဲ့​ ြမန်မာစာ စာလံုး​စနစ် (Font) ​ေတွကို တီထွင်လာြကတယ်။ ၁၉၉၂ အ​ေစာပိုင်း​မှာ “Shwe and Mya” လို့​​ေခါ်တဲ့​ ပထမဆံုး​ြမန်မာစာ Font ကိုတီထွင်ထုတ်လုပ်ခဲ့​တယ်။ ြမန်မာစာကို် ြမင်ရ​ေသာ်လည်း​ ကွန်ပျူတာက အမှန်တကယ်သိသည်မှာ Latin စာ​ေတွပဲြဖစ်​ေနတယ်။ ဥပမာ Win Font မှာဆိုရင် “က” ဟုြမင်​ေနရ​ေသာ်လည်း​ ကွန်ပျူတာက Latin စာ ‘u’ ကိုသာ သိမ်း​ထား​ြခင်း​ြဖစ်တယ်။


သဲသဲ​ေအး​ (http://thetheaye.my-mm.org/)

​ေဇာ်ဂျီ နဲ့​လူမိုက်အား​ေပး​ဘ​ေလာ့​ဂါများ​



ယူနီကုတ်နဲ့​ ​ေဇာ်ဂျီြပသနာ တစ်ခါ ​ေပါ်လာြပန်ပါြပီ။ အ​ေပါ်ယံြကည့်​ရင် ​ေဇာ်ဂျီနဲ့​ Myanmar3 ​ေဖာင့်​ တိုက်ခိုက်​ေနတယ် ထင်ရ​ေပမယ့်​ တကယ်တမ်း​​ေတာ့​ မဟုတ်ပါဘူး​။ ယူနီကုတ် စံနှုန်း​ကို လိုက်နာတဲ့​​ေဖာင့်​ ထုတ်လုပ်သူ​ေတွ (ြမန်မာ၃၊ ပိ​ေတာက်၊ ပုရပိုက်၊ မိုင်ြမန်မာ) နဲ့​ ယူနီကုတ် စံနှုန်း​ကို မလိုက်နာတဲ့​ ​ေဇာ်ဂျီရဲ့​ တိုက်ပွဲပါ။ အများ​နဲ့​ တစ်​ေယာက်၊ အမှန်နဲ့​ အမှား​ ​ေပမယ့်​ တစ်​ေယာက်တည်း​ ြဖစ်တဲ့​သူ မှား​​ေနတဲ့​သူ ြဖစ်တဲ့​ ​ေဇာ်ဂျီက အား​သာ​ေနပါတယ်။ ဘာလို့​လဲ ​ေမး​ရင်​ေတာ့​ ကွျန်​ေတာ်တို့​လို လူမိုက်အား​​ေပး​ လုပ်​ေနတဲ့​ ဘ​ေလာ့​ဂါ​ေတွ ​ေြကာင့်​ပါပဲ။

ယူနီကုတ် ၅.၁ ဘက်က ရပ်တည်တဲ့​ သူများ​ စကား​ အ​ေြပာအဆို မတတ်ြကပါဘူး​။ အ​ေြပာ မတတ်​ေတာ့​ ဆဲသလို ြဖစ်ပါတယ်။ User ​ေတွကို ​ေဇာ်ဂျီသံုး​တဲ့​အတွက် အနာဂတ်မှာ ဘာြပသနာ​ေတွ ရှိလာနိုင်တယ်ဆိုတာ ​ေအး​​ေအး​​ေဆး​​ေဆး​ မရှင်း​ြပဘဲ ​ေြပာင်​ေြပာင်တင်း​တင်း​ြကီး​ စစ်မျက်နှာဖွင့်​ တိုက်ပါတယ်။ အမှန်တရား​ ​ေပမယ့်​လည်း​ ပိသ​ေလး​​ေဘး​ပစ် ြကား​ရ​ေတာ့​လည်း​ ြကား​ရတဲ့​သူ​ေတွဘက်က အြမင်ကတ်စရာ ြဖစ်ပါတယ်။

​ေဇာ်ဂျီဖက်က​ေတာ့​ ဒီတစ်ခါလည်း​ User ​ေတွ ရဲ့​ ​ေရွး​ချယ်မှု ဆိုတဲ့​ ဓာတ်ြပား​​ေဟာင်း​ြကီး​ ဖွင့်​လာြပန်ပါြပီ။ User ​ေတွမှာ ​ေရွး​ချယ်မှု ရှိတာကို ကွျန်​ေတာ် လက်ခံပါတယ်။ ဒါ​ေပမယ့်​ မှန်ကန်တဲ့​ ​ေရွး​ချယ်မှု ြဖစ်ဖို့​ အတွက် သတင်း​အချက်အလက်ကို​ေတာ့​ အမှန်အတိုင်း​ ​ေပး​ဖို့​ လိုအပ်ပါတယ်။ လူညီညီ မညီညီ ဤဟာဤ ကွျဲဟာကွျဲ ပါပဲ။ User ​ေတွ ဘယ်​ေလာက် အသံုး​များ​များ​ ​ေဇာ်ဂျီဟာ ဘယ်​ေတာ့​မှ ယူနီကုတ် စံနှုန်း​ ြဖစ်လာမှာ မဟုတ်ဘူး​ ဆိုတာ User ​ေတွ သိထား​သင့်​ပါတယ်။ ဘာလို့​ မြဖစ်နိုင်တာလဲ ​ေမး​ရင် ကွျန်​ေတာ် သိသ​ေလာက် ​ေြဖပါမယ်။ ​ေဇာ်ဂျီဟာ ယူနီကုတ် စံနှုန်း​ကို လံုး​ဝ မလိုက်နာ ထား​ပါဘူး​။ ယူနီကုတ် စာတမ်း​ကို အြကမ်း​မျဥ်း​ လှန်​ေလှာြပီး​ ဖတ်ရင်​ေတာင် ​ေတွ့​နိုင်တဲ့​ အချက်အလက်​ေတွက အစ မသိချင်​ေယာင်​ေဆာင်ြပီး​ အလွယ်လမ်း​ လိုက်ထား​ပါတယ်။ Globalization ​ေခတ်ြကီး​မှာ နိုင်ငံတကာ စံနှုန်း​ဆိုတာ အ​ေရး​ပါတဲ့​ ​ေနရာက​ေန ပါဝင်ပါတယ်။ နိုင်ငံတကာက သ​ေဘာတူထား​တဲ့​ စံနှုန်း​ကို မလိုက်နာဘဲ လုပ်​ေနြကအတိုင်း​ အား​လံုး​ကို ြမန်မာ့​နည်း​ ြမန်မာ့​ဟန် နဲ့​ သွား​ြကမယ် ဆိုြပီး​ ​ေခါင်း​မာ​ေနြကမယ် ဆိုရင်လည်း​ ကွျန်​ေတာ့်​ အ​ေနနဲ့​ အထူး​တလည် ဘာမှ ထပ်ြပီး​ ​ေြပာ​ေနစရာ မရှိပါဘူး​။

​ေဇာ်ဂျီသံုး​လို့​ ဘာြပသနာမှ မရှိဘူး​ ဆိုြပီး​ ​ေြပာ​ေနြကပါတယ်။ အချိန်တန် ကွန်ဗာတာထဲထည့်​ ယူနီကုတ် ​ေြပာင်း​လိုက် ြဖစ်သွား​တာပဲ ဆိုြပီး​ ​ေြပာြကပါတယ်။ Database ထဲက Unicode Normalization ကိစ္စကို ဘယ်သူမှ ထည့်​မ​ေြပာ ြကပါဘူး​။ ရူး​ချင်​ေယာင် ​ေဆာင်​ေနြကပါတယ်။ ဒီကိစ္စဟာ စိတ်ကူး​ယဥ် ြပသနာ မဟုတ်ပါဘူး​။ ြမန်မာအွန်လိုင်း​ စွယ်စံုကျမ်း​မှာ ြကံုခဲ့​ဖူး​ပါတယ်။ ယူနီကုတ် ၅.၁ စနစ် ထွက်​ေတာ့​ MySQL က သူတို့​ ​ေဒတာ​ေဘ့​စ်ထဲမှာ ြမန်မာစာ ကိုပါ ယူနီကုတ် စံနှုန်း​အတိုင်း​ သိမ်း​ဆည်း​လို့​ ရ​ေအာင် လုပ်လိုက်ပါတယ်။ ြမန်မာ အွန်လိုင်း​ စွယ်စံုကျမ်း​ရဲ့​ ​ေနာက်ကွယ်မှာ MySQL ​ေဒတာ​ေဘ့​စ် ကို သံုး​ထား​ပါတယ်။ အဲဒီ​ေတာ့​ ြမန်မာအွန်လိုင်း​ စွယ်စံုကျမ်း​ ထဲမှာ ယူနီကုတ် စနစ်မဟုတ်တဲ့​ ​ေဇာ်ဂျီနဲ့​ ​ေရး​ထား​တဲ့​ စာ​ေတွ အကုန်လံုး​ သံုး​မရ​ေအာင် ြဖစ်ကုန်ပါတယ်။ Backup ရှိလို့​သာ ​ေတာ်ပါ​ေသး​တယ်။ ြမန်မာ အွန်လိုင်း​ စွယ်စံုကျမ်း​မှာ ကိုယ့်​​ေဒတာ​ေဘ့​စ်ကိုယ် ကိုင်တာမို့​ ဘာမှ ြပသနာ မရှိပါဘူး​။ ​ေဒတာ​ေဘ့​စ်ကို ြမန်မာစာ နား​မလည်​ေအာင် ရူး​ချင်​ေယာင် ​ေဆာင်ခိုင်း​လိုက်လို့​ ရပါတယ်။ အကယ်၍ Google ကသာ သူတို့​ရဲ့​ ​ေဒတာ​ေဘ့​စ်ကို ြမန်မာစာ နား​လည်တဲ့​ ​ေဒတာ​ေဘ့​စ် အြဖစ် Upgrade လုပ်လိုက်မယ် ဆိုရင် ကွျန်​ေတာ်တို့​ Blogspot ​ေပါ်မှာ ​ေဇာ်ဂျီနဲ့​ ​ေရး​ထား​တဲ့​ စာ​ေတွ ဘာြဖစ်သွား​မလဲ စဥ်း​စား​ြကည့်​ြကစမ်း​ပါ။ ြမန်မာအွန်လိုင်း​ စွယ်စံုကျမ်း​မှာ လုပ်တုန်း​ကလို ​ေဒတာ​ေဘ့​စ်ကို ြမန်မာစာ နား​မလည်​ေအာင် ရူး​ချင်​ေယာင်​ေဆာင်ခိုင်း​လို့​ မရပါဘူး​။ Blogspot ထဲမှာ ​ေဒတာ​ေဘ့​စ်ကို ကွျန်​ေတာ်တို့​ လိုသလို ြပင်နိုင်တဲ့​ အခွင့်​အ​ေရး​ မရှိပါဘူး​။ ဒီကိစ္စ ​ေသ​ေသချာချာ သိချင်ရင် ကိုယ်တိုင်ြကံုခဲ့​ဖူး​တဲ့​ ကိုစိုး​မင်း​တို့​ ၊ ြမန်မာသင်ကာတို့​ ၊ အိုကိစံတို့​ကို ​ေမး​ြကည့်​နိုင်ပါတယ်။

​ေနာက်တစ်ခုက အခုလက်ရှိ Microsoft က ြမန်မာစာကို တရား​ဝင် Support မလုပ်​ေသး​ပါဘူး​။ Microsoft ကသာ ြမန်မာစာကို တရား​ဝင် Support လုပ်ခဲ့​မယ် ဆိုရင် ​ေနာက်ထပ် ြပသနာ တစ်ခု လာပါ​ေတာ့​မယ်။ Microsoft က ​ေဇာ်ဂျီ စံနှုန်း​နဲ့​ သွား​မှာ မဟုတ်ပဲ နိုင်ငံတကာက သ​ေဘာတူထား​တဲ့​ ယူနီကုတ် စံနှုန်း​နဲ့​ပဲ သွား​မှာပါ။ အဲဒါဆိုရင် ကွျန်​ေတာ်တို့​မှာ Microsoft က ​ေဆာ့​ဖ်ဝဲလ်တိုင်း​ကို Workaround လုပ်ြပီး​ သံုး​ချင်သံုး​ မသံုး​ချင်ရင်လည်း​ ြမန်မာစာ မသံုး​ဘဲ ပစ်ထား​လိုက်ဖို့​ပဲ ရှိပါတယ်။

​ေဇာ်ဂျီ​ေဖာင့်​ သံုး​တာများ​ လွယ်လွယ်​ေလး​ Download တစ်ချက်လုပ် Install လုပ်လိုက် ြပီး​သွား​တာပဲ။ ဘာကိစ္စ ​ေြကာင်ပူ​ေနရတာလဲ ​ေမး​ချင်တဲ့​သူလည်း​ ရှိပါလိမ့်​မယ်။ ကွျန်​ေတာ်တို့​ အချိန်တိုင်း​မှာ ကိုယ့်​ကွန်ြပူတာနဲ့​ကိုယ် အင်တာနက် သံုး​ဖို့​ အခွင့်​အ​ေရး​ မရှိပါဘူး​။ ​ေကျာင်း​က ကွန်ြပူတာ၊ ရံုး​က ကွန်ြပူတာ၊ အင်တာနက် ကဖီး​က ကွန်ြပူတာများ​နဲ့​ အင်တာနက် သံုး​ရတဲ့​ အခါများ​လည်း​ ရှိပါတယ်။ အဲဒီအခါမျိုး​မှာ ကိုယ့်​မှာ အက်ဒမင် အခွင့်​အ​ေရး​ မရှိတဲ့​အတွက် ​ေဖာင့်​ကို ​ေဒါင်း​လုပ်လုပ်ြပီး​ သံုး​လို့​ မရပါဘူး​။

နိုင်ငံတကာကို ​ေရာက်ရင် အ​ေတာ် မျက်နှာငယ်ပါတယ်။ အင်တာနက် ကဖီး​မှာ ကိုယ့်​​ေဘး​က ဂျပန်က ဂျပန်စာ​ေတွဖတ်၊ ကုလား​က အိန္ဒိယစာ​ေတွ ဖတ်​ေနတဲ့​ အချိန်မှာ ကွျန်​ေတာ်တို့​က​ေတာ့​ ဘာမှန်း​မသိတဲ့​ ​ေလး​​ေထာင့်​တံုး​​ေတွပဲ ထိုင်ြကည့်​​ေနရပါတယ်။ အြကံအဖန်လုပ် ​ေဖာင့်​သွင်း​ြပီး​ ဖတ်ဖို့​ ြကိုး​စား​​ေပမယ့်​လည်း​ အက်ဒမင် အခွင့်​အ​ေရး​ မရှိလို့​ ဘာမှ လုပ်မရပါဘူး​။ ြမန်မာစာကို Windows ထဲမှာ Native Language တစ်ခု အ​ေနနဲ့​ ပါလာမယ့်​ အချိန်ကို ကွျန်​ေတာ်တို့​ ​ေမှျာ်လင့်​​ေနပါတယ်။ ဒါ​ေပမယ့်​လည်း​ အဲဒီ အချိန်ကျရင် Native Language Support ကို သံုး​ြပီး​ ​ေဇာ်ဂျီနဲ့​ ​ေရး​ထား​တဲ့​ စာကို ဖတ်လို့​ ရမှာ မဟုတ်ဘဲ ယူနီကုတ် ၅.၁ နဲ့​ ​ေရး​ထား​တဲ့​ စာပဲ ဖတ်လို့​ ရမယ် ဆိုတာကို User ​ေတွ အ​ေနနဲ့​ သိထား​သင့်​ ပါတယ်။

​ေနာက်တစ်ခု က ဘာသာြပန် ကိစ္စပါ။ အခု Open Office.org 3.1 ကို ြမန်မာလို ြပန်ြပီး​ပါြပီ။ ကွျန်​ေတာ်တို့​ အ​ေနနဲ့​ အဂင်္လိပ်စာ ကွျမ်း​ကွျမ်း​ကျင်ကျင် တတ်လို့​ ကိစ္စ မရှိ​ေပမယ့်​ အဂင်္လိပ်စာကို ကွျမ်း​ကွျမ်း​ကျင်ကျင် မတတ်တဲ့​ ြမန်မာ​ေတာသူ​ေတာင်သား​​ေတွ ကွန်ြပူတာ သံုး​နိုင်တဲ့​ ​ေခတ်ကို ​ေမှျာ်ြကည့်​ ရပါမယ်။ သူတို့​ အတွက် ထည့်​စဥ်း​စား​ ​ေပး​ရပါမယ်။ ​ေဆာ့​ဖ်ဝဲလ်​ေတွကို ြမန်မာလို ြပန်နိုင်ရင် ြမန်မာြပည်မှာ ကွန်ြပူတာကို အသံုး​ြပုနိုင်မယ့်​သူ ပိုများ​ လာလိမ့်​မယ်လို့​ ​ေမှျာ်လင့်​ပါတယ်။ နာမည်ြကီး​ ​ေဆာ့​ဖ်ဝဲလ် အသိုင်း​အဝန်း​ (Community) အချို့​ က ယူနီကုတ် စနစ်ကို မလိုက်နာတဲ့​ ​ေဇာ်ဂျီကို ဘာသာြပန်တဲ့​ ​ေနရာမှာ သံုး​ဖို့​လက်မခံပါဘူး​။ သူတို့​ အ​ေနနဲ့​ နိုင်ငံတကာ စံနှုန်း​ြဖစ်တဲ့​ ယူနီကုတ် ၅.၁ ကိုပဲ လက်ခံပါတယ်။ ဒါ​ေပမယ့်​လည်း​ ြမန်မာစာ အသံုး​ြပုသူ အများ​စုက ​ေဇာ်ဂျီကို သံုး​​ေနြကတဲ့​အတွက် ယူနီကုတ်နဲ့​ ဘာသာြပန်မယ့်​သူ နည်း​​ေနပါတယ်။ အ​ေပါ်ယံြကည့်​ရင် မဆိုင်ဘူး​ ထင်ရ​ေပမယ့်​ ​ေသ​ေသချာချာ စဥ်း​စား​ြကည့်​ပါ။ ကွျန်​ေတာ်တို့​ အား​လံုး​သာ ယူနီကုတ် ၅.၁ သံုး​​ေနြကရင် ​ေဆာ့​ဖ်ဝဲလ် ဘာသာြပန်မယ့်​သူ ဒီထက်မက များ​လာနိုင်တယ် ဆိုတာ အ​ေသအချာပါပဲ။

​ေနာက်တစ်ခုက တိုင်း​ရင်း​သား​ ဘာသာစကား​ ကိစ္စပါ။ ဒီကိစ္စကလည်း​ မှန်ပါတယ်။ ​ေဇာ်ဂျီက စ​ေကာကရင်၊ ပိုး​ကရင် အစရှိတဲ့​ တိုင်း​ရင်း​သား​ ဘာသာစကား​​ေတွအတွက် သတ်မှတ် ထား​တဲ့​ ကုတ်ဒ်ပွိုင့်​​ေတွကို ယူသံုး​ထား​ပါတယ်။ အဲဒီအတွက် တိုင်း​ရင်း​သား​ ဘာသာစကား​​ေတွ အတွက် ​ေဇာ်ဂျီက သီး​သန့်​ထုတ်ထား​တဲ့​ တိုင်း​ရင်း​သား​ ဘာသာစကား​​ေဖာင့်​ကို သံုး​ရင်သံုး​ မသံုး​ရင်​ေတာ့​ ြမန်မာစာနဲ့​ တိုင်း​ရင်း​သား​ ဘာသာစကား​ကို စာမျက်နှာ တစ်ခုတည်း​မှာ အတူ မသံုး​ြကဖို့​ပဲ ရှိပါတယ်။ စာဖတ်သူ​ေတွ အရိပ်ြပရင် အ​ေကာင်ြမင်တယ် ဆိုတာကို ကွျန်​ေတာ် ယံုြကည်ပါတယ်။ ဘာြပသနာ ရှိလဲ ဆိုတာ ကိုယ့်​ဘာသာကိုယ် စဥ်း​စား​ြကည့်​ပါ။

ကွျန်​ေတာ် ဒီြပသနာကို ​ေအး​​ေအး​​ေဆး​​ေဆး​ ​ေြဖရှင်း​ချင်ပါတယ်။ အဲဒါ​ေြကာင့်​ ြမန်မာအိုင်တီပရိုမှာ ​ေဇာ်ဂျီနဲ့​ ယူနီကုတ် ၅.၁ အဖွဲ့​​ေတွြကား​ ြကား​ဝင်ြဖန်​ေြဖ​ေရး​ လုပ်ဖို့​ ြကိုး​စား​ခဲ့​ပါတယ်။ အဲဒီတုန်း​က ကွျန်​ေတာ်​ေရး​ခဲ့​တဲ့​ ပို့​စ်ရဲ့​ ​ေကာ်ပီကို ဒီမှာ ဖတ်နိုင်ပါတယ်။ ြပသနာက ​ေဇာ်ဂျီ​ေဖာင့်​ ထုတ်လုပ်တဲ့​သူ​ေတွဖက်က အား​လံုး​နဲ့​ ညိှနှိုင်း​ဖို့​ မြကိုး​စား​ဘဲ ငါတို့​​ေဖာင့်​ကို လူသံုး​များ​တာ နိုင်ငံတကာ စံနှုန်း​ ဘာလို့​ လိုက်နာရမှာလဲ ဆိုတဲ့​ အ​ေပါက်မျိုး​ ချိုး​ပါတယ်။ ​ေဇာ်ဂျီ​ေဖာင့်​ လူသံုး​များ​ရတဲ့​ ကိစ္စမှာ User ​ေတွကို သတင်း​အချက်အလက် အမှား​​ေတွ ​ေပး​ထား​တယ် ၊ ယူနီကုတ် အစစ်အမှန် မဟုတ်ဘဲ ယူနီကုတ်လို့​ နာမည် ခံထား​တယ် ဆိုတဲ့​ ကိစ္စ​ေတွကို ဝန်မခံပါဘူး​။ အဲဒီ​ေတာ့​ ကွျန်​ေတာ်တို့​လည်း​ ​ေရှ့​ဆက်ြပီး​ ​ေဇာ်ဂျီ User အ​ေနနဲ့​ လူမိုက်အား​​ေပး​ လုပ်​ေနသင့်​သလား​ မသင့်​ဘူး​လား​ ဆိုတာကို ကိုယ့်​ဘာသာကိုယ် ြပန်သံုး​သပ်ဖို့​ လိုအပ်​ေနြပီ လို့​ ထင်ပါတယ် ဆိုတဲ့​ အ​ေြကာင်း​ အား​လံုး​ကို တိုက်တွန်း​ လိုက်ရပါတယ်။

Zaw Thet ( http://phoonuthit.blogspot.com/2009/07/blog-post_2043.html )

Why did Unicode born?



ကွန်ပျူတာတွင် ယူနီကုဒ်သည် ကမ္ဘာ​ေပါ်ရှိ စာ​ေရး​စနစ် (writting system) အား​လံုး​နီး​ပါး​ ပါရှိြပီး​ ကွန်ပျူတာများ​နှင့​် လုိက်​ေရာညီ​ေထွ ရှိ​ေစ​ေရး​အတွက် သက်မှတ်ထား​​ေသာ စက်မှုစံ (industry standard) တစ်ခုြဖစ်သည်။ Universal Character Set စံ နှင်အတူ ယူနီကုဒ်စံ သည် အက္ခရာ​ေပါင်း​ ၁၀၀ ၀၀၀ ​ေကျာ်ပါ​ေသာ စာအုပ် ထုတ်​ေဝခဲ့​သည်။

ထုိစံစာအုပ်တွင် ကုိး​ကား​ရန် ဇယား​များ​၊ encoding နည်း​စဥ်များ​၊ character encoding စံများ​၊ အက္ခရာ၏ သ​ေဘာသဘာဝများ​ (ဥပမာ စာလံုး​ြကီး​၊ စာလံုး​​ေသး​)၊ အ​ေထာက်အကူြပု computer file များ​၊ အြခား​ သက်ဆုိင်ရာများ​ (အက္ခရာသ​ေဘာ၊ normalization ဥပ​ေဒ၊ ခဲွြခင်း​၊ ​ေပါင်း​ြခင်း​၊ rendering နှင် နှစ်ဖက်သွား​ စာများ​၏ အစဥ်၊ ဘယ်ညာ သ​ေဘာများ​၊ စသည့​်) ပါရှိသည်။

အြမတ်မယူ အသင်း​အဖွဲ့​ ြဖစ်​ေသာ Unicode Consortium သည် ယူနီကုဒ် ရှင်သန်တုိး​တက်​ေရး​အတွက် ြကိုး​စား​မှုတွင် ရှိြပီး​ character encoding အား​လံုး​ကုိ ယူနီကုဒ် ြဖင့​်အစား​ထုိး​သွား​ရန် ရည်ရွယ်သည်။ ယူနီကုဒ် ၏ Unicode Transformation Format (UTF) scheme များ​တွင် ရှိြပီး​ encoding နည်း​များ​သည် ဘာသာစံု (multilingual) အတွက် လုိအပ်လျက်ရှိသည်။

ဘာသာစံု ပါဝင်​ေသာ ယူနီကုဒ် ၏ ​ေအာင်ြမင်မှု​ေြကာင့​် computer software ကုိ internationalization and localization လုပ်ရာတွင် များ​စွာ အသံုး​ချလျက်ရှိသည်။ ယူနီကုဒ်စံစနစ်ကုိ ယခု ​ေပါ်​ေပါက်​ေန​ေသာ XML၊ Java programming language၊ Microsoft .NET Framework နှင့​် ​ေခတ်​ေပါ် operating system များ​တွင် အသံုး​ချလျက်ရှိသည်။

ယူနီကုဒ်စံစနစ်ကုိ အသံုး​ြပုရာတွင် character encoding မျုိး​စံု အသံုး​ြပုနုိင်သည်။ အသံုး​အများ​ဆံုး​မှာ UTF-8 (1 byte ကုိ ASCII အက္ခရာ အတွက် နှင့​် ၄ byte အထိ ကျန် ​ေနများ​ကုိ အြခား​ အက္ခရာ အတွက်)၊ မသံုး​​ေတာ့​​ေသာ UCS-2 (2 bytes ကုိ အက္ခရာ အား​လံုး​အတွက် သုိ့​​ေသာ် ယူနီကုဒ် အက္ခရာ အား​လံုး​မပါ) နှင့​် UTF-16 (၄ bytes သံုး​ြပီး​ UCS-2 ကုိ ထက်ဆင့​်၍ ကျန်ရှိ​ေန​ေသး​​ေသာ ယူနီကုဒ် အက္ခရာ များ​ကုိ ထည့​်သွင်း​) ြဖစ်ြကသည်။

အစဦး​ နှင့​် တုိး​တက်​ေြပာင်း​လဲြခင်း​

ယူနီကုဒ်သည် ​ေရှး​ရုိး​ သံုး​လာခဲ့​ြက​ေသာ စာလံုး​ သိမ်း​ဆည်း​ပံု (character encoding) များ​၊ ISO 8859 စံ များ​ ကုိ ကျယ်ကျယ်ြပန့်​ြပန့်​ သတ်မှတ်လုိသည်။ ISO 8859 စံ သည် နုိင်ငံ​ေပါင်း​များ​စွာ၏ အသံုး​အနှုန်း​များ​ ကုိ သတ်မှတ်နုိင်ခဲ့​​ေသာ်လည်း​ တစ်ခုနှင့​်တစ်ခု ​ေြပာင်း​လဲ၍ (incompatible) သံုး​နှုန်း​မရ​ေပ။ များ​စွာ​ေသာ ​ေရှး​ရုိး​ရာ စာလံုး​ သိမ်း​ဆည်း​ပံု၏ ​ေတွ့​​ေနကျ ြပသနာမှာ ဘာသာနှစ်မျုိး​ ရရန် ြပုလုပ်ြခင်း​ (များ​​ေသာအား​ြဖင့​် Roman characters နှင် ​ေဒသစာ) တွင် ဘာသာမျုိး​စံု အတွက်မပါ​ေပ။

ယူနီကုဒ်သည် သ​ေဘာအား​ြဖင့​် စာလံုး​ပံု (glyph) များ​ကုိ ထက် အ​ေြခခံ စာလံုး​ (character) များ​ — graphemes and grapheme-like units — ကုိ သိမ်း​ဆည်း​ထား​သည်။ တရုတ်စာတွင် အ​ေြခခံ စာလံုး​ နှင် စာလံုး​ပံု တုိ့​ကုိခဲွြခား​ရန် ခက်ခဲသည်။

စာများ​ကုိ တွက်ချက်ြခင်း​ (text processing) တွင် ယူနီကုဒ်သည် စာလံုး​တုိင်း​အတွက် အတုမရှိ​ေသာ စာခွက် (code point) — စာလံုး​ပံု အစား​ နံပါတ်တစ်ခု — ရှိ​ေရး​ တာဝန်ယူသည်။ တစ်နည်း​အား​ြဖင့​် ယူနီကုဒ်သည် စာလံုး​များ​ကုိ မူရင်း​သဘာဝ (an abstract way) ကုိကုိယ်စား​ြပုြပီး​ ပံု​ေဖာ်ရန် အတွက်ကုိမူ (အရွယ်၊ ပံု၊ ​ေဖာင့​် (သုိ့​) သဏ္ဍာန်) software (web browser, word processor) ၏တာဝန်အြဖစ် ချန်ထား​ခဲ့​သည်။ ထုိမှျရှင်း​လင်း​​ေသာ ြကိုး​စား​မှုပင် ရှုပ်​ေထွး​ရ​ေသာ အ​ေြကာင်း​မှာ ယူနီကုဒ် ဒီဇုိင်း​ြပုသူများ​ ယူနီကုဒ် ကျယ်ြပန့်​စွာ အသံုး​ြပု​ေရး​ ြကိုး​ပမ်း​မှုတွင် သ​ေဘာတူညီမှု မရနုိင်ြခင်း​တုိ့​​ေြကာင့​်ြဖစ်သည်။

ယူနီကုဒ်၏ ပဋ္ဌမ ၂၅၆ လံုး​မှာ ISO 8859-1 နှင့​် တူ​ေသာ​ေြကာင့​် ရှိြပီး​ အ​ေနာက်နုိင်ငံမှ စာများ​အတွက် အခက်အခဲ မရှိ​ေပ။ များ​စွာ​ေသာ အတူတူ စာလံုး​များ​ကုိ မတူ​ေသာ စာခွက်များ​တွင် သက်မှတ်ြခင်း​မှာ ရှိြပီး​ စာလံုး​ သိမ်း​ဆည်း​ပံု နှင့​် အဆင်​ေြပ​ေစရန် ြဖစ်သည်။ ထုိ့​​ေြကာင့​် ရှိြပီး​စာ များ​မှ ယူနီကုဒ်ကုိ ​ေြပာင်း​ရာတွင် မှား​ယံင်း​မှု မရှိနုိင်​ေပ။

သမုိင်း​ြမန်မာယူနီကုဒ်

ယူနီကုဒ်၊ ယူနီကုဒ်နဲ့​ လူ​ေတွက​ေတာ့​​ေြပာ​ေနြကတယ်။ ​ေြပာ​ေနတဲ့​သူတိုင်း​က​ေရာ ယူနီကုဒ်ဆိုတာဘာလဲဆိုတာအ​ေသအချာ ရှင်း​ရှင်း​လင်း​လင်း​ သိချင်မှသိြကလိမ့်​မယ်။ ယူနီကုဒ်ဆိုတာကို ​ေနာက်မှ​ေပါက်တဲ့​​ေရွှြကာပင်ရယ်လို့​သ​ေဘာထား​ြပီး​ မသံုး​ချင်ြက​ေသး​တဲ့​ သူ​ေတွလည်း​ရှိချင်ရှိမယ်။
ဘာပဲြဖစ်ြဖစ်​ေပါ့​​ေလ…
- ြမန်မာယူနီကုဒ်ဆိုတာဘာလဲ
- ယူနီကုဒ်ကဘာ​ေတွပိုအသံုး​၀င်မှာလဲ
- အရင်တုန်း​ကသံုး​​ေနတာနဲ့​ဘာကွာလို့​​ေြပာင်း​သံုး​​ေနြကတာလဲ
အစရှိတဲ့​အ​ေြခခံ​ေမး​ခွန်း​​ေလး​​ေတွကိုအရင်ရှင်း​သွား​​ေအာင်​ေြပာချင်ပါတယ်။

ASCII Font အ​ေြကာင်း​
ြမန်မာနိုင်ငံမှာကွန်ပျူတာ​ေတွကို သံုး​ြက​ေတာ့​ကွန်ပျူတာမှာInternational Language ြဖစ်တဲ့​English ကိုပဲသံုး​​ေနရာက​ေန ကိုယ့်​နိုင်ငံအတွက် ကိုယ့်​စာ​ေတွကို ကွန်ပျူတာမှာ ြမင်ချင်လာြကတယ်။ အဲဒီအချိန်မှာ ကွန်ပျူတာမှာ သံုး​​ေနြကတာ Latin စာ​ေတွ​ေလ။ အဲဒီ Latin စာ​ေတွကိုကွန်ပျူတာထဲမှာ ASCII (American Standard Code for Information Interchange) စနစ်ကိုသံုး​ြပီး​သိမ်း​တယ်။ သူတို့​ Latin စာအတွက် ကုဒ်​ေတွ သတ်မှတ်ထား​​ေပမယ့်​ ြမန်မာစာအတွက်က ကုဒ်မှမသတ်မှတ်ထား​​ေသး​တာ။ ကုဒ်မရှိလဲ ြမန်မာစာြမင်ချင်​ေတာ့​ ခုနက​ေြပာတဲ့​ Latin စာ​ေတွသိမ်း​တဲ့​ ASCII စနစ်ကိုပဲသံုး​ရ​ေတာ့​တယ်။ အဲဒီလိုနဲ့​ပဲ ASCII စနစ်ကိုသံုး​တဲ့​ ြမန်မာစာ စာလံုး​စနစ် (Font) ​ေတွကို တီထွင်လာြကတယ်။ ၁၉၉၂ အ​ေစာပိုင်း​မှာ “Shwe and Mya” လို့​​ေခါ်တဲ့​ ပထမဆံုး​ြမန်မာစာ Font ကိုတီထွင်ထုတ်လုပ်ခဲ့​တယ်။ ြမန်မာစာကို် ြမင်ရ​ေသာ်လည်း​ ကွန်ပျူတာက အမှန်တကယ်သိသည်မှာ Latin စာ​ေတွပဲြဖစ်​ေနတယ်။ ဥပမာ Win Font မှာဆိုရင် “က” ဟုြမင်​ေနရ​ေသာ်လည်း​ ကွန်ပျူတာက Latin စာ ‘u’ ကိုသာ သိမ်း​ထား​ြခင်း​ြဖစ်တယ်။

ြပဿနာ

ြမန်မာစာ ASCII Font ​ေတွရဲ့​အဓိကြပဿနာက​ေတာ့​ စာရိုက်စဉ်ကအသံုး​ထား​​ေသာ font အမျိုး​အစား​မရှိ​ေသာ ကွန်ပျူတာတွင် ြပန်ဖွင့်​ြကည့်​လှျင် Latin စာများ​သာြမင်ရြခင်း​ ြဖစ်သည်။ ဥပမာ- Win Font အသံုး​ြပု၍စာရိုက်ထား​​ေသာ ဖိုင်တစ်ခုကို Win Font မရှိ​ေသာ ကွန်ပျူတာတွင်ဖွင့်​ြကည့်​လှျင် abc…d (Latin) စာများ​သာြမင်ရမည်ြဖစ်သည်။ ထိုစက်တွင် Win Font မရှိ​ေသာ်လည်း​ ASCII Font တစ်ခုြဖစ်သည့်​ Academy Font ရှိ၍ ထို Academy နှင့်​ြပန်ဖွင့်​ြကည့်​လှျင် ြမန်မာစာများ​ကို​ေတာ့​ ြမင်နိုင်ပါမည်။ သို့​​ေသာ် မှန်ကန်စွာ ြပန်ြမင်နိုင်​ေတာ့​မည် မဟုတ်​ေပ။ ဥပမာ- Win Font တွင် ‘က’ သည် ‘u’ ​ေနရာတွင် ထား​​ေသာ်လည်း​ Academy Font တွင် ‘u’ ဟူ​ေသာ Latin စာ​ေနရာတွင် ‘ယ’ ထား​​ေသာ​ေြကာင့်​ Win Font တွင်ရိုက်တား​​ေသာ ‘က’ ​ေနရာများ​တွင် Academy Font ​ေြပာင်း​​ေသာအခါ ‘ယ’ များ​အြဖစ်​ေြပာင်း​လဲသွား​​ေသာ​ေြကာင့်​ အမှန်ကို ြမင်နိုင်​ေတာ့​မည် မဟုတ်​ေချ။
ထိုသို့​ြပဿနာမျိုး​များ​ ြဖစ်ရြခင်း​မှာ စာလံုး​စနစ်သိမ်း​ရာတွင် တိကျ​ေသာ စံသတ်မှတ်ချက်မရှိြခင်း​​ေြကာင့်​ ြဖစ်သည်။ ဥပမာ- ‘က’ ဟူ​ေသာစာလံုး​တစ်ခုသည် Latin စာ ‘u’ ​ေနရာတွင်သာြဖစ်သည်ဟူ​ေသာ သတ်မှတ်ချက်မျိုး​မရှိခဲ့​​ေပ။

ASCII စနစ်ကိုသံုး​ြခင်း​၏ အဓိက၀မ်း​နည်း​စရာအ​ေကာင်း​ဆံုး​အချက်မှာ ကိုယ်ပိုင်စနစ် မရှိြခင်း​​ေြကာင့်​၊ သူများ​စနစ်ကို အငှား​သံုး​ထား​ရြခင်း​ပင်ြဖစ်သည်။ ‘က’ ဟုြမင်​ေနရ​ေသာ်လည်း​ ကွန်ပျူတာက ‘u’ ဟုသာသိ​ေနြခင်း​ြဖစ်သည်။

ထို့​​ေနာက် ြမန်မာစာအတွက် ကိုယ်ပိုင်ကုဒ်စနစ်တစ်ခုရရှိရန် ြကိုး​ပမ်း​ြကရာ ‘Unicode’ ဟု​ေခါ်​ေသာစနစ်ကို ရှာ​ေဖွ​ေတွ့​ရှိခဲ့​သည်။ထို ‘Unicode’ စနစ်ဆိုသည်မှာ တစ်ကမာ္ဘလံုး​တွင် ရှိ​ေသာ ဘာသာစကား​တိုင်း​အတွက် ကိုယ်ပိုင်​ေနရာများ​ သတ်မှတ်​ေပး​​ေသာ စနစ်ြဖစ်သည်။ ထို Unicode စနစ်တွင်ြမန်မာစာပါရှိ​ေရး​အတွက် ြကိုး​ပမ်း​ြကရာ (၁၉၉၈) ခုနှစ်တွင် ြမန်မာနိုင်ငံအတွက် ကုဒ်​ေနရာ​ေပါင်း​ ( ၁၆၀ ) (1000 မှ -109F အထိ )​ေနရာရရိှလာခဲ့​သည်။

ြမန်မာယူနီကုဒ် အ​ေြကာင်း​

‘Unicode’ စနစ်တွင် ဗမာစာအတွက် ကိုယ်ပိုင်​ေနရာတစ်ခု ရရှိလာြပီး​​ေနာက် ထိုစနစ်ကို အသံုး​ြပု၍ Unicode Font များ​ကိုထုတ်လုပ်လာြကပါသည်။ Unicode စနစ်တွင် အက္ခရာတစ်ခုစီအတွက် သီး​သန့်​ကုဒ်တစ်ခုရှိသည်။ ဥပမာ- ‘က’ သည် ‘Unicode’ စနစ်တွင် ‘1000’ ဟူ​ေသာ ​ေနရာတွင်ရှိသည်။ Unicode စနစ်ကိုသံုး​ထား​​ေသာ မည်သည့်​ Font တွင်မဆို ‘က’ သည် ကုဒ် ‘1000’ သာြဖစ်​ေနသည်။
‘Unicode’ စနစ်တွင် ဗမာစာ၏ အဓိကအ​ေြခခံအက္ခရာများ​ကိုသာ ကိုယ်ပိုင်ကုဒ် သတ်မှတ်​ေပး​ထား​ြခင်း​ ြဖစ်သည်။ ASCII စနစ်နှင့်​ ကွာြခား​ချက်မှာ ASCII စနစ်တွင် ( ု) သည် အတိုနှင့်​ အရှည် ( ု ) နှစ်မျိုး​လံုး​အတွက် ကုဒ်တစ်ခုစီအသံုး​ြပုထား​​ေသာ်လည်း​၊ ‘Unicode’ စနစ်တွင်မူ ‘ ု’ သည် “102F” ဟူ​ေသာ ကုဒ် ၁ ခုတွင်သာ ရှိ​ေနမည်ြဖစ်ြပီး​ ကီး​ဘုတ်တွင်လည်း​ ‘Key’ ၁ခုတွင်သာရှိ​ေန​ေပမည်။ ထိုအခါ စာရိုက်သူက ‘ ု’ လိုချင်​ေသာအခါ မည်သို့​ြပုလုပ်ရမည်နည်း​ ဆိုလှျင် မည်သို့​မှျြပုလုပ်ရန် မလိုပါ။ ‘ ု’ သည် ‘K’ key တွင် ရှိသည်ဆိုလှျင် စာရိုက်သူသည် ‘ ု’ လိုချင်သည်ြဖစ်​ေစ၊ ‘ ု ’ လိုချင်သည်ြဖစ်​ေစ ထို ‘K’ key ၁ခုကိုသာ နှိပ်ရန်မှတ်သား​ထား​ရပါမည်။ ထိုသို့​ ‘ ု’ / ‘ ု ’ ​ေြပာင်း​လဲြခင်း​ကို ထိုသရနှင့်​တွဲ​ေသာ အက္ခရာ​ေပါ်မူတည်၍ ဗမာစာ​ေရး​နည်း​စနစ်အတိုင်း​ ​ေြပာင်း​လဲရမည့်​ပံုစံကို ​ေြပာင်း​လဲြခင်း​ကို ‘Rendering Engine’ လုပ်​ေဆာင်​ေပး​ပါလိမ့်​မည်။ ထို ‘Rendering’ သည် ‘Unicode’ ၏ စံသတ်မှတ်ချက်ကို လိုက်နာထား​​ေသာ Unicode Font များ​တွင် တစ်ပါတည်း​ပါရှိမည်ြဖစ်သည်။


ယူနီကုဒ် သမုိင်း​ကုိ ၁၉၈၇ ခု Xerox မှ Joe Becker နှင့​် Apple မှ Lee Collins and Mark Davis တုိ့​က အြပည်ြပည်ဆုိင်ရာ စာလံုး​ စနစ် ြဖစ်နုိင်​ေြခကုိ စတင် စူး​စမ်း​ခဲ့​သည်။ ထုိနှစ် ြသဂုတ်လတွင် Joe Becker သည်
international/multilingual text character encoding system, tentatively called Unicode.


စာတမ်း​ကုိ ထုတ်​ေဝခဲ့​သည်။ Unicode 88 ​ေခါင်း​စဥ်ရှိ​ေသာ ထုိစာတန်း​၏ ၁၆ ဘစ် (bit) အ​ေြခြပု စာလံုး​ မုိဒယ်တွင် Unicode is intended to address the need for a workable, reliable world text encoding. Unicode could be roughly described as "wide-body ASCII" that has been stretched to 16 bits to encompass the characters of all the world's living languages. In a properly engineered design, 16 bits per character are more than sufficient for this purpose.ဟု​ေဖါ်ြပခဲ့​သည်။ မူလ ၁၆ ဘစ် (bit) အ​ေြခြပု စာလံုး​ မုိဒယ်သည် ယခု သံုး​စွဲ​ေန​ေသာ စာ​ေရး​စနစ် များ​ကုိသာ စဥ်း​စား​ခဲ့​သည်။ သုိ့​​ေသာ

ယခုသံုး​​ေန​ေသာ စာလံုး​များ​မှာ

Unicode gives higher priority to ensuring utility for the future than to preserving past antiquities. Unicode aims in the first instance at the characters published in modern text (e.g. in the union of all newspapers and magazines printed in the world in 1988), whose number is undoubtedly far below 214 = 16,384. Beyond those modern-use characters, all others may be defined to be obsolete or rare; these are better candidates for private-use registration than for congesting the public list of generally-useful Unicodes.

ဟု သံုး​သပ်ခဲ့​သည်။ ဆုိလုိသည်မှာ ​ေရှး​စာနှင့​် အသံုး​များ​​ေသာ စာလံုး​များ​ပါ ယူနီကုဒ် တွင် ပါဝင်ရန်လုိအပ်ခဲ့​သည်။

သဲသဲ​ေအး​ (http://thetheaye.my-mm.org/)

ယူနီကုတ်​၅.၁ တို့​၏ ေကာင်း​ေသာအချက် မ​ေကာင်း​ေသာအချက်များ​

​ေကာင်း​​ေသာအချက်




  • ၁။ တစ်​ေချာင်း​ငင်၊ ရရစ်စတာ​ေတွ ပုံကွဲတစ်မျိုး​သာရှိြခင်း​



မ​ေကာင်း​သာ အချက်များ​




​​ေဇာ်​ဂျီ​နှင့်​​​ ​ယူ​နီ​ကုဒ်​တို့​​​၏​ ​​ေန​ရာ​ကွာ​ြခား​​ချက်​တ​ခု
​ေဇာ်​ဂျီ​နှင့်​​​ ​ယူ​နီ​ကုဒ်​တို့​​​၏​ ​​ေန​ရာ​ကွာ​ြခား​​ချက်​တ​ခု




  • ၁။ ယူနီကုတ် ၅.ဝ က​ေန ၅.၁ ကို ​ေြပာင်း​ရာတွင် အြပာ​ေရာင်ြဖင့်​ ြပထား​​ေသာ စာလုံး​ ၅လုံး​ သည် ​ေဇာ်ဂျီနှင့်​ အတူတူ ြဖစ်​ေနရာမှ ​ေနာက်သို့​ ​ေနရာတစ်လုံး​​ေရွ့​ြပစ်လိုက်ြခင်း​ (တစ်လုံး​ထည့်​ဖို့​အတွက် လွတ်တဲ့​​ေနရာမှာ မထည့်​ပဲ ၅လုံး​ကို ​ေရွ့​ြပစ်လိုက်တာ လုံး​ဝ သဘာဝမကျပါဘူး​။ အဲဒါ​ေြကာင့်​ အလကား​သက်သက်မဲ့​ Converter ​ေတွ Encoding Detect လုပ်တာ​ေတွ လိုလာရပါတယ်။)

  • ၂။ ြမန်မာစာ အတွက် အသတ်ကို ထည့်​ မစဉ်း​စား​ပဲ ပါဠိစာကို အဓိကစဉ်း​စား​ြပီး​ ဒီဇိုင်း​ ဆင်ခဲ့​ြခင်း​ (ဒါ​ေြကာင့်​ \u1039 - အသတ်​ေနရာမှာ ပါဌ်ဆင့်​​ေရှ့​ခံစာလုံး​ ြဖစ်​ေနသည်) ယူနီကုတ် ၅.ဝ အထိ အသတ်ကို ရိုက်ချင်လှျင် ZWSP လို့​​ေခါ်တဲ့​ \u200x ကိုထည့်​ရိုက်ရြခင်း​ (ကသတ်​ေပါ်ဖို့​အတွက် - က + \u1039 (ပါဌ်ဆင့်​စာလုံး​) + \u200x လို့​ ၃လုံး​ရိုက်ရ)

  • http://rishida.net/scripts/myanmar/
    Changes in Unicode 5.1. In Unicode 5.0, U+103A MYANMAR SIGN ASAT did not exist, and U+1039 MYANMAR SIGN VIRAMA had to be used for both visible and non-visible ....

  • ၃။ အကယ်၍ ပတ်ဆင့်​​ေရာ၊ အသတ်​ေရာ အစကတည်း​က ထည့်​စဉ်း​စား​ခဲ့​မယ်ဆိုလှျင် ပါဌ်ဆင့်​​ေရှ့​ခံစာလုံး​ကို \u1039 အသတ်​ေနရာ မှာမဟုတ်ပဲ အြခား​လွတ်တဲ့​ ​ေနရာမှာ ထား​လို့​ရြခင်း​။

  • ၄။ အသတ် စာလုံး​​ေရှ့​မှာ ​ေအာက်ကြမစ်ကို ထား​ဖို့​ စဉ်း​စား​​ေနြခင်း​ (ထား​ြပီး​?) ဥပမာ -- နှင့်​ ကို နှ--င---့​---် လို့​ ထား​ြခင်း​



အ​ေတာ်များ​များ​ဟာ work around သ​ေဘာမျိုး​ ​ေနာက်မှ မတတ်သာလို့​ မြဖစ်ြဖစ်​ေအာင် ြပင်ြပစ်ရတာ​ေတွြဖစ်လာတယ်။ အဲဒီလိုလုပ်​ေတာ့​ ြဖစ်ကရဆန်း​ သ​ေဘာမျိုး​ြဖစ်​ေနတယ်။ အပိုအလုပ်​ေတွ ရှုပ်လာတယ်။


မာ့​ခ်၏ ကိုယ်ပိုင် အတ္တများ​ (http://www.soemin.net/2009/07/blog-post_17.html)

ြမန်မာစာစနစ်များ​၏ ေနာက်ခံကား​



ယခုအခါ ကွန်ပျူတာသံုး​ ြမန်မာစာ စနစ်အမျိုး​မျိုး​ ​ေပါ်ထွန်း​လှျက် ရှိသည်။ ၄င်း​ စနစ် အသီး​သီး​ ၏ ​ေပါ်​ေပါက် လာရြခင်း​ အ​ေြကာင်း​ရင်း​ နှင့်​ သ​ေဘာ သဘာဝများ​မှာ တခု နှင့်​ တခု မတူညီပဲ ကွဲြပား​ လှျက်ရှိသည်။ Unicode 5.1 တွင် ြမန်မာ အက္ခရာများ​ ၏ ​ေနရာ သတ်မှတ်ချက် တည်ြငိမ်လာြပီြဖစ်ရာ​ အချက်အလက်များ​ မှျ​ေဝ နုိင်ရန်၊ ြမန်မာ ဘာသာြဖင့်​ ​ေရး​သား​ ထား​​ေသာစာများ​ ကုိ အက္ခရာဝလိစီရန် နှင့်​ ရှာ​ေဖွနုိင်ရန် ၄င်း​ ​ေနရာ သတ်မှတ်ချက်များ​ အတုိင်း​ ​ေြပာင်း​လဲ သံုး​စွဲ သင့်​ြပီ ြဖစ်သည်။ လက်ရှိ စနစ်များ​ ၏ ​ေနာက်ခံကား​ကုိ နား​လည် သ​ေဘာ​ေပါက်မှ ၄င်း​ စနစ်များ​ အား​ အသံုး​ြပု လှျက်ရှိသူတုိ့​ကုိ Unicode အဆင့်​မီ စနစ်များ​ သုိ့​ ​ေချာ​ေချာ​ေမွ့​​ေမွ့​ ​ေြပာင်း​လဲနုိင်​ေစမည်ြဖစ်ရာ ဤစာတမ်း​ငယ်တွင် လက်ရှိ ြမန်မာစာ စနစ်များ​ ၏ သ​ေဘာ သဘာဝကုိ Information Systems Practitioner တစ်ဦး​ ၏အြမင်မှ ​ေဆွး​​ေနွး​ တင်ြပမည် ြဖစ်သည်။

နိဒါန်း​

ယခုအခါ ကွန်ပျူတာကုိ အသံုး​ြပုရာတွင် အဂင်္လိပ်၊ ဂျာမန်၊ ြပင်သစ်စ​ေသာ အ​ေနာက်တုိင်း​ ဘာသာစကား​များ​သာမကပဲ တရုတ်၊ ကုိရီး​ယား​၊ ဂျပန် စ​ေသာ အ​ေရှ့​တုိင်း​ ဘာသာစကား​များ​ြဖင့်​လဲ လွယ်ကူစွာ အသံုး​ြပုနုိင်ြကြပီ ြဖစ်သည်။ ဤကဲ့​သုိ့​ မိခင်ဘာသာစကား​များ​ြဖင့်​ ကွန်ပျူတာကုိ အသံုး​ြပုနုိင်ရြခင်း​မှာ ဘာသာစကား​အများ​အြပား​၏ အက္ခရာများ​ကုိ code-range တစ်ခုအတွင်း​တွင် ​ေနရာချထား​​ေပး​​ေသာ Unicode ​ေခါ် စံနှုန်း​တစ်ရပ်ကုိ အများ​သ​ေဘာတူ သတ်မှတ်နုိင်ခဲ့​​ေသာ​ေြကာင့်​ ြဖစ်သည်။ အဆုိပါ စံနှုန်း​အတွင်း​တွင် ြမန်မာအက္ခရာများ​အတွက် code-range ကုိ သတ်မှတ်နုိင်ခဲ့​​ေသာ်လည်း​ နှစ်​ေပါင်း​များ​စွာြကာသည့်​တုိင်​ေအာင် အ​ေသး​စိတ် အ​ေကာင်အထည်​ေဖာ်မည့်​ ပံုစံကုိ အတည်မြပုနုိင်​ေသး​ပဲ ရှိခဲ့​သည်။

ယခုအခါ ြမန်မာစာ Unicode စနစ်သည် တည်ြငိမ်စ ြပုလာြပီြဖစ်ြပီး​ ​ေဇာ်ဂျီ ြမန်မာစာ စနစ်မှာ အြခား​ဘာသာစကား​များ​နှင့်​ ယှဥ်တွဲ သံုး​စွဲနုိင်သည့်​ Unicode အစစ်မဟုတ်​ေသာ်လည်း​ အများ​သံုး​ (de facto) စံနှုန်း​တစ်ရပ် အြဖစ် ရပ်တည်လှျက်ရှိသည်။ ယခင်က သံုး​စွဲခဲ့​​ေသာ ASCII (truetype) font များ​နှင့်​ Burglish သံုး​စွဲမှုများ​လဲ ယ​ေန့​တုိင် ရပ်တည်လှျက်ရှိသည်ကို ​ေတွ့​ရှိရသည်။ ဤစာတမ်း​တွင် 8 bit font များ​နှင့်​ burglish အ​ေြကာင်း​ကို ​ေရှး​ဦး​စွာတင်ြပြပီး​ အများ​သံုး​ြဖစ်သည့်​ ​ေဇာ်ဂျီစနစ်အ​ေြကာင်း​ကုိ ဆက်လက် ​ေဆွး​​ေနွး​မည် ြဖစ်သည်။ ထုိ့​​ေနာက် Unicode 5.1 အဆင့်​မီစနစ်များ​အ​ေြကာင်း​နှင့်​ ၄င်း​တုိ့​ကုိ အဘယ်​ေြကာင့်​ ​ေရွး​ချယ်သင့်​သည်ကို ရှင်း​လင်း​​ေရး​သား​မည် ြဖစ်ပါသည်။

8 Bit Systems

ယခင်က အဂင်္လိပ်စာလံုး​ကဲ့​သုိ့​​ေသာ လက်တင်စာလံုး​များ​ြဖင့်​ ​ေရး​သား​ထား​သည့်​ contents များ​ကုိ ကွန်ပျူတာများ​ ​ေဝမှျသံုး​စွဲနုိင်​ေစရန်အတွက် စံအြဖစ် IBM မှ EBCDIC (8 bits) စနစ်နှင့်​ ASCII (7 bits) စနစ်ဟူ၍ စတင် ​ေပါ်​ေပါက်ခဲ့​သည်။ ​ေနာက်ပုိင်း​တွင် ASCII စနစ်ကုိ 8 bit သုိ့​ တုိး​ချဲ့​ခဲ့​သည်။ နာမည်ြကီး​ Windows စနစ်များ​တွင် ASCII စနစ်ကုိ အသံုး​ြပုနုိင်ရာ အဂင်္လိပ်စာလံုး​များ​ကုိ ပံုြပင်ဆွဲ၍ ြမန်မာစာလံုး​ပံုစံ အများ​အြပား​ ​ေပါ်ထွက်ခဲ့​သည်။ ၄င်း​တုိ့​သည် နည်း​ပညာရှု​ေထာင့်​အရ အဂင်္လိပ်စာကုိ ပံု​ေြပာင်း​ထား​ြခင်း​မှျသာြဖစ်ြပီး​ ြမန်မာဘာသာြဖင့်​ ​ေရး​သား​ထား​​ေသာ အချက်အလက်များ​ကုိ ြမန်မာစာ အက္ခရာစီထံုး​ြဖင့်​ အလွယ်တကူ စီ၍မရ​ေပ။ ယခုအခါ ၄င်း​တုိ့​ကုိ ပံုနှိပ်တုိက်များ​တွင် ကျယ်ြပန့်​စွာ သံုး​စွဲလှျက်ရှိြပီး​ CE နှင့်​ Win-Myanmar ပံုစံတုိ့​မှာ ထင်ရှား​သည်။

Burglish

ြမန်မာနှင့်​ အဂင်္လိပ်စာ ​ေရာ​ေထွး​​ေရး​သား​ရန် 16 bit code များ​ မ​ေပါ်​ေပါက်မီက Chat application သံုး​စွဲသူအချို့​သည် ​ေြပာလုိ​ေသာ အ​ေြကာင်း​အရာကုိ အသံဖလှယ်၍ အဂင်္လိပ် အက္ခရာများ​ြဖင့်​ ​ေရး​သား​သံုး​စွဲြကသည်။ (ဥပမာအား​ြဖင့်​ Sar Pee P Lar ? = စား​ြပီး​ြပီလား​ ြဖစ်သည်။) ယ​ေန့​တုိင် ြမန်မာစာ ​ေကာင်း​စွာ မရိုက်တတ်သူ Chat application အသံုး​ြပုသူအချို့​လဲ ရှိ​ေနဆဲပင် ြဖစ်သည်။ ၄င်း​တုိ့​အတွက် အလုိအ​ေလျာက် ဘာသာြပန်​ေပး​သည့်​ စနစ်အမျိုး​မျိုး​ ​ေပါ်ထွက်ခဲ့​ရာ ဝိဇ္ဇာစနစ်မှာ ထင်ရှား​​ေသာ ဥပမာ တစ်ခုြဖစ်ြပီး​ ​ေဇာ်ဂျီနှင့်​ Myanmar – 3 သုိ့​ ဘာသာြပန်​ေပး​နုိင်သည်။

​ေဇာ်ဂျီ

နုိင်ငံတကာသံုး​ စံနှုန်း​ြဖစ်သည့်​ Unicode စံနှုန်း​ (16 bit code) တွင် ြမန်မာအက္ခရာများ​၏ ​ေနရာ (ခွင်) ကို အတိအကျ သတ်မှတ်နုိင်ခဲ့​ြပီး​ ြဖစ်​ေသာ်လည်း​ စာလံုး​များ​၏ ​ေနရာနှင့်​ ဘာသာစကား​၏ ရှုပ်​ေထွး​မှု ြပဿနာများ​ကို ​ေြဖရှင်း​နုိင်ရန် စံသတ်မှတ်ချက် အတိအကျ မရှိသည်မှာ အ​ေတာ်ပင် ြကာြမင့်​ခဲ့​သည်။ ဥပမာအား​ြဖင့်​ ြပ နှင့်​ ြက တွင် ပါဝင်​ေသာ ရရစ်မှာ အတူတူပင်ြဖစ်​ေသာ်လည်း​ ၄င်း​တုိ့​ကုိ ပံု​ေဖာ်ရန်အတွက် software support (rendering support) လုိသည်။ ၄င်း​ကုိ အလွယ်နည်း​နှင့်​ ​ေြဖရှင်း​ရန်မှာ code-range ကို ချဲ့​ပစ်ရန်ြဖစ်ရာ (ရရစ် ၂ ခုသံုး​မယ်၊ code ၂ ခု​ေပး​ ဆုိတာမျိုး​) ပညာရှင်အချို့​က စံနှုန်း​မတည်ြငိမ်မီ ကာလအတွင်း​ ​ေဆး​ြမီး​တုိအြဖစ် အြခား​ဘာသာစကား​များ​၏ code များ​ကုိ ​ေချး​ငှား​သံုး​စွဲကာ ​ေဇာ်ဂျီစာလံုး​စနစ်ကုိ ဖန်တီး​ခဲ့​ြကသည်။

၄င်း​သည် ြပဿနာ ၂ ရပ်ကုိ ဖိတ်​ေခါ်လာသည်။ ​ေဇာ်ဂျီသည် အဂင်္လိပ် အက္ခရာများ​၏ code ကုိ မထိသြဖင့်​ အဂင်္လိပ်/ြမန်မာ တွဲဖက်​ေရး​သား​ရာတွင် အဆင်​ေြပ​ေသာ်လည်း​ ၄င်း​​ေချး​ငှား​ထား​​ေသာ ဘာသာစကား​များ​နှင့်​ ြမန်မာစာကုိ တွဲဖက်​ေရး​သား​ပါက ကွန်ပျူတာအ​ေနနှင့်​ ​ေချး​သံုး​ထား​​ေသာ code များ​ကုိ မည်သည့်​ အက္ခရာ (ြမန်မာ အက္ခရာ သို့​မဟုတ် အြခား​ အက္ခရာ) အြဖစ် ​ေဖာ်ြပ​ေပး​ရမည်ကုိ မသိနုိင်ပဲ ြဖစ်လိမ့်​မည်။ (ဥပမာ 1E29 သည် 'ḩ' လား​၊ Latin Small Letter H with Cedilla လား​ မသိနုိင်​ေတာ့​​ေပ။) ​ေနာက်ြပဿနာတစ်ရပ်မှာ တူညီ​ေသာ စာလံုး​များ​ ကုိ code အများ​အြပား​သုိ့​ assign လုပ်ထား​သြဖင့်​ အက္ခရာစဥ် စီရာ (နှင့်​ searching ရှာရာ) တွင် မလုိလား​အပ်​ေသာ ရှုပ်​ေထွး​မှုများ​ကုိ ြဖစ်​ေပါ်​ေစပါသည်။ ဥပမာအား​ြဖင့်​ ရရစ်သည် ြပ ဟု​ေရး​ရာတွင် တမျိုး​၊ ြက ဟု​ေရး​ရာတွင် တမျိုး​၊ လံုး​ြကီး​တင်နှင့်​ တွဲရန်တမျိုး​ (ြပိ၊ ြကိ) စသြဖင့်​ code အမျိုး​မျိုး​ ြဖစ်​ေနသည်။ အမှန်မှာ အက္ခရာ စဥ်ရာတွင် ြကသည် ြပအ​ေရှ့​ (ြကိသည် ြပိအ​ေရှ့​) ဟူ၍ ရရစ် ၂ မျိုး​ကုိ အတူတူ သ​ေဘာထား​ြပီး​ စီရရာ ​ေဇာ်ဂျီစနစ်ြဖင့်​ ​ေရး​သား​ထား​​ေသာ ြမန်မာစာများ​ကုိ အက္ခရာစီနုိင်ရန် ခက်ခဲပါသည်။

​ေဇာ်ဂျီ၏ အဓိက အား​နည်း​ချက် တစ်ရပ်မှာ စာလံုး​များ​၏ စံပံုစံ မရှိြခင်း​ပင် ြဖစ်သည်။ တ + - ိ + - ု (တုိ) နှင့်​ တ + - ု + - ိ (တုိ) တုိ့​မှာ ​ေဇာ်ဂျီတွင် မတူညီြက​ေပ။ သုိ့​ြဖစ်၍ ပထမ တုိ ကုိ ရှာ​ေဖွရန် ြကိုး​စား​ရာတွင် ဒုတိယ တုိ ကုိ ထည့်​သွင်း​ ရှာ​ေဖွခုိင်း​ပါက ရှာ​ေတွ့​မည် မဟုတ်ပါ​ေချ။ တူညီ​ေသာစာလံုး​များ​ကုိ ရုိက်ထည့်​​ေသာ အစီအစဥ် မတူညီြခင်း​​ေြကာင့်​ ကွန်ပျူတာက မတူညီဟု အ​ေြဖထုတ်​ေပး​ြခင်း​မှာ လက်ခံနုိင်ဖွယ် အရည်အ​ေသွး​တစ်ရပ် မဟုတ်​ေပ။ ​ေဇာ်ဂျီြဖင့်​ ​ေရး​သား​ထား​​ေသာ ြမန်မာစာတုိ့​မှာ တ​ေန့​တြခား​ တုိး​ပွား​လာ​ေနရာ ​ေနာင်တချိန်တွင် ၄င်း​တုိ့​သည် ရှာရ၊ ​ေဖွရခက်သည့်​ စာအုပ်ပံုြကီး​နှင့်​ အတူတူပင် ြဖစ်လာ​ေတာ့​မည် ြဖစ်သည်။ (အဆုိ​ေတာ် စုိင်း​စုိင်း​ခမ်း​လှုိင်၏ အ​ေြကာင်း​ကို ​ေရး​သား​သူ တဝက်က စ + - ိ + - ု + င + - ် + - း​ ဟု ​ေရး​ြပီး​ ကျန်တဝက်က စ + - ု + - ိ + င + - ် + -း​ ဟု ​ေရး​ပါက မည်သုိ့​ ြဖစ်မည်ကို မှန်း​ဆြကည့်​ပါ။) သုိ့​ရာတွင် ​ေရှး​ယခင် လက်နှိပ်စက်များ​ကဲ့​သုိ့​ပင် သ​ေဝထုိး​နှင့်​ ရရစ်ကုိ ဗျည်း​မရုိက်ခင် ရိုက်ရြခင်း​၊ ဗျည်း​တွဲများ​ (ရရစ်ဝဆွဲ၊ ယပင့်​ဝဆွဲ စသည်တုိ့​)ကုိ ခလုတ်တစ်ချက်နှိပ်ရံုနှင့်​ ​ေရး​သား​နုိင်ြခင်း​တုိ့​မှာ သံုး​စွဲသူတုိ့​ နှစ်သက်ဖွယ်ြဖစ်သည်။

Windows စနစ်အများ​စုတွင် ​ေဇာ်ဂျီစနစ်ြဖင့်​ ြမန်မာစာ ​ေရး​သား​ရန်အတွက် အခမဲ့​ ရရှိနုိင်​ေသာ Zawgyi installer application ကုိ သွင်း​လုိက်ရန်သာလုိအပ်ြပီး​ ဖတ်ရှုရန်အတွက်မူ သာမာန် စာလံုး​ပံုစံတစ်ခု သွင်း​သကဲ့​သုိ့​ ​ေဇာ်ဂျီ စာလံုး​ပံုစံကုိ သွင်း​လုိက်ရန်သာ လုိအပ်သည်။ ​ေရး​သား​ရန်အတွက် လက်ကွက်မှတပါး​ ​ေလ့​ကျင့်​ရန် မလုိအပ်​ေပ။ အသံုး​ြပုရလွယ်ကူြခင်း​​ေြကာင့်​ ယ​ေန့​တွင် online ​ေပါ်ရှိ ြမန်မာစာအသံုး​ြပုမှု (blog, forum, chat application) အများ​စုသည် ​ေဇာ်ဂျီ ြမန်မာစာ စနစ်ြဖင့်​ ြဖစ်သည်။

Unicode 5.1 အဆင့်​မီ ြမန်မာစာစနစ်များ​

Myanmar 3 အပါအဝင် Unicode 5.1 စနစ်သံုး​ ြမန်မာစာစနစ်များ​သည်လည်း​ အစုိး​ရက ​ေထာက်ခံ​ေနလင့်​ကစား​ အား​နည်း​ချက်များ​ ရှိဆဲပင်ြဖစ်သည်။ ဥပမာအား​ြဖင့်​ ​ေမာက်ချာ (- ါ) နှင့်​ ​ေရး​ချာ (- ာ) တုိ့​မှာ စာလံုး​ ၂ လံုး​ြဖစ်​ေနသည်။ အက္ခရာစဥ်ရာတွင် ၄င်း​တုိ့​ကုိ အတူတူဟု သ​ေဘာထား​ြပီး​ စီရသည်။ (​ေဇာ်ဂျီ၏ ရရစ်ကဲ့​သုိ့​ပင် မလုိအပ်ပဲ code-range ကုိ ြဖုန်း​တီး​သကဲ့​သုိ့​ ြဖစ်​ေနပါသည်။) အသတ် (- ်)နှင့်​ ပံုစံတူ​ေသာ်လည်း​ အသတ်နှင့်​ ဘာမှမဆုိင်​ေသာ ​ေရှ့​ထုိး​ (ဥပမာ ​ေကာ် မှ - ်) မှာ code မရှိပါ။ တနည်း​အား​ြဖင့်​ဆုိ​ေသာ် Unicode 5.1 သည်လည်း​ တုိး​တက်​ေြပာင်း​လဲဦး​မည့်​ အရိပ်အ​ေယာင်များ​ ရှိ​ေနပါသည်။ သုိ့​ရာတွင် ၄င်း​သည် စာရိုက်ရာတွင် သတ်မှတ်ထား​သလုိသာ ရုိက်သွင်း​ရသြဖင့်​ ​ေဇာ်ဂျီကဲ့​သုိ့​ တုိ ၂ မျိုး​ ြဖစ်​ေနစရာ မရှိသြဖင့်​ ​ေဇာ်ဂျီထက် ပုိမုိ တည်ြငိမ်မည်ဟု ​ေမှျာ်လင့်​ရသည်။

ထုိ့​ြပင် Myanmar – 3 ကိုအသံုး​ြပုရန်အတွက် အနည်း​ငယ်ရှုပ်​ေထွး​​ေသာ အဆင့်​များ​ လုိအပ်သည်။ Windows စနစ်တွင် ဖတ်ရှုရန်အတွက်လဲ သီး​သန့်​ software များ​ သွင်း​ရန် လက်ရှိအချိန်တွင် လုိအပ်ဆဲြဖစ်သည်။ ၄င်း​ကုိ အသံုး​ြပု ​ေရး​သား​ရန်အတွက် အချိန်အနည်း​ငယ်ြကာမှျ ​ေလ့​ကျင့်​ရန် လုိအပ်ပါသည်။

ဘာကုိသံုး​ရမလဲ၊ ဘာ​ေြကာင့်​ လူများ​စု မသံုး​​ေသး​တာလဲ။

ယ​ေန့​တွင် အစုိး​ရဝန်ြကီး​ဌာနများ​အား​လံုး​ကို Myanmar-3 ကုိ အသံုး​ြပုရန် ညှွန်ြကား​ထား​ပါသည်။ ထုိ့​​ေြကာင့်​ e-Government စနစ်များ​ကို ​ေနာင်အနာဂါတ်တွင် မိတ်ဆက်ခဲ့​ပါက Myamar – 3 ကုိ နုိင်ငံသား​တုိင်း​ မြဖစ်မ​ေန အသံုး​ြပုရမည်မှာ ​ေသချာသ​ေလာက် ရှိသည်။ ထုိ့​ြပင် Windows စနစ်များ​တွင် Unicode 5.1 ကုိ အ​ေထာက်အပံ့​​ေပး​ပါက ဖတ်ရ​ေရး​ရခက်​ေသာ ြပဿနာမှာ အလုိအ​ေလျာက် ​ေြပလည်သွား​မည်ြဖစ်သည်။ (ယခုအခါ KDE သံုး​ Linux များ​တွင် Myanmar – 3 ကုိ ဒီအတုိင်း​ ဖတ်လုိ့​ရြပီြဖစ်သည်။) ထုိအချိန်တွင် ​ေဇာ်ဂျီသည် Myanmar- 3 ထက်ပုိ၍ ​ေရး​ရ၊ ဖတ်ရလွယ်သည်ဆုိ​ေသာ အား​သာချက် မရှိနုိင်​ေတာ့​​ေပ။

အသံုး​များ​​ေသာ ​ေဇာ်ဂျီမှ Unicode 5.1 သို့​​ေြပာင်း​လဲနုိင်​ေရး​သည် တကယ်တမ်း​အား​ြဖင့်​ ကွန်ပျူတာ သိပ္ပံ ြပဿနာ တစ်ရပ်မဟုတ်ပါ (အကျယ်ကုိ ​ေလာကအလှနှင့်​ အင်တာဗျူး​ ရှု)။ Myanmar – 3 ကုိ ​ေြပာင်း​ရမည်မှာလဲ ​ေသချာ၊ ​ေဇာ်ဂျီကုိလဲ ြကာရှည် အသံုး​ြပုရန်လဲ အဆင်မ​ေြပ၊ တစ်ဦး​ချင်း​ ​ေြပာင်း​ရန်လဲ နည်း​ပညာအရ လွယ်ကူ လှျင်ြမန်ပါလှျက်နှင့်​ ​ေဇာ်ဂျီကုိ လူများ​စု ဖက်တွယ်ထား​ြကြခင်း​မှာ အ​ေြကာင်း​ရင်း​ ၂ ရပ်​ေြကာင့်​ ြဖစ်သည်။ ပထမ အ​ေြကာင်း​ရင်း​မှာ Myanmar – 3 တွင် လက်နှိပ်စက်အတုိင်း​ ရုိက်မရပဲ ​ေလ့​လာသင်ြကား​မှု လုိအပ်​ေသာ​ေြကာင့်​ (​ေဇာ်ဂျီ၏ တခုတည်း​​ေသာ အား​သာချက်) ြဖစ်သည်။ ဒုတိယ အ​ေြကာင်း​ရင်း​မှာ လူများ​စု သံုး​စွဲြခင်း​ မြပု​ေသာ​ေြကာင့်​ အထီး​ကျန်မည်ကုိ စုိး​ရိမ်သည့်​ လူမှု​ေရး​ ြပဿနာြဖစ်ြပီး​ ပုိမုိအ​ေရး​ြကီး​သည်။

နိဂံုး​

ယခုစာတမ်း​ငယ်တွင် 8 bit font၊ Burglish၊ ​ေဇာ်ဂျီနှင့်​ Myanmar – 3 အစရှိ​ေသာ ြမန်မာစာ စနစ်အမျိုး​မျိုး​၏ သ​ေဘာသဘာဝများ​ကို သိနား​လည်မှ Unicode အဆင့်​မီ ြမန်မာစာစနစ်များ​သုိ့​ ​ေြပာင်း​လဲရန် အစီအစဥ်ကုိ ြကံဆနုိင်မည်ြဖစ်သြဖင့်​ ၄င်း​တုိ့​၏ ဂုဏ်သတ္တိများ​ကုိ နည်း​ပညာနှင့်​ လူမှု​ေရး​ (သမိုင်း​​ေြကာင်း​နှင့်​ သံုး​စွဲသူများ​) ရှု​ေထာင့်​များ​မှ တင်ြပထား​သည်။ အဆုိပါ ​ေတွ့​ရှိချက်များ​ကုိ အ​ေြခခံ၍ Unicode အဆင့်​မီ ြမန်မာစာစနစ်များ​သုိ့​ ​ေြပာင်း​လဲနုိင်ရန် အစီအစဥ်ကုိ ဆက်လက်​ေဆွး​​ေနွး​ရန် ကျန်ရှိ​ေနပါ​ေသး​သည်။

​ေလာ ရှည် - က တဲ့​ ပွဲ ( http://opera.lawshay.com/2009/07/blog-post_15.html)

Unicode ြပဿနာ အ​ေြဖရှာ

ယခုအခါ ကွန်ပျူတာကုိ အသံုး​ြပုရာတွင် အဂင်္လိပ်၊ ဂျာမန်၊ ြပင်သစ်စ​ေသာ အ​ေနာက်တုိင်း​ ဘာသာစကား​များ​သာမကပဲ တရုတ်၊ ကုိရီး​ယား​၊ ဂျပန် စ​ေသာ အ​ေရှ့​တုိင်း​ ဘာသာစကား​များ​ြဖင့်​လဲ လွယ်ကူစွာ အသံုး​ြပုနုိင်ြကြပီ ြဖစ်သည်။ ဤကဲ့​သုိ့​ မိခင်ဘာသာစကား​များ​ြဖင့်​ ကွန်ပျူတာကုိ အသံုး​ြပုနုိင်ရြခင်း​မှာ ဘာသာစကား​အများ​အြပား​၏ အက္ခရာများ​ကုိ code-range တစ်ခုအတွင်း​တွင် ​ေနရာချထား​​ေပး​​ေသာ Unicode ​ေခါ် စံနှုန်း​တစ်ရပ်ကုိ အများ​သ​ေဘာတူ သတ်မှတ်နုိင်ခဲ့​​ေသာ​ေြကာင့်​ ြဖစ်သည်။


အဆုိပါ စံနှုန်း​အတွင်း​တွင် ြမန်မာအက္ခရာများ​အတွက် code-range ကုိ သတ်မှတ်နုိင်ခဲ့​​ေသာ်လည်း​ နှစ်​ေပါင်း​များ​စွာြကာသည့်​တုိင်​ေအာင် အ​ေသး​စိတ် အ​ေကာင်အထည်​ေဖာ်မည့်​ ပံုစံကုိ အတည်မြပုနုိင်​ေသး​ပဲ ရှိခဲ့​သည်။ ထုိကာလ အ​ေတာအတွင်း​တွင် ကွန်ပျူတာတွင် ြမန်မာစာအသံုး​ြပုမှုကုိ ကျယ်ြပန့်​လာ​ေစရန် ရည်သန်လှျက် ြမန်မာအက္ခရာများ​အတွက် သတ်မှတ်​ေပး​ထား​​ေသာ code-range ကုိ​ေကျာ်လွန်ြပီး​ အြခား​ဘာသာစကား​များ​၏ code-range အတွင်း​မှ code အချို့​​ေပါင်း​စပ်လှျက် ပညာရှင်အချို့​က ​ေဇာ်ဂျီ ြမန်မာစာ စနစ်ကုိ ဖန်တီး​ခဲ့​ြကသည်။ ယခုအခါ ြမန်မာစာ Unicode စနစ်သည် တည်ြငိမ်စ ြပုလာြပီြဖစ်ြပီး​ ​ေဇာ်ဂျီ ြမန်မာစာ စနစ်မှာ အြခား​ဘာသာစကား​များ​နှင့်​ ယှဥ်တွဲ သံုး​စွဲနုိင်သည့်​ Unicode အစစ်မဟုတ်​ေသာ်လည်း​ အများ​သံုး​ (de facto) စံနှုန်း​တစ်ရပ် အြဖစ် ရပ်တည်လှျက်ရှိသည်။ ဤစာတမ်း​ငယ်တွင် ​ေဇာ်ဂျီစနစ်မှ Unicode စနစ်သုိ့​ အဆင်​ေြပ​ေြပ ​ေြပာင်း​လဲနုိင်မည့်​ နည်း​လမ်း​များ​ကုိ သုတသိပ္ပံ (Information Systems) ​ေလ့​လာသူတစ်ဦး​၏အြမင်မှ ​ေဆွး​​ေနွး​တင်ြပမည် ြဖစ်သည်။




[caption id="attachment_105" align="aligncenter" width="174" caption="Unicode Chart for Myanmar ---- Unicode Consortium. Modified to show a purpose."]Unicode Chart for Myanmar ---- Unicode Consortium. Modified to show a purpose.[/caption]




နိဒါန်း​


နုိင်ငံတကာသံုး​ စံနှုန်း​ြဖစ်သည့်​ Unicode စံနှုန်း​တွင် ြမန်မာအက္ခရာများ​၏ ​ေနရာ (ခွင်) ကို အတိအကျ သတ်မှတ်နုိင်ခဲ့​ြပီး​ ြဖစ်​ေသာ်လည်း​ စာလံုး​များ​၏ ​ေနရာနှင့်​ ဘာသာစကား​၏ ရှုပ်​ေထွး​မှု ြပဿနာများ​ကို ​ေြဖရှင်း​နုိင်ရန် စံသတ်မှတ်ချက် အတိအကျ မရှိသည်မှာ အ​ေတာ်ပင် ြကာြမင့်​ခဲ့​သည်။ ဥပမာအား​ြဖင့်​ ြပ နှင့်​ ြက တွင် သံုး​ထား​​ေသာ ရရစ်မှာ အတူတူပင်ြဖစ်​ေသာ်လည်း​ ၄င်း​တုိ့​ကုိ ပံု​ေဖာ်ရန်အတွက် software support (rendering support) လုိ​ေန​ေလသည်။ ၄င်း​ကုိ အလွယ်နည်း​နှင့်​ ​ေြဖရှင်း​ရန်မှာ code-range ကို ချဲ့​ပစ်ရန်ြဖစ်ရာ (ရရစ် ၂ ခုသံုး​မယ်၊ code ၂ ခု​ေပး​ ဆုိတာမျိုး​) ပညာရှင်အချို့​က စံနှုန်း​မတည်ြငိမ်မီ ကာလအတွင်း​ ​ေဆး​ြမီး​တုိအြဖစ် အြခား​ဘာသာစကား​များ​၏ code များ​ကုိ ​ေချး​ငှား​သံုး​စွဲကာ ​ေဇာ်ဂျီစာလံုး​စနစ်ကုိ ဖန်တီး​ခဲ့​ြကသည်။



​ေဇာ်ဂျီရဲ့​ ြပဿနာ


၄င်း​သည် ြပဿနာ ၂ ရပ်ကုိ ဖိတ်​ေခါ်လာသည်။ ​ေဇာ်ဂျီသည် အဂင်္လိပ် အက္ခရာများ​၏ code ကုိ မထိသြဖင့်​ အဂင်္လိပ်/ြမန်မာ တွဲဖက်​ေရး​သား​ရာတွင် အဆင်​ေြပ​ေသာ်လည်း​ ၄င်း​​ေချး​ငှား​ထား​​ေသာ ဘာသာစကား​များ​နှင့်​ ြမန်မာစာကုိ တွဲဖက်​ေရး​သား​ပါက ကွန်ပျူတာအ​ေနနှင့်​ ​ေချး​သံုး​ထား​​ေသာ code များ​ကုိ မည်သည့်​ အက္ခရာ (ြမန်မာ အက္ခရာ သို့​မဟုတ် အြခား​ အက္ခရာ) အြဖစ် ​ေဖာ်ြပ​ေပး​ရမည်ကုိ မသိနုိင်ပဲ ြဖစ်လိမ့်​မည်။ (ဥပမာ 1E29 သည် 'ḩ' လား​၊ Latin Small Letter H with Cedilla လား​ မသိနုိင်​ေတာ့​​ေပ။) ​ေနာက်ြပဿနာတစ်ရပ်မှာ တူညီ​ေသာ စာလံုး​များ​ ကုိ code အများ​အြပား​သုိ့​ assign လုပ်ထား​သြဖင့်​ sorting စီရာ (နှင့်​ searching ရှာရာ) တွင် မလုိလား​အပ်​ေသာ ရှုပ်​ေထွး​မှုများ​ကုိ ြဖစ်​ေပါ်​ေစပါသည်။ ဥပမာအား​ြဖင့်​ ရရစ်သည် ြပ ဟု​ေရး​ရာတွင် တမျိုး​၊ ြက ဟု​ေရး​ရာတွင် တမျိုး​၊ လံုး​ြကီး​တင်နှင့်​ တွဲရန်တမျိုး​ (ြပိ၊ ြကိ) စသြဖင့်​ အမျိုး​မျိုး​ ရိုက်​ေနရသည်။ အမှန်မှာ အက္ခရာ စဥ်ရာတွင် ြကသည် ြပအ​ေရှ့​ (ြကိသည် ြပိအ​ေရှ့​) ဟူ၍ ရရစ် ၂ မျိုး​ကုိ အတူတူ သ​ေဘာထား​ြပီး​ စီရရာ အက္ခရာစီရာတွင် အချိန် ပုိမုိ ြကာြမင့်​​ေစပါသည်။


​ေဇာ်ဂျီ၏ အဓိက အား​နည်း​ချက် တစ်ရပ်မှာ စာလံုး​များ​၏ စံပံုစံ မရှိြခင်း​ပင် ြဖစ်သည်။ တ + - ိ + - ု (တုိ) နှင့်​ တ + - ု + - ိ (တုိ) တုိ့​မှာ ​ေဇာ်ဂျီတွင် မတူညီြက​ေပ။ တူညီ​ေသာစာလံုး​များ​ကုိ ရုိက်ထည့်​​ေသာ အစီအစဥ် မတူညီြခင်း​​ေြကာင့်​ ကွန်ပျူတာက မတူညီဟု အ​ေြဖထုတ်​ေပး​ြခင်း​မှာ လက်ခံနုိင်ဖွယ် အရည်အ​ေသွး​တစ်ရပ် မဟုတ်​ေပ။ အသံုး​ြပုရလွယ်ကူြခင်း​​ေြကာင့်​ ယ​ေန့​တွင် online ​ေပါ်ရှိ ြမန်မာစာအသံုး​ြပုမှု (blog, forum, chat application) အများ​စုသည် ​ေဇာ်ဂျီ ြမန်မာစာ စနစ်ြဖင့်​ ြဖစ်သည်။ (ြမန်မာစာ ​ေရး​သား​ရန်အတွက် Zawgyi installer application ကုိ install လုပ်ြခင်း​ြဖင့်​ Windows စနစ်အများ​စုတွင် ​ေဇာ်ဂျီ ြမန်မာစာ စနစ်ကုိ ချက်ချင်း​ အသံုး​ြပုနုိင်ြပီး​ ဖတ်ရှုရန်အတွက်မူ သာမာန် font တစ်ခု သွင်း​သကဲ့​သုိ့​ သွင်း​လုိက်ရန်သာ လုိအပ်သည်။ ​ေရး​သား​ရန်အတွက် ​ေလ့​ကျင့်​ရန် မလုိအပ်​ေပ။)



Myanmar - 3 ရဲ့​ ြပဿနာ


Myanmar - 3 အပါအဝင် Unicode 5.1 စနစ်သံုး​ ြမန်မာစာစနစ်များ​သည်လည်း​ အစုိး​ရက ​ေထာက်ခံ​ေနလင့်​ကစား​ အား​နည်း​ချက်များ​ ရှိဆဲပင်ြဖစ်သည်။ ဥပမာအား​ြဖင့်​ ​ေမာက်ချာ (- ါ) နှင့်​ ​ေရး​ချာ (- ာ) တုိ့​မှာ စာလံုး​ ၂ လံုး​ြဖစ်​ေနသည်။ အက္ခရာစဥ်ရာတွင် ၄င်း​တုိ့​ကုိ အတူတူဟု သ​ေဘာထား​ြပီး​ စီရသည်။ (​ေဇာ်ဂျီ၏ ရရစ်ကဲ့​သုိ့​ပင် မလုိအပ်ပဲ code-range ကုိ ြဖုန်း​တီး​သကဲ့​သုိ့​ ြဖစ်​ေနပါသည်။) အသတ် (- ်)နှင့်​ ပံုစံတူ​ေသာ်လည်း​ အသတ်နှင့်​ ဘာမှမဆုိင်​ေသာ ​ေရှ့​ထုိး​ (ဥပမာ ​ေကာ် မှ - ်) မှာ code မရှိပါ။ တနည်း​အား​ြဖင့်​ဆုိ​ေသာ် Unicode 5.1 သည်လည်း​ တုိး​တက်​ေြပာင်း​လဲဦး​မည့်​ အရိပ်အ​ေယာင်များ​ ရှိ​ေနပါသည်။ သုိ့​ရာတွင် ၄င်း​သည် စာရိုက်ရာတွင် သတ်မှတ်ထား​သလုိသာ ရုိက်သွင်း​ရသြဖင့်​ ​ေဇာ်ဂျီကဲ့​သုိ့​ တုိ ၂ မျိုး​ ြဖစ်​ေနစရာ မရှိသြဖင့်​ ​ေဇာ်ဂျီထက် ပုိမုိ တည်ြငိမ်မည်ဟု ​ေမှျာ်လင့်​ရသည်။


ယ​ေန့​တွင် အစုိး​ရဝန်ြကီး​ဌာနများ​အား​လံုး​ကို Myanmar-3 အသံုး​ြပုရန် ညှွန်ြကား​ထား​ပါသည်။ ၄င်း​ကိုအသံုး​ြပုရန်အတွက် အနည်း​ငယ်ရှုပ်​ေထွး​​ေသာ အဆင့်​များ​ လုိအပ်သည်။ Windows စနစ်တွင် ဖတ်ရှုရန်အတွက်လဲ သီး​သန့်​ software များ​ သွင်း​ရန် လက်ရှိအချိန်တွင် လုိအပ်ဆဲြဖစ်သည်။ ၄င်း​ကုိ အသံုး​ြပု ​ေရး​သား​ရန်အတွက် အချိန်အနည်း​ငယ်ြကာမှျ ​ေလ့​ကျင့်​ရန် လုိအပ်ပါသည်။



Unicode ြပဿနာဆုိတာ ဘာလဲ။


​ေဇာ်ဂျီြဖင့်​ ​ေရး​သား​ထား​​ေသာ စာများ​သည် စီ၍၊ ရှာ၍ ခက်ခဲလှသည်။ ဥပမာအား​ြဖင့်​ တ + - ိ + - ု (တုိ) နှင့်​ တ + - ု + - ိ (တုိ) တုိ့​သည် မတူညီြကပါ။ ပထမ တုိ ကုိ ရှာ​ေဖွရန် ြကိုး​စား​ရာတွင် ဒုတိယ တုိ ကုိ ထည့်​သွင်း​ ရှာ​ေဖွခုိင်း​ပါက ရှာ​ေတွ့​မည် မဟုတ်ပါ​ေချ။ ​ေဇာ်ဂျီြဖင့်​ ​ေရး​သား​ထား​​ေသာ ြမန်မာစာတုိ့​မှာ တ​ေန့​တြခား​ တုိး​ပွား​လာ​ေနရာ ​ေနာင်တချိန်တွင် ၄င်း​တုိ့​သည် ရှာရ၊ ​ေဖွရခက်သည့်​ စာအုပ်ပံုြကီး​နှင့်​ အတူတူပင် ြဖစ်လာ​ေတာ့​မည် ြဖစ်သည်။ (အဆုိ​ေတာ် စုိင်း​စုိင်း​ခမ်း​လှုိင်၏ အ​ေြကာင်း​ကို ​ေရး​သား​သူ တဝက်က စ + - ိ + - ု + င + - ် ဟု ​ေရး​ြပီး​ ကျန်တဝက်က စ + - ု + - ိ + င + - ် ဟု ​ေရး​ပါက မည်သုိ့​ ြဖစ်မည်ကို မှန်း​ဆြကည့်​ပါ။)


အြခား​တစ်ဖက်တွင် အစုိး​ရ ဝန်ြကီး​ဌာနများ​သည် အသံုး​ြပုသူ အများ​စု (သ​ေဝထုိး​ ြပဿနာ​ေြကာင့်​) ဖတ်မရ​ေသာ Myanmar – 3 စနစ်ကုိ အသံုး​ြပုလှျက် ရှိြကသည်။ ၄င်း​ဌာနများ​က e-Government စနစ်များ​ကို ​ေနာင်အနာဂါတ်တွင် မိတ်ဆက်ခဲ့​ပါက Myamar – 3 ကုိ နုိင်ငံသား​တုိင်း​ မြဖစ်မ​ေန အသံုး​ြပုရမည်မှာ ​ေသချာသ​ေလာက် ရှိသည်။ ထုိ့​ြပင် Windows စနစ်များ​တွင် Unicode 5.1 ကုိ အ​ေထာက်အပံ့​​ေပး​ပါက ဖတ်မရ​ေသာ ြပဿနာမှာ အလုိအ​ေလျာက် ​ေြပလည်သွား​မည်ြဖစ်သည်။ (ယခုအခါ KDE သံုး​ Linux များ​တွင် Myanmar – 3 ကုိ ဒီအတုိင်း​ ဖတ်လုိ့​ရြပီြဖစ်သည်။) ​ေြပာချင်သည်မှာ Myanmar – 3 ကုိ အ​ေနှး​နှင့်​ အြမန် ​ေြပာင်း​ကုိ ​ေြပာင်း​ရမည် ြဖစ်သည်။


Unicode ြပဿနာသည် တကယ်တမ်း​အား​ြဖင့်​ ကွန်ပျူတာ သိပ္ပံ ြပဿနာ တစ်ရပ်မဟုတ်ပါ (အကျယ်ကုိ ​ေလာကအလှနှင့်​ အင်တာဗျူး​ ရှု)။ Myanmar – 3 ကုိ ​ေြပာင်း​ရမည်မှာလဲ ​ေသချာ၊ ​ေဇာ်ဂျီကုိလဲ ြကာရှည် အသံုး​ြပုရန်လဲ အဆင်မ​ေြပ၊ တစ်ဦး​ချင်း​ ​ေြပာင်း​ရန်လဲ နည်း​ပညာအရ လွယ်ကူ လှျင်ြမန်ပါလှျက်နှင့်​ ​ေဇာ်ဂျီကုိ လူများ​စု ဖက်တွယ်ထား​ြကြခင်း​မှာ လူမှု​ေရး​ ြပဿနာ ြဖစ်သည်။



ြမန်မာစာ အသံုး​ြပုြကသူများ​


ြမန်မာစာ အသံုး​ြပုြကသူများ​နှင့်​ အသံုး​ြပုရြခင်း​ ရည်ရွယ်ချက်ကို နား​လည်မှသာလှျင် ၄င်း​တုိ့​ကုိ ​ေြပာင်း​လဲရန်အတွက် ဓာတ်ကူပစ္စည်း​ (Agent of Change) ထည့်​သွင်း​​ေပး​လုိ့​ ရ​ေပမည်။ ြမန်မာစာ အသံုး​ြပုြကသူများ​နှင့်​ ၄င်း​တုိ့​၏ ရည်ရွယ်ချက်များ​မှာ ​ေအာက်ပါအတုိင်း​ြဖစ်သည်။


* စာစီစာရုိက်ဆုိင်များ​ - ရည်ရွယ်ချက် - ြမန်မာစာကို ​ေရး​သား​ြပီး​ ပံုနှိပ်ထုတ်​ေပး​ရန်


* အစုိး​ရ ဌာနများ​ - ဌာနတွင်း​ စာ​ေရး​သား​ရန်၊ ​ေရး​သား​သမှျကို အထက်က ညှွန်ြကား​သည့်​ ပံုစံအတုိင်း​ ကွန်ပျူတာအတွင်း​ သိမ်း​ဆည်း​ရန်၊ e-Government စနစ်များ​ြဖင့်​ အလုပ်လုပ်ကုိင်ရန်


* Chatter များ​ - မိမိ ​ေရး​သား​လုိက်သည့်​ စာအတုိင်း​ တဖက်က ြမင်ရ​ေစရန် (တဖက်က ​ေရး​သား​လုိက်သည့်​အတုိင်း​ မိမိြမင်ရ​ေစရန်)


* Forum များ​ - အဖွဲ့​ဝင်အား​လံုး​ အဆင်​ေြပ​ေြပြဖင့်​ ​ေရး​နုိင်ဖတ်နုိင်ရန်။


* Blogger များ​ - visitor အား​လံုး​ အဆင်​ေြပ​ေြပြဖင့်​ ဖတ်နုိင်ရန် (မှတ်ချက် ြပန်​ေရး​နုိင်ရန်)။


ဆုိြပီး​ အြကမ်း​ဖျင်း​​ေတွ့​ရှိရပါတယ်။ ပထမဆံုး​ အမျိုး​အစား​က​ေတာ့​ ရှင်း​ပါတယ်။ ဘာစနစ်ပဲ သံုး​သံုး​ စက္ကူ​ေပါ်ကုိ စာလံုး​ထင်​ေအာင် ပံုနှိပ်နုိင်ရင် ြပီး​တာပါပဲ။ သူတုိ့​ဟာ အချက်အလက်​ေတွကို သိမ်း​ဆည်း​မှာလဲ မဟုတ်​ေတာ့​ Unicode ြပဿနာမှာ ြကီး​မား​တဲ့​ အခန်း​က မပါဝင်ပါဘူး​။ ဒုတိယ အမျိုး​အစား​က​ေတာ့​ အစကတည်း​က Myanmar – 3 ကုိ ​ေြပာင်း​လဲ သံုး​စွဲြပီး​ ြဖစ်တဲ့​အတွက် ထည့်​သွင်း​စဥ်း​စား​ရန် မလုိပါဘူး​။


​ေနာက်ဆံုး​ အမျိုး​အစား​ ၃ မျိုး​ရဲ့​ ရည်ရွယ်ချက်​ေတွက​ေတာ့​ ခပ်ဆင်ဆင် တူညီပါတယ်။ မိမိ ​ေပး​ချင်တဲ့​ သတင်း​စကား​ကုိ လက်ခံသူက အထူး​အ​ေထွ အား​မစုိက်ရပဲ ြမန်မာလုိ ြမင်ရ​ေစဖုိ့​ ြဖစ်ပါတယ်။ (Forum ​ေတွက​ေတာ့​ searching/sorting ကုိ လုိချင်ြကမှာ​ေပါ့​။) သူတုိ့​ရဲ့​ အဓိက ရည်ရွယ်ချက်က Myanmar – 3 ကုိ မ​ေြပာင်း​ြကြခင်း​ရဲ့​ အ​ေြဖပါပဲ။ Myanmar – 3 ကုိ​ေြပာင်း​လုိက်ရင် သူတုိ့​​ေပး​ချင်တဲ့​ သတင်း​စကား​ (စာသား​) ကုိ စာဖတ်သူအများ​စု မြမင်နုိင်ြကမှာကုိ စုိး​​ေြကာက်တာ ြဖစ်ပါတယ်။ ​ေနာက်တမျိုး​​ေြပာရရင် အကျဥ်း​သား​ရဲ့​ ဒွိဟ (Prisoner's dilemma) ြဖစ်ပါတယ်။ (ငါတစ်​ေယာက်တည်း​ ချွန်ထွက်ြပီး​ ​ေြပာင်း​မိမှြဖင့်​ ငါ​ေတာ့​ ဒုက္ခ​ေရာက်ရ​ေချရဲ့​ ြဖစ်​ေနတာပါ။ အဲဒါနဲ့​ပဲ အြပန်အလှန်​ေစာင့်​ရင်း​ lock ြဖစ်​ေနပါတယ်။)



ဘယ်လုိ​ေြပာင်း​ြကမလဲ


လက်ရှိ ​ေဇာ်ဂျီက​ေန Myanmar – 3 ကုိ ​ေြပာင်း​လဲဖုိ့​ စည်း​ရံုး​​ေနြကတဲ့​သူအများ​စုက ဒီလုိ lock ြဖစ်​ေနတဲ့​ အ​ေြခအ​ေနက​ေန ရုန်း​ထွက်နုိင်ဖုိ့​အတွက် ဘာမှ မကူညီြကပါဘူး​။ အဲဒီအစား​ ​ေဇာ်ဂျီသံုး​ရင် ​ေနာင်တချိန်မှာ အကုန်လံုး​ ပျက်သွား​မယ် (​ေရး​ထား​တာ​ေလး​က Sci-Fi ဇာတ်လမ်း​ကျ​ေနတာပဲ) ဆုိြပီး​ ြခိမ်း​​ေချာက်လုိက်၊ ​ေဇာ်ဂျီဟာ Unicode အစစ်မဟုတ်ဘူး​ ထ​ေြပာလုိက်နဲ့​ပဲ တ​ေယာက်ချင်း​ကုိ ​ေြပာင်း​ဖုိ့​ တုိက်တွန်း​​ေနြကပါတယ်။ ​ေဇာ်ဂျီအသံုး​ြပုသူများ​အ​ေနနဲ့​ လာဖတ်တဲ့​သူ​ေတွ ဘာမှလုပ်စရာမလုိပဲ Myanmar – 3 နဲ့​ ​ေရး​ထား​တဲ့​ ြမန်မာစာ ြမင်ရ​ေစမယ်လုိ့​ အာမမခံမချင်း​ ​ေြပာင်း​လဲမှာ မဟုတ်ပါဘူး​။ ဒီလုိအာမခံတာ​ေတာင် ဒီတုိင်း​လဲ ြမင်​ေနရတာပဲဆုိြပီး​ ​ေြပာင်း​ဦး​မှာ မဟုတ်လုိ့​ အ​ေြပာင်း​အလဲအတွက် ဆုလာဘ်​ေပး​ဖုိ့​ (မက်လံုး​​ေပး​ဖုိ့​) လုိပါတယ်။


စာ​ေရး​သူရဲ့​ အဆုိြပုချက်က ဒီလုိပါ။ Myanmar – 3 ကုိ အြပည့်​အဝ အ​ေထာက်အပံ့​​ေပး​တဲ့​ Major Operating Systems (Windows) ထွက်လာတဲ့​အထိ ​ေစာင့်​ပါ။ အဲဒါ ထွက်လာခဲ့​ရင် ကနဦး​ ​ေြပာင်း​လဲမဲ့​ Forum/Blog အ​ေရအတွက်ကုိ သတ်မှတ်ပါ။ (ရှိသမှျ Forum/Blog အား​လံုး​ရဲ့​ ၆ဝ% အနည်း​ဆံုး​ ရှိသင့်​ပါသည်။ ​ေြပာင်း​လဲဖုိ့​ commitment ​ေပး​တဲ့​ Forum Admin/Blogger ကုိ ​ေြပာင်း​လဲဖုိ့​အတွက် နည်း​ပညာ အ​ေထာက်အကူ ​ေပး​ပါ။) သတ်မှတ်ထား​တဲ့​ အ​ေရအတွက် မြပည့်​မီ မည်သူမှျ စတင် မ​ေြပာင်း​လဲရပါ။ commitment ​ေပး​ထား​တဲ့​ Forum/Blog ဘယ်နှခုရှိြပီဆုိတာကုိ သတင်း​မှန်မှန် ထုတ်ြပန်ပါ။ သတ်မှတ်ထား​တဲ့​ အ​ေရအတွက် ြပည့်​သွား​ရင် ​ေြပာင်း​လဲဖုိ့​ ရက်သတ်မှတ်ြပီး​ တြပိုင်နက် ​ေြပာင်း​လဲခုိင်း​ပါ။ (Database Literature မှ 2-phase commit နှင့်​ ဆင်ဆင်တူပါသည်။)


တနည်း​အား​ြဖင့်​ ​ေြပာရလှျင် ရှိသမှျ Forum/Blog အား​လံုး​ရဲ့​ ရာနှုန်း​တစ်ခု (၆ဝ%) ​ေြပာင်း​ြကမယ်ဆုိရင် သင်လိုက်​ေြပာင်း​မှာလား​လုိ့​ ​ေမး​လိုက်တာနဲ့​ တူတူပါပဲ။ ​ေြပာင်း​မယ်လုိ့​ ​ေြဖတဲ့​သူ အဲဒီ ရာနှုန်း​ ြပည့်​သွား​ရင် ြပည့်​သွား​ြပီ၊ ​ေြပာင်း​ြက​ေတာ့​လုိ့​ ​ေြပာလုိက်တာ ြဖစ်ပါတယ်။ ကုိယ်တ​ေယာက်တည်း​ ချွန်ထွက်မ​ေနဘူး​လုိ့​ အာမခံချက်ရတဲ့​အတွက် ​ေဇာ်ဂျီအသံုး​ြပုသူဟာ စိတ်လံုြခံုမှု ရရှိမှာ ြဖစ်ပါတယ်။ ပုိြပီး​​ေကာင်း​တဲ့​ ရလဒ်ရ​ေအာင်လုိ့​ ဒီ​ေြပာင်း​လဲမှုကို ​ေဇာ်ဂျီကုိ ဖန်တီး​တဲ့​ အဖွဲ့​အစည်း​က ဦး​​ေဆာင်ရင် ပို​ေကာင်း​ပါတယ်။ Commitment ​ေပး​တဲ့​လူ​ေတွ များ​လာ​ေအာင်လုိ့​ Myanmar – 3 က ​ေဇာ်ဂျီထက် သာတဲ့​အချက်​ေတွ (စီတာ၊ ရှာတာ လုပ်နုိင်တာ၊ ဘာသာစကား​အများ​အြပား​နဲ့​ တွဲသံုး​နုိင်တာ၊ Unicode စစ်တာ) ​ေတွနဲ့​ marketing လုပ်ဖုိ့​ လုိပါမယ်။



နိဂံုး​


ဤစာတမ်း​ငယ်တွင် ြမန်မာစာစနစ်များ​အ​ေြကာင်း​ မိတ်ဆက်တင်ြပြပီး​ အများ​သံုး​ ​ေဇာ်ဂျီစနစ်မှ Unicode စံနှုန်း​မီ Myanmar - 3 ြမန်မာစာစနစ်သုိ့​ ​ေြပာင်း​လဲရန်လုိအပ်​ေြကာင်း​၊ ထုိသုိ့​​ေြပာင်း​လဲြခင်း​ကုိ အဟန့်​အတား​ြဖစ်​ေနသည်မှာ နည်း​ပညာ ြပဿနာထက် လူမှု​ေရး​ြပဿနာသာ ြဖစ်​ေြကာင်း​ ​ေဖာ်ြပြပီး​ ၄င်း​လူမှု​ေရး​ ြပဿနာကုိ ​ေြဖရှင်း​ရန် နည်း​လမ်း​တစ်ခုကိုလဲ အချက်အလက်အ​ေြခ ဘာသာရပ်မှ ငှား​ယူ ​ေဖာ်ြပခဲ့​သည်။ ၄င်း​ နည်း​လမ်း​၏ ထိ​ေရာက်နုိင်စွမ်း​နှင့်​ အြခား​ နည်း​လမ်း​ကွဲများ​ကုိ အနာဂါတ်တွင် ​ေလ့​လာရန် ကျန်ရှိ​ေနဆဲ ြဖစ်သည်။



စာြကွင်း​ ...


ြမန်မာစာ ​ေကာင်း​စွာ မရိုက်တတ်သူ Chat application အသံုး​ြပုသူအချို့​လဲ ရှိ​ေနဆဲပင် ြဖစ်သည်။ ၄င်း​တုိ့​သည် ​ေြပာလုိ​ေသာ အ​ေြကာင်း​အရာကုိ အသံဖလှယ်၍ အဂင်္လိပ် အက္ခရာများ​ြဖင့်​ ​ေရး​သား​သံုး​စွဲြကသည်။ (ဥပမာအား​ြဖင့်​ Sar Pee P Lar ? = စား​ြပီး​ြပီလား​ ြဖစ်သည်။) ၄င်း​တုိ့​အတွက် အလုိအ​ေလျာက် ဘာသာြပန်​ေပး​သည့်​ စနစ်အမျိုး​မျိုး​ ​ေပါ်ထွက်ခဲ့​ရာ ဝိဇ္ဇာစနစ်မှာ ထင်ရှား​​ေသာ ဥပမာ တစ်ခုြဖစ်သည်။
​ေလာ ရှည် - က တဲ့​ ပွဲ ( http://opera.lawshay.com/2009/07/unicode.html )


content top