Zawgyi Normalization နဲ့ syllable breaking ကို ဒီနေ့တော့ RC version လေးပြီးသွားတယ်။ အံဩဖွယ်ရာကောင်းတာက ကျွန်တော် အများကြီးရေးထားတဲ့ pattern တွေကို ၁၀ ကြောင်းတည်းနဲ့ ရေးလို့ရသွားတာပဲ။ ကိုယ့်အချိန်တွေတောင် ကိုယ်နှမြောတယ်။ အတွေ့အကြုံဆိုတာက လက်တွေ့ကနေ ရယူရတာပဲ။ အတွေ့အကြုံရှိမှပဲ လုပ်ရ ကိုက်ရတာ မြန်မှာ။ အခု စုစုပေါင်း pattern 51 ခုနဲ့ ပြီးသွားတယ်။ အမှန်တိုင်းဆိုရင်
ပိသာ = ပိဿာ
ပြသနာ = ပြဿနာ
ရေ=ရေ
ရာ=ရာ
ရွ=ရွ
စတာတွေ ထပ်ဖြည့်ထားတာကြောင့်လည်း ပါတယ်။ အမှန်တိုင်းဆို normalization က တော်တော်အရေးပါတယ်။ အစက ကိုညီလင်းဆက် ပြောတုန်းက အမှုမဲ့အမှတ်မဲ့ပဲလေ။ syllable breaking အကြောင်း ကိုရဲမြတ်သူပြောတုန်းက ဘယ်နေရာမှာသုံးမလဲ သေချာမပြောတတ်ဘူး။ နောက်တော့ ornagai ကိုလုပ်မှပဲ normalization , syllable breaking တွေ အရေးပါတာကို သိတော့တယ်။ ကိုရဲမြတ်သူနဲ့ ကိုညီလင်းဆက် ပြောဘူးတာတွေက တော်တော်လေးကို အထောက်အကူဖြစ်သွားတယ်။ ကိုညီလင်းဆက်ရဲ့ data တွေက အထောက်အကူပေးတယ်။ ယခုလက်ရှိ ရေးထားတာကတော့ ကိုစိုးမင်း python နဲ့ရေးထားတာလောက် မြန်မှာတော့ မဟုတ်လောက်ဘူး။ သူ့မြန်နှုန်းက ကြောက်စရာကြီး :D ။ 60 MB/s ဆိုလား မသိဘူး။ online မှာကတော့ loading ကြောင့်လား connection ကြောင့်လားတော့ မသိဘူး နည်းနည်းနှေးတယ်။ အခု RC version မှာ ပြဿနာမရှိရင် opensource နဲ့ opentech ချတော့မှာ ဖြစ်လို့ ဝိုင်းစစ်ပေးစေချင်ပါတယ် :) Syllable Breaking ကို http://myanmarwords.pikay.org/ ကနေ စစ်ဆေးခဲ့ပါတယ်။ :)
Leave a Reply