Zawgyi Normalization နဲ့ syllable breaking ကို ဒီနေ့တော့ RC version လေးပြီးသွားတယ်။ အံဩဖွယ်ရာကောင်းတာက ကျွန်တော် အများကြီးရေးထားတဲ့ pattern တွေကို ၁၀ ကြောင်းတည်းနဲ့ ရေးလို့ရသွားတာပဲ။ ကိုယ့်အချိန်တွေတောင် ကိုယ်နှမြောတယ်။ အတွေ့အကြုံဆိုတာက လက်တွေ့ကနေ ရယူရတာပဲ။ အတွေ့အကြုံရှိမှပဲ လုပ်ရ ကိုက်ရတာ မြန်မှာ။ အခု စုစုပေါင်း pattern 51 ခုနဲ့ ပြီးသွားတယ်။ အမှန်တိုင်းဆိုရင်

ပိသာ = ပိဿာ
ပြသနာ = ပြဿနာ
ရေ=ရေ
ရာ=ရာ
ရွ=ရွ

စတာတွေ ထပ်ဖြည့်ထားတာကြောင့်လည်း ပါတယ်။ အမှန်တိုင်းဆို normalization က တော်တော်အရေးပါတယ်။ အစက ကိုညီလင်းဆက် ပြောတုန်းက အမှုမဲ့အမှတ်မဲ့ပဲလေ။ syllable breaking အကြောင်း ကိုရဲမြတ်သူပြောတုန်းက ဘယ်နေရာမှာသုံးမလဲ သေချာမပြောတတ်ဘူး။ နောက်တော့ ornagai ကိုလုပ်မှပဲ normalization , syllable breaking တွေ အရေးပါတာကို သိတော့တယ်။ ကိုရဲမြတ်သူနဲ့ ကိုညီလင်းဆက် ပြောဘူးတာတွေက တော်တော်လေးကို အထောက်အကူဖြစ်သွားတယ်။ ကိုညီလင်းဆက်ရဲ့ data တွေက အထောက်အကူပေးတယ်။ ယခုလက်ရှိ ရေးထားတာကတော့ ကိုစိုးမင်း python နဲ့ရေးထားတာလောက် မြန်မှာတော့ မဟုတ်လောက်ဘူး။ သူ့မြန်နှုန်းက ကြောက်စရာကြီး :D ။ 60 MB/s ဆိုလား မသိဘူး။ online မှာကတော့ loading ကြောင့်လား connection ကြောင့်လားတော့ မသိဘူး နည်းနည်းနှေးတယ်။ အခု RC version မှာ ပြဿနာမရှိရင် opensource နဲ့ opentech ချတော့မှာ ဖြစ်လို့ ဝိုင်းစစ်ပေးစေချင်ပါတယ် :) Syllable Breaking ကို http://myanmarwords.pikay.org/ ကနေ စစ်ဆေးခဲ့ပါတယ်။ :)

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.