Zawgyi Nor & SyB

Zawgyi Normalization နဲ့ syllable breaking ကို ဒီနေ့တော့ RC version လေးပြီးသွားတယ်။ အံဩဖွယ်ရာကောင်းတာက ကျွန်တော် အများကြီးရေးထားတဲ့ pattern တွေကို ၁၀ ကြောင်းတည်းနဲ့ ရေးလို့ရသွားတာပဲ။ ကိုယ့်အချိန်တွေတောင် ကိုယ်နှမြောတယ်။ အတွေ့အကြုံဆိုတာက လက်တွေ့ကနေ ရယူရတာပဲ။ အတွေ့အကြုံရှိမှပဲ လုပ်ရ ကိုက်ရတာ မြန်မှာ။ အခု စုစုပေါင်း pattern 51 ခုနဲ့ ပြီးသွားတယ်။ အမှန်တိုင်းဆိုရင်

ပိသာ = ပိဿာ
ပြသနာ = ပြဿနာ
ရေ=ရေ
ရာ=ရာ
ရွ=ရွ

စတာတွေ ထပ်ဖြည့်ထားတာကြောင့်လည်း ပါတယ်။ အမှန်တိုင်းဆို normalization က တော်တော်အရေးပါတယ်။ အစက ကိုညီလင်းဆက် ပြောတုန်းက အမှုမဲ့အမှတ်မဲ့ပဲလေ။ syllable breaking အကြောင်း ကိုရဲမြတ်သူပြောတုန်းက ဘယ်နေရာမှာသုံးမလဲ သေချာမပြောတတ်ဘူး။ နောက်တော့ ornagai ကိုလုပ်မှပဲ normalization , syllable breaking တွေ အရေးပါတာကို သိတော့တယ်။ ကိုရဲမြတ်သူနဲ့ ကိုညီလင်းဆက် ပြောဘူးတာတွေက တော်တော်လေးကို အထောက်အကူဖြစ်သွားတယ်။ ကိုညီလင်းဆက်ရဲ့ data တွေက အထောက်အကူပေးတယ်။ ယခုလက်ရှိ ရေးထားတာကတော့ ကိုစိုးမင်း python နဲ့ရေးထားတာလောက် မြန်မှာတော့ မဟုတ်လောက်ဘူး။ သူ့မြန်နှုန်းက ကြောက်စရာကြီး :D ။ 60 MB/s ဆိုလား မသိဘူး။ online မှာကတော့ loading ကြောင့်လား connection ကြောင့်လားတော့ မသိဘူး နည်းနည်းနှေးတယ်။ အခု RC version မှာ ပြဿနာမရှိရင် opensource နဲ့ opentech ချတော့မှာ ဖြစ်လို့ ဝိုင်းစစ်ပေးစေချင်ပါတယ် :) Syllable Breaking ကို http://myanmarwords.pikay.org/ ကနေ စစ်ဆေးခဲ့ပါတယ်။ :)

Leave a Comment

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.