Zawgyi Normalization နဲ့ syllable breaking ကို ဒီနေ့တော့ RC version လေးပြီးသွားတယ်။ အံဩဖွယ်ရာကောင်းတာက ကျွန်တော် အများကြီးရေးထားတဲ့ pattern တွေကို ၁၀ ကြောင်းတည်းနဲ့ ရေးလို့ရသွားတာပဲ။ ကိုယ့်အချိန်တွေတောင် ကိုယ်နှမြောတယ်။ အတွေ့အကြုံဆိုတာက လက်တွေ့ကနေ ရယူရတာပဲ။ အတွေ့အကြုံရှိမှပဲ လုပ်ရ ကိုက်ရတာ မြန်မှာ။ အခု စုစုပေါင်း pattern 51 ခုနဲ့ ပြီးသွားတယ်။ အမှန်တိုင်းဆိုရင်

ပိသာ = ပိဿာ
ပြသနာ = ပြဿနာ
ရေ=ရေ
ရာ=ရာ
ရွ=ရွ

စတာတွေ ထပ်ဖြည့်ထားတာကြောင့်လည်း ပါတယ်။ အမှန်တိုင်းဆို normalization က တော်တော်အရေးပါတယ်။ အစက ကိုညီလင်းဆက် ပြောတုန်းက အမှုမဲ့အမှတ်မဲ့ပဲလေ။ syllable breaking အကြောင်း ကိုရဲမြတ်သူပြောတုန်းက ဘယ်နေရာမှာသုံးမလဲ သေချာမပြောတတ်ဘူး။ နောက်တော့ ornagai ကိုလုပ်မှပဲ normalization , syllable breaking တွေ အရေးပါတာကို သိတော့တယ်။ ကိုရဲမြတ်သူနဲ့ ကိုညီလင်းဆက် ပြောဘူးတာတွေက တော်တော်လေးကို အထောက်အကူဖြစ်သွားတယ်။ ကိုညီလင်းဆက်ရဲ့ data တွေက အထောက်အကူပေးတယ်။ ယခုလက်ရှိ ရေးထားတာကတော့ ကိုစိုးမင်း python နဲ့ရေးထားတာလောက် မြန်မှာတော့ မဟုတ်လောက်ဘူး။ သူ့မြန်နှုန်းက ကြောက်စရာကြီး :D ။ 60 MB/s ဆိုလား မသိဘူး။ online မှာကတော့ loading ကြောင့်လား connection ကြောင့်လားတော့ မသိဘူး နည်းနည်းနှေးတယ်။ အခု RC version မှာ ပြဿနာမရှိရင် opensource နဲ့ opentech ချတော့မှာ ဖြစ်လို့ ဝိုင်းစစ်ပေးစေချင်ပါတယ် :) Syllable Breaking ကို http://myanmarwords.pikay.org/ ကနေ စစ်ဆေးခဲ့ပါတယ်။ :)

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Discover more from Saturngod

Subscribe now to keep reading and get access to the full archive.

Continue reading