Shan Syllable Break

မြန်မာစာ Syllable Break က တော်တော်များများ လုပ်ထားပြီးသားပါ။ မြန်မာစာ syllable break မှာ လက်ရှိ ကိုရဲကျော်သူ syllable က အတော်လေးကို ကောင်းတယ်။ သူ့ရဲ့ syllable ကို အခြေခံပြီး ထပ်ပြင် ထပ်ဖြည့်ရတာတွေတော့ ရှိပေမယ့် အဆင်ပြေတယ်လို့ ဆိုနိုင်တယ်။ NLP စပြီဆိုရင် Syllable Break ကို မဖြစ်မနေ လုပ်မှ ရတယ်။ Syllable Break လုပ်မှ word break အဆင်ပြေမယ်။ word break အဆင်ပြေမှ POS Tagging နဲ့ အခြား NLP ဆိုင်တာတွေ ရှေ့ဆက်လို့ ရမယ်။ မြန်မာစာမှာ အဓိက rules နဲ့ ဖြေရှင်းလိုက်လို့ရတယ်။… Continue reading Shan Syllable Break

Machine Learning and Zawgyi

ဇော်ဂျီဟာ AI က မသိဘူး။ ဇော်ဂျီ နဲ့ ရေးထားရင် AI တွေက နားမလည်ဘူး စတာတွေကို လူတွေ ပြောနေကြတာကို တွေ့မိတယ်။ အဓိက ပြောနေသည် သူတွေ အကုန်လုံးက AI ဆိုတာ ဘာလဲ မသိသည့် သူတွေ ပဲ။ AI ဆိုရင် Terminator ကားထဲကလို စက်ရုပ်တွေ လို့ပဲ ထင်နေသည့် သူတွေက အများသားပဲ။ နောက်ပြီး တချို့ပညာရှင်တွေက AI သုံးလာမှာ ကို ကြောက်ကြတယ်ဆိုတာက Terminator ထဲကလို ဖြစ်လာမှာ ကြောက်တာထက် ပေါက်ကရ data ဝင်သွားရင် ပေါက်ကရတွေ ဖြစ်ကုန်မှာ။ အကောင်းဆုံး ဥပမာ အနေနဲ့ Microsoft ရဲ့ AI twitter… Continue reading Machine Learning and Zawgyi