NLP

  • ASR ဆိုတာကတော့ Automatic Speech Recognition (Speech to Text) ပါ။ Bagan ကနေ ပြီးတော့ Myanmar ASR ကို လုပ်နေတာ အတော်လေးကို ကြာနေပါပြီ။ ၁ နှစ်ကျော်လောက်တော့ ရှိပြီ ထင်တယ်။ အခုတော့ ၂၀% ပြီးပြီ ဖြစ်သည့် အတွက်ကြောင့် demo စမ်းလို့ ရပါတယ်။ Demo ကို https://research.baganintel.ai/asr မှာ စမ်းနိုင်ပါတယ်။ လက်ရှိ စမ်းသလောက်တော့ စာလုံးတော်တော်များများ မသိသေးဘူး။ Mobile နဲ့ က ပိုအဆင်ပြေတယ်။ Laptop နဲ့က mic က noise တွေ များနေတာ ကြောင့် အဆင်မပြေဘူး။ နောက်ပြီး အနားမှာ ပြန်ကာ…

  • မြန်မာစာ Syllable Break က တော်တော်များများ လုပ်ထားပြီးသားပါ။ မြန်မာစာ syllable break မှာ လက်ရှိ ကိုရဲကျော်သူ syllable က အတော်လေးကို ကောင်းတယ်။ သူ့ရဲ့ syllable ကို အခြေခံပြီး ထပ်ပြင် ထပ်ဖြည့်ရတာတွေတော့ ရှိပေမယ့် အဆင်ပြေတယ်လို့ ဆိုနိုင်တယ်။ NLP စပြီဆိုရင် Syllable Break ကို မဖြစ်မနေ လုပ်မှ ရတယ်။ Syllable Break လုပ်မှ word break အဆင်ပြေမယ်။ word break အဆင်ပြေမှ POS Tagging နဲ့ အခြား NLP ဆိုင်တာတွေ ရှေ့ဆက်လို့ ရမယ်။ မြန်မာစာမှာ အဓိက rules နဲ့ ဖြေရှင်းလိုက်လို့ရတယ်။…

  • လွန်ခဲ့သည့် ၁ နှစ်ကျော်လောက်က BIT က မြန်မာစာအတွက် NLP လုပ်ချင်လို့ ဆိုပြီး ကျွန်တော့်ဆီ ဆက်သွယ်ခဲ့တယ်။ NLP ကို Machine Learning ပုံစံ နဲ့သွားချင်တယ်။ NLP နဲ့ Machine Learning ကို စိတ်ဝင်စားလို့ Part Time Reseacher အနေနဲ့ ဝင်လုပ်ခဲ့တယ်။ တော်တော်များများလည်း လေ့လာဖြစ်ခဲ့သလို Machine Learning အကြောင်းတွေလည်း သိခဲ့ရတယ်။ သမာရိုးကျ NLP ထက် Machine Learning နဲ့ အပိုင်းက ပိုအဆင်ပြေတယ်။ အဓိက ပြဿနာက Corpus တွေ မရှိတာပဲ။ BIT Team က data တွေ အတွက် အတော်လေးကို အချိန်ပေးခဲ့ရတယ်။…

  • ကျောင်းတက်တုန်းက သင်္ချာမှာ Probability ကို သင်ခဲ့ရပါတယ်။ သို့ပေမယ့် အတန်းက ပျက်တာရယ် စာတွေသေချာ လိုက်မလိုက်ဖြစ်ခဲ့တာကြောင့် Probability ကို ကောင်းမွန်စွာ မသိခဲ့ဘူး။ ပြီးခဲ့တဲ့ အပတ်က Natural Language Processing with Swift ဆိုတာကို ကြည့်ပြီးမှ ကျောင်းက သင်ခဲ့တာတွေ အသုံးဝင်သားပဲ လို့ တွေးမိတယ်။ Swift ကို အသုံးမပြုသည့် တိုင် သင်္ချာနဲ့ ပတ်သက်ပြီး programming နဲ့ ဘယ်လို တွဲသုံးရမလဲဆိုတာကို သိရအောင် ကြည့်သင့်တဲ့ video တစ်ခုပါ။ မူရင်း website https://realm.io/news/natural-language-processing-with-swift/ မှာ slide show နဲ့ တကွ video ရှိပါတယ်။ အချိန်ရရင် အချိန်လေး ပေးပြီး…

  • http://www.myanmarnlp.org.mm/sites/all/modules/pubdlcnt/pubdlcnt.php?file=/sites/default/files/windws_myanmar_translator_version1.0.zip&nid=21 ဘာပဲဖြစ်ဖြစ်ကြိုဆိုပါတယ်ဗျာ။ ဒီအဖွဲ့အစည်းက ဒါတွေလုပ်ဖို့ ထားတာပဲ။ ၃ လ ထဲနဲ့ လုပ်ထားတာဆိုတော့ ဒီလောက်တော့ ရှိမှာပါ။ သူများတွေကတော့ codeproject က ဟာကို ယူပြီး ပြင်တယ်လို့ပြောတာပဲ။ ဟုတ်မဟုတ်တော့ မသိ။ စိတ်လည်း မဝင်စားပါ။ မြန်မြန်ဆန်ဆန်နဲ့ ဒီထက် ပိုကောင်းလာဖို့ မျှော်လင့်နေပါတယ်။ beta အစား alpha version ဆို ပိုမှန်မယ်ထင်တယ်။