Zawgyi syllable breaking

အခုတလော breaking တွေလုပ်ရတာ မူးနောက်နေတာပဲ။ ကိုစိုးမင်းကိုတော့ တော်တော်လေး လေးစားတယ်။ သူလုပ်ထားတာ တော်တော်လေးမြန်တယ်။ နောက်ပြီး မှန်လည်းမှန်တယ်။ ခက်တာက PHP နဲ့တွဲသုံးလို့မရတာပဲ။ နောက်ပြီးတော့ PHP library ကလည်း ကိုယ်ပိုင် server မှ အဆင်ပြေမှာဆိုတော့ ကိုယ့်ဘာသာကိုယ် PHP နဲ့ရေးလိုက်တာ။ normalize က လွယ်တယ်။ syllable breaking က ထင်တာထက် ပိုခက်တယ်။ ဘုန်းကြီးဝတ်နေတုန်းက လက်နဲ့ အကြမ်းချရေးခဲ့ပြီးပေမယ့် လက်တွေ့မှာတော့ ထင်သလိုမရဘူး။ အများကြီးပြန်ပြင်ရတယ်။ ရတဲ့ပုံစံနဲ့ ရေးရတယ်။ အခုတော့ pattern ပေါင်း ၇၅ ခုရှိနေပြီ။ အခုက အကြမ်းအဆင့်ပဲရှိသေးတယ်။ အချောသတ်ရအုံးမယ်။ အဲဒီ breaking လေးရရင် ornagai မှာ မြန်မာစာ search အတွက် တော်တော်အဆင်ပြေပြီ။ ကျွန်တော် အခု စဉ်းစားနေတာ 0 width space သုံးမလို့။ အဲဒါက size တော့ ပိုများသွားမယ်။ ဒါပေမယ့် searching ပိုင်း သိသိသာသာ တိုးလာမယ်။ ပိုလည်း မြန်ပြီး တိကျလာလိမ့်မယ်။ ဥပမာ တံ ဆိုတဲ့ စာလုံးကို ရှာရင် တံ လည်းထွက်မယ်။ တုံ လည်းထွက်မယ်။ တုံး လည်းထွက်လာမှာပဲ။ တနည်းပြောရင် တံ = တုံ = တုံး ဆိုတာက ရလဒ် တစ်ခုတည်းမှာ ထွက်နေပြီ။ 0 width space တွေသာ ထည့်လိုက်မယ်ဆိုရင် တံ ဆိုတဲ့ result ကိုပဲ ပြတော့မယ်။ ဒါကြောင့် query က ပိုမြန်လာနိုင်မယ်။ database size က ပိုကြီးသွားမယ်။ စာလုံးတိုင်းမှာ 0 width space ပါလာတာကြောင့်ပါ။ result တွေကတော့ ထိရောက်ပြီး ကျုံသွားမှာတော့ သေချာတယ်။ အခုတော့ တော်တော်လေး ပြီးနေပြီ။ စစ်ဆေးဆဲပဲ။ ပြီးရင် အဲဒီ Normalization နဲ့ syllable breaking ကို open technology ချမယ်။ ဘာဖြစ်လို့လည်းဆိုတော့ အခြား searching တွေအတွက်ပါ အသုံးပြုနိုင်အောင်။ နောက်ပြီးရင် wordpress အတွက် plugin လုပ်မယ်။ ဒါဆိုရင် ကိုယ့် site မှာ က ိ ု နဲ့ပဲ ရှာရှာ က ု ိ နဲ့ပဲရှာရှာ ရလဒ်က တူသွားမယ်။ နောက်ပြီး မြန်မာစာအတွက် တိကျတဲ့ result တွေရလာလိမ့်မယ်။

2 responses to “Zawgyi syllable breaking”

  1. အကိုတို့ကြိုးစားတာကိုကြည့်ပြီး အရမ်းကို မျှော်လင့်နေတယ်ဗျာ..

    1. thank you… so much…

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.