Zawgyi syllable breaking

အခုတလော breaking တွေလုပ်ရတာ မူးနောက်နေတာပဲ။ ကိုစိုးမင်းကိုတော့ တော်တော်လေး လေးစားတယ်။ သူလုပ်ထားတာ တော်တော်လေးမြန်တယ်။ နောက်ပြီး မှန်လည်းမှန်တယ်။ ခက်တာက PHP နဲ့တွဲသုံးလို့မရတာပဲ။ နောက်ပြီးတော့ PHP library ကလည်း ကိုယ်ပိုင် server မှ အဆင်ပြေမှာဆိုတော့ ကိုယ့်ဘာသာကိုယ် PHP နဲ့ရေးလိုက်တာ။ normalize က လွယ်တယ်။ syllable breaking က ထင်တာထက် ပိုခက်တယ်။ ဘုန်းကြီးဝတ်နေတုန်းက လက်နဲ့ အကြမ်းချရေးခဲ့ပြီးပေမယ့် လက်တွေ့မှာတော့ ထင်သလိုမရဘူး။ အများကြီးပြန်ပြင်ရတယ်။ ရတဲ့ပုံစံနဲ့ ရေးရတယ်။ အခုတော့ pattern ပေါင်း ၇၅ ခုရှိနေပြီ။ အခုက အကြမ်းအဆင့်ပဲရှိသေးတယ်။ အချောသတ်ရအုံးမယ်။ အဲဒီ breaking လေးရရင် ornagai မှာ မြန်မာစာ search အတွက် တော်တော်အဆင်ပြေပြီ။ ကျွန်တော် အခု စဉ်းစားနေတာ 0 width space သုံးမလို့။ အဲဒါက size တော့ ပိုများသွားမယ်။ ဒါပေမယ့် searching ပိုင်း သိသိသာသာ တိုးလာမယ်။ ပိုလည်း မြန်ပြီး တိကျလာလိမ့်မယ်။ ဥပမာ တံ ဆိုတဲ့ စာလုံးကို ရှာရင် တံ လည်းထွက်မယ်။ တုံ လည်းထွက်မယ်။ တုံး လည်းထွက်လာမှာပဲ။ တနည်းပြောရင် တံ = တုံ = တုံး ဆိုတာက ရလဒ် တစ်ခုတည်းမှာ ထွက်နေပြီ။ 0 width space တွေသာ ထည့်လိုက်မယ်ဆိုရင် တံ ဆိုတဲ့ result ကိုပဲ ပြတော့မယ်။ ဒါကြောင့် query က ပိုမြန်လာနိုင်မယ်။ database size က ပိုကြီးသွားမယ်။ စာလုံးတိုင်းမှာ 0 width space ပါလာတာကြောင့်ပါ။ result တွေကတော့ ထိရောက်ပြီး ကျုံသွားမှာတော့ သေချာတယ်။ အခုတော့ တော်တော်လေး ပြီးနေပြီ။ စစ်ဆေးဆဲပဲ။ ပြီးရင် အဲဒီ Normalization နဲ့ syllable breaking ကို open technology ချမယ်။ ဘာဖြစ်လို့လည်းဆိုတော့ အခြား searching တွေအတွက်ပါ အသုံးပြုနိုင်အောင်။ နောက်ပြီးရင် wordpress အတွက် plugin လုပ်မယ်။ ဒါဆိုရင် ကိုယ့် site မှာ က ိ ု နဲ့ပဲ ရှာရှာ က ု ိ နဲ့ပဲရှာရှာ ရလဒ်က တူသွားမယ်။ နောက်ပြီး မြန်မာစာအတွက် တိကျတဲ့ result တွေရလာလိမ့်မယ်။

2 Comments

  1. အကိုတို့ကြိုးစားတာကိုကြည့်ပြီး အရမ်းကို မျှော်လင့်နေတယ်ဗျာ..

    1. saturngod says:

      thank you… so much…

Leave a Comment

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.