Apple Foundation Framework

ဒီတစ်ခေါက် WWDC 2026 မှာ စိတ်ဝင်စားစရာ ကောင်းတာက Apple ရဲ့ Foundation Framework ပဲ။ မနှစ်ကတည်းက ပါပေမယ့် ဒီနှစ် မှာတော့ ပိုကောင်းလာတယ်။

Technical အပိုင်းအရ ပြောရရင် Apple က Model ၂ မျိုး ခွဲပေးထားတာပါ။ သာမန်နေ့စဉ်သုံးဖို့ 3B Dense Model (AFM 3 Core) အပြင်၊ ခက်ခဲတဲ့ task တွေ အတွက် Multimodal (Image Analyze) လုပ်ဖို့အတွက် 20B Sparse Model (AFM 3 Core Advanced) ကိုပါ ထည့်ပေးထားပါတယ်။

“ဖုန်းပေါ်မှာ 20B Model ကြီး ဘယ်လို Run မှာလဲ” လို့ မေးစရာ ရှိပေမယ့် Apple က MoE ဆန်တဲ့ sparse architecture ကို အသုံးပြုထားတယ်။ Model ကြီးတစ်ခုလုံးကို RAM ပေါ် အတင်းမတင်ဘဲ Flash Memory (Storage) ထဲမှာပဲ sleep mode အနေနဲ့ ရှိပြီး Query တစ်ခုလာရင် သက်ဆိုင်ရာ ကျွမ်းကျင်တဲ့ Expert အပိုင်းအစလေးတွေကိုပဲ ရွေးပြီး RAM ပေါ် ဆွဲတင်တာမို့ တစ်ခါသုံးရင် 1B ကနေ 4B ဝန်းကျင်လောက်ပဲ Dynamically အလုပ်လုပ်သွားတာ။ ဒါကြောင့် ဖုန်းမှာ RAM လည်း မပြည့်ဘဲ ပေါ့ပေါ့ပါးပါးနဲ့ လုပ်ဆောင်နိုင်စွမ်း ရှိတယ်။

အခုက Tool calling အတွက်ပဲ အဓိက ထားသည့် ပုံစံပဲ။ Image analyze လုပ်မယ်။ ပြီးတော့ LanguageModel protocol အသစ်ကြောင့် On-device တင်မကဘဲ ပြင်ပက တခြား model တွေ နဲ့ပါ Code ပြန်ပြင်စရာမလိုဘဲ အလွယ်တကူ ချိတ်လို့ရအောင် ဖွင့်ပေးထားသေးတယ်။

တနည်းပြောရင် Apple သွားနေသည့် လမ်းကြောင်းက အခု LLM တွေ သွားနေသည့် Cloud-centric super intelligence မဟုတ်ပဲ on device reasoning + personal context ကို အဓိက ထားတာပဲ။ Tool calling, reasoning logic တချို့ကို device မှာပဲ ပြီးစေတာပဲ။

ဥပမာ Online Store မှာ product တစ်ခု ရှာတယ် ဆိုပါစို့။ အခု လုပ်နေရတာက mobile က prompt ကို server side ကို ပို့တယ်။ server side ကနေ AI server ကို prompt ထပ်ပို့တယ်။ ပြီးတော့ tool calling နဲ့ product search ရမလား ဘာလုပ်ရမလဲ ဆုံးဖြတ်တယ်။ အဲဒီ function ခေါ်ဖို့ AI server ကနေ server ကို ရောက်လာတယ်။ ပြီးတော့ search လုပ်ပြီး result တွေကို AI server ကို ပြန်ပို့တယ်။ AI server ကနေ result ကို ပြန်လာပေးပြီး အဲဒါကို server ကနေ mobile ကို ပြန်ပို့ပေးနေရတာပေါ့။ အဆင့်တွေတော့ များတာပေါ့။ အလွယ်ပြောရရင်

user prompt → server → AI Server → Tool call (server) → AI server → response

ဆိုတဲ့ လမ်းကြောင်းပေါ့။

အခု Apple လုပ်သည့် ပုံစံက Simple reasoning နဲ့ tool orchestration တချို့ကို on-device မှာပဲ လုပ်နိုင်လာပြီး complex task တွေကို PCC ဆီ handoff လုပ်နိုင်တဲ့ ပုံစံပါ။

“မနက်ဖြန် မွေးနေ့ အတွက် ဘာလက်ဆောင် ဝယ်ရမလဲ” ဆိုတာကို on device မှာ AI က context အကုန်သိနေပြီးတော့ server ဘက်ကို q=birthday present, gender=male, type=event အဲလိုခေါ်ဖို့ ပဲလိုတော့သည့် သဘော။ server မှာ processing တွေ သက်သာသွားမယ်။ AI data center မှာ query တွေ ပြုံပြီး အလုပ်လုပ်နေဖို့ မလိုတော့ဘူး။ AI ဖိုးတွေ သက်သာလာမယ်။ Complex tasks တွေ အတွက် Private Cloud Compute (PCC) ကို အသုံးပြုနိုင်တယ်။ အဲဒီ အတွက်လည်း iOS က အလိုအလျောက်လုပ်ပေးမှာပါ။ on device မှာ မနိုင်တဲ့ query တွေကို PCC မှာ process လုပ်ပါမယ်။

Apple က cloud-first AI ထက် hybrid model (on-device + PCC) ကို ပိုအလေးထားနေတဲ့ ပုံစံ မြင်ရတယ်။ သူက customer base နဲ့ User Privacy ကို သွားနေသည့် သဘော။ Developer တွေ အတွက်လည်း အတော်လေးကို အဆင်ပြေသွားတယ်။ ဒီ approach ကြောင့် developer တွေ အတွက် cloud AI usage ကို လျော့ချနိုင်မယ့် အလားအလာ ရှိတယ်။

ref:

  • https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models
  • https://developer.apple.com/videos/play/wwdc2026/319/
  • https://developer.apple.com/videos/play/wwdc2026/241/
  • https://developer.apple.com/videos/play/wwdc2026/339/
  • https://developer.apple.com/documentation/foundationmodels