สนามรบ AI ในจีนตอนนี้เปรียบได้กับ "สงครามแห่งร้อยแบบจําลอง" (War of a Hundred Models) จริงๆ นี่คือการแข่งขันที่ดุเดือดระหว่างยักษ์ใหญ่เทคโนโลยีเดิมที่เรารู้จักกันดีอย่าง Baidu, Alibaba, Tencent และ Huawei (กลุ่ม BATX) กับกลุ่มสตาร์ทอัพดาวรุ่งที่ถูกขนานนามว่า "พยัคฆ์ AI สายเลือดใหม่" ทั้งหมดนี้เกิดขึ้นภายใต้การกํากับและส่งเสริมจากรัฐบาล ซึ่งมีบทบาทสําคัญในการกําหนดทิศทางอุตสาหกรรม | คําถามสําคัญที่เราจะเจาะดูกันในวันนี้คือ ในสมรภูมินี้ โมเดลภาษา (LLM) ของจีนยืนอยู่จุดไหนเมื่อเทียบกับคู่แข่งระดับโลกอย่าง OpenAI, Google หรือ Meta? และพวกเขามีทีเด็ดอะไรซ่อนไว้บ้าง | | | | | | ยักษ์ใหญ่ลงสนาม vs. พยัคฆ์สายเลือดใหม่ | ภูมิทัศน์ของจีนแบ่งผู้เล่นออกเป็นสองกลุ่มชัดเจน กลุ่มแรกคือ ยักษ์ใหญ่ดั้งเดิม (BATX) บริษัทเหล่านี้มีแต้มต่อมหาศาล พวกเขามีโครงสร้างพื้นฐานคลาวด์ที่แข็งแกร่งอยู่แล้ว อย่างเช่น Alibaba Cloud และ Baidu AI Cloud แถมยังมีคลังข้อมูลผู้ใช้ขนาดมหึมา กลยุทธ์หลักของพวกเขาคือการนําเสนอ LLM ในรูปแบบบริการ (Models-as-a-Service หรือ MaaS) บนแพลตฟอร์มคลาวด์ของตนเอง อย่าง Baidu AI Cloud ก็ครองส่วนแบ่งตลาด LLM ที่ใหญ่ที่สุดในจีนไปแล้ว พวกเขาไม่เพียงสร้างรายได้ใหม่ แต่ยังเป็นการสร้าง "กําแพง" ล้อมลูกค้าให้อยู่ในระบบนิเวศของตัวเอง | กลุ่มที่สองคือ "พยัคฆ์ AI สายเลือดใหม่" หรือที่บางคนเรียกว่า "หกมังกรน้อย" กลุ่มนี้รวมถึงสตาร์ทอัพที่มาแรงอย่าง DeepSeek, Zhipu AI, Moonshot AI, Baichuan AI, MiniMax และ 01.AI แม้จะเล็กกว่า แต่บริษัทเหล่านี้คล่องตัวสูงและเป็นผู้สร้างนวัตกรรมที่น่าทึ่ง | จุดที่น่าสนใจคือการปรับตัวของเหล่าสตาร์ทอัพ ในช่วงแรก หลายบริษัทตั้งเป้าสร้างโมเดลอเนกประสงค์เพื่อชนกับ OpenAI ตรงๆ แต่เมื่อเจอกับสงครามราคาในประเทศ และความลังเลของภาคธุรกิจที่จะจ่ายแพง พวกเขาเริ่มปรับกลยุทธ์ หันไปเจาะตลาดเฉพาะทางมากขึ้น อย่าง Baichuan ที่มุ่งเน้นภาคการเงินและการดูแลสุขภาพ หรือ MiniMax ที่หันไปบุกตลาดผู้บริโภคในสหรัฐฯ ด้วยแอปแชท "Talkie" นี่แสดงให้เห็นถึงความยืดหยุ่นและการมองหาช่องว่างใหม่ๆ ที่น่าจับตามอง | |
| |
| | |
| ส่องคลังอาวุธ: 4 กลยุทธ์หลักจาก 4 ผู้เล่นเด่น | เมื่อเจาะดูลึกขึ้น เราจะเห็นว่าผู้เล่นหลักแต่ละรายมีกลยุทธ์การต่อสู้ที่แตกต่างกันอย่างชัดเจน: | | | | | ByteDance (Doubao/Byteplus): กลยุทธ์สองแนวรบ | ByteDance บริษัทแม่ของ TikTok ใช้กลยุทธ์จู่โจมสองแนวรบ แนวรบแรกคือตลาดผู้บริโภค พวกเขาส่งแชทบอท Doubao (โต้วเปา) ลงสนาม ซึ่งมีรายงานว่ามียอดดาวน์โหลดแซงหน้า Ernie Bot ของ Baidu ในจีนไปแล้ว สะท้อนความเชี่ยวชาญในการทําผลิตภัณฑ์ให้โดนใจคนหมู่มาก | แนวรบที่สองคือตลาดองค์กร ผ่าน Byteplus (สําหรับตลาดต่างประเทศ) และ Volcano Engine (บริการคลาวด์ในจีน) หัวใจคือตระกูลโมเดล "Seed" ที่ทําได้หลากหลายมิติ (multimodal) ไม่ว่าจะเป็น Seedream สําหรับสร้างภาพ หรือ Seedance สําหรับสร้างวิดีโอ และอาวุธลับของพวกเขาคือ การตั้งราคาที่ดุดัน โดยตั้งราคาโมเดล Doubao ต่ํากว่าคู่แข่งจากตะวันตกอย่างชัดเจน เป็นกลยุทธ์ที่ตั้งใจมาครองตลาดด้วยความเป็นผู้นําด้านต้นทุน |
| |
| | |
| | | | | Alibaba (Qwen): พลังแห่งโอเพนซอร์ส | Alibaba Cloud ส่งตระกูลโมเดล Qwen (ทงอี้ เชียนเวิ่น) เข้าแข่งขัน โมเดลเรือธงอย่าง Qwen 2.5-Max ก็ทําผลงานได้ดีในเวทีโลก แต่กลยุทธ์หลักของ Alibaba คือการเน้น โอเพนซอร์ส พวกเขาปล่อยโมเดลหลายขนาด ตั้งแต่เล็กจิ๋วไปจนถึง 72 พันล้านพารามิเตอร์ แนวทางนี้คล้ายกับกลยุทธ์ Llama ของ Meta ที่ได้ผลดีมาก การเปิดกว้างนี้ช่วยสร้างชุมชนนักพัฒนาที่แข็งแกร่ง และท้ายที่สุดก็ดึงดูดการใช้งานบริการคลาวด์ของตัวเอง ด้วยลูกค้าองค์กรกว่า 90,000 ราย Alibaba ถือเป็นผู้นําการใช้งาน LLM ในภาคธุรกิจจีนอย่างแท้จริง |
| |
| | |
| | | | | Huawei (Pangu): ผู้เชี่ยวชาญแห่งโลกอุตสาหกรรม | Huawei เลือกเส้นทางที่แตกต่างอย่างสิ้นเชิง แทนที่จะกระโจนเข้าสู่สงครามแชทบอทอเนกประสงค์ Huawei กลับมุ่งเน้นการพัฒนาโมเดล "ผู้เชี่ยวชาญเฉพาะทาง" สําหรับภาคอุตสาหกรรมหนัก อย่างเช่น ภาครัฐ การเงิน การผลิต เหมืองแร่ และอุตุนิยมวิทยา | ตัวอย่างที่ชัดเจนคือ Pangu Weather Model ที่สามารถพยากรณ์เส้นทางพายุไต้ฝุ่นได้แม่นยําและเร็วกว่าวิธีดั้งเดิมมาก นี่คือการสร้างมูลค่าที่จับต้องได้ให้ลูกค้าองค์กร และที่สําคัญ กลยุทธ์นี้เชื่อมโยงโดยตรงกับธุรกิจฮาร์ดแวร์ของ Huawei โมเดล Pangu ถูกออกแบบมาให้ทํางานได้ดีที่สุดบนหน่วยประมวลผล AI Ascend ที่พวกเขาพัฒนาขึ้นเอง ในยุคที่ถูกจํากัดการเข้าถึงชิปจากสหรัฐฯ นี่คือการสร้างระบบนิเวศที่พึ่งพาตนเองได้ และเป็นข้อได้เปรียบที่สําคัญอย่างยิ่ง |
| |
| | |
| | | | | DeepSeek: ม้ามืดผู้ทลายกําแพง "Scale" | ถ้ามี "ม้ามืด" ในการแข่งครั้งนี้ DeepSeek คือตัวจริง พวกเขาสร้างผลงานระดับ State-of-the-art ที่น่าทึ่ง โมเดลอย่าง DeepSeek-V3 สามารถทําคะแนนบนเบนช์มาร์ก MMLU ได้ทัดเทียมหรือเกือบเท่ากับ GPT-4, Llama 3.1 และ Claude 3.5 Sonnet | แต่เรื่องที่ช็อกวงการยิ่งกว่าคือ ความคุ้มค่า มีรายงานว่า DeepSeek-V3 ใช้ต้นทุนในการฝึกฝนน้อยกว่าโมเดลตะวันตกที่มีขนาดใกล้เคียงกันอย่างมาก โดยอาศัยสถาปัตยกรรม MoE ที่มีประสิทธิภาพสูง นี่คือการท้าทายกระบวนทัศน์ที่ว่า "ขนาดคือทุกสิ่ง" (scale is all you need) และพิสูจน์ว่าสถาปัตยกรรมและข้อมูลที่เหนือกว่า สามารถลบจุดด้อยด้านทรัพยากรได้ การที่ DeepSeek มุ่งมั่นปล่อยโมเดลโอเพนซอร์สที่ทรงพลังออกมาต่อเนื่อง ทําให้พวกเขากลายเป็นขวัญใจนักพัฒนาทั่วโลก |
| |
| | |
| ตารางสรุปโมเดลภาษาของจีน | บริษัท | ชื่อแบบจําลอง | พารามิเตอร์ | สถาปัตยกรรม | จุดเด่น |
|---|
ByteDance | Doubao Series | ไม่เปิดเผย | ไม่เปิดเผย | การเจาะตลาดผู้บริโภค, ราคาแข่งขัน | Alibaba | Qwen 2.5-Max | ไม่เปิดเผย | MoE | โอเพนซอร์ส, ประสิทธิภาพสูง, หลายภาษา | Huawei | Pangu 5.5 / Ultra | 718B (MoE) / 135B | MoE / Dense | เฉพาะอุตสาหกรรม, ร่วมฮาร์ดแวร์ Ascend | DeepSeek | DeepSeek-V3 / R1 | 671B | MoE | ประสิทธิภาพสูง, คุ้มค่า, การให้เหตุผล | Zhipu AI | GLM-4.5 | 355B | MoE | การเขียนโค้ด, Agentic Tasks | Baichuan | Baichuan 3 | >1T | ไม่เปิดเผย | Context ยาวพิเศษ | Moonshot AI | Kimi | ไม่เปิดเผย | ไม่เปิดเผย | Context ยาวพิเศษ, แชทบอทยอดนิยม |
| | | | | ปิดช่องว่าง: เมื่อคะแนนเบนช์มาร์กไม่ใช่คําตอบสุดท้าย | นี่คือหัวใจสําคัญ: ประสิทธิภาพของจีนเทียบกับโลกเป็นอย่างไร? | คําตอบคือ ช่องว่างด้านประสิทธิภาพได้ลดลงอย่างรวดเร็ว ถ้าในปี 2023 โมเดลจากสหรัฐฯ ยังนําอยู่ชัดเจน แต่ในช่วงปลาย 2024 ถึงปัจจุบัน ช่องว่างบนเบนช์มาร์กสําคัญๆ ได้ลดลงจนแทบจะเท่ากันแล้ว ตารางเปรียบเทียบแสดงให้เห็นว่าคะแนน MMLU (วัดความรู้) ของ DeepSeek-V3 (88.5) แทบจะหายใจรดต้นคอ Llama 3.1 (88.6) หรือในด้านคณิตศาสตร์ GLM-4.5 ของ Zhipu ก็ทําคะแนนได้ในระดับที่แข่งขันกับโมเดลสูงสุดของโลกได้ | แต่ตัวเลขก็ไม่ใช่ทุกอย่าง เมื่อเรามองเชิงคุณภาพ เราจะเห็นจุดแข็งและจุดอ่อนที่ชัดเจน: | จุดแข็ง: ความคุ้มค่าคืออาวุธร้ายแรง อย่างที่เห็นจาก DeepSeek และ ByteDance พวกเขาสามารถพัฒนาโมเดลที่ทรงพลังในต้นทุนที่ต่ํากว่าตะวันตกมาก นอกจากนี้ "สงครามร้อยโมเดล" ยังบีบให้เกิดการพัฒนาที่รวดเร็วและมุ่งเน้นการใช้งานจริง (เช่น Pangu ของ Huawei) จุดอ่อน (และความท้าทายใหญ่): นั่นคือ การเซ็นเซอร์ข้อมูล นี่คือประเด็นที่หลีกเลี่ยงไม่ได้ โมเดลจีนถูกฝึกบนข้อมูลที่ผ่านการกรองและต้องหลีกเลี่ยงหัวข้อที่ละเอียดอ่อน (เช่น เหตุการณ์ที่จัตุรัสเทียนอันเหมิน)
| การ "ดัดทอน" (lobotomization) นี้ อาจจํากัดความสามารถในการให้เหตุผลอย่างอิสระและเชิงวิพากษ์อย่างรุนแรง เรื่องนี้อาจส่งผลต่อความน่าเชื่อถือสําหรับการใช้งานในระดับโลก แม้ว่าคะแนนเบนช์มาร์กจะไล่ทันกันแล้ว แต่มันอาจเป็นสัญญาณว่าเบนช์มาร์กเหล่านี้กําลังจะ "อิ่มตัว" และไม่สามารถใช้วัดความสามารถที่แท้จริงได้อีกต่อไป สนามแข่งต่อไปอาจอยู่ที่ความน่าเชื่อถือและความไว้วางใจ ซึ่งเป็นจุดที่ผลกระทบจากการเซ็นเซอร์อาจกลายเป็นข้อเสียเปรียบสําคัญ |
| |
| | |
| | | | | อนาคตของ AI จีน: พึ่งพาตนเอง หรือ ถูกแบ่งแยก? | ภัยคุกคามที่ใหญ่ที่สุดต่อความทะเยอทะยานด้าน AI ของจีน ไม่ใช่คู่แข่ง แต่คือ การเข้าถึงฮาร์ดแวร์ การควบคุมการส่งออกเซมิคอนดักเตอร์ขั้นสูง (อย่าง GPU ของ NVIDIA) โดยสหรัฐฯ สร้างแรงกดดันมหาศาลต่อการฝึกโมเดลขนาดใหญ่รุ่นต่อไป | เพื่อตอบโต้ จีนเร่งผลักดันการพัฒนาฮาร์ดแวร์ของตนเองเต็มกําลัง เราจึงเห็น Huawei สร้างระบบนิเวศทั้งหมดบนชิป Ascend ของตัวเอง Baidu ก็มีชิป Kunlun 3 นี่คือการเดิมพันครั้งใหญ่ว่าฮาร์ดแวร์ที่ผลิตในประเทศจะก้าวทันเทคโนโลยีล้ําสมัยจาก NVIDIA ได้หรือไม่ | ในขณะเดียวกัน สถานะของจีนในเวทีโลกก็มีสองด้าน ด้านหนึ่ง บริษัทจีนเป็นผู้เล่นสําคัญในชุมชนโอเพนซอร์ส (Alibaba, DeepSeek) แต่อีกด้านหนึ่ง การเซ็นเซอร์ภายในก็สร้างอุปสรรคต่อความน่าดึงดูดใจในตลาดตะวันตก ภูมิทัศน์ AI โลกจึงมีความเสี่ยงที่จะแบ่งออกเป็นสองระบบนิเวศที่แข่งขันกัน โดยมีมาตรฐานและค่านิยมที่แตกต่างกัน |
| |
| | |
| | | | | | คําศัพท์เฉพาะทางเพิ่มเติม | LLM (Large Language Model): โมเดลภาษาขนาดใหญ่ คือ AI ที่ถูกฝึกฝนด้วยข้อมูลข้อความมหาศาล เพื่อให้สามารถเข้าใจ สร้าง และโต้ตอบด้วยภาษาที่เหมือนมนุษย์ MoE (Mixture-of-Experts): สถาปัตยกรรม "ส่วนผสมของผู้เชี่ยวชาญ" แทนที่จะใช้ "สมอง" ขนาดใหญ่ก้อนเดียว โมเดล MoE จะมี "ผู้เชี่ยวชาญ" เฉพาะทางย่อยๆ จํานวนมาก เมื่อมีคําสั่งเข้ามา ระบบจะเลือกใช้เฉพาะผู้เชี่ยวชาญที่เกี่ยวข้อง ทําให้ประมวลผลได้เร็วและประหยัดต้นทุนกว่ามาก นี่คือเบื้องหลังความสําเร็จของ DeepSeek Context Window (หน้าต่างบริบท): คือปริมาณข้อมูล (เช่น จํานวนคํา หรือ token) ที่ AI สามารถ "จดจํา" หรือประมวลผลได้ในคราวเดียว โมเดลที่มี Context Window กว้างๆ อย่าง Kimi หรือ Baichuan สามารถอ่านเอกสารหนาๆ หรือหนังสือทั้งเล่ม เพื่อสรุปหรือตอบคําถามได้ในครั้งเดียว Benchmark (เบนช์มาร์ก): คือชุดแบบทดสอบมาตรฐานที่ใช้วัดประสิทธิภาพของ AI ในด้านต่างๆ อย่างเช่น MMLU (วัดความรู้ทั่วไป) หรือ SWE-bench (วัดความสามารถในการเขียนโค้ด)
|
| |
| | |
| | | | | | บทวิเคราะห์จาก Insiderly | ยุคที่โลกตะวันตกครองความเป็นผู้นําด้านประสิทธิภาพ LLM อย่างชัดเจนได้ สิ้นสุดลงแล้ว ช่องว่างได้ลดลงจนแทบจะเท่าเทียมกันในตัวชี้วัดสําคัญ พรมแดนของ AI ได้กลายเป็นภูมิทัศน์ที่มีหลายขั้วอํานาจ | การแข่งขันในอนาคตจะไม่ใช่แค่การเอาชนะกันเล็กๆ น้อยๆ บนตารางเบนช์มาร์ก แต่จะหันมาให้ความสําคัญกับ ต้นทุน ประสิทธิภาพ และความเร็วในการนําไปใช้ เพื่อสร้างมูลค่าทางเศรษฐกิจที่จับต้องได้ และในยุคใหม่นี้ จุดแข็งของจีนในด้านการประยุกต์ใช้ที่รวดเร็ว การขยายขนาดที่คุ้มค่า และตลาดภายในขนาดใหญ่ ทําให้จีนกลายเป็นคู่แข่งที่น่าเกรงขามอย่างแท้จริง | ทิศทางของจีนชี้ให้เห็นการตระหนักรู้เชิงกลยุทธ์ที่น่าสนใจ: คุณค่าสูงสุดของ AI อาจไม่ได้อยู่ที่การสร้าง AGI (ปัญญาประดิษฐ์ทั่วไป) ที่เก่งที่สุดเพียงหนึ่งเดียว แต่อยู่ที่การปรับใช้เครื่องมือ AI เฉพาะทางที่ คุ้มค่า จํานวนมหาศาล เพื่อฝังลึกเข้าไปในระบบเศรษฐกิจ | ในขณะที่โลกตะวันตกมักมุ่งเน้นไปที่การสร้าง "สมอง" จีนกลับให้ความสําคัญกับการสร้าง "มือและเท้า" ซึ่งก็คือระบบนิเวศของแอปพลิเคชัน AI ที่ขับเคลื่อนเศรษฐกิจจริง นี่คือ Key Takeaways ที่เราต้องจับตามอง: | ประสิทธิภาพไม่ใช่คูเมืองอีกต่อไป: เมื่อโมเดลจีนอย่าง DeepSeek หรือ Qwen มีประสิทธิภาพทัดเทียมระดับโลก ธุรกิจทั่วโลกไม่สามารถสันนิษฐานได้อีกแล้วว่าโมเดลตะวันตก "ดีกว่า" เสมอไป การแข่งขันจะย้ายไปอยู่ที่ปัจจัยอื่น สงครามราคาคืออาวุธใหม่: ความสําเร็จของ DeepSeek และกลยุทธ์ของ ByteDance พิสูจน์ว่าประสิทธิภาพระดับสูงสามารถมาในราคาที่ต่ํากว่ามาก นี่จะสร้างแรงกดดันมหาศาลต่อโมเดลราคาของ OpenAI, Google และ Anthropic ในตลาดโลก ความเฉพาะทางอาจชนะความทั่วไป: กลยุทธ์ของ Huawei กับ Pangu เป็นสิ่งที่ธุรกิจควรศึกษาอย่างยิ่ง สําหรับภาคอุตสาหกรรม โมเดลที่พยากรณ์อากาศได้แม่นยํา 100% หรือตรวจจับความผิดพลาดในโรงงานได้ มีมูลค่าสูงกว่าแชทบอทที่เขียนกลอนได้ สมรภูมิที่แท้จริงคือ "ฮาร์ดแวร์": อนาคตของ AI จีนทั้งหมด ขึ้นอยู่กับการต่อสู้กับการคว่ําบาตรชิป หากระบบนิเวศ Ascend ของ Huawei ประสบความสําเร็จในการพึ่งพาตนเอง จีนจะกลายเป็นคู่แข่งที่ไร้จุดอ่อนด้านอุปทาน แต่หากล้มเหลว พวกเขาอาจชนเพดานทางเทคโนโลยี เงาของการเซ็นเซอร์: นี่คือความเสี่ยงที่ยังคงอยู่ การ "ดัดทอน" ไม่เพียงจํากัดความน่าเชื่อถือในตลาดโลก แต่ยังอาจเป็นข้อจํากัดที่มองไม่เห็นต่อความสามารถในการให้เหตุผลเชิงวิพากษ์ขั้นสูง ซึ่งเป็นสิ่งจําเป็นสําหรับ AI ในอนาคต กลยุทธ์ "มือและเท้า" คือเกมเปลี่ยนโลก: นี่คือภัยคุกคามเชิงกลยุทธ์ที่ใหญ่ที่สุดสําหรับโลกตะวันตก จีนไม่ได้แค่สร้าง AI แต่กําลังสร้าง "เศรษฐกิจที่ขับเคลื่อนด้วย AI" ในระยะยาว ประเทศที่ประสบความสําเร็จในการฝัง AI เข้าไปในโครงสร้างเศรษฐกิจและอุตสาหกรรม อาจเป็นผู้ชนะที่แท้จริง ไม่ใช่ประเทศที่ชนะแค่การแข่งขันบนตารางคะแนนเบนช์มาร์ก
|
| |
| | |
| แหล่งข้อมูลอ้างอิง | |
|