อาลีบาบาเปิดตัว Qwen3 สร้างมาตรฐานใหม่ใน AI โอเพ่นซอร์สด้วยการใช้เหตุผลแบบไฮบริด

- ซีรีส์ Qwen3 มีรุ่นหนาแน่นหกรุ่นและรุ่น MoE สองรุ่น ซึ่งถือเป็นการเปิดตัวโมเดลการให้เหตุผลแบบไฮบริดของอาลีบาบา
- การทําซ้ํา Qwen ล่าสุดบรรลุการให้เหตุผลที่ยอดเยี่ยมการติดตามคําแนะนําการใช้เครื่องมือและประสิทธิภาพหลายภาษาซึ่งยอดเยี่ยมในเกณฑ์มาตรฐานอุตสาหกรรม
ทความนี้ได้รับการอัปเดตเพื่อรวมกระดานผู้นําล่าสุดของ LiveBench ในวันที่ 6 พฤษภาคม
อาลีบาบาได้เปิดตัว Qwen3 ซึ่งเป็นรุ่นล่าสุดของตระกูลโมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพ่นซอร์ส ซึ่งกําหนดมาตรฐานใหม่สําหรับนวัตกรรม AI
ซีรีส์ Qwen3 มีรุ่นหนาแน่นหกรุ่นและรุ่น Mixture-of-Experts (MoE) สองรุ่น ทําให้นักพัฒนามีความยืดหยุ่นในการสร้างแอปพลิเคชันรุ่นต่อไปในอุปกรณ์พกพา แว่นตาอัจฉริยะ ยานยนต์ไร้คนขับ หุ่นยนต์ และอื่นๆ
Qwen3 ทุกรุ่น – รวมถึงรุ่นหนาแน่น (พารามิเตอร์ 0.6B, 1.7B, 4B, 8B, 14B และ 32B) และรุ่น MoE (30B ที่ใช้งาน 3B และ 235B พร้อม 22B ที่ใช้งานอยู่) – เป็นโอเพ่นซอร์สและพร้อมใช้งานทั่วโลก
ตามลีดเดอร์บอร์ดล่าสุดของ LiveBench ซึ่งเป็นเกณฑ์มาตรฐาน LLM ที่ให้ข้อมูลทดสอบที่ปราศจากการปนเปื้อน Qwen3-235B-A22B ได้รับการจัดอันดับให้เป็นโมเดลภาษาขนาดใหญ่โอเพ่นซอร์สอันดับต้น ๆ โดยได้อันดับที่ 7 โดยรวมและได้คะแนนสูงสุดในการติดตามการเรียนการสอน

การใช้เหตุผลแบบไฮบริดที่ผสมผสานโหมดการคิดและไม่คิด
Qwen3 ถือเป็นการเปิดตัวโมเดลการให้เหตุผลแบบไฮบริดของอาลีบาบา โดยผสมผสานความสามารถของ LLM แบบดั้งเดิมเข้ากับการให้เหตุผลขั้นสูงแบบไดนามิก โมเดล Qwen3 สามารถสลับระหว่างโหมดการคิดสําหรับงานที่ซับซ้อนและมีหลายขั้นตอน เช่น คณิตศาสตร์ การเข้ารหัส และการหักเชิงตรรกะ และโหมดไม่คิดเพื่อการตอบสนองที่รวดเร็วและวัตถุประสงค์ทั่วไป
สําหรับนักพัฒนาที่เข้าถึง Qwen3 ผ่าน API โมเดลนี้ให้การควบคุมระยะเวลาการคิดอย่างละเอียด (สูงสุด 38,000 โทเค็น) ทําให้สามารถสร้างสมดุลที่เหมาะสมที่สุดระหว่างประสิทธิภาพอัจฉริยะและประสิทธิภาพการประมวลผล โดยเฉพาะอย่างยิ่ง รุ่น Qwen3-235B-A22B MoE ช่วยลดต้นทุนการปรับใช้ลงอย่างมากเมื่อเทียบกับรุ่นที่ล้ําสมัยอื่นๆ ซึ่งตอกย้ําความมุ่งมั่นของอาลีบาบาต่อ AI ที่เข้าถึงได้และมีประสิทธิภาพสูง
ความก้าวหน้าในทักษะหลายภาษาความสามารถของตัวแทนการใช้เหตุผลและการจัดตําแหน่งของมนุษย์
ได้รับการฝึกอบรมจากชุดข้อมูลขนาดใหญ่ 36 ล้านล้านโทเค็น ซึ่งเป็นสองเท่าของ Qwen2.5 รุ่นก่อน Qwen3 มอบความก้าวหน้าที่สําคัญในด้านการใช้เหตุผล การติดตามคําแนะนํา การใช้เครื่องมือ และงานหลายภาษา
ความสามารถที่สําคัญ ได้แก่ :
- ความเชี่ยวชาญหลายภาษา: รองรับ 119 ภาษาและภาษาถิ่น พร้อมประสิทธิภาพชั้นนําในการแปลและการติดตามการเรียนการสอนหลายภาษา
- การรวมตัวแทนขั้นสูง: รองรับ Model Context Protocol (MCP) และการเรียกใช้ฟังก์ชันที่มีประสิทธิภาพ ซึ่งเป็นโมเดลโอเพ่นซอร์สชั้นนําในงานที่ใช้ตัวแทนที่ซับซ้อน
- การใช้เหตุผลที่เหนือกว่า: เหนือกว่าโมเดล Qwen ก่อนหน้า (QwQ ในโหมดการคิดและ Qwen2.5 ในโหมดไม่คิด) ในด้านคณิตศาสตร์ การเข้ารหัส และเกณฑ์มาตรฐานการให้เหตุผลเชิงตรรกะ
- ปรับปรุงการจัดตําแหน่งของมนุษย์: มอบประสบการณ์การเขียนเชิงสร้างสรรค์ การสวมบทบาท และบทสนทนาแบบหลายรอบที่เป็นธรรมชาติมากขึ้นเพื่อการสนทนาที่เป็นธรรมชาติและมีส่วนร่วมมากขึ้น

ด้วยความก้าวหน้าในสถาปัตยกรรมแบบจําลอง การเพิ่มข้อมูลการฝึกอบรม และวิธีการฝึกอบรมที่มีประสิทธิภาพมากขึ้น โมเดล Qwen3 จึงบรรลุผลลัพธ์ระดับบนสุดในเกณฑ์มาตรฐานอุตสาหกรรม เช่น AIME25 (การให้เหตุผลทางคณิตศาสตร์), LiveCodeBench (ความเชี่ยวชาญในการเขียนโค้ด), BFCL (ความสามารถในการเรียกใช้เครื่องมือและฟังก์ชัน) และ Arena-Hard (เกณฑ์มาตรฐานสําหรับ LLM ที่ปรับแต่งคําสั่ง) นอกจากนี้ ในการพัฒนาแบบจําลองการใช้เหตุผลแบบไฮบริด ได้มีการใช้กระบวนการฝึกอบรมสี่ขั้นตอน ซึ่งรวมถึงการสตาร์ทเย็นแบบห่วงโซ่ความคิด (CoT) แบบยาว การเรียนรู้แบบเสริมแรงตามการใช้เหตุผล (RL) การหลอมรวมโหมดการคิด และ RL ทั่วไป
การเข้าถึงแบบเปิดเพื่อขับเคลื่อนนวัตกรรม
โมเดล Qwen3 สามารถดาวน์โหลดได้ฟรีบน Hugging Face, GitHub และ ModelScope และสามารถสํารวจได้บน chat.qwen.ai การเข้าถึง API จะพร้อมใช้งานในไม่ช้าผ่าน Model Studio แพลตฟอร์มการพัฒนาโมเดล AI ของอาลีบาบา Qwen3 ยังขับเคลื่อนแอปพลิเคชั่นผู้ช่วยสุดยอด AI เรือธงของอาลีบาบา Quark
นับตั้งแต่เปิดตัว ตระกูลโมเดล Qwen ได้ดึงดูดการดาวน์โหลดมากกว่า 300 ล้านครั้งทั่วโลก นักพัฒนาได้สร้างโมเดลอนุพันธ์ที่ใช้ Qwen มากกว่า 100,000 รายการบน Hugging Face ทําให้ Qwen เป็นหนึ่งในซีรีส์โมเดล AI โอเพ่นซอร์สที่นํามาใช้กันอย่างแพร่หลายมากที่สุดในโลก
แบ่งปัน
คุณอาจชอบเนื้อหานี้
เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ
เนื้อหายอดนิยม
อาลีบาบาเปิดตัว Qwen3 สร้างมาตรฐานใหม่ใน AI โอเพ่นซอร์สด้วยการใช้เหตุผลแบบไฮบริด

- ซีรีส์ Qwen3 มีรุ่นหนาแน่นหกรุ่นและรุ่น MoE สองรุ่น ซึ่งถือเป็นการเปิดตัวโมเดลการให้เหตุผลแบบไฮบริดของอาลีบาบา
- การทําซ้ํา Qwen ล่าสุดบรรลุการให้เหตุผลที่ยอดเยี่ยมการติดตามคําแนะนําการใช้เครื่องมือและประสิทธิภาพหลายภาษาซึ่งยอดเยี่ยมในเกณฑ์มาตรฐานอุตสาหกรรม
ทความนี้ได้รับการอัปเดตเพื่อรวมกระดานผู้นําล่าสุดของ LiveBench ในวันที่ 6 พฤษภาคม
อาลีบาบาได้เปิดตัว Qwen3 ซึ่งเป็นรุ่นล่าสุดของตระกูลโมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพ่นซอร์ส ซึ่งกําหนดมาตรฐานใหม่สําหรับนวัตกรรม AI
ซีรีส์ Qwen3 มีรุ่นหนาแน่นหกรุ่นและรุ่น Mixture-of-Experts (MoE) สองรุ่น ทําให้นักพัฒนามีความยืดหยุ่นในการสร้างแอปพลิเคชันรุ่นต่อไปในอุปกรณ์พกพา แว่นตาอัจฉริยะ ยานยนต์ไร้คนขับ หุ่นยนต์ และอื่นๆ
Qwen3 ทุกรุ่น – รวมถึงรุ่นหนาแน่น (พารามิเตอร์ 0.6B, 1.7B, 4B, 8B, 14B และ 32B) และรุ่น MoE (30B ที่ใช้งาน 3B และ 235B พร้อม 22B ที่ใช้งานอยู่) – เป็นโอเพ่นซอร์สและพร้อมใช้งานทั่วโลก
ตามลีดเดอร์บอร์ดล่าสุดของ LiveBench ซึ่งเป็นเกณฑ์มาตรฐาน LLM ที่ให้ข้อมูลทดสอบที่ปราศจากการปนเปื้อน Qwen3-235B-A22B ได้รับการจัดอันดับให้เป็นโมเดลภาษาขนาดใหญ่โอเพ่นซอร์สอันดับต้น ๆ โดยได้อันดับที่ 7 โดยรวมและได้คะแนนสูงสุดในการติดตามการเรียนการสอน

การใช้เหตุผลแบบไฮบริดที่ผสมผสานโหมดการคิดและไม่คิด
Qwen3 ถือเป็นการเปิดตัวโมเดลการให้เหตุผลแบบไฮบริดของอาลีบาบา โดยผสมผสานความสามารถของ LLM แบบดั้งเดิมเข้ากับการให้เหตุผลขั้นสูงแบบไดนามิก โมเดล Qwen3 สามารถสลับระหว่างโหมดการคิดสําหรับงานที่ซับซ้อนและมีหลายขั้นตอน เช่น คณิตศาสตร์ การเข้ารหัส และการหักเชิงตรรกะ และโหมดไม่คิดเพื่อการตอบสนองที่รวดเร็วและวัตถุประสงค์ทั่วไป
สําหรับนักพัฒนาที่เข้าถึง Qwen3 ผ่าน API โมเดลนี้ให้การควบคุมระยะเวลาการคิดอย่างละเอียด (สูงสุด 38,000 โทเค็น) ทําให้สามารถสร้างสมดุลที่เหมาะสมที่สุดระหว่างประสิทธิภาพอัจฉริยะและประสิทธิภาพการประมวลผล โดยเฉพาะอย่างยิ่ง รุ่น Qwen3-235B-A22B MoE ช่วยลดต้นทุนการปรับใช้ลงอย่างมากเมื่อเทียบกับรุ่นที่ล้ําสมัยอื่นๆ ซึ่งตอกย้ําความมุ่งมั่นของอาลีบาบาต่อ AI ที่เข้าถึงได้และมีประสิทธิภาพสูง
ความก้าวหน้าในทักษะหลายภาษาความสามารถของตัวแทนการใช้เหตุผลและการจัดตําแหน่งของมนุษย์
ได้รับการฝึกอบรมจากชุดข้อมูลขนาดใหญ่ 36 ล้านล้านโทเค็น ซึ่งเป็นสองเท่าของ Qwen2.5 รุ่นก่อน Qwen3 มอบความก้าวหน้าที่สําคัญในด้านการใช้เหตุผล การติดตามคําแนะนํา การใช้เครื่องมือ และงานหลายภาษา
ความสามารถที่สําคัญ ได้แก่ :
- ความเชี่ยวชาญหลายภาษา: รองรับ 119 ภาษาและภาษาถิ่น พร้อมประสิทธิภาพชั้นนําในการแปลและการติดตามการเรียนการสอนหลายภาษา
- การรวมตัวแทนขั้นสูง: รองรับ Model Context Protocol (MCP) และการเรียกใช้ฟังก์ชันที่มีประสิทธิภาพ ซึ่งเป็นโมเดลโอเพ่นซอร์สชั้นนําในงานที่ใช้ตัวแทนที่ซับซ้อน
- การใช้เหตุผลที่เหนือกว่า: เหนือกว่าโมเดล Qwen ก่อนหน้า (QwQ ในโหมดการคิดและ Qwen2.5 ในโหมดไม่คิด) ในด้านคณิตศาสตร์ การเข้ารหัส และเกณฑ์มาตรฐานการให้เหตุผลเชิงตรรกะ
- ปรับปรุงการจัดตําแหน่งของมนุษย์: มอบประสบการณ์การเขียนเชิงสร้างสรรค์ การสวมบทบาท และบทสนทนาแบบหลายรอบที่เป็นธรรมชาติมากขึ้นเพื่อการสนทนาที่เป็นธรรมชาติและมีส่วนร่วมมากขึ้น

ด้วยความก้าวหน้าในสถาปัตยกรรมแบบจําลอง การเพิ่มข้อมูลการฝึกอบรม และวิธีการฝึกอบรมที่มีประสิทธิภาพมากขึ้น โมเดล Qwen3 จึงบรรลุผลลัพธ์ระดับบนสุดในเกณฑ์มาตรฐานอุตสาหกรรม เช่น AIME25 (การให้เหตุผลทางคณิตศาสตร์), LiveCodeBench (ความเชี่ยวชาญในการเขียนโค้ด), BFCL (ความสามารถในการเรียกใช้เครื่องมือและฟังก์ชัน) และ Arena-Hard (เกณฑ์มาตรฐานสําหรับ LLM ที่ปรับแต่งคําสั่ง) นอกจากนี้ ในการพัฒนาแบบจําลองการใช้เหตุผลแบบไฮบริด ได้มีการใช้กระบวนการฝึกอบรมสี่ขั้นตอน ซึ่งรวมถึงการสตาร์ทเย็นแบบห่วงโซ่ความคิด (CoT) แบบยาว การเรียนรู้แบบเสริมแรงตามการใช้เหตุผล (RL) การหลอมรวมโหมดการคิด และ RL ทั่วไป
การเข้าถึงแบบเปิดเพื่อขับเคลื่อนนวัตกรรม
โมเดล Qwen3 สามารถดาวน์โหลดได้ฟรีบน Hugging Face, GitHub และ ModelScope และสามารถสํารวจได้บน chat.qwen.ai การเข้าถึง API จะพร้อมใช้งานในไม่ช้าผ่าน Model Studio แพลตฟอร์มการพัฒนาโมเดล AI ของอาลีบาบา Qwen3 ยังขับเคลื่อนแอปพลิเคชั่นผู้ช่วยสุดยอด AI เรือธงของอาลีบาบา Quark
นับตั้งแต่เปิดตัว ตระกูลโมเดล Qwen ได้ดึงดูดการดาวน์โหลดมากกว่า 300 ล้านครั้งทั่วโลก นักพัฒนาได้สร้างโมเดลอนุพันธ์ที่ใช้ Qwen มากกว่า 100,000 รายการบน Hugging Face ทําให้ Qwen เป็นหนึ่งในซีรีส์โมเดล AI โอเพ่นซอร์สที่นํามาใช้กันอย่างแพร่หลายมากที่สุดในโลก











