- Home
- เทคโนโลยี
- เทคโนโลยีเกิดใหม่
- Qwen2 ของ Alibaba Cloud พร้อมความสามารถที่ได้รับการปรับปรุง ติดอันดับ LLM Leaderboard
Qwen2 ของ Alibaba Cloud พร้อมความสามารถที่ได้รับการปรับปรุง ติดอันดับ LLM Leaderboard

- ซีรีส์ Qwen 2 มีประสิทธิภาพเหนือกว่ารุ่นโอเพ่นซอร์สชั้นนำอื่นๆ ในการวัดประสิทธิภาพ 15 รายการ
- มี 29 ภาษา ตั้งแต่ภาษาอิตาลีไปจนถึงภาษาอาหรับ รวมอยู่ในการฝึกอบรม Qwen2 ของ Alibaba Cloud
ซีรีส์โมเดลภาษาล่าสุดจาก Alibaba Cloud ติดอันดับสูงสุดสำหรับ LLM แบบโอเพ่นซอร์สหลังจากเปิดตัวเมื่อวันศุกร์ไม่นาน ต้องขอบคุณประสิทธิภาพที่เพิ่มขึ้นและการจัดแนวความปลอดภัยที่ดีขึ้น
ซีรีส์โมเดล Qwen2 ประกอบด้วยโมเดลภาษาพื้นฐานจำนวนหนึ่งและโมเดลภาษาที่ปรับแต่งตามคำสั่งด้วยขนาดตั้งแต่ 0.5 ถึง 72 พันล้านพารามิเตอร์ รวมถึงโมเดล Mixture-of-Experts (MoE)
ความสามารถที่ได้รับการปรับปรุงทำให้ติดอันดับหนึ่งใน Open LLM Leaderboard จากแพลตฟอร์มปัญญาประดิษฐ์ที่ทำงานร่วมกัน Hugging Face ซึ่งเปิดให้ใช้งานเพื่อวัตถุประสงค์ทางการค้าหรือการวิจัย
“เราหวังว่าจะสร้างคลาวด์แบบเปิดที่สุดในยุค AI ทำให้พลังการประมวลผลครอบคลุมมากขึ้นและเข้าถึง AI ได้มากขึ้น” โจว จิงเหริน ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ Alibaba Cloud กล่าว
นอกจากนี้ โมเดล Qwen2 ยังมีอยู่ในModelScope ชุมชนโมเดล AI ของ Alibaba Cloud

ประสิทธิภาพที่เพิ่มขึ้น
โมเดลขนาดใหญ่ Qwen2-72B ใช้ประโยชน์จากวิธีการฝึกอบรมที่ได้รับการปรับปรุงประสิทธิภาพของ Alibaba Cloud โดยมีประสิทธิภาพเหนือกว่าโมเดลโอเพ่นซอร์สชั้นนำอื่นๆ ในเกณฑ์มาตรฐาน 15 รายการ รวมถึงความเข้าใจภาษา การสร้างภาษา ความสามารถหลายภาษา การเขียนโค้ด คณิตศาสตร์ และการใช้เหตุผล
นอกจากนี้ Qwen2-72B ยังแสดงความสามารถที่น่าประทับใจในการจัดการความยาวบริบทได้สูงสุดถึง 128K โทเค็น ซึ่งเป็นจำนวนโทเค็นสูงสุดที่โมเดลสามารถจดจำได้เมื่อสร้างข้อความ
เพื่อส่งเสริมความสามารถด้านหลายภาษา จึงได้รวม 27 ภาษา นอกเหนือจากภาษาจีนและอังกฤษ ไว้ในการฝึกอบรม Qwen 2 มีตั้งแต่ภาษาเยอรมันและภาษาอิตาลี ไปจนถึงภาษาอาหรับ เปอร์เซีย และฮีบรู
นอกจากนี้ โมเดล Qwen2 ยังมีความเร็วที่เพิ่มขึ้นในขณะที่ใช้หน่วยความจำน้อยลงในการอนุมานโมเดล เนื่องมาจากเทคนิคที่เรียกว่า Group Query Attention ซึ่งปรับสมดุลระหว่างประสิทธิภาพการคำนวณและประสิทธิภาพของโมเดลให้เหมาะสม
เอไอที่มีความรับผิดชอบ
นอกจากจะเชี่ยวชาญด้านคณิตศาสตร์และภาษาศาสตร์แล้ว ผลลัพธ์ของโมเดล Qwen2 ยังแสดงให้เห็นถึงความสอดคล้องกับคุณค่าของมนุษย์อีกด้วย
ประสิทธิภาพการเปรียบเทียบบนเกณฑ์มาตรฐาน เช่น MT-bench ซึ่งเป็นชุดคำถามแบบหลายรอบที่ประเมินความสามารถในการสนทนาแบบหลายรอบและความสามารถในการติดตามคำสั่งของแชทบอท แสดงให้เห็นว่า Qwen2 ทำคะแนนได้สูงในองค์ประกอบที่สำคัญสองประการนี้ในด้านความชอบของมนุษย์
แบบจำลองดังกล่าวได้รับประสิทธิภาพที่ดีด้านความปลอดภัยและความรับผิดชอบ ด้วยการรวมความคิดเห็นของมนุษย์เพื่อให้สอดคล้องกับค่านิยมของมนุษย์มากขึ้น พวกเขาสามารถจัดการกับคำถามที่ไม่ปลอดภัยหลายภาษาที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมาย เช่น การฉ้อโกงและการละเมิดความเป็นส่วนตัว เพื่อป้องกันการใช้โมเดลในทางที่ผิด
ในแง่ของรุ่นที่เล็กกว่า Qwen2-7B ยังโดดเด่นกว่ารุ่นล้ำสมัยอื่นๆ ที่มีขนาดใกล้เคียงกันในการวัดประสิทธิภาพ ซึ่งรวมถึงการเข้ารหัสด้วย
แบ่งปัน
คุณอาจชอบเนื้อหานี้
เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ
เนื้อหายอดนิยม
Qwen2 ของ Alibaba Cloud พร้อมความสามารถที่ได้รับการปรับปรุง ติดอันดับ LLM Leaderboard

- ซีรีส์ Qwen 2 มีประสิทธิภาพเหนือกว่ารุ่นโอเพ่นซอร์สชั้นนำอื่นๆ ในการวัดประสิทธิภาพ 15 รายการ
- มี 29 ภาษา ตั้งแต่ภาษาอิตาลีไปจนถึงภาษาอาหรับ รวมอยู่ในการฝึกอบรม Qwen2 ของ Alibaba Cloud
ซีรีส์โมเดลภาษาล่าสุดจาก Alibaba Cloud ติดอันดับสูงสุดสำหรับ LLM แบบโอเพ่นซอร์สหลังจากเปิดตัวเมื่อวันศุกร์ไม่นาน ต้องขอบคุณประสิทธิภาพที่เพิ่มขึ้นและการจัดแนวความปลอดภัยที่ดีขึ้น
ซีรีส์โมเดล Qwen2 ประกอบด้วยโมเดลภาษาพื้นฐานจำนวนหนึ่งและโมเดลภาษาที่ปรับแต่งตามคำสั่งด้วยขนาดตั้งแต่ 0.5 ถึง 72 พันล้านพารามิเตอร์ รวมถึงโมเดล Mixture-of-Experts (MoE)
ความสามารถที่ได้รับการปรับปรุงทำให้ติดอันดับหนึ่งใน Open LLM Leaderboard จากแพลตฟอร์มปัญญาประดิษฐ์ที่ทำงานร่วมกัน Hugging Face ซึ่งเปิดให้ใช้งานเพื่อวัตถุประสงค์ทางการค้าหรือการวิจัย
“เราหวังว่าจะสร้างคลาวด์แบบเปิดที่สุดในยุค AI ทำให้พลังการประมวลผลครอบคลุมมากขึ้นและเข้าถึง AI ได้มากขึ้น” โจว จิงเหริน ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ Alibaba Cloud กล่าว
นอกจากนี้ โมเดล Qwen2 ยังมีอยู่ในModelScope ชุมชนโมเดล AI ของ Alibaba Cloud

ประสิทธิภาพที่เพิ่มขึ้น
โมเดลขนาดใหญ่ Qwen2-72B ใช้ประโยชน์จากวิธีการฝึกอบรมที่ได้รับการปรับปรุงประสิทธิภาพของ Alibaba Cloud โดยมีประสิทธิภาพเหนือกว่าโมเดลโอเพ่นซอร์สชั้นนำอื่นๆ ในเกณฑ์มาตรฐาน 15 รายการ รวมถึงความเข้าใจภาษา การสร้างภาษา ความสามารถหลายภาษา การเขียนโค้ด คณิตศาสตร์ และการใช้เหตุผล
นอกจากนี้ Qwen2-72B ยังแสดงความสามารถที่น่าประทับใจในการจัดการความยาวบริบทได้สูงสุดถึง 128K โทเค็น ซึ่งเป็นจำนวนโทเค็นสูงสุดที่โมเดลสามารถจดจำได้เมื่อสร้างข้อความ
เพื่อส่งเสริมความสามารถด้านหลายภาษา จึงได้รวม 27 ภาษา นอกเหนือจากภาษาจีนและอังกฤษ ไว้ในการฝึกอบรม Qwen 2 มีตั้งแต่ภาษาเยอรมันและภาษาอิตาลี ไปจนถึงภาษาอาหรับ เปอร์เซีย และฮีบรู
นอกจากนี้ โมเดล Qwen2 ยังมีความเร็วที่เพิ่มขึ้นในขณะที่ใช้หน่วยความจำน้อยลงในการอนุมานโมเดล เนื่องมาจากเทคนิคที่เรียกว่า Group Query Attention ซึ่งปรับสมดุลระหว่างประสิทธิภาพการคำนวณและประสิทธิภาพของโมเดลให้เหมาะสม
เอไอที่มีความรับผิดชอบ
นอกจากจะเชี่ยวชาญด้านคณิตศาสตร์และภาษาศาสตร์แล้ว ผลลัพธ์ของโมเดล Qwen2 ยังแสดงให้เห็นถึงความสอดคล้องกับคุณค่าของมนุษย์อีกด้วย
ประสิทธิภาพการเปรียบเทียบบนเกณฑ์มาตรฐาน เช่น MT-bench ซึ่งเป็นชุดคำถามแบบหลายรอบที่ประเมินความสามารถในการสนทนาแบบหลายรอบและความสามารถในการติดตามคำสั่งของแชทบอท แสดงให้เห็นว่า Qwen2 ทำคะแนนได้สูงในองค์ประกอบที่สำคัญสองประการนี้ในด้านความชอบของมนุษย์
แบบจำลองดังกล่าวได้รับประสิทธิภาพที่ดีด้านความปลอดภัยและความรับผิดชอบ ด้วยการรวมความคิดเห็นของมนุษย์เพื่อให้สอดคล้องกับค่านิยมของมนุษย์มากขึ้น พวกเขาสามารถจัดการกับคำถามที่ไม่ปลอดภัยหลายภาษาที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมาย เช่น การฉ้อโกงและการละเมิดความเป็นส่วนตัว เพื่อป้องกันการใช้โมเดลในทางที่ผิด
ในแง่ของรุ่นที่เล็กกว่า Qwen2-7B ยังโดดเด่นกว่ารุ่นล้ำสมัยอื่นๆ ที่มีขนาดใกล้เคียงกันในการวัดประสิทธิภาพ ซึ่งรวมถึงการเข้ารหัสด้วย












