Qwen2 ของ Alibaba Cloud พร้อมความสามารถที่ได้รับการปรับปรุง ติดอันดับ LLM Leaderboard

ทั้งหมด Alibaba Group อีคอมเมิร์ซ เทคโนโลยี โลจิสติกส์ ความยั่งยืน ไลฟ์สไตล์

Qwen2 ของ Alibaba Cloud พร้อมความสามารถที่ได้รับการปรับปรุง ติดอันดับ LLM Leaderboard

เครดิตภาพ: Shutterstock

เทคโนโลยีเกิดใหม่|เผยแพร่เมื่อ 08 มิถุนายน 2024

ซีรีส์ Qwen 2 มีประสิทธิภาพเหนือกว่ารุ่นโอเพ่นซอร์สชั้นนำอื่นๆ ในการวัดประสิทธิภาพ 15 รายการ
มี 29 ภาษา ตั้งแต่ภาษาอิตาลีไปจนถึงภาษาอาหรับ รวมอยู่ในการฝึกอบรม Qwen2 ของ Alibaba Cloud

ซีรีส์โมเดลภาษาล่าสุดจาก Alibaba Cloud ติดอันดับสูงสุดสำหรับ LLM แบบโอเพ่นซอร์สหลังจากเปิดตัวเมื่อวันศุกร์ไม่นาน ต้องขอบคุณประสิทธิภาพที่เพิ่มขึ้นและการจัดแนวความปลอดภัยที่ดีขึ้น

ซีรีส์โมเดล Qwen2 ประกอบด้วยโมเดลภาษาพื้นฐานจำนวนหนึ่งและโมเดลภาษาที่ปรับแต่งตามคำสั่งด้วยขนาดตั้งแต่ 0.5 ถึง 72 พันล้านพารามิเตอร์ รวมถึงโมเดล Mixture-of-Experts (MoE)

ความสามารถที่ได้รับการปรับปรุงทำให้ติดอันดับหนึ่งใน Open LLM Leaderboard จากแพลตฟอร์มปัญญาประดิษฐ์ที่ทำงานร่วมกัน Hugging Face ซึ่งเปิดให้ใช้งานเพื่อวัตถุประสงค์ทางการค้าหรือการวิจัย

“เราหวังว่าจะสร้างคลาวด์แบบเปิดที่สุดในยุค AI ทำให้พลังการประมวลผลครอบคลุมมากขึ้นและเข้าถึง AI ได้มากขึ้น” โจว จิงเหริน ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ Alibaba Cloud กล่าว

นอกจากนี้ โมเดล Qwen2 ยังมีอยู่ในModelScope ชุมชนโมเดล AI ของ Alibaba Cloud

รุ่น Qwen2-72B มีประสิทธิภาพเหนือกว่ารุ่นโอเพ่นซอร์สชั้นนำอื่นๆ ในการวัดประสิทธิภาพ 15 รายการ เครดิตภาพ: อาลีบาบา กรุ๊ป

ประสิทธิภาพที่เพิ่มขึ้น

โมเดลขนาดใหญ่ Qwen2-72B ใช้ประโยชน์จากวิธีการฝึกอบรมที่ได้รับการปรับปรุงประสิทธิภาพของ Alibaba Cloud โดยมีประสิทธิภาพเหนือกว่าโมเดลโอเพ่นซอร์สชั้นนำอื่นๆ ในเกณฑ์มาตรฐาน 15 รายการ รวมถึงความเข้าใจภาษา การสร้างภาษา ความสามารถหลายภาษา การเขียนโค้ด คณิตศาสตร์ และการใช้เหตุผล

นอกจากนี้ Qwen2-72B ยังแสดงความสามารถที่น่าประทับใจในการจัดการความยาวบริบทได้สูงสุดถึง 128K โทเค็น ซึ่งเป็นจำนวนโทเค็นสูงสุดที่โมเดลสามารถจดจำได้เมื่อสร้างข้อความ

เพื่อส่งเสริมความสามารถด้านหลายภาษา จึงได้รวม 27 ภาษา นอกเหนือจากภาษาจีนและอังกฤษ ไว้ในการฝึกอบรม Qwen 2 มีตั้งแต่ภาษาเยอรมันและภาษาอิตาลี ไปจนถึงภาษาอาหรับ เปอร์เซีย และฮีบรู

นอกจากนี้ โมเดล Qwen2 ยังมีความเร็วที่เพิ่มขึ้นในขณะที่ใช้หน่วยความจำน้อยลงในการอนุมานโมเดล เนื่องมาจากเทคนิคที่เรียกว่า Group Query Attention ซึ่งปรับสมดุลระหว่างประสิทธิภาพการคำนวณและประสิทธิภาพของโมเดลให้เหมาะสม

เอไอที่มีความรับผิดชอบ

นอกจากจะเชี่ยวชาญด้านคณิตศาสตร์และภาษาศาสตร์แล้ว ผลลัพธ์ของโมเดล Qwen2 ยังแสดงให้เห็นถึงความสอดคล้องกับคุณค่าของมนุษย์อีกด้วย

ประสิทธิภาพการเปรียบเทียบบนเกณฑ์มาตรฐาน เช่น MT-bench ซึ่งเป็นชุดคำถามแบบหลายรอบที่ประเมินความสามารถในการสนทนาแบบหลายรอบและความสามารถในการติดตามคำสั่งของแชทบอท แสดงให้เห็นว่า Qwen2 ทำคะแนนได้สูงในองค์ประกอบที่สำคัญสองประการนี้ในด้านความชอบของมนุษย์

แบบจำลองดังกล่าวได้รับประสิทธิภาพที่ดีด้านความปลอดภัยและความรับผิดชอบ ด้วยการรวมความคิดเห็นของมนุษย์เพื่อให้สอดคล้องกับค่านิยมของมนุษย์มากขึ้น พวกเขาสามารถจัดการกับคำถามที่ไม่ปลอดภัยหลายภาษาที่เกี่ยวข้องกับกิจกรรมที่ผิดกฎหมาย เช่น การฉ้อโกงและการละเมิดความเป็นส่วนตัว เพื่อป้องกันการใช้โมเดลในทางที่ผิด

ในแง่ของรุ่นที่เล็กกว่า Qwen2-7B ยังโดดเด่นกว่ารุ่นล้ำสมัยอื่นๆ ที่มีขนาดใกล้เคียงกันในการวัดประสิทธิภาพ ซึ่งรวมถึงการเข้ารหัสด้วย

คุณอาจชอบเนื้อหานี้

เทคโนโลยี

เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ

SHOPPING MALL

เนื้อหายอดนิยม

เทคโนโลยี