Alibaba Cloud เพิ่ม LLM เพื่อรองรับชุมชนโอเพ่นซอร์ส

ทั้งหมด Alibaba Group อีคอมเมิร์ซ เทคโนโลยี โลจิสติกส์ ความยั่งยืน ไลฟ์สไตล์

Alibaba Cloud เพิ่ม LLM เพื่อรองรับชุมชนโอเพ่นซอร์ส

Zhou Jingren ซีทีโอของ Alibaba Cloud ได้ประกาศโครงการริเริ่มโอเพ่นซอร์สในงานแถลงข่าว เครดิตภาพ: อาลีบาบา คลาวด์

เทคโนโลยีเกิดใหม่|เผยแพร่เมื่อ 05 ธันวาคม 2023

อาลีบาบาคลาวด์โอเพ่นซอร์สรุ่นพารามิเตอร์ 72 พันล้านและ 1.8 พันล้านของรุ่นรากฐาน Tongyi Qianwen
ดาวน์โหลด LLM แบบโอเพ่นซอร์สรวม +1.5 ล้านครั้งบน ModelScope, Hugging Face ตั้งแต่เดือนสิงหาคม

Alibaba Cloud กล่าวเมื่อวันจันทร์ว่าได้สร้างโมเดลภาษาขนาดใหญ่สองโมเดล และโมเดลที่เข้าใจเสียงที่พร้อมใช้งานอย่างอิสระ เนื่องจากดูเหมือนว่าจะสร้างคลาวด์ที่เปิดกว้างที่สุดในยุค AI

บริษัทคลาวด์คอมพิวติ้งกำลังเปิดให้เข้าถึงเวอร์ชันพื้นฐานที่เป็นเอกสิทธิ์ของบริษัท Tongyi Qianwen รุ่นที่มีพารามิเตอร์ 72 พันล้านพารามิเตอร์และ1.8 พันล้านพารามิเตอร์

นอกจากนี้ ยังทำให้ LLM หลายรูปแบบใช้งานได้ฟรีมากขึ้น ซึ่งรวมถึงQwen-AudioและQwen-Audio-Chatซึ่งเป็นโมเดลการทำความเข้าใจเสียงที่ได้รับการฝึกอบรมล่วงหน้า และเวอร์ชันที่ได้รับการปรับแต่งการสนทนาเพื่อวัตถุประสงค์ในการวิจัยและเชิงพาณิชย์

โครงการริเริ่มนี้ช่วยให้ธุรกิจทุกขนาดสามารถใช้ประโยชน์จาก LLM เพื่อสร้างโซลูชันที่ปรับให้เหมาะสม ณ ขณะนี้ Alibaba Cloud ได้สนับสนุน LLM ด้วยพารามิเตอร์ตั้งแต่ 1.8 พันล้าน, 7 พันล้าน, 14 พันล้านถึง 72 พันล้าน รวมถึง LLM หลายรูปแบบที่มีความเข้าใจด้านภาพ และเสียง

“การสร้างระบบนิเวศแบบโอเพ่นซอร์สถือเป็นสิ่งสำคัญในการส่งเสริมการพัฒนา LLM และการสร้างแอปพลิเคชัน AI เราปรารถนาที่จะกลายเป็นคลาวด์ที่เปิดกว้างที่สุด และทำให้ทุกคนสามารถเข้าถึงความสามารถด้าน AI เชิงสร้างสรรค์ได้” โจว จิงเหริน ซีทีโอของ Alibaba Cloud กล่าว

ครอบครัวของ LLM

โดยทั่วไปการปรับขนาดโมเดลภาษาขนาดใหญ่ที่ได้รับการฝึกอบรมล่วงหน้าจะนำไปสู่ประสิทธิภาพที่สูงขึ้น แต่การฝึกอบรมและการรันโมเดลขนาดใหญ่นั้นต้องใช้ทรัพยากรในการคำนวณที่มากขึ้น

ด้วยเหตุนี้ Alibaba Cloud จึงได้โอเพ่นซอร์ส LLM พารามิเตอร์ 1.8 พันล้าน Qwen-1.8B ซึ่งได้รับการปรับให้เหมาะกับอุปกรณ์ขนาดเล็ก และเสนอตัวเลือกที่คุ้มค่ามากขึ้นสำหรับการวิจัย เนื่องจากต้องใช้พลังการประมวลผลน้อยกว่า จึงสามารถทำงานได้บนโทรศัพท์มือถือที่มีทรัพยากรในการคำนวณและหน่วยความจำน้อยกว่าเซิร์ฟเวอร์คลาวด์อย่างมาก นอกจากนี้ยังหมายความว่าแอปพลิเคชันที่ขับเคลื่อนด้วย LLM ยังคงสามารถทำงานได้โดยมีการเชื่อมต่อเครือข่ายที่จำกัดหรือไม่มีเลย

ขณะเดียวกัน Alibaba Cloud กล่าวว่า Qwen-72B ซึ่งมีพารามิเตอร์ 7.2 หมื่นล้านพารามิเตอร์ มีประสิทธิภาพเหนือกว่าโมเดลโอเพ่นซอร์สหลักๆ อื่นๆ เทียบกับเกณฑ์มาตรฐาน 10 รายการ รวมถึงเกณฑ์มาตรฐาน Massive Multi-task Language Undering ที่วัดความแม่นยำของมัลติทาสก์ของโมเดล HumanEval ที่ทดสอบการสร้างโค้ด ความสามารถและ GSM8K ซึ่งเป็นมาตรฐานในการแก้ปัญหาทางคณิตศาสตร์

โมเดลนี้ยังมีประสิทธิภาพเหนือกว่าเมื่อเล่นตามบทบาทและในการถ่ายโอนรูปแบบภาษา ซึ่งเป็นหัวใจสำคัญของการสร้างแชทบอทส่วนบุคคล

Qwen-72B มีประสิทธิภาพเหนือกว่ารุ่นโอเพ่นซอร์สหลักอื่นๆ ในเกณฑ์มาตรฐานหลัก 10 ประการ เครดิตภาพ: อาลีบาบา คลาวด์

ผลักดันหลายรูปแบบ

นอกจากนี้ Alibaba Cloud ยังมีความก้าวหน้าในการบูรณาการความหลากหลายรูปแบบเข้ากับ LLM ของตน นั่นคือความสามารถในการประมวลผลข้อมูลอื่นที่ไม่ใช่ข้อความลงใน LLM

มีโอเพ่นซอร์สโมเดล Qwen-Audio และ Qwen-Audio-Chat เพื่อการวิจัยและเชิงพาณิชย์

Qwen-Audio สามารถเข้าใจข้อความและเสียง รวมถึงคำพูดของมนุษย์ เสียงที่เป็นธรรมชาติ และดนตรี สามารถประมวลผลเสียงได้มากกว่า 30 งาน เช่น การถอดเสียงหลายภาษา การแก้ไขคำพูด และการวิเคราะห์คำบรรยายเสียง เวอร์ชันที่ได้รับการปรับแต่งการสนทนาอย่างละเอียดสามารถตรวจจับอารมณ์และน้ำเสียงในคำพูดของมนุษย์ได้

การผลักดันต่อเนื่องหลายรูปแบบต่อยอดมาจากความคิดริเริ่มก่อนหน้าของ Alibaba Cloud ในการใช้ โมเดล ภาษาวิสัยทัศน์ขนาดใหญ่ Qwen-VL แบบโอเพ่นซอร์ส และเวอร์ชันแชท Qwen-VL-Chat ที่สามารถเข้าใจข้อมูลภาพและดำเนินงานด้านภาพได้

โมเดล LLM แบบโอเพ่นซอร์ส ซึ่งรวมถึง Qwen-7B, Qwen-14B และ Qwen-VL รวมถึงเวอร์ชันที่ได้รับการปรับแต่งการสนทนา ได้รับการดาวน์โหลดรวมแล้วมากกว่า 1.5 ล้านครั้งบนชุมชนโมเดล AI แบบโอเพ่นซอร์สของ Alibaba Cloud ModelScope และ Hugging Face ตั้งแต่เดือนสิงหาคม ตามข้อมูลล่าสุดจาก Alibaba Cloud

คุณอาจชอบเนื้อหานี้

เทคโนโลยี

เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ

SHOPPING MALL

เนื้อหายอดนิยม

กีฬาและความบันเทิง