Alibaba Cloud เพิ่ม LLM เพื่อรองรับชุมชนโอเพ่นซอร์ส – Taobao Thailand

ทั้งหมด                 Alibaba Group                 อีคอมเมิร์ซ                 เทคโนโลยี                 โลจิสติกส์            ความยั่งยืน                 ไลฟ์สไตล์


Alibaba Cloud เพิ่ม LLM เพื่อรองรับชุมชนโอเพ่นซอร์ส

Zhou Jingren ซีทีโอของ Alibaba Cloud ได้ประกาศโครงการริเริ่มโอเพ่นซอร์สในงานแถลงข่าว เครดิตภาพ: อาลีบาบา คลาวด์
เทคโนโลยีเกิดใหม่|เผยแพร่เมื่อ 05 ธันวาคม 2023

  • อาลีบาบาคลาวด์โอเพ่นซอร์สรุ่นพารามิเตอร์ 72 พันล้านและ 1.8 พันล้านของรุ่นรากฐาน Tongyi Qianwen
  • ดาวน์โหลด LLM แบบโอเพ่นซอร์สรวม +1.5 ล้านครั้งบน ModelScope, Hugging Face ตั้งแต่เดือนสิงหาคม

Alibaba Cloud กล่าวเมื่อวันจันทร์ว่าได้สร้างโมเดลภาษาขนาดใหญ่สองโมเดล และโมเดลที่เข้าใจเสียงที่พร้อมใช้งานอย่างอิสระ เนื่องจากดูเหมือนว่าจะสร้างคลาวด์ที่เปิดกว้างที่สุดในยุค AI

บริษัทคลาวด์คอมพิวติ้งกำลังเปิดให้เข้าถึงเวอร์ชันพื้นฐานที่เป็นเอกสิทธิ์ของบริษัท Tongyi Qianwen รุ่นที่มีพารามิเตอร์ 72 พันล้านพารามิเตอร์และ1.8 พันล้านพารามิเตอร์

นอกจากนี้ ยังทำให้ LLM หลายรูปแบบใช้งานได้ฟรีมากขึ้น ซึ่งรวมถึงQwen-AudioและQwen-Audio-Chatซึ่งเป็นโมเดลการทำความเข้าใจเสียงที่ได้รับการฝึกอบรมล่วงหน้า และเวอร์ชันที่ได้รับการปรับแต่งการสนทนาเพื่อวัตถุประสงค์ในการวิจัยและเชิงพาณิชย์

โครงการริเริ่มนี้ช่วยให้ธุรกิจทุกขนาดสามารถใช้ประโยชน์จาก LLM เพื่อสร้างโซลูชันที่ปรับให้เหมาะสม ณ ขณะนี้ Alibaba Cloud ได้สนับสนุน LLM ด้วยพารามิเตอร์ตั้งแต่ 1.8 พันล้าน, 7 พันล้าน, 14 พันล้านถึง 72 พันล้าน รวมถึง LLM หลายรูปแบบที่มีความเข้าใจด้านภาพ และเสียง

“การสร้างระบบนิเวศแบบโอเพ่นซอร์สถือเป็นสิ่งสำคัญในการส่งเสริมการพัฒนา LLM และการสร้างแอปพลิเคชัน AI เราปรารถนาที่จะกลายเป็นคลาวด์ที่เปิดกว้างที่สุด และทำให้ทุกคนสามารถเข้าถึงความสามารถด้าน AI เชิงสร้างสรรค์ได้” โจว จิงเหริน ซีทีโอของ Alibaba Cloud กล่าว

ครอบครัวของ LLM

โดยทั่วไปการปรับขนาดโมเดลภาษาขนาดใหญ่ที่ได้รับการฝึกอบรมล่วงหน้าจะนำไปสู่ประสิทธิภาพที่สูงขึ้น แต่การฝึกอบรมและการรันโมเดลขนาดใหญ่นั้นต้องใช้ทรัพยากรในการคำนวณที่มากขึ้น

ด้วยเหตุนี้ Alibaba Cloud จึงได้โอเพ่นซอร์ส LLM พารามิเตอร์ 1.8 พันล้าน Qwen-1.8B ซึ่งได้รับการปรับให้เหมาะกับอุปกรณ์ขนาดเล็ก และเสนอตัวเลือกที่คุ้มค่ามากขึ้นสำหรับการวิจัย เนื่องจากต้องใช้พลังการประมวลผลน้อยกว่า จึงสามารถทำงานได้บนโทรศัพท์มือถือที่มีทรัพยากรในการคำนวณและหน่วยความจำน้อยกว่าเซิร์ฟเวอร์คลาวด์อย่างมาก นอกจากนี้ยังหมายความว่าแอปพลิเคชันที่ขับเคลื่อนด้วย LLM ยังคงสามารถทำงานได้โดยมีการเชื่อมต่อเครือข่ายที่จำกัดหรือไม่มีเลย

ขณะเดียวกัน Alibaba Cloud กล่าวว่า Qwen-72B ซึ่งมีพารามิเตอร์ 7.2 หมื่นล้านพารามิเตอร์ มีประสิทธิภาพเหนือกว่าโมเดลโอเพ่นซอร์สหลักๆ อื่นๆ เทียบกับเกณฑ์มาตรฐาน 10 รายการ รวมถึงเกณฑ์มาตรฐาน Massive Multi-task Language Undering ที่วัดความแม่นยำของมัลติทาสก์ของโมเดล HumanEval ที่ทดสอบการสร้างโค้ด ความสามารถและ GSM8K ซึ่งเป็นมาตรฐานในการแก้ปัญหาทางคณิตศาสตร์

โมเดลนี้ยังมีประสิทธิภาพเหนือกว่าเมื่อเล่นตามบทบาทและในการถ่ายโอนรูปแบบภาษา ซึ่งเป็นหัวใจสำคัญของการสร้างแชทบอทส่วนบุคคล

Qwen-72B มีประสิทธิภาพเหนือกว่ารุ่นโอเพ่นซอร์สหลักอื่นๆ ในเกณฑ์มาตรฐานหลัก 10 ประการ เครดิตภาพ: อาลีบาบา คลาวด์

ผลักดันหลายรูปแบบ

นอกจากนี้ Alibaba Cloud ยังมีความก้าวหน้าในการบูรณาการความหลากหลายรูปแบบเข้ากับ LLM ของตน นั่นคือความสามารถในการประมวลผลข้อมูลอื่นที่ไม่ใช่ข้อความลงใน LLM

มีโอเพ่นซอร์สโมเดล Qwen-Audio และ Qwen-Audio-Chat เพื่อการวิจัยและเชิงพาณิชย์

Qwen-Audio สามารถเข้าใจข้อความและเสียง รวมถึงคำพูดของมนุษย์ เสียงที่เป็นธรรมชาติ และดนตรี สามารถประมวลผลเสียงได้มากกว่า 30 งาน เช่น การถอดเสียงหลายภาษา การแก้ไขคำพูด และการวิเคราะห์คำบรรยายเสียง เวอร์ชันที่ได้รับการปรับแต่งการสนทนาอย่างละเอียดสามารถตรวจจับอารมณ์และน้ำเสียงในคำพูดของมนุษย์ได้

การผลักดันต่อเนื่องหลายรูปแบบต่อยอดมาจากความคิดริเริ่มก่อนหน้าของ Alibaba Cloud ในการใช้ โมเดล ภาษาวิสัยทัศน์ขนาดใหญ่ Qwen-VL แบบโอเพ่นซอร์ส และเวอร์ชันแชท Qwen-VL-Chat ที่สามารถเข้าใจข้อมูลภาพและดำเนินงานด้านภาพได้

โมเดล LLM แบบโอเพ่นซอร์ส ซึ่งรวมถึง Qwen-7B, Qwen-14B และ Qwen-VL รวมถึงเวอร์ชันที่ได้รับการปรับแต่งการสนทนา ได้รับการดาวน์โหลดรวมแล้วมากกว่า 1.5 ล้านครั้งบนชุมชนโมเดล AI แบบโอเพ่นซอร์สของ Alibaba Cloud ModelScope และ Hugging Face ตั้งแต่เดือนสิงหาคม ตามข้อมูลล่าสุดจาก Alibaba Cloud

เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ

SHOPPING MALL

Alibaba Cloud เพิ่ม LLM เพื่อรองรับชุมชนโอเพ่นซอร์ส

Zhou Jingren ซีทีโอของ Alibaba Cloud ได้ประกาศโครงการริเริ่มโอเพ่นซอร์สในงานแถลงข่าว เครดิตภาพ: อาลีบาบา คลาวด์
เทคโนโลยีเกิดใหม่|เผยแพร่เมื่อ 05 ธันวาคม 2023
เผยแพร่เมื่อ 05 ธันวาคม 2023

  • อาลีบาบาคลาวด์โอเพ่นซอร์สรุ่นพารามิเตอร์ 72 พันล้านและ 1.8 พันล้านของรุ่นรากฐาน Tongyi Qianwen
  • ดาวน์โหลด LLM แบบโอเพ่นซอร์สรวม +1.5 ล้านครั้งบน ModelScope, Hugging Face ตั้งแต่เดือนสิงหาคม

Alibaba Cloud กล่าวเมื่อวันจันทร์ว่าได้สร้างโมเดลภาษาขนาดใหญ่สองโมเดล และโมเดลที่เข้าใจเสียงที่พร้อมใช้งานอย่างอิสระ เนื่องจากดูเหมือนว่าจะสร้างคลาวด์ที่เปิดกว้างที่สุดในยุค AI

บริษัทคลาวด์คอมพิวติ้งกำลังเปิดให้เข้าถึงเวอร์ชันพื้นฐานที่เป็นเอกสิทธิ์ของบริษัท Tongyi Qianwen รุ่นที่มีพารามิเตอร์ 72 พันล้านพารามิเตอร์และ1.8 พันล้านพารามิเตอร์

นอกจากนี้ ยังทำให้ LLM หลายรูปแบบใช้งานได้ฟรีมากขึ้น ซึ่งรวมถึงQwen-AudioและQwen-Audio-Chatซึ่งเป็นโมเดลการทำความเข้าใจเสียงที่ได้รับการฝึกอบรมล่วงหน้า และเวอร์ชันที่ได้รับการปรับแต่งการสนทนาเพื่อวัตถุประสงค์ในการวิจัยและเชิงพาณิชย์

โครงการริเริ่มนี้ช่วยให้ธุรกิจทุกขนาดสามารถใช้ประโยชน์จาก LLM เพื่อสร้างโซลูชันที่ปรับให้เหมาะสม ณ ขณะนี้ Alibaba Cloud ได้สนับสนุน LLM ด้วยพารามิเตอร์ตั้งแต่ 1.8 พันล้าน, 7 พันล้าน, 14 พันล้านถึง 72 พันล้าน รวมถึง LLM หลายรูปแบบที่มีความเข้าใจด้านภาพ และเสียง

“การสร้างระบบนิเวศแบบโอเพ่นซอร์สถือเป็นสิ่งสำคัญในการส่งเสริมการพัฒนา LLM และการสร้างแอปพลิเคชัน AI เราปรารถนาที่จะกลายเป็นคลาวด์ที่เปิดกว้างที่สุด และทำให้ทุกคนสามารถเข้าถึงความสามารถด้าน AI เชิงสร้างสรรค์ได้” โจว จิงเหริน ซีทีโอของ Alibaba Cloud กล่าว

ครอบครัวของ LLM

โดยทั่วไปการปรับขนาดโมเดลภาษาขนาดใหญ่ที่ได้รับการฝึกอบรมล่วงหน้าจะนำไปสู่ประสิทธิภาพที่สูงขึ้น แต่การฝึกอบรมและการรันโมเดลขนาดใหญ่นั้นต้องใช้ทรัพยากรในการคำนวณที่มากขึ้น

ด้วยเหตุนี้ Alibaba Cloud จึงได้โอเพ่นซอร์ส LLM พารามิเตอร์ 1.8 พันล้าน Qwen-1.8B ซึ่งได้รับการปรับให้เหมาะกับอุปกรณ์ขนาดเล็ก และเสนอตัวเลือกที่คุ้มค่ามากขึ้นสำหรับการวิจัย เนื่องจากต้องใช้พลังการประมวลผลน้อยกว่า จึงสามารถทำงานได้บนโทรศัพท์มือถือที่มีทรัพยากรในการคำนวณและหน่วยความจำน้อยกว่าเซิร์ฟเวอร์คลาวด์อย่างมาก นอกจากนี้ยังหมายความว่าแอปพลิเคชันที่ขับเคลื่อนด้วย LLM ยังคงสามารถทำงานได้โดยมีการเชื่อมต่อเครือข่ายที่จำกัดหรือไม่มีเลย

ขณะเดียวกัน Alibaba Cloud กล่าวว่า Qwen-72B ซึ่งมีพารามิเตอร์ 7.2 หมื่นล้านพารามิเตอร์ มีประสิทธิภาพเหนือกว่าโมเดลโอเพ่นซอร์สหลักๆ อื่นๆ เทียบกับเกณฑ์มาตรฐาน 10 รายการ รวมถึงเกณฑ์มาตรฐาน Massive Multi-task Language Undering ที่วัดความแม่นยำของมัลติทาสก์ของโมเดล HumanEval ที่ทดสอบการสร้างโค้ด ความสามารถและ GSM8K ซึ่งเป็นมาตรฐานในการแก้ปัญหาทางคณิตศาสตร์

โมเดลนี้ยังมีประสิทธิภาพเหนือกว่าเมื่อเล่นตามบทบาทและในการถ่ายโอนรูปแบบภาษา ซึ่งเป็นหัวใจสำคัญของการสร้างแชทบอทส่วนบุคคล

Qwen-72B มีประสิทธิภาพเหนือกว่ารุ่นโอเพ่นซอร์สหลักอื่นๆ ในเกณฑ์มาตรฐานหลัก 10 ประการ เครดิตภาพ: อาลีบาบา คลาวด์

ผลักดันหลายรูปแบบ

นอกจากนี้ Alibaba Cloud ยังมีความก้าวหน้าในการบูรณาการความหลากหลายรูปแบบเข้ากับ LLM ของตน นั่นคือความสามารถในการประมวลผลข้อมูลอื่นที่ไม่ใช่ข้อความลงใน LLM

มีโอเพ่นซอร์สโมเดล Qwen-Audio และ Qwen-Audio-Chat เพื่อการวิจัยและเชิงพาณิชย์

Qwen-Audio สามารถเข้าใจข้อความและเสียง รวมถึงคำพูดของมนุษย์ เสียงที่เป็นธรรมชาติ และดนตรี สามารถประมวลผลเสียงได้มากกว่า 30 งาน เช่น การถอดเสียงหลายภาษา การแก้ไขคำพูด และการวิเคราะห์คำบรรยายเสียง เวอร์ชันที่ได้รับการปรับแต่งการสนทนาอย่างละเอียดสามารถตรวจจับอารมณ์และน้ำเสียงในคำพูดของมนุษย์ได้

การผลักดันต่อเนื่องหลายรูปแบบต่อยอดมาจากความคิดริเริ่มก่อนหน้าของ Alibaba Cloud ในการใช้ โมเดล ภาษาวิสัยทัศน์ขนาดใหญ่ Qwen-VL แบบโอเพ่นซอร์ส และเวอร์ชันแชท Qwen-VL-Chat ที่สามารถเข้าใจข้อมูลภาพและดำเนินงานด้านภาพได้

โมเดล LLM แบบโอเพ่นซอร์ส ซึ่งรวมถึง Qwen-7B, Qwen-14B และ Qwen-VL รวมถึงเวอร์ชันที่ได้รับการปรับแต่งการสนทนา ได้รับการดาวน์โหลดรวมแล้วมากกว่า 1.5 ล้านครั้งบนชุมชนโมเดล AI แบบโอเพ่นซอร์สของ Alibaba Cloud ModelScope และ Hugging Face ตั้งแต่เดือนสิงหาคม ตามข้อมูลล่าสุดจาก Alibaba Cloud

เลือกชมสินค้ามากมาย และให้เราสั่งซื้อให้คุณ

SHOPPING MALL

ให้เราสั่งซื้อสินค้าให้คุณ

SHOPPING MALL

คุณอาจชอบเนื้อหานี้

Privacy Preference Center