สรุปข่าว: CosyVoice 3 หลายภาษา, AgentScope ที่อัปเกรดสําหรับตัวแทน AI ระดับการผลิต, การเข้ารหัส AI ที่พร้อมสําหรับองค์กร

ทั้งหมด Alibaba Group อีคอมเมิร์ซ เทคโนโลยี โลจิสติกส์ ความยั่งยืน ไลฟ์สไตล์

สรุปข่าว: CosyVoice 3 หลายภาษา, AgentScope ที่อัปเกรดสําหรับตัวแทน AI ระดับการผลิต, การเข้ารหัส AI ที่พร้อมสําหรับองค์กร

รายงานพิเศษ|เผยแพร่เมื่อ 16 ธันวาคม 2025

สัปดาห์นี้ CosyVoice 3 โอเพ่นซอร์สใหม่ของอาลีบาบารองรับเก้าภาษาและบรรลุประสิทธิภาพ SOTA ในเกณฑ์มาตรฐานที่กําหนดไว้หลายรายการ AgentScope เปิดตัวการอัปเกรดเพื่อรองรับการพัฒนาและการปรับใช้เอเจนต์ AI ระดับการผลิตได้ดียิ่งขึ้น ในขณะเดียวกัน แผน Teams ก็เปิดตัวเพื่อเพิ่มศักยภาพให้กับธุรกิจด้วยการพัฒนาที่ขับเคลื่อนด้วย AI ที่ปรับขนาดได้ ปลอดภัย และพร้อมสําหรับการผลิต

อาลีบาบาโอเพ่นซอร์ส CosyVoice 3 โมเดลคําพูด Zero-Shot หลายภาษาที่พัฒนาการสังเคราะห์เสียงที่ล้ําสมัย

อาลีบาบามีโอเพ่นซอร์ส CosyVoice 3 ซึ่งเป็นโมเดลการสังเคราะห์คําพูดหลายภาษาที่มีประสิทธิภาพเหนือกว่ารุ่นก่อนอย่างมากในด้านความสอดคล้องของเนื้อหาความคล้ายคลึงกันของผู้พูดและความเป็นธรรมชาติของฉันทลักษณ์

หัวใจสําคัญของโมเดลนี้คือโทเค็นคําพูดแบบใหม่ที่ช่วยเพิ่มความสามารถในการทําความเข้าใจและวิเคราะห์คําพูดที่หลากหลาย รวมถึงการรู้จําเสียงอัตโนมัติ (ASR) การรู้จําอารมณ์เสียงพูด การระบุภาษา การตรวจจับเหตุการณ์เสียง และการวิเคราะห์ผู้พูด นอกจากนี้ โมเดลยังแนะนําวิธีการเพิ่มประสิทธิภาพรางวัลที่แตกต่างได้ (DiffRO) ใหม่สําหรับหลังการฝึกอบรม ซึ่งจะเพิ่มประสิทธิภาพโทเค็นคําพูดโดยตรง เทคนิคนี้มีประสิทธิภาพโดยเฉพาะอย่างยิ่งสําหรับโมเดลการสังเคราะห์เสียงพูดที่ใช้โมเดลภาษาขนาดใหญ่ (LLM) ทําให้สามารถสร้างเสียงได้แม่นยําและแสดงออกมากขึ้น

โมเดลนี้ได้รับการฝึกฝนจากชุดข้อมูลที่กว้างขวางของเสียง 1 ล้านชั่วโมง มีให้เลือกสองรุ่น โดยมีพารามิเตอร์ 0.5 พันล้านและ 1.5 พันล้านพารามิเตอร์ตามลําดับ CosyVoice 3 รองรับเก้าภาษา ได้แก่ อังกฤษ จีน เยอรมัน สเปน ฝรั่งเศส อิตาลี ญี่ปุ่น เกาหลี และรัสเซีย บรรลุประสิทธิภาพที่ล้ําสมัย (SOTA) ในเกณฑ์มาตรฐานที่กําหนดไว้หลายรายการ

ในฐานะที่เป็นโมเดลการสร้างเสียงพูดแบบ zero-shot CosyVoice 3 ถือเป็นการก้าวกระโดดครั้งสําคัญในการสังเคราะห์เสียงหลายภาษาที่มีความเที่ยงตรงสูงปูทางไปสู่แอปพลิเคชันเสียงที่หลากหลายเป็นธรรมชาติและคํานึงถึงบริบทมากขึ้นในสถานการณ์จริงเช่นผู้ช่วยเสมือนการบรรยายหนังสือเสียง / พอดแคสต์การบริการลูกค้าอัตโนมัติการผลิตเสียงพากย์สําหรับวิดีโอสั้นและเกมและการสร้างบทสนทนาแบบโต้ตอบในการตั้งค่าการศึกษา

นักพัฒนาทั่วโลกสามารถเข้าถึงโมเดลบน Hugging Face, Github และ ModelScope และสัมผัสกับโมเดลบนเว็บไซต์สาธิต

CosyVoice3 บรรลุประสิทธิภาพที่โดดเด่นในด้านความสอดคล้องของเนื้อหา

AgentScope เปิดตัวการอัปเกรดครั้งใหญ่สําหรับเอเจนต์ AI ที่พร้อมใช้งานจริง

Alibaba Tongyi Lab ได้ประกาศการอัปเกรด AgentScope ซึ่งเป็นเฟรมเวิร์กการพัฒนาตัวแทน AI โดยมุ่งเน้นไปที่สถานการณ์การใช้งานที่กว้างขึ้น โครงสร้างพื้นฐานที่แข็งแกร่งขึ้น และความพร้อมในการผลิตที่ได้รับการปรับปรุงเพื่อสนับสนุนการพัฒนาและการปรับใช้เอเจนต์ AI ระดับการผลิตได้ดียิ่งขึ้น

ในด้านแอปพลิเคชัน AgentScope ได้พัฒนาจากการให้ความสามารถพื้นฐาน เช่น การวิจัยเชิงลึก การใช้เบราว์เซอร์ และการวางแผน ไปจนถึงการส่งมอบแอปพลิเคชันตัวแทนที่พร้อมใช้งานและปรับให้เหมาะกับสถานการณ์ตัวอย่างเช่น Alias เป็นเอเจนต์ที่พร้อมใช้งานจริง ซึ่งจะสลับไปมาระหว่างโหมดทั่วไปและโหมดเฉพาะทางแบบไดนามิก (เช่น การวิเคราะห์ทางการเงิน วิทยาศาสตร์ข้อมูล) รองรับการปรับใช้ในเครื่องในคลิกเดียว และทําหน้าที่เป็นเทมเพลตที่ปรับแต่งได้สําหรับโซลูชันเฉพาะโดเมน EvoTraders จําลองทีมการลงทุนในโลกแห่งความเป็นจริงและใช้ระบบหน่วยความจํา ReMe เพื่อปรับแต่งกลยุทธ์ทั้ง Alias และ EvoTraders นําเสนออินเทอร์เฟซที่ปรับแต่งได้สูงสําหรับการกําหนดค่าชุดเครื่องมือ ข้อความแจ้ง และตรรกะการประสานงาน และสามารถใช้งานได้ทันทีหรือขยายเพื่อรวมเครื่องมือ ข้อมูล และเวิร์กโฟลว์ทางธุรกิจที่เป็นกรรมสิทธิ์

ที่เลเยอร์พื้นฐาน AgentScope แนะนํา Agent Skill ซึ่งเป็นกรอบทักษะแบบไดนามิกแบบพลักแอนด์เพลย์ที่ช่วยให้ตัวแทนสามารถเขียนความสามารถสําหรับงานที่ซับซ้อนได้อย่างยืดหยุ่น นอกจากนี้ยังแนะนํา AgentScope-Studio ซึ่งเป็นสภาพแวดล้อมการพัฒนาภาพที่มีสตรีมข้อความแบบดูคู่ การติดตามสถานะ ReAct และการรวม OpenTelemetry เพื่อปรับปรุงประสิทธิภาพการดีบักและประสบการณ์ของนักพัฒนา

สําหรับการปรับใช้ AgentScope-Runtime v1.0 แนะนํากระบวนทัศน์ “กล่องขาว” ที่สร้างสมดุลระหว่างความสะดวกในการใช้งานกับความยืดหยุ่น นักพัฒนาสามารถควบคุมวงจรชีวิตของแอปพลิเคชันตัวแทนได้อย่างแม่นยําโดยไม่สูญเสียความเรียบง่าย รันไทม์รองรับการทํางานร่วมกันแบบหลายตัวแทน ทําให้สามารถแชร์เซสชัน หน่วยความจํา และชุดเครื่องมือที่ปรับแต่งได้เพื่อการประสานงานที่มีประสิทธิภาพ และยังเปิดใช้งานการประสานงานข้ามเฟรมเวิร์กเพื่อให้มั่นใจถึงความสอดคล้องตั้งแต่การพัฒนาไปจนถึงการผลิต นอกจากนี้ยังมีเมทริกซ์แซนด์บ็อกซ์ที่ประกอบด้วยหลายประเภท ครอบคลุมสภาพแวดล้อมภายในและระบบคลาวด์ในอุปกรณ์ประเภทต่างๆ ให้การดําเนินการที่ปลอดภัยและแยกจากกันสําหรับการควบคุมเบราว์เซอร์ การทํางานของไฟล์ และระบบอัตโนมัติบนมือถือ ทั้งหมดนี้มีความสามารถในการขยายตาม MCP

ระบบนิเวศ AgentScope ยังรวมถึง SparkChat พร้อม Web UI ในตัวสําหรับการโต้ตอบด้วยภาพทันที และ AgentScope-Java v1.0 สําหรับสแต็ก Java ขององค์กร

การอัปเกรด AgentScope ล่าสุดพร้อมใช้งานต่อสาธารณะแล้วบน GitHub ทําให้องค์กรและนักพัฒนาสามารถเข้าถึงระบบนิเวศการพัฒนาเอเจนต์ที่แข็งแกร่งและพร้อมใช้งานจริงมากขึ้น

Qoder เปิดตัวแผน Teams เพื่อเร่งการเข้ารหัส AI ระดับองค์กร

Qoder ซึ่งเป็นแพลตฟอร์มการเข้ารหัสแบบเอเจนต์ที่สร้างขึ้นสําหรับการพัฒนาซอฟต์แวร์ในโลกแห่งความเป็นจริง ได้เปิดตัว Qoder Teams ซึ่งเป็นแผนใหม่ที่ออกแบบมาเพื่อเพิ่มศักยภาพให้กับธุรกิจที่มีขนาดต่างกันด้วยการพัฒนาที่ขับเคลื่อนด้วย AI ที่ปรับขนาดได้ ปลอดภัย และพร้อมสําหรับการผลิต

แผน Teams มอบความสามารถระดับองค์กร รวมถึงบริการความรู้ขั้นสูง การรับรู้บริบทที่ได้รับการปรับปรุง และการพัฒนาที่ขับเคลื่อนด้วยข้อมูลจําเพาะ นอกจากนี้ยังมีชุดเครื่องมือที่ยืดหยุ่น เช่น Qoder IDE, ปลั๊กอิน Qoder สําหรับ JetBrains IDE และ Qoder CLI เพื่อผสานรวมเข้ากับเวิร์กโฟลว์ของทีมที่หลากหลายและสภาพแวดล้อมการพัฒนาที่มีอยู่ได้อย่างราบรื่น

ฟีเจอร์หลักขององค์กรช่วยปรับปรุงข้อเสนอให้ดียิ่งขึ้น: การเรียกเก็บเงินแบบรวมศูนย์ การรวมการลงชื่อเพียงครั้งเดียว (SSO) และการสนับสนุนที่กําลังจะมาถึงสําหรับกลุ่มเครดิตที่ใช้ร่วมกัน ด้วยฟังก์ชันที่กําลังจะมาถึงนี้ องค์กรจะสามารถซื้อเครดิต AI โดยรวมและจัดสรรแบบไดนามิกระหว่างทีม ซึ่งทําให้สามารถจัดการทรัพยากรตามการใช้งานได้อย่างยืดหยุ่น

ด้วยการรวมคุณสมบัติ AI เข้ากับสภาพแวดล้อมการพัฒนา Qoder ช่วยให้ทีมวิศวกรปรับปรุงการเขียนโค้ด ลดการสลับบริบท และเร่งการส่งมอบ ทั้งหมดนี้โดยไม่กระทบต่อความปลอดภัยหรือคุณภาพของโค้ด

คุณอาจชอบเนื้อหานี้

เทคโนโลยี

เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ

SHOPPING MALL

เนื้อหายอดนิยม

11.11