- Home
- เพิ่มเติม
- รายงานพิเศษ
- สรุปข่าว: CosyVoice 3 หลายภาษา, AgentScope ที่อัปเกรดสําหรับตัวแทน AI ระดับการผลิต, การเข้ารหัส AI ที่พร้อมสําหรับองค์กร
สรุปข่าว: CosyVoice 3 หลายภาษา, AgentScope ที่อัปเกรดสําหรับตัวแทน AI ระดับการผลิต, การเข้ารหัส AI ที่พร้อมสําหรับองค์กร

สัปดาห์นี้ CosyVoice 3 โอเพ่นซอร์สใหม่ของอาลีบาบารองรับเก้าภาษาและบรรลุประสิทธิภาพ SOTA ในเกณฑ์มาตรฐานที่กําหนดไว้หลายรายการ AgentScope เปิดตัวการอัปเกรดเพื่อรองรับการพัฒนาและการปรับใช้เอเจนต์ AI ระดับการผลิตได้ดียิ่งขึ้น ในขณะเดียวกัน แผน Teams ก็เปิดตัวเพื่อเพิ่มศักยภาพให้กับธุรกิจด้วยการพัฒนาที่ขับเคลื่อนด้วย AI ที่ปรับขนาดได้ ปลอดภัย และพร้อมสําหรับการผลิต
อาลีบาบาโอเพ่นซอร์ส CosyVoice 3 โมเดลคําพูด Zero-Shot หลายภาษาที่พัฒนาการสังเคราะห์เสียงที่ล้ําสมัย
อาลีบาบามีโอเพ่นซอร์ส CosyVoice 3 ซึ่งเป็นโมเดลการสังเคราะห์คําพูดหลายภาษาที่มีประสิทธิภาพเหนือกว่ารุ่นก่อนอย่างมากในด้านความสอดคล้องของเนื้อหาความคล้ายคลึงกันของผู้พูดและความเป็นธรรมชาติของฉันทลักษณ์
หัวใจสําคัญของโมเดลนี้คือโทเค็นคําพูดแบบใหม่ที่ช่วยเพิ่มความสามารถในการทําความเข้าใจและวิเคราะห์คําพูดที่หลากหลาย รวมถึงการรู้จําเสียงอัตโนมัติ (ASR) การรู้จําอารมณ์เสียงพูด การระบุภาษา การตรวจจับเหตุการณ์เสียง และการวิเคราะห์ผู้พูด นอกจากนี้ โมเดลยังแนะนําวิธีการเพิ่มประสิทธิภาพรางวัลที่แตกต่างได้ (DiffRO) ใหม่สําหรับหลังการฝึกอบรม ซึ่งจะเพิ่มประสิทธิภาพโทเค็นคําพูดโดยตรง เทคนิคนี้มีประสิทธิภาพโดยเฉพาะอย่างยิ่งสําหรับโมเดลการสังเคราะห์เสียงพูดที่ใช้โมเดลภาษาขนาดใหญ่ (LLM) ทําให้สามารถสร้างเสียงได้แม่นยําและแสดงออกมากขึ้น
โมเดลนี้ได้รับการฝึกฝนจากชุดข้อมูลที่กว้างขวางของเสียง 1 ล้านชั่วโมง มีให้เลือกสองรุ่น โดยมีพารามิเตอร์ 0.5 พันล้านและ 1.5 พันล้านพารามิเตอร์ตามลําดับ CosyVoice 3 รองรับเก้าภาษา ได้แก่ อังกฤษ จีน เยอรมัน สเปน ฝรั่งเศส อิตาลี ญี่ปุ่น เกาหลี และรัสเซีย บรรลุประสิทธิภาพที่ล้ําสมัย (SOTA) ในเกณฑ์มาตรฐานที่กําหนดไว้หลายรายการ
ในฐานะที่เป็นโมเดลการสร้างเสียงพูดแบบ zero-shot CosyVoice 3 ถือเป็นการก้าวกระโดดครั้งสําคัญในการสังเคราะห์เสียงหลายภาษาที่มีความเที่ยงตรงสูงปูทางไปสู่แอปพลิเคชันเสียงที่หลากหลายเป็นธรรมชาติและคํานึงถึงบริบทมากขึ้นในสถานการณ์จริงเช่นผู้ช่วยเสมือนการบรรยายหนังสือเสียง / พอดแคสต์การบริการลูกค้าอัตโนมัติการผลิตเสียงพากย์สําหรับวิดีโอสั้นและเกมและการสร้างบทสนทนาแบบโต้ตอบในการตั้งค่าการศึกษา
นักพัฒนาทั่วโลกสามารถเข้าถึงโมเดลบน Hugging Face, Github และ ModelScope และสัมผัสกับโมเดลบนเว็บไซต์สาธิต

AgentScope เปิดตัวการอัปเกรดครั้งใหญ่สําหรับเอเจนต์ AI ที่พร้อมใช้งานจริง
Alibaba Tongyi Lab ได้ประกาศการอัปเกรด AgentScope ซึ่งเป็นเฟรมเวิร์กการพัฒนาตัวแทน AI โดยมุ่งเน้นไปที่สถานการณ์การใช้งานที่กว้างขึ้น โครงสร้างพื้นฐานที่แข็งแกร่งขึ้น และความพร้อมในการผลิตที่ได้รับการปรับปรุงเพื่อสนับสนุนการพัฒนาและการปรับใช้เอเจนต์ AI ระดับการผลิตได้ดียิ่งขึ้น
ในด้านแอปพลิเคชัน AgentScope ได้พัฒนาจากการให้ความสามารถพื้นฐาน เช่น การวิจัยเชิงลึก การใช้เบราว์เซอร์ และการวางแผน ไปจนถึงการส่งมอบแอปพลิเคชันตัวแทนที่พร้อมใช้งานและปรับให้เหมาะกับสถานการณ์ตัวอย่างเช่น Alias เป็นเอเจนต์ที่พร้อมใช้งานจริง ซึ่งจะสลับไปมาระหว่างโหมดทั่วไปและโหมดเฉพาะทางแบบไดนามิก (เช่น การวิเคราะห์ทางการเงิน วิทยาศาสตร์ข้อมูล) รองรับการปรับใช้ในเครื่องในคลิกเดียว และทําหน้าที่เป็นเทมเพลตที่ปรับแต่งได้สําหรับโซลูชันเฉพาะโดเมน EvoTraders จําลองทีมการลงทุนในโลกแห่งความเป็นจริงและใช้ระบบหน่วยความจํา ReMe เพื่อปรับแต่งกลยุทธ์ทั้ง Alias และ EvoTraders นําเสนออินเทอร์เฟซที่ปรับแต่งได้สูงสําหรับการกําหนดค่าชุดเครื่องมือ ข้อความแจ้ง และตรรกะการประสานงาน และสามารถใช้งานได้ทันทีหรือขยายเพื่อรวมเครื่องมือ ข้อมูล และเวิร์กโฟลว์ทางธุรกิจที่เป็นกรรมสิทธิ์

ที่เลเยอร์พื้นฐาน AgentScope แนะนํา Agent Skill ซึ่งเป็นกรอบทักษะแบบไดนามิกแบบพลักแอนด์เพลย์ที่ช่วยให้ตัวแทนสามารถเขียนความสามารถสําหรับงานที่ซับซ้อนได้อย่างยืดหยุ่น นอกจากนี้ยังแนะนํา AgentScope-Studio ซึ่งเป็นสภาพแวดล้อมการพัฒนาภาพที่มีสตรีมข้อความแบบดูคู่ การติดตามสถานะ ReAct และการรวม OpenTelemetry เพื่อปรับปรุงประสิทธิภาพการดีบักและประสบการณ์ของนักพัฒนา
สําหรับการปรับใช้ AgentScope-Runtime v1.0 แนะนํากระบวนทัศน์ “กล่องขาว” ที่สร้างสมดุลระหว่างความสะดวกในการใช้งานกับความยืดหยุ่น นักพัฒนาสามารถควบคุมวงจรชีวิตของแอปพลิเคชันตัวแทนได้อย่างแม่นยําโดยไม่สูญเสียความเรียบง่าย รันไทม์รองรับการทํางานร่วมกันแบบหลายตัวแทน ทําให้สามารถแชร์เซสชัน หน่วยความจํา และชุดเครื่องมือที่ปรับแต่งได้เพื่อการประสานงานที่มีประสิทธิภาพ และยังเปิดใช้งานการประสานงานข้ามเฟรมเวิร์กเพื่อให้มั่นใจถึงความสอดคล้องตั้งแต่การพัฒนาไปจนถึงการผลิต นอกจากนี้ยังมีเมทริกซ์แซนด์บ็อกซ์ที่ประกอบด้วยหลายประเภท ครอบคลุมสภาพแวดล้อมภายในและระบบคลาวด์ในอุปกรณ์ประเภทต่างๆ ให้การดําเนินการที่ปลอดภัยและแยกจากกันสําหรับการควบคุมเบราว์เซอร์ การทํางานของไฟล์ และระบบอัตโนมัติบนมือถือ ทั้งหมดนี้มีความสามารถในการขยายตาม MCP
ระบบนิเวศ AgentScope ยังรวมถึง SparkChat พร้อม Web UI ในตัวสําหรับการโต้ตอบด้วยภาพทันที และ AgentScope-Java v1.0 สําหรับสแต็ก Java ขององค์กร
การอัปเกรด AgentScope ล่าสุดพร้อมใช้งานต่อสาธารณะแล้วบน GitHub ทําให้องค์กรและนักพัฒนาสามารถเข้าถึงระบบนิเวศการพัฒนาเอเจนต์ที่แข็งแกร่งและพร้อมใช้งานจริงมากขึ้น
Qoder เปิดตัวแผน Teams เพื่อเร่งการเข้ารหัส AI ระดับองค์กร
Qoder ซึ่งเป็นแพลตฟอร์มการเข้ารหัสแบบเอเจนต์ที่สร้างขึ้นสําหรับการพัฒนาซอฟต์แวร์ในโลกแห่งความเป็นจริง ได้เปิดตัว Qoder Teams ซึ่งเป็นแผนใหม่ที่ออกแบบมาเพื่อเพิ่มศักยภาพให้กับธุรกิจที่มีขนาดต่างกันด้วยการพัฒนาที่ขับเคลื่อนด้วย AI ที่ปรับขนาดได้ ปลอดภัย และพร้อมสําหรับการผลิต
แผน Teams มอบความสามารถระดับองค์กร รวมถึงบริการความรู้ขั้นสูง การรับรู้บริบทที่ได้รับการปรับปรุง และการพัฒนาที่ขับเคลื่อนด้วยข้อมูลจําเพาะ นอกจากนี้ยังมีชุดเครื่องมือที่ยืดหยุ่น เช่น Qoder IDE, ปลั๊กอิน Qoder สําหรับ JetBrains IDE และ Qoder CLI เพื่อผสานรวมเข้ากับเวิร์กโฟลว์ของทีมที่หลากหลายและสภาพแวดล้อมการพัฒนาที่มีอยู่ได้อย่างราบรื่น
ฟีเจอร์หลักขององค์กรช่วยปรับปรุงข้อเสนอให้ดียิ่งขึ้น: การเรียกเก็บเงินแบบรวมศูนย์ การรวมการลงชื่อเพียงครั้งเดียว (SSO) และการสนับสนุนที่กําลังจะมาถึงสําหรับกลุ่มเครดิตที่ใช้ร่วมกัน ด้วยฟังก์ชันที่กําลังจะมาถึงนี้ องค์กรจะสามารถซื้อเครดิต AI โดยรวมและจัดสรรแบบไดนามิกระหว่างทีม ซึ่งทําให้สามารถจัดการทรัพยากรตามการใช้งานได้อย่างยืดหยุ่น
ด้วยการรวมคุณสมบัติ AI เข้ากับสภาพแวดล้อมการพัฒนา Qoder ช่วยให้ทีมวิศวกรปรับปรุงการเขียนโค้ด ลดการสลับบริบท และเร่งการส่งมอบ ทั้งหมดนี้โดยไม่กระทบต่อความปลอดภัยหรือคุณภาพของโค้ด
แบ่งปัน
คุณอาจชอบเนื้อหานี้
เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ
เนื้อหายอดนิยม
สรุปข่าว: CosyVoice 3 หลายภาษา, AgentScope ที่อัปเกรดสําหรับตัวแทน AI ระดับการผลิต, การเข้ารหัส AI ที่พร้อมสําหรับองค์กร

สัปดาห์นี้ CosyVoice 3 โอเพ่นซอร์สใหม่ของอาลีบาบารองรับเก้าภาษาและบรรลุประสิทธิภาพ SOTA ในเกณฑ์มาตรฐานที่กําหนดไว้หลายรายการ AgentScope เปิดตัวการอัปเกรดเพื่อรองรับการพัฒนาและการปรับใช้เอเจนต์ AI ระดับการผลิตได้ดียิ่งขึ้น ในขณะเดียวกัน แผน Teams ก็เปิดตัวเพื่อเพิ่มศักยภาพให้กับธุรกิจด้วยการพัฒนาที่ขับเคลื่อนด้วย AI ที่ปรับขนาดได้ ปลอดภัย และพร้อมสําหรับการผลิต
อาลีบาบาโอเพ่นซอร์ส CosyVoice 3 โมเดลคําพูด Zero-Shot หลายภาษาที่พัฒนาการสังเคราะห์เสียงที่ล้ําสมัย
อาลีบาบามีโอเพ่นซอร์ส CosyVoice 3 ซึ่งเป็นโมเดลการสังเคราะห์คําพูดหลายภาษาที่มีประสิทธิภาพเหนือกว่ารุ่นก่อนอย่างมากในด้านความสอดคล้องของเนื้อหาความคล้ายคลึงกันของผู้พูดและความเป็นธรรมชาติของฉันทลักษณ์
หัวใจสําคัญของโมเดลนี้คือโทเค็นคําพูดแบบใหม่ที่ช่วยเพิ่มความสามารถในการทําความเข้าใจและวิเคราะห์คําพูดที่หลากหลาย รวมถึงการรู้จําเสียงอัตโนมัติ (ASR) การรู้จําอารมณ์เสียงพูด การระบุภาษา การตรวจจับเหตุการณ์เสียง และการวิเคราะห์ผู้พูด นอกจากนี้ โมเดลยังแนะนําวิธีการเพิ่มประสิทธิภาพรางวัลที่แตกต่างได้ (DiffRO) ใหม่สําหรับหลังการฝึกอบรม ซึ่งจะเพิ่มประสิทธิภาพโทเค็นคําพูดโดยตรง เทคนิคนี้มีประสิทธิภาพโดยเฉพาะอย่างยิ่งสําหรับโมเดลการสังเคราะห์เสียงพูดที่ใช้โมเดลภาษาขนาดใหญ่ (LLM) ทําให้สามารถสร้างเสียงได้แม่นยําและแสดงออกมากขึ้น
โมเดลนี้ได้รับการฝึกฝนจากชุดข้อมูลที่กว้างขวางของเสียง 1 ล้านชั่วโมง มีให้เลือกสองรุ่น โดยมีพารามิเตอร์ 0.5 พันล้านและ 1.5 พันล้านพารามิเตอร์ตามลําดับ CosyVoice 3 รองรับเก้าภาษา ได้แก่ อังกฤษ จีน เยอรมัน สเปน ฝรั่งเศส อิตาลี ญี่ปุ่น เกาหลี และรัสเซีย บรรลุประสิทธิภาพที่ล้ําสมัย (SOTA) ในเกณฑ์มาตรฐานที่กําหนดไว้หลายรายการ
ในฐานะที่เป็นโมเดลการสร้างเสียงพูดแบบ zero-shot CosyVoice 3 ถือเป็นการก้าวกระโดดครั้งสําคัญในการสังเคราะห์เสียงหลายภาษาที่มีความเที่ยงตรงสูงปูทางไปสู่แอปพลิเคชันเสียงที่หลากหลายเป็นธรรมชาติและคํานึงถึงบริบทมากขึ้นในสถานการณ์จริงเช่นผู้ช่วยเสมือนการบรรยายหนังสือเสียง / พอดแคสต์การบริการลูกค้าอัตโนมัติการผลิตเสียงพากย์สําหรับวิดีโอสั้นและเกมและการสร้างบทสนทนาแบบโต้ตอบในการตั้งค่าการศึกษา
นักพัฒนาทั่วโลกสามารถเข้าถึงโมเดลบน Hugging Face, Github และ ModelScope และสัมผัสกับโมเดลบนเว็บไซต์สาธิต

AgentScope เปิดตัวการอัปเกรดครั้งใหญ่สําหรับเอเจนต์ AI ที่พร้อมใช้งานจริง
Alibaba Tongyi Lab ได้ประกาศการอัปเกรด AgentScope ซึ่งเป็นเฟรมเวิร์กการพัฒนาตัวแทน AI โดยมุ่งเน้นไปที่สถานการณ์การใช้งานที่กว้างขึ้น โครงสร้างพื้นฐานที่แข็งแกร่งขึ้น และความพร้อมในการผลิตที่ได้รับการปรับปรุงเพื่อสนับสนุนการพัฒนาและการปรับใช้เอเจนต์ AI ระดับการผลิตได้ดียิ่งขึ้น
ในด้านแอปพลิเคชัน AgentScope ได้พัฒนาจากการให้ความสามารถพื้นฐาน เช่น การวิจัยเชิงลึก การใช้เบราว์เซอร์ และการวางแผน ไปจนถึงการส่งมอบแอปพลิเคชันตัวแทนที่พร้อมใช้งานและปรับให้เหมาะกับสถานการณ์ตัวอย่างเช่น Alias เป็นเอเจนต์ที่พร้อมใช้งานจริง ซึ่งจะสลับไปมาระหว่างโหมดทั่วไปและโหมดเฉพาะทางแบบไดนามิก (เช่น การวิเคราะห์ทางการเงิน วิทยาศาสตร์ข้อมูล) รองรับการปรับใช้ในเครื่องในคลิกเดียว และทําหน้าที่เป็นเทมเพลตที่ปรับแต่งได้สําหรับโซลูชันเฉพาะโดเมน EvoTraders จําลองทีมการลงทุนในโลกแห่งความเป็นจริงและใช้ระบบหน่วยความจํา ReMe เพื่อปรับแต่งกลยุทธ์ทั้ง Alias และ EvoTraders นําเสนออินเทอร์เฟซที่ปรับแต่งได้สูงสําหรับการกําหนดค่าชุดเครื่องมือ ข้อความแจ้ง และตรรกะการประสานงาน และสามารถใช้งานได้ทันทีหรือขยายเพื่อรวมเครื่องมือ ข้อมูล และเวิร์กโฟลว์ทางธุรกิจที่เป็นกรรมสิทธิ์

ที่เลเยอร์พื้นฐาน AgentScope แนะนํา Agent Skill ซึ่งเป็นกรอบทักษะแบบไดนามิกแบบพลักแอนด์เพลย์ที่ช่วยให้ตัวแทนสามารถเขียนความสามารถสําหรับงานที่ซับซ้อนได้อย่างยืดหยุ่น นอกจากนี้ยังแนะนํา AgentScope-Studio ซึ่งเป็นสภาพแวดล้อมการพัฒนาภาพที่มีสตรีมข้อความแบบดูคู่ การติดตามสถานะ ReAct และการรวม OpenTelemetry เพื่อปรับปรุงประสิทธิภาพการดีบักและประสบการณ์ของนักพัฒนา
สําหรับการปรับใช้ AgentScope-Runtime v1.0 แนะนํากระบวนทัศน์ “กล่องขาว” ที่สร้างสมดุลระหว่างความสะดวกในการใช้งานกับความยืดหยุ่น นักพัฒนาสามารถควบคุมวงจรชีวิตของแอปพลิเคชันตัวแทนได้อย่างแม่นยําโดยไม่สูญเสียความเรียบง่าย รันไทม์รองรับการทํางานร่วมกันแบบหลายตัวแทน ทําให้สามารถแชร์เซสชัน หน่วยความจํา และชุดเครื่องมือที่ปรับแต่งได้เพื่อการประสานงานที่มีประสิทธิภาพ และยังเปิดใช้งานการประสานงานข้ามเฟรมเวิร์กเพื่อให้มั่นใจถึงความสอดคล้องตั้งแต่การพัฒนาไปจนถึงการผลิต นอกจากนี้ยังมีเมทริกซ์แซนด์บ็อกซ์ที่ประกอบด้วยหลายประเภท ครอบคลุมสภาพแวดล้อมภายในและระบบคลาวด์ในอุปกรณ์ประเภทต่างๆ ให้การดําเนินการที่ปลอดภัยและแยกจากกันสําหรับการควบคุมเบราว์เซอร์ การทํางานของไฟล์ และระบบอัตโนมัติบนมือถือ ทั้งหมดนี้มีความสามารถในการขยายตาม MCP
ระบบนิเวศ AgentScope ยังรวมถึง SparkChat พร้อม Web UI ในตัวสําหรับการโต้ตอบด้วยภาพทันที และ AgentScope-Java v1.0 สําหรับสแต็ก Java ขององค์กร
การอัปเกรด AgentScope ล่าสุดพร้อมใช้งานต่อสาธารณะแล้วบน GitHub ทําให้องค์กรและนักพัฒนาสามารถเข้าถึงระบบนิเวศการพัฒนาเอเจนต์ที่แข็งแกร่งและพร้อมใช้งานจริงมากขึ้น
Qoder เปิดตัวแผน Teams เพื่อเร่งการเข้ารหัส AI ระดับองค์กร
Qoder ซึ่งเป็นแพลตฟอร์มการเข้ารหัสแบบเอเจนต์ที่สร้างขึ้นสําหรับการพัฒนาซอฟต์แวร์ในโลกแห่งความเป็นจริง ได้เปิดตัว Qoder Teams ซึ่งเป็นแผนใหม่ที่ออกแบบมาเพื่อเพิ่มศักยภาพให้กับธุรกิจที่มีขนาดต่างกันด้วยการพัฒนาที่ขับเคลื่อนด้วย AI ที่ปรับขนาดได้ ปลอดภัย และพร้อมสําหรับการผลิต
แผน Teams มอบความสามารถระดับองค์กร รวมถึงบริการความรู้ขั้นสูง การรับรู้บริบทที่ได้รับการปรับปรุง และการพัฒนาที่ขับเคลื่อนด้วยข้อมูลจําเพาะ นอกจากนี้ยังมีชุดเครื่องมือที่ยืดหยุ่น เช่น Qoder IDE, ปลั๊กอิน Qoder สําหรับ JetBrains IDE และ Qoder CLI เพื่อผสานรวมเข้ากับเวิร์กโฟลว์ของทีมที่หลากหลายและสภาพแวดล้อมการพัฒนาที่มีอยู่ได้อย่างราบรื่น
ฟีเจอร์หลักขององค์กรช่วยปรับปรุงข้อเสนอให้ดียิ่งขึ้น: การเรียกเก็บเงินแบบรวมศูนย์ การรวมการลงชื่อเพียงครั้งเดียว (SSO) และการสนับสนุนที่กําลังจะมาถึงสําหรับกลุ่มเครดิตที่ใช้ร่วมกัน ด้วยฟังก์ชันที่กําลังจะมาถึงนี้ องค์กรจะสามารถซื้อเครดิต AI โดยรวมและจัดสรรแบบไดนามิกระหว่างทีม ซึ่งทําให้สามารถจัดการทรัพยากรตามการใช้งานได้อย่างยืดหยุ่น
ด้วยการรวมคุณสมบัติ AI เข้ากับสภาพแวดล้อมการพัฒนา Qoder ช่วยให้ทีมวิศวกรปรับปรุงการเขียนโค้ด ลดการสลับบริบท และเร่งการส่งมอบ ทั้งหมดนี้โดยไม่กระทบต่อความปลอดภัยหรือคุณภาพของโค้ด












