- Home
- เทคโนโลยี
- เทคโนโลยีเกิดใหม่
- DAMO Academy ของอาลีบาบาเปิดตัว LLM ที่ออกแบบมาสำหรับเอเชียตะวันออกเฉียงใต้
DAMO Academy ของอาลีบาบาเปิดตัว LLM ที่ออกแบบมาสำหรับเอเชียตะวันออกเฉียงใต้

- LLM ได้รับการปรับให้เหมาะสมเพื่อประมวลผลภาษาเอเชียตะวันออกเฉียงใต้และสามารถสะท้อนความแตกต่างทางวัฒนธรรมได้
- ตอบสนองความต้องการ LLM ที่แปลแล้วเทียบกับ LLM ที่ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลภาษาอังกฤษและละติน
สถาบันวิจัยDAMO Academy ของอาลีบาบา กรุ๊ป เปิดเผยเมื่อวันจันทร์ที่ผ่านมา แบบจำลองภาษาขนาดใหญ่ 2 โมเดลที่ออกแบบมาเพื่อสะท้อนภูมิทัศน์ทางภาษาและวัฒนธรรมที่หลากหลายของเอเชียตะวันออกเฉียงใต้
DAMO Academy เปิดตัวโมเดลชื่อ SeaLLM และเวอร์ชันที่ได้รับการปรับแต่งการสนทนาชื่อ SeaLLM-chat
แบบจำลองซึ่งมีสองขนาดคือ 13 พันล้านและ 7 พันล้านพารามิเตอร์ สามารถประมวลผลภาษาท้องถิ่น ได้แก่ เวียดนาม อินโดนีเซีย ไทย มาเลย์ เขมร ลาว ตากาล็อก และพม่า ทั้งสองสามารถปฏิบัติงานที่สอดคล้องกับประเพณี สไตล์ และข้อกำหนดทางกฎหมายของท้องถิ่นได้ดีขึ้น
ความคิดริเริ่มนี้เกิดขึ้นท่ามกลางความต้องการ LLM ที่เกี่ยวข้องกับท้องถิ่นที่เพิ่มขึ้นจากประเทศต่างๆ ในเอเชียตะวันออกเฉียงใต้ ตัวอย่างเช่น สิงคโปร์ได้สร้างโครงการริเริ่มด้าน AI มูลค่า 52 ล้านดอลลาร์เพื่อพัฒนาขีดความสามารถด้านการวิจัยและวิศวกรรมของ Lion City ในด้าน LLM แบบหลายรูปแบบ
อาลีบาบากล่าวว่าการเปิดตัวดังกล่าวได้รับการออกแบบเพื่อสร้าง LLM ที่มีความครอบคลุมและเกี่ยวข้องกับภูมิภาคมากขึ้น ซึ่งสะท้อนถึงความแตกต่างทางวัฒนธรรมของเอเชียตะวันออกเฉียงใต้ LLM ส่วนใหญ่มาจากประเทศตะวันตกและได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่มาจากภาษาที่มาจากภาษาอังกฤษและภาษาที่มาจากภาษาละตินอย่างไม่เป็นสัดส่วน
“นวัตกรรมนี้มีจุดมุ่งหมายเพื่อเร่งการทำให้ AI เป็นประชาธิปไตย และเพิ่มศักยภาพให้กับชุมชนที่ไม่เคยมีบทบาทน้อยในอดีตในอาณาจักรดิจิทัล” Bing Lidong ผู้อำนวยการห้องปฏิบัติการเทคโนโลยีภาษาของ DAMO Academy ของ Alibaba กล่าว
DAMO Academy ได้เปิดซอร์สโมเดลบนHugging Faceทำให้สามารถนำไปใช้ในการวิจัยและเชิงพาณิชย์ได้อย่างอิสระ
การเชื่อมการแบ่งแยกทางภาษา
ด้วยการฝึกอบรมชุดภาษาเอเชียตะวันออกเฉียงใต้ที่หลากหลาย SeaLLM สามารถตีความและประมวลผลข้อความได้นานกว่ารุ่นเช่น ChatGPT สำหรับภาษาที่ไม่ใช่ละตินถึงเก้าเท่า และมีความสามารถในการดำเนินงานที่ซับซ้อนมากขึ้น โดยมีประสิทธิภาพเหนือกว่า LLM แบบโอเพ่นซอร์สส่วนใหญ่ในการทำความเข้าใจสาขาวิชาที่หลากหลายตั้งแต่วิทยาศาสตร์ เคมี ฟิสิกส์ ไปจนถึงเศรษฐศาสตร์ ในภาษาของภูมิภาค
โมเดลนี้มีประสิทธิภาพเหนือกว่าโมเดลอื่นๆ ที่มีอยู่ในด้านความสามารถในการแปลภาษาด้วยเครื่องระหว่างภาษาอังกฤษและภาษาที่มีทรัพยากรต่ำ โดยอ้างอิงถึงรุ่นที่มีข้อมูลที่จำกัดสำหรับการฝึกอบรมระบบ AI การสนทนา เช่น ลาวและเขมร นอกจากนี้ยังมอบประสิทธิภาพที่ทัดเทียมกับโมเดลล้ำสมัยในภาษาที่มีทรัพยากรสูงส่วนใหญ่ โดยอ้างอิงถึงภาษาที่มีแหล่งข้อมูลการฝึกอบรมมากมาย เช่น ภาษาเวียดนามและอินโดนีเซีย
ด้วยการเพิ่มประสิทธิภาพก่อนการฝึกอบรมและการปรับแต่งตามวัฒนธรรม ผู้ช่วย AI ที่ขับเคลื่อนโดย SeaLLM-chat สามารถเข้าใจ เคารพ และสะท้อนบริบททางวัฒนธรรมของภาษาในภูมิภาคได้อย่างแม่นยำ รวมถึงบรรทัดฐานทางสังคม การตั้งค่าทางภาษา และการพิจารณาทางกฎหมาย
“โครงการริเริ่มนี้มีศักยภาพในการปลดล็อกโอกาสใหม่ๆ ให้กับผู้คนนับล้านที่พูดภาษาต่างๆ นอกเหนือจากภาษาอังกฤษและภาษาจีน ความพยายามของอาลีบาบาในการสนับสนุนเทคโนโลยีที่ครอบคลุมได้มาถึงจุดสำคัญแล้วด้วยการเปิดตัว SeaLLM” Luu Anh Tuan ผู้ช่วยศาสตราจารย์ในคณะวิทยาการคอมพิวเตอร์และวิศวกรรมศาสตร์ (SCSE) แห่งมหาวิทยาลัยเทคโนโลยีนันยาง ซึ่งเป็นพันธมิตรระยะยาวของอาลีบาบาในการศึกษา AI หลายภาษา กล่าว .
LLM ที่ปรับตัวเข้ากับวัฒนธรรมยังสามารถช่วยให้บริษัทต่างๆ สามารถสร้างผู้ช่วยแชทบอทของตนเองสำหรับธุรกิจที่เกี่ยวข้องกับตลาดเอเชียตะวันออกเฉียงใต้
แบ่งปัน
คุณอาจชอบเนื้อหานี้
เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ
เนื้อหายอดนิยม
DAMO Academy ของอาลีบาบาเปิดตัว LLM ที่ออกแบบมาสำหรับเอเชียตะวันออกเฉียงใต้

- LLM ได้รับการปรับให้เหมาะสมเพื่อประมวลผลภาษาเอเชียตะวันออกเฉียงใต้และสามารถสะท้อนความแตกต่างทางวัฒนธรรมได้
- ตอบสนองความต้องการ LLM ที่แปลแล้วเทียบกับ LLM ที่ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลภาษาอังกฤษและละติน
สถาบันวิจัยDAMO Academy ของอาลีบาบา กรุ๊ป เปิดเผยเมื่อวันจันทร์ที่ผ่านมา แบบจำลองภาษาขนาดใหญ่ 2 โมเดลที่ออกแบบมาเพื่อสะท้อนภูมิทัศน์ทางภาษาและวัฒนธรรมที่หลากหลายของเอเชียตะวันออกเฉียงใต้
DAMO Academy เปิดตัวโมเดลชื่อ SeaLLM และเวอร์ชันที่ได้รับการปรับแต่งการสนทนาชื่อ SeaLLM-chat
แบบจำลองซึ่งมีสองขนาดคือ 13 พันล้านและ 7 พันล้านพารามิเตอร์ สามารถประมวลผลภาษาท้องถิ่น ได้แก่ เวียดนาม อินโดนีเซีย ไทย มาเลย์ เขมร ลาว ตากาล็อก และพม่า ทั้งสองสามารถปฏิบัติงานที่สอดคล้องกับประเพณี สไตล์ และข้อกำหนดทางกฎหมายของท้องถิ่นได้ดีขึ้น
ความคิดริเริ่มนี้เกิดขึ้นท่ามกลางความต้องการ LLM ที่เกี่ยวข้องกับท้องถิ่นที่เพิ่มขึ้นจากประเทศต่างๆ ในเอเชียตะวันออกเฉียงใต้ ตัวอย่างเช่น สิงคโปร์ได้สร้างโครงการริเริ่มด้าน AI มูลค่า 52 ล้านดอลลาร์เพื่อพัฒนาขีดความสามารถด้านการวิจัยและวิศวกรรมของ Lion City ในด้าน LLM แบบหลายรูปแบบ
อาลีบาบากล่าวว่าการเปิดตัวดังกล่าวได้รับการออกแบบเพื่อสร้าง LLM ที่มีความครอบคลุมและเกี่ยวข้องกับภูมิภาคมากขึ้น ซึ่งสะท้อนถึงความแตกต่างทางวัฒนธรรมของเอเชียตะวันออกเฉียงใต้ LLM ส่วนใหญ่มาจากประเทศตะวันตกและได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่มาจากภาษาที่มาจากภาษาอังกฤษและภาษาที่มาจากภาษาละตินอย่างไม่เป็นสัดส่วน
“นวัตกรรมนี้มีจุดมุ่งหมายเพื่อเร่งการทำให้ AI เป็นประชาธิปไตย และเพิ่มศักยภาพให้กับชุมชนที่ไม่เคยมีบทบาทน้อยในอดีตในอาณาจักรดิจิทัล” Bing Lidong ผู้อำนวยการห้องปฏิบัติการเทคโนโลยีภาษาของ DAMO Academy ของ Alibaba กล่าว
DAMO Academy ได้เปิดซอร์สโมเดลบนHugging Faceทำให้สามารถนำไปใช้ในการวิจัยและเชิงพาณิชย์ได้อย่างอิสระ
การเชื่อมการแบ่งแยกทางภาษา
ด้วยการฝึกอบรมชุดภาษาเอเชียตะวันออกเฉียงใต้ที่หลากหลาย SeaLLM สามารถตีความและประมวลผลข้อความได้นานกว่ารุ่นเช่น ChatGPT สำหรับภาษาที่ไม่ใช่ละตินถึงเก้าเท่า และมีความสามารถในการดำเนินงานที่ซับซ้อนมากขึ้น โดยมีประสิทธิภาพเหนือกว่า LLM แบบโอเพ่นซอร์สส่วนใหญ่ในการทำความเข้าใจสาขาวิชาที่หลากหลายตั้งแต่วิทยาศาสตร์ เคมี ฟิสิกส์ ไปจนถึงเศรษฐศาสตร์ ในภาษาของภูมิภาค
โมเดลนี้มีประสิทธิภาพเหนือกว่าโมเดลอื่นๆ ที่มีอยู่ในด้านความสามารถในการแปลภาษาด้วยเครื่องระหว่างภาษาอังกฤษและภาษาที่มีทรัพยากรต่ำ โดยอ้างอิงถึงรุ่นที่มีข้อมูลที่จำกัดสำหรับการฝึกอบรมระบบ AI การสนทนา เช่น ลาวและเขมร นอกจากนี้ยังมอบประสิทธิภาพที่ทัดเทียมกับโมเดลล้ำสมัยในภาษาที่มีทรัพยากรสูงส่วนใหญ่ โดยอ้างอิงถึงภาษาที่มีแหล่งข้อมูลการฝึกอบรมมากมาย เช่น ภาษาเวียดนามและอินโดนีเซีย
ด้วยการเพิ่มประสิทธิภาพก่อนการฝึกอบรมและการปรับแต่งตามวัฒนธรรม ผู้ช่วย AI ที่ขับเคลื่อนโดย SeaLLM-chat สามารถเข้าใจ เคารพ และสะท้อนบริบททางวัฒนธรรมของภาษาในภูมิภาคได้อย่างแม่นยำ รวมถึงบรรทัดฐานทางสังคม การตั้งค่าทางภาษา และการพิจารณาทางกฎหมาย
“โครงการริเริ่มนี้มีศักยภาพในการปลดล็อกโอกาสใหม่ๆ ให้กับผู้คนนับล้านที่พูดภาษาต่างๆ นอกเหนือจากภาษาอังกฤษและภาษาจีน ความพยายามของอาลีบาบาในการสนับสนุนเทคโนโลยีที่ครอบคลุมได้มาถึงจุดสำคัญแล้วด้วยการเปิดตัว SeaLLM” Luu Anh Tuan ผู้ช่วยศาสตราจารย์ในคณะวิทยาการคอมพิวเตอร์และวิศวกรรมศาสตร์ (SCSE) แห่งมหาวิทยาลัยเทคโนโลยีนันยาง ซึ่งเป็นพันธมิตรระยะยาวของอาลีบาบาในการศึกษา AI หลายภาษา กล่าว .
LLM ที่ปรับตัวเข้ากับวัฒนธรรมยังสามารถช่วยให้บริษัทต่างๆ สามารถสร้างผู้ช่วยแชทบอทของตนเองสำหรับธุรกิจที่เกี่ยวข้องกับตลาดเอเชียตะวันออกเฉียงใต้











