DAMO Academy ของอาลีบาบาเปิดตัว LLM ที่ออกแบบมาสำหรับเอเชียตะวันออกเฉียงใต้ – Taobao Thailand

ทั้งหมด                 Alibaba Group                 อีคอมเมิร์ซ                 เทคโนโลยี                 โลจิสติกส์            ความยั่งยืน                 ไลฟ์สไตล์


DAMO Academy ของอาลีบาบาเปิดตัว LLM ที่ออกแบบมาสำหรับเอเชียตะวันออกเฉียงใต้

เครดิตภาพ: Shutterstock
เทคโนโลยีเกิดใหม่|เผยแพร่เมื่อ 11 ธันวาคม 2023

  • LLM ได้รับการปรับให้เหมาะสมเพื่อประมวลผลภาษาเอเชียตะวันออกเฉียงใต้และสามารถสะท้อนความแตกต่างทางวัฒนธรรมได้
  • ตอบสนองความต้องการ LLM ที่แปลแล้วเทียบกับ LLM ที่ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลภาษาอังกฤษและละติน

สถาบันวิจัยDAMO Academy ของอาลีบาบา กรุ๊ป เปิดเผยเมื่อวันจันทร์ที่ผ่านมา แบบจำลองภาษาขนาดใหญ่ 2 โมเดลที่ออกแบบมาเพื่อสะท้อนภูมิทัศน์ทางภาษาและวัฒนธรรมที่หลากหลายของเอเชียตะวันออกเฉียงใต้

DAMO Academy เปิดตัวโมเดลชื่อ SeaLLM และเวอร์ชันที่ได้รับการปรับแต่งการสนทนาชื่อ SeaLLM-chat

แบบจำลองซึ่งมีสองขนาดคือ 13 พันล้านและ 7 พันล้านพารามิเตอร์ สามารถประมวลผลภาษาท้องถิ่น ได้แก่ เวียดนาม อินโดนีเซีย ไทย มาเลย์ เขมร ลาว ตากาล็อก และพม่า ทั้งสองสามารถปฏิบัติงานที่สอดคล้องกับประเพณี สไตล์ และข้อกำหนดทางกฎหมายของท้องถิ่นได้ดีขึ้น

ความคิดริเริ่มนี้เกิดขึ้นท่ามกลางความต้องการ LLM ที่เกี่ยวข้องกับท้องถิ่นที่เพิ่มขึ้นจากประเทศต่างๆ ในเอเชียตะวันออกเฉียงใต้ ตัวอย่างเช่น สิงคโปร์ได้สร้างโครงการริเริ่มด้าน AI มูลค่า 52 ล้านดอลลาร์เพื่อพัฒนาขีดความสามารถด้านการวิจัยและวิศวกรรมของ Lion City ในด้าน LLM แบบหลายรูปแบบ

อาลีบาบากล่าวว่าการเปิดตัวดังกล่าวได้รับการออกแบบเพื่อสร้าง LLM ที่มีความครอบคลุมและเกี่ยวข้องกับภูมิภาคมากขึ้น ซึ่งสะท้อนถึงความแตกต่างทางวัฒนธรรมของเอเชียตะวันออกเฉียงใต้ LLM ส่วนใหญ่มาจากประเทศตะวันตกและได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่มาจากภาษาที่มาจากภาษาอังกฤษและภาษาที่มาจากภาษาละตินอย่างไม่เป็นสัดส่วน

“นวัตกรรมนี้มีจุดมุ่งหมายเพื่อเร่งการทำให้ AI เป็นประชาธิปไตย และเพิ่มศักยภาพให้กับชุมชนที่ไม่เคยมีบทบาทน้อยในอดีตในอาณาจักรดิจิทัล” Bing Lidong ผู้อำนวยการห้องปฏิบัติการเทคโนโลยีภาษาของ DAMO Academy ของ Alibaba กล่าว

DAMO Academy ได้เปิดซอร์สโมเดลบนHugging Faceทำให้สามารถนำไปใช้ในการวิจัยและเชิงพาณิชย์ได้อย่างอิสระ

การเชื่อมการแบ่งแยกทางภาษา

ด้วยการฝึกอบรมชุดภาษาเอเชียตะวันออกเฉียงใต้ที่หลากหลาย SeaLLM สามารถตีความและประมวลผลข้อความได้นานกว่ารุ่นเช่น ChatGPT สำหรับภาษาที่ไม่ใช่ละตินถึงเก้าเท่า และมีความสามารถในการดำเนินงานที่ซับซ้อนมากขึ้น โดยมีประสิทธิภาพเหนือกว่า LLM แบบโอเพ่นซอร์สส่วนใหญ่ในการทำความเข้าใจสาขาวิชาที่หลากหลายตั้งแต่วิทยาศาสตร์ เคมี ฟิสิกส์ ไปจนถึงเศรษฐศาสตร์ ในภาษาของภูมิภาค

โมเดลนี้มีประสิทธิภาพเหนือกว่าโมเดลอื่นๆ ที่มีอยู่ในด้านความสามารถในการแปลภาษาด้วยเครื่องระหว่างภาษาอังกฤษและภาษาที่มีทรัพยากรต่ำ โดยอ้างอิงถึงรุ่นที่มีข้อมูลที่จำกัดสำหรับการฝึกอบรมระบบ AI การสนทนา เช่น ลาวและเขมร นอกจากนี้ยังมอบประสิทธิภาพที่ทัดเทียมกับโมเดลล้ำสมัยในภาษาที่มีทรัพยากรสูงส่วนใหญ่ โดยอ้างอิงถึงภาษาที่มีแหล่งข้อมูลการฝึกอบรมมากมาย เช่น ภาษาเวียดนามและอินโดนีเซีย

ด้วยการเพิ่มประสิทธิภาพก่อนการฝึกอบรมและการปรับแต่งตามวัฒนธรรม ผู้ช่วย AI ที่ขับเคลื่อนโดย SeaLLM-chat สามารถเข้าใจ เคารพ และสะท้อนบริบททางวัฒนธรรมของภาษาในภูมิภาคได้อย่างแม่นยำ รวมถึงบรรทัดฐานทางสังคม การตั้งค่าทางภาษา และการพิจารณาทางกฎหมาย

“โครงการริเริ่มนี้มีศักยภาพในการปลดล็อกโอกาสใหม่ๆ ให้กับผู้คนนับล้านที่พูดภาษาต่างๆ นอกเหนือจากภาษาอังกฤษและภาษาจีน ความพยายามของอาลีบาบาในการสนับสนุนเทคโนโลยีที่ครอบคลุมได้มาถึงจุดสำคัญแล้วด้วยการเปิดตัว SeaLLM” Luu Anh Tuan ผู้ช่วยศาสตราจารย์ในคณะวิทยาการคอมพิวเตอร์และวิศวกรรมศาสตร์ (SCSE) แห่งมหาวิทยาลัยเทคโนโลยีนันยาง ซึ่งเป็นพันธมิตรระยะยาวของอาลีบาบาในการศึกษา AI หลายภาษา กล่าว .

LLM ที่ปรับตัวเข้ากับวัฒนธรรมยังสามารถช่วยให้บริษัทต่างๆ สามารถสร้างผู้ช่วยแชทบอทของตนเองสำหรับธุรกิจที่เกี่ยวข้องกับตลาดเอเชียตะวันออกเฉียงใต้

เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ

SHOPPING MALL

DAMO Academy ของอาลีบาบาเปิดตัว LLM ที่ออกแบบมาสำหรับเอเชียตะวันออกเฉียงใต้

เครดิตภาพ: Shutterstock
เทคโนโลยีเกิดใหม่|เผยแพร่เมื่อ 11 ธันวาคม 2023
เผยแพร่เมื่อ 11 ธันวาคม 2023

  • LLM ได้รับการปรับให้เหมาะสมเพื่อประมวลผลภาษาเอเชียตะวันออกเฉียงใต้และสามารถสะท้อนความแตกต่างทางวัฒนธรรมได้
  • ตอบสนองความต้องการ LLM ที่แปลแล้วเทียบกับ LLM ที่ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลภาษาอังกฤษและละติน

สถาบันวิจัยDAMO Academy ของอาลีบาบา กรุ๊ป เปิดเผยเมื่อวันจันทร์ที่ผ่านมา แบบจำลองภาษาขนาดใหญ่ 2 โมเดลที่ออกแบบมาเพื่อสะท้อนภูมิทัศน์ทางภาษาและวัฒนธรรมที่หลากหลายของเอเชียตะวันออกเฉียงใต้

DAMO Academy เปิดตัวโมเดลชื่อ SeaLLM และเวอร์ชันที่ได้รับการปรับแต่งการสนทนาชื่อ SeaLLM-chat

แบบจำลองซึ่งมีสองขนาดคือ 13 พันล้านและ 7 พันล้านพารามิเตอร์ สามารถประมวลผลภาษาท้องถิ่น ได้แก่ เวียดนาม อินโดนีเซีย ไทย มาเลย์ เขมร ลาว ตากาล็อก และพม่า ทั้งสองสามารถปฏิบัติงานที่สอดคล้องกับประเพณี สไตล์ และข้อกำหนดทางกฎหมายของท้องถิ่นได้ดีขึ้น

ความคิดริเริ่มนี้เกิดขึ้นท่ามกลางความต้องการ LLM ที่เกี่ยวข้องกับท้องถิ่นที่เพิ่มขึ้นจากประเทศต่างๆ ในเอเชียตะวันออกเฉียงใต้ ตัวอย่างเช่น สิงคโปร์ได้สร้างโครงการริเริ่มด้าน AI มูลค่า 52 ล้านดอลลาร์เพื่อพัฒนาขีดความสามารถด้านการวิจัยและวิศวกรรมของ Lion City ในด้าน LLM แบบหลายรูปแบบ

อาลีบาบากล่าวว่าการเปิดตัวดังกล่าวได้รับการออกแบบเพื่อสร้าง LLM ที่มีความครอบคลุมและเกี่ยวข้องกับภูมิภาคมากขึ้น ซึ่งสะท้อนถึงความแตกต่างทางวัฒนธรรมของเอเชียตะวันออกเฉียงใต้ LLM ส่วนใหญ่มาจากประเทศตะวันตกและได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่มาจากภาษาที่มาจากภาษาอังกฤษและภาษาที่มาจากภาษาละตินอย่างไม่เป็นสัดส่วน

“นวัตกรรมนี้มีจุดมุ่งหมายเพื่อเร่งการทำให้ AI เป็นประชาธิปไตย และเพิ่มศักยภาพให้กับชุมชนที่ไม่เคยมีบทบาทน้อยในอดีตในอาณาจักรดิจิทัล” Bing Lidong ผู้อำนวยการห้องปฏิบัติการเทคโนโลยีภาษาของ DAMO Academy ของ Alibaba กล่าว

DAMO Academy ได้เปิดซอร์สโมเดลบนHugging Faceทำให้สามารถนำไปใช้ในการวิจัยและเชิงพาณิชย์ได้อย่างอิสระ

การเชื่อมการแบ่งแยกทางภาษา

ด้วยการฝึกอบรมชุดภาษาเอเชียตะวันออกเฉียงใต้ที่หลากหลาย SeaLLM สามารถตีความและประมวลผลข้อความได้นานกว่ารุ่นเช่น ChatGPT สำหรับภาษาที่ไม่ใช่ละตินถึงเก้าเท่า และมีความสามารถในการดำเนินงานที่ซับซ้อนมากขึ้น โดยมีประสิทธิภาพเหนือกว่า LLM แบบโอเพ่นซอร์สส่วนใหญ่ในการทำความเข้าใจสาขาวิชาที่หลากหลายตั้งแต่วิทยาศาสตร์ เคมี ฟิสิกส์ ไปจนถึงเศรษฐศาสตร์ ในภาษาของภูมิภาค

โมเดลนี้มีประสิทธิภาพเหนือกว่าโมเดลอื่นๆ ที่มีอยู่ในด้านความสามารถในการแปลภาษาด้วยเครื่องระหว่างภาษาอังกฤษและภาษาที่มีทรัพยากรต่ำ โดยอ้างอิงถึงรุ่นที่มีข้อมูลที่จำกัดสำหรับการฝึกอบรมระบบ AI การสนทนา เช่น ลาวและเขมร นอกจากนี้ยังมอบประสิทธิภาพที่ทัดเทียมกับโมเดลล้ำสมัยในภาษาที่มีทรัพยากรสูงส่วนใหญ่ โดยอ้างอิงถึงภาษาที่มีแหล่งข้อมูลการฝึกอบรมมากมาย เช่น ภาษาเวียดนามและอินโดนีเซีย

ด้วยการเพิ่มประสิทธิภาพก่อนการฝึกอบรมและการปรับแต่งตามวัฒนธรรม ผู้ช่วย AI ที่ขับเคลื่อนโดย SeaLLM-chat สามารถเข้าใจ เคารพ และสะท้อนบริบททางวัฒนธรรมของภาษาในภูมิภาคได้อย่างแม่นยำ รวมถึงบรรทัดฐานทางสังคม การตั้งค่าทางภาษา และการพิจารณาทางกฎหมาย

“โครงการริเริ่มนี้มีศักยภาพในการปลดล็อกโอกาสใหม่ๆ ให้กับผู้คนนับล้านที่พูดภาษาต่างๆ นอกเหนือจากภาษาอังกฤษและภาษาจีน ความพยายามของอาลีบาบาในการสนับสนุนเทคโนโลยีที่ครอบคลุมได้มาถึงจุดสำคัญแล้วด้วยการเปิดตัว SeaLLM” Luu Anh Tuan ผู้ช่วยศาสตราจารย์ในคณะวิทยาการคอมพิวเตอร์และวิศวกรรมศาสตร์ (SCSE) แห่งมหาวิทยาลัยเทคโนโลยีนันยาง ซึ่งเป็นพันธมิตรระยะยาวของอาลีบาบาในการศึกษา AI หลายภาษา กล่าว .

LLM ที่ปรับตัวเข้ากับวัฒนธรรมยังสามารถช่วยให้บริษัทต่างๆ สามารถสร้างผู้ช่วยแชทบอทของตนเองสำหรับธุรกิจที่เกี่ยวข้องกับตลาดเอเชียตะวันออกเฉียงใต้

เลือกชมสินค้ามากมาย และให้เราสั่งซื้อให้คุณ

SHOPPING MALL

ให้เราสั่งซื้อสินค้าให้คุณ

SHOPPING MALL

คุณอาจชอบเนื้อหานี้

Privacy Preference Center