วิธีการฝึกอบรม AI ใหม่ของอาลีบาบาลดต้นทุนการค้นหาได้เกือบ 90%

ทั้งหมด Alibaba Group อีคอมเมิร์ซ เทคโนโลยี โลจิสติกส์ ความยั่งยืน ไลฟ์สไตล์

วิธีการฝึกอบรม AI ใหม่ของอาลีบาบาลดต้นทุนการค้นหาได้เกือบ 90%

เทคโนโลยี|เผยแพร่เมื่อ 13 พฤษภาคม 2025

ZEROSEARCH ของอาลีบาบาใช้กลยุทธ์การจําลองสองขั้นตอนเพื่อขจัดต้นทุน API
การวิเคราะห์การประเมินอิสระที่รู้จักกันดีจัดอันดับ Qwen3-235B-A22B เป็นอันดับแรกในด้านความสามารถในการจ่ายในบรรดารุ่นชั้นนํา

อาลีบาบาได้เปิดตัว ZEROSEARCH ซึ่งเป็นแนวทางที่ก้าวล้ําสําหรับการฝึกอบรมโมเดลภาษาขนาดใหญ่ (LLM) ที่ช่วยลดต้นทุนในการสอน AI ให้ทํางานค้นหาได้อย่างมาก แนวทางที่เป็นนวัตกรรมใหม่นี้ช่วยขจัดการเรียก API ที่มีราคาแพงไปยังเครื่องมือค้นหาเชิงพาณิชย์โดยการฝึกอบรมโมเดลเพื่อจําลองพฤติกรรมการค้นหาลดค่าใช้จ่ายในการฝึกอบรมลงเกือบ 90% และทําให้ฟังก์ชันการค้นหา AI ขั้นสูงเข้าถึงได้มากขึ้น

“ด้วยการลดต้นทุนที่เกี่ยวข้องกับการฝึกอบรม LLM เพื่อจําลองพฤติกรรมของเครื่องมือค้นหา เรากําลังช่วยให้นักพัฒนาและธุรกิจ โดยเฉพาะองค์กรขนาดเล็กและขนาดกลาง สามารถพัฒนาเฟรมเวิร์กการเรียนรู้แบบเสริมแรง (RL) ของตนเองได้อย่างอิสระโดยไม่ต้องมีการโต้ตอบกับเครื่องมือค้นหาที่มีค่าใช้จ่ายสูง” Huang Fei หัวหน้าห้องปฏิบัติการประมวลผลภาษาธรรมชาติ Tongyi ของอาลีบาบากล่าว. “ZEROSEARCH เป็นก้าวสําคัญในการทําให้เทคโนโลยี RL ขนาดใหญ่เป็นประชาธิปไตยโดยการเพิ่มความสามารถในการจ่ายโดยไม่ลดทอนประสิทธิภาพ”

ลดอุปสรรคสําหรับนักพัฒนาและธุรกิจ

การค้นหาข้อมูลที่เกี่ยวข้องเป็นสิ่งสําคัญในการเพิ่มเหตุผลและความแม่นยําในการตอบสนองของ LLM วิธีการเรียนรู้แบบเสริมแรง (RL) แบบดั้งเดิมต้องการการโต้ตอบหลายแสนครั้งกับเครื่องมือค้นหาสดผ่านคําขอ API ที่มีราคาแพงทําให้การฝึกอบรมมีราคาแพงมากและจํากัดความสามารถในการปรับขนาด นอกจากนี้ คุณภาพผลลัพธ์ที่ไม่สอดคล้องกันที่ได้รับจากเครื่องมือค้นหามักส่งผลกระทบต่อประสิทธิภาพของกระบวนการฝึกอบรม

จําลองการค้นหาอย่างมีประสิทธิภาพและราคาไม่แพง

เพื่อจัดการกับความท้าทายเหล่านี้ ZEROSEARCH ของอาลีบาบาใช้กลยุทธ์การจําลองแบบสองขั้นตอนที่ช่วยลดความจําเป็นในการเรียก API ที่มีค่าใช้จ่ายสูง:

ขั้นแรกทีมงานใช้การปรับแต่งภายใต้การดูแลที่มีน้ําหนักเบาเพื่อเปลี่ยน LLM ให้เป็นโมดูลการดึงข้อมูลที่สามารถสร้างเอกสารที่เกี่ยวข้องเพื่อตอบสนองต่อคําถามของผู้ใช้โดยเลียนแบบพฤติกรรมของเครื่องมือค้นหาจริง

ประการที่สอง ในช่วง RL นักวิจัยใช้กลยุทธ์การเปิดตัวตามหลักสูตร วิธีนี้ลดคุณภาพของเอกสารจําลองที่สร้างขึ้นเรื่อย ๆ ทําให้โมเดลต้องปรับตัวและปรับปรุงประสิทธิภาพอย่างต่อเนื่อง

ในการทดสอบโมเดลที่ฝึกโดยใช้ ZEROSEARCH ตรงกับหรือเกินประสิทธิภาพของโมเดลที่ได้รับการฝึกอบรมด้วย API ของเครื่องมือค้นหาจริง ตัวอย่างเช่น โมดูลการดึงข้อมูล Qwen2.5-7B แสดงให้เห็นถึงประสิทธิภาพที่เทียบได้กับ Google Search ในขณะที่โมดูล 14B ที่ใหญ่กว่านั้นเหนือกว่าความสามารถของ Google ซึ่งช่วยลดค่าใช้จ่ายในการฝึกอบรมได้ 88%

ความมุ่งมั่นอย่างต่อเนื่องของอาลีบาบาในการเปิด AI และราคาไม่แพง

นอกเหนือจากการฝึกอบรมที่คุ้มค่าแล้ว Alibaba ยังได้โอเพ่นซอร์สโมเดล AI หลายแบบในขนาด ภาษา และรูปแบบ สนับสนุนนักพัฒนาทั่วโลกในการสร้างโซลูชัน AI แบบกําหนดเองด้วยวิธีที่คุ้มค่า

การวิเคราะห์ประดิษฐ์ทําให้ Qwen3-235B-A22B อยู่ในอันดับที่ห้าโดยรวมในด้านสติปัญญาและเป็นอันดับหนึ่งในด้านความสามารถในการจ่าย

การประเมินอิสระโดย Artificial Analysis ซึ่งเป็นการวิเคราะห์อิสระที่ได้รับการยอมรับอย่างดีเกี่ยวกับโมเดล AI และผู้ให้บริการ API ได้วาง LLM Qwen3-235B-A22B ล่าสุดของอาลีบาบา เป็นอันดับห้าโดยรวมในด้านสติปัญญา (คณิตศาสตร์ การเข้ารหัส การให้เหตุผล และวิทยาศาสตร์) และเป็นอันดับหนึ่งในด้านความสามารถในการจ่าย ซึ่งต่ํากว่าข้อเสนอของคู่แข่งอย่างมาก

คุณอาจชอบเนื้อหานี้

เทคโนโลยี

เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ

SHOPPING MALL

เนื้อหายอดนิยม

เทคโนโลยี