วิธีการฝึกอบรม AI ใหม่ของอาลีบาบาลดต้นทุนการค้นหาได้เกือบ 90%

- ZEROSEARCH ของอาลีบาบาใช้กลยุทธ์การจําลองสองขั้นตอนเพื่อขจัดต้นทุน API
- การวิเคราะห์การประเมินอิสระที่รู้จักกันดีจัดอันดับ Qwen3-235B-A22B เป็นอันดับแรกในด้านความสามารถในการจ่ายในบรรดารุ่นชั้นนํา
อาลีบาบาได้เปิดตัว ZEROSEARCH ซึ่งเป็นแนวทางที่ก้าวล้ําสําหรับการฝึกอบรมโมเดลภาษาขนาดใหญ่ (LLM) ที่ช่วยลดต้นทุนในการสอน AI ให้ทํางานค้นหาได้อย่างมาก แนวทางที่เป็นนวัตกรรมใหม่นี้ช่วยขจัดการเรียก API ที่มีราคาแพงไปยังเครื่องมือค้นหาเชิงพาณิชย์โดยการฝึกอบรมโมเดลเพื่อจําลองพฤติกรรมการค้นหาลดค่าใช้จ่ายในการฝึกอบรมลงเกือบ 90% และทําให้ฟังก์ชันการค้นหา AI ขั้นสูงเข้าถึงได้มากขึ้น
“ด้วยการลดต้นทุนที่เกี่ยวข้องกับการฝึกอบรม LLM เพื่อจําลองพฤติกรรมของเครื่องมือค้นหา เรากําลังช่วยให้นักพัฒนาและธุรกิจ โดยเฉพาะองค์กรขนาดเล็กและขนาดกลาง สามารถพัฒนาเฟรมเวิร์กการเรียนรู้แบบเสริมแรง (RL) ของตนเองได้อย่างอิสระโดยไม่ต้องมีการโต้ตอบกับเครื่องมือค้นหาที่มีค่าใช้จ่ายสูง” Huang Fei หัวหน้าห้องปฏิบัติการประมวลผลภาษาธรรมชาติ Tongyi ของอาลีบาบากล่าว. “ZEROSEARCH เป็นก้าวสําคัญในการทําให้เทคโนโลยี RL ขนาดใหญ่เป็นประชาธิปไตยโดยการเพิ่มความสามารถในการจ่ายโดยไม่ลดทอนประสิทธิภาพ”
ลดอุปสรรคสําหรับนักพัฒนาและธุรกิจ
การค้นหาข้อมูลที่เกี่ยวข้องเป็นสิ่งสําคัญในการเพิ่มเหตุผลและความแม่นยําในการตอบสนองของ LLM วิธีการเรียนรู้แบบเสริมแรง (RL) แบบดั้งเดิมต้องการการโต้ตอบหลายแสนครั้งกับเครื่องมือค้นหาสดผ่านคําขอ API ที่มีราคาแพงทําให้การฝึกอบรมมีราคาแพงมากและจํากัดความสามารถในการปรับขนาด นอกจากนี้ คุณภาพผลลัพธ์ที่ไม่สอดคล้องกันที่ได้รับจากเครื่องมือค้นหามักส่งผลกระทบต่อประสิทธิภาพของกระบวนการฝึกอบรม
จําลองการค้นหาอย่างมีประสิทธิภาพและราคาไม่แพง
เพื่อจัดการกับความท้าทายเหล่านี้ ZEROSEARCH ของอาลีบาบาใช้กลยุทธ์การจําลองแบบสองขั้นตอนที่ช่วยลดความจําเป็นในการเรียก API ที่มีค่าใช้จ่ายสูง:
ขั้นแรกทีมงานใช้การปรับแต่งภายใต้การดูแลที่มีน้ําหนักเบาเพื่อเปลี่ยน LLM ให้เป็นโมดูลการดึงข้อมูลที่สามารถสร้างเอกสารที่เกี่ยวข้องเพื่อตอบสนองต่อคําถามของผู้ใช้โดยเลียนแบบพฤติกรรมของเครื่องมือค้นหาจริง
ประการที่สอง ในช่วง RL นักวิจัยใช้กลยุทธ์การเปิดตัวตามหลักสูตร วิธีนี้ลดคุณภาพของเอกสารจําลองที่สร้างขึ้นเรื่อย ๆ ทําให้โมเดลต้องปรับตัวและปรับปรุงประสิทธิภาพอย่างต่อเนื่อง
ในการทดสอบโมเดลที่ฝึกโดยใช้ ZEROSEARCH ตรงกับหรือเกินประสิทธิภาพของโมเดลที่ได้รับการฝึกอบรมด้วย API ของเครื่องมือค้นหาจริง ตัวอย่างเช่น โมดูลการดึงข้อมูล Qwen2.5-7B แสดงให้เห็นถึงประสิทธิภาพที่เทียบได้กับ Google Search ในขณะที่โมดูล 14B ที่ใหญ่กว่านั้นเหนือกว่าความสามารถของ Google ซึ่งช่วยลดค่าใช้จ่ายในการฝึกอบรมได้ 88%
ความมุ่งมั่นอย่างต่อเนื่องของอาลีบาบาในการเปิด AI และราคาไม่แพง
นอกเหนือจากการฝึกอบรมที่คุ้มค่าแล้ว Alibaba ยังได้โอเพ่นซอร์สโมเดล AI หลายแบบในขนาด ภาษา และรูปแบบ สนับสนุนนักพัฒนาทั่วโลกในการสร้างโซลูชัน AI แบบกําหนดเองด้วยวิธีที่คุ้มค่า


การประเมินอิสระโดย Artificial Analysis ซึ่งเป็นการวิเคราะห์อิสระที่ได้รับการยอมรับอย่างดีเกี่ยวกับโมเดล AI และผู้ให้บริการ API ได้วาง LLM Qwen3-235B-A22B ล่าสุดของอาลีบาบา เป็นอันดับห้าโดยรวมในด้านสติปัญญา (คณิตศาสตร์ การเข้ารหัส การให้เหตุผล และวิทยาศาสตร์) และเป็นอันดับหนึ่งในด้านความสามารถในการจ่าย ซึ่งต่ํากว่าข้อเสนอของคู่แข่งอย่างมาก
แบ่งปัน
คุณอาจชอบเนื้อหานี้
เลือกชมสินค้ามากมาย และให้เราสั่งซื้อสินค้าให้คุณ
เนื้อหายอดนิยม
วิธีการฝึกอบรม AI ใหม่ของอาลีบาบาลดต้นทุนการค้นหาได้เกือบ 90%

- ZEROSEARCH ของอาลีบาบาใช้กลยุทธ์การจําลองสองขั้นตอนเพื่อขจัดต้นทุน API
- การวิเคราะห์การประเมินอิสระที่รู้จักกันดีจัดอันดับ Qwen3-235B-A22B เป็นอันดับแรกในด้านความสามารถในการจ่ายในบรรดารุ่นชั้นนํา
อาลีบาบาได้เปิดตัว ZEROSEARCH ซึ่งเป็นแนวทางที่ก้าวล้ําสําหรับการฝึกอบรมโมเดลภาษาขนาดใหญ่ (LLM) ที่ช่วยลดต้นทุนในการสอน AI ให้ทํางานค้นหาได้อย่างมาก แนวทางที่เป็นนวัตกรรมใหม่นี้ช่วยขจัดการเรียก API ที่มีราคาแพงไปยังเครื่องมือค้นหาเชิงพาณิชย์โดยการฝึกอบรมโมเดลเพื่อจําลองพฤติกรรมการค้นหาลดค่าใช้จ่ายในการฝึกอบรมลงเกือบ 90% และทําให้ฟังก์ชันการค้นหา AI ขั้นสูงเข้าถึงได้มากขึ้น
“ด้วยการลดต้นทุนที่เกี่ยวข้องกับการฝึกอบรม LLM เพื่อจําลองพฤติกรรมของเครื่องมือค้นหา เรากําลังช่วยให้นักพัฒนาและธุรกิจ โดยเฉพาะองค์กรขนาดเล็กและขนาดกลาง สามารถพัฒนาเฟรมเวิร์กการเรียนรู้แบบเสริมแรง (RL) ของตนเองได้อย่างอิสระโดยไม่ต้องมีการโต้ตอบกับเครื่องมือค้นหาที่มีค่าใช้จ่ายสูง” Huang Fei หัวหน้าห้องปฏิบัติการประมวลผลภาษาธรรมชาติ Tongyi ของอาลีบาบากล่าว. “ZEROSEARCH เป็นก้าวสําคัญในการทําให้เทคโนโลยี RL ขนาดใหญ่เป็นประชาธิปไตยโดยการเพิ่มความสามารถในการจ่ายโดยไม่ลดทอนประสิทธิภาพ”
ลดอุปสรรคสําหรับนักพัฒนาและธุรกิจ
การค้นหาข้อมูลที่เกี่ยวข้องเป็นสิ่งสําคัญในการเพิ่มเหตุผลและความแม่นยําในการตอบสนองของ LLM วิธีการเรียนรู้แบบเสริมแรง (RL) แบบดั้งเดิมต้องการการโต้ตอบหลายแสนครั้งกับเครื่องมือค้นหาสดผ่านคําขอ API ที่มีราคาแพงทําให้การฝึกอบรมมีราคาแพงมากและจํากัดความสามารถในการปรับขนาด นอกจากนี้ คุณภาพผลลัพธ์ที่ไม่สอดคล้องกันที่ได้รับจากเครื่องมือค้นหามักส่งผลกระทบต่อประสิทธิภาพของกระบวนการฝึกอบรม
จําลองการค้นหาอย่างมีประสิทธิภาพและราคาไม่แพง
เพื่อจัดการกับความท้าทายเหล่านี้ ZEROSEARCH ของอาลีบาบาใช้กลยุทธ์การจําลองแบบสองขั้นตอนที่ช่วยลดความจําเป็นในการเรียก API ที่มีค่าใช้จ่ายสูง:
ขั้นแรกทีมงานใช้การปรับแต่งภายใต้การดูแลที่มีน้ําหนักเบาเพื่อเปลี่ยน LLM ให้เป็นโมดูลการดึงข้อมูลที่สามารถสร้างเอกสารที่เกี่ยวข้องเพื่อตอบสนองต่อคําถามของผู้ใช้โดยเลียนแบบพฤติกรรมของเครื่องมือค้นหาจริง
ประการที่สอง ในช่วง RL นักวิจัยใช้กลยุทธ์การเปิดตัวตามหลักสูตร วิธีนี้ลดคุณภาพของเอกสารจําลองที่สร้างขึ้นเรื่อย ๆ ทําให้โมเดลต้องปรับตัวและปรับปรุงประสิทธิภาพอย่างต่อเนื่อง
ในการทดสอบโมเดลที่ฝึกโดยใช้ ZEROSEARCH ตรงกับหรือเกินประสิทธิภาพของโมเดลที่ได้รับการฝึกอบรมด้วย API ของเครื่องมือค้นหาจริง ตัวอย่างเช่น โมดูลการดึงข้อมูล Qwen2.5-7B แสดงให้เห็นถึงประสิทธิภาพที่เทียบได้กับ Google Search ในขณะที่โมดูล 14B ที่ใหญ่กว่านั้นเหนือกว่าความสามารถของ Google ซึ่งช่วยลดค่าใช้จ่ายในการฝึกอบรมได้ 88%
ความมุ่งมั่นอย่างต่อเนื่องของอาลีบาบาในการเปิด AI และราคาไม่แพง
นอกเหนือจากการฝึกอบรมที่คุ้มค่าแล้ว Alibaba ยังได้โอเพ่นซอร์สโมเดล AI หลายแบบในขนาด ภาษา และรูปแบบ สนับสนุนนักพัฒนาทั่วโลกในการสร้างโซลูชัน AI แบบกําหนดเองด้วยวิธีที่คุ้มค่า


การประเมินอิสระโดย Artificial Analysis ซึ่งเป็นการวิเคราะห์อิสระที่ได้รับการยอมรับอย่างดีเกี่ยวกับโมเดล AI และผู้ให้บริการ API ได้วาง LLM Qwen3-235B-A22B ล่าสุดของอาลีบาบา เป็นอันดับห้าโดยรวมในด้านสติปัญญา (คณิตศาสตร์ การเข้ารหัส การให้เหตุผล และวิทยาศาสตร์) และเป็นอันดับหนึ่งในด้านความสามารถในการจ่าย ซึ่งต่ํากว่าข้อเสนอของคู่แข่งอย่างมาก










