مدلهای زبانی در حین پیشآموزش بین «طوطی» و «هوش» جابهجا میشن
محققان دانشگاه UC Berkeley کشف کردن که مدلهای زبانی در حین پیشآموزش بهجای پیشرفت خطی، بارها و ناگهانی بین دو حالت «طوطی» (الگوبرداری سطحی) و «هوش» (تعمیم واقعی) سوئیچ میکنن؛ پدیدهای که اسمش رو «mode-hopping» گذاشتن. این جهشها نه با دینامیکهای بهینهسازی معمول قابل توضیحن و نه با میانگینگیری چکپوینتها قابل رفعن. تیم تحقیقاتی یه مجموعه ارزیابی ارزون طراحی کرده که میشه ازش برای انتخاب چکپوینتها و دادههای پیشآموزش بهتر استفاده کرد.
این محتوا بهصورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه میشود و مسئولیت استفاده از آن بهعهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید
خلاصهٔ کاملتر
پژوهشگران UC Berkeley و Stanford یه کشف جالب داشتن: مدلهای زبانی بزرگ (LLM) در طول پیشآموزش، بر خلاف تصور رایج، بهتدریج از «طوطی» به «هوش» تبدیل نمیشن. در عوض، بارها و بهصورت ناگهانی بین دو حالت مجزا جابهجا میشن؛ یکی الگوبرداری سطحی و یکی تعمیم واقعی. این پدیده رو mode-hopping نامیدن.
برای مثال، OLMo3 32B روی یه آزمون ساده در توکن ۲.۱۷ تریلیون دقت ۸۱٪ داره، در ۲.۱۹ تریلیون به صفر سقوط میکنه، و در ۲.۲۱ تریلیون دوباره به ۸۱.۷٪ میرسه. تیم یه مجموعه ارزیابی اسباببازیمانند (toy eval suite) طراحی کردن که شامل شش آزمون رفتاریه: از تشخیص اینکه مدل دنباله عددی را واقعاً حل میکنه یا فقط الگوی «جواب+۱» رو کپی میکنه، تا اینکه آیا مدل «چیزی که درسته» رو میگه یا «چیزی که بهنظر درست میرسه».
خلاصهٔ کاملتر این خبر رو میتونی با داشتن اشتراک ویژه بخونی!
اشتراک رایگان
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات
اشتراک ویژه
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات




