‏مدل‌های زبانی در حین پیش‌آموزش بین «طوطی» و «هوش» جابه‌جا می‌شن

۹ خرداد

محققان دانشگاه UC Berkeley کشف کردن که مدل‌های زبانی در حین پیش‌آموزش به‌جای پیشرفت خطی، بارها و ناگهانی بین دو حالت «طوطی» (الگوبرداری سطحی) و «هوش» (تعمیم واقعی) سوئیچ می‌کنن؛ پدیده‌ای که اسمش رو «mode-hopping» گذاشتن. این جهش‌ها نه با دینامیک‌های بهینه‌سازی معمول قابل توضیحن و نه با میانگین‌گیری چک‌پوینت‌ها قابل رفعن. تیم تحقیقاتی یه مجموعه ارزیابی ارزون طراحی کرده که می‌شه ازش برای انتخاب چک‌پوینت‌ها و داده‌های پیش‌آموزش بهتر استفاده کرد.

این محتوا به‌صورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه می‌شود و مسئولیت استفاده از آن به‌عهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید

خلاصهٔ کامل‌تر

پژوهشگران UC Berkeley و Stanford یه کشف جالب داشتن: مدل‌های زبانی بزرگ (LLM) در طول پیش‌آموزش، بر خلاف تصور رایج، به‌تدریج از «طوطی» به «هوش» تبدیل نمی‌شن. در عوض، بارها و به‌صورت ناگهانی بین دو حالت مجزا جابه‌جا می‌شن؛ یکی الگوبرداری سطحی و یکی تعمیم واقعی. این پدیده رو mode-hopping نامیدن.

برای مثال، OLMo3 32B روی یه آزمون ساده در توکن ۲.۱۷ تریلیون دقت ۸۱٪ داره، در ۲.۱۹ تریلیون به صفر سقوط می‌کنه، و در ۲.۲۱ تریلیون دوباره به ۸۱.۷٪ می‌رسه. تیم یه مجموعه ارزیابی اسباب‌بازی‌مانند (toy eval suite) طراحی کردن که شامل شش آزمون رفتاری‌ه: از تشخیص اینکه مدل دنباله عددی را واقعاً حل می‌کنه یا فقط الگوی «جواب+۱» رو کپی می‌کنه، تا اینکه آیا مدل «چیزی که درسته» رو می‌گه یا «چیزی که به‌نظر درست می‌رسه».

خلاصهٔ کامل‌تر این خبر رو می‌تونی با داشتن اشتراک ویژه بخونی!

اشتراک رایگان

دسترسی به خلاصهٔ کوتاه خبر
دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
ارسال اخبار مورد علاقه به ایمیل شما
ارسال اخبار مورد علاقه به تلگرام شما
عدم نمایش تبلیغات

اشتراک ویژه

دسترسی به خلاصهٔ کوتاه خبر
دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
ارسال اخبار مورد علاقه به ایمیل شما
ارسال اخبار مورد علاقه به تلگرام شما
عدم نمایش تبلیغات

ارتقا به اشتراک ویژه

منبع: TLDR AI — https://jiaxin-wen.github.io/blog/generalization-dynamics

اشتراک‌گذاری:

خلاصهٔ کامل‌تر

اخبار مرتبط