مشکل Open/Closed در هوش مصنوعی: داریم اشتباه پیش میریم؟
در کنفرانس MLSys سیاتل، تقریباً همه روی بهینهسازی آموزش و استنتاج مدلهای زبانی کار میکردن. نویسنده یه مشکل اساسیتر رو مطرح میکنه: مدلهای فعلی با یه حلقه باز یاد میگیرن و بعد از استقرار دیگه چیزی یاد نمیگیرن. تخصصیشدن سختافزار روی همین پارادایم داره راه آزمایش یادگیری حلقهبسته رو میبنده، درست مثل اتفاقی که در دوران GPUهای fixed-pipeline برای گرافیک سهبعدی افتاد.
این محتوا بهصورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه میشود و مسئولیت استفاده از آن بهعهده کاربر است. برای مطالعه متن اصلی خبر، اینجا را کلیک کنید
خلاصهٔ کاملتر
نویسنده در کنفرانس نهم MLSys در سیاتل شرکت کرده و متوجه یه الگوی نگرانکننده شده. تقریباً تمام کارهای ارائهشده حول بهینهسازی آموزش و استنتاج مدلهای زبانی بزرگ (LLM) میچرخید. اما پشت این هیجان، یه مشکل بنیادی پنهونه که اسمش رو گذاشته «مشکل Open/Closed».
برای فهمیدن این مشکل، یه مثال تاریخی جالب میزنه: گرافیک سهبعدی در دهه ۹۰ اول روی CPU اجرا میشد، که یه سیستم کاملاً آزاد بود و کلی خلاقیت وجود داشت. بعد GPUهای اولیه با fixed pipeline (خط پردازش ثابت) اومدن که سرعت رو بالا بردن ولی آزادی رو گرفتن. سپس shaderهای قابل برنامهریزی این آزادی رو برگردوندن، و از دل همین برنامهپذیری بود که CUDA و بعدش آموزش شبکههای عصبی روی GPU ممکن شد. حالا دوباره داریم به سمت سختافزار بسته و تخصصیشده میریم: ASICهای اختصاصی برای استنتاج یا آموزش.
خلاصهٔ کاملتر این خبر رو میتونی با داشتن اشتراک ویژه بخونی!
اشتراک رایگان
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات
اشتراک ویژه
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات




