‏مشکل Open/Closed در هوش مصنوعی: داریم اشتباه پیش می‌ریم؟

۲ تیر

در کنفرانس MLSys سیاتل، تقریباً همه روی بهینه‌سازی آموزش و استنتاج مدل‌های زبانی کار می‌کردن. نویسنده یه مشکل اساسی‌تر رو مطرح می‌کنه: مدل‌های فعلی با یه حلقه باز یاد می‌گیرن و بعد از استقرار دیگه چیزی یاد نمی‌گیرن. تخصصی‌شدن سخت‌افزار روی همین پارادایم داره راه آزمایش یادگیری حلقه‌بسته رو می‌بنده، درست مثل اتفاقی که در دوران GPU‌های fixed-pipeline برای گرافیک سه‌بعدی افتاد.

این محتوا به‌صورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه می‌شود و مسئولیت استفاده از آن به‌عهده کاربر است. برای مطالعه متن اصلی خبر، اینجا را کلیک کنید

خلاصهٔ کامل‌تر

نویسنده در کنفرانس نهم MLSys در سیاتل شرکت کرده و متوجه یه الگوی نگران‌کننده شده. تقریباً تمام کارهای ارائه‌شده حول بهینه‌سازی آموزش و استنتاج مدل‌های زبانی بزرگ (LLM) می‌چرخید. اما پشت این هیجان، یه مشکل بنیادی پنهونه که اسمش رو گذاشته «مشکل Open/Closed».

برای فهمیدن این مشکل، یه مثال تاریخی جالب می‌زنه: گرافیک سه‌بعدی در دهه ۹۰ اول روی CPU اجرا می‌شد، که یه سیستم کاملاً آزاد بود و کلی خلاقیت وجود داشت. بعد GPU‌های اولیه با fixed pipeline (خط پردازش ثابت) اومدن که سرعت رو بالا بردن ولی آزادی رو گرفتن. سپس shaderهای قابل برنامه‌ریزی این آزادی رو برگردوندن، و از دل همین برنامه‌پذیری بود که CUDA و بعدش آموزش شبکه‌های عصبی روی GPU ممکن شد. حالا دوباره داریم به سمت سخت‌افزار بسته و تخصصی‌شده می‌ریم: ASIC‌های اختصاصی برای استنتاج یا آموزش.

خلاصهٔ کامل‌تر این خبر رو می‌تونی با داشتن اشتراک ویژه بخونی!

اشتراک رایگان

دسترسی به خلاصهٔ کوتاه خبر
دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
ارسال اخبار مورد علاقه به ایمیل شما
ارسال اخبار مورد علاقه به تلگرام شما
عدم نمایش تبلیغات

اشتراک ویژه

دسترسی به خلاصهٔ کوتاه خبر
دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
ارسال اخبار مورد علاقه به ایمیل شما
ارسال اخبار مورد علاقه به تلگرام شما
عدم نمایش تبلیغات

ارتقا به اشتراک ویژه

منبع: TLDR Tech — https://blog.mempko.com/the-open-closed-problem-in-ai/

اشتراک‌گذاری:

خلاصهٔ کامل‌تر

اخبار مرتبط