LLMها اون جعبهٔ سیاهی نیستن که بهتون گفتن
نویسنده میگه مدلهای زبانی اون «جعبهٔ سیاه» همیشگی نیستن و شاخهٔ «تفسیرپذیری مکانیکی» داره کارکرد درونیشون رو آشکار میکنه. تکنیک circuit tracing از Anthropic فعالیت مدل رو به مفاهیم قابلفهم آدم تجزیه میکنه و نشون میده مدلها واقعاً چندمرحلهای استدلال میکنن. جالب اینکه خود مدل نسبت به فرایند درونیش بینش نداره، انگار یهجور ناخودآگاه داره.
این محتوا بهصورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه میشود و مسئولیت استفاده از آن بهعهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید
خلاصهٔ کاملتر
نویسنده میگه برخلاف چیزی که سالها گفته شده، مدلهای زبانی اون «جعبهٔ سیاه» تمامعیار نیستن. شاخهای به اسم «تفسیرپذیری مکانیکی» (mechanistic interpretability) که سعی میکنه کارکرد درونی شبکهٔ عصبی رو مهندسی معکوس کنه، پیشرفتهای بزرگی کرده و مقالهٔ «دربارهٔ زیستشناسی یک مدل زبانی بزرگ» از Anthropic یه نقطهٔ عطفه.
به گفتهٔ نویسنده، فهمیدن اینکه مدل به چی «فکر» میکنه از خوندن فعالیت تکتک نورونها سختتره، چون پدیدهای به اسم superposition هست: یه نورون تو کلی مفهوم بیربط شرکت داره و هر مفهوم هم روی کلی نورون پخش شده. پس نمیشه معنی رو مستقیم از یه واحد خوند.
خلاصهٔ کاملتر این خبر رو میتونی با داشتن اشتراک ویژه بخونی!
اشتراک رایگان
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات
اشتراک ویژه
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات




