‏LLMها اون جعبهٔ سیاهی نیستن که بهتون گفتن

۲۶ خرداد

نویسنده می‌گه مدل‌های زبانی اون «جعبهٔ سیاه» همیشگی نیستن و شاخهٔ «تفسیرپذیری مکانیکی» داره کارکرد درونیشون رو آشکار می‌کنه. تکنیک circuit tracing از Anthropic فعالیت مدل رو به مفاهیم قابل‌فهم آدم تجزیه می‌کنه و نشون می‌ده مدل‌ها واقعاً چندمرحله‌ای استدلال می‌کنن. جالب اینکه خود مدل نسبت به فرایند درونیش بینش نداره، انگار یه‌جور ناخودآگاه داره.

این محتوا به‌صورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه می‌شود و مسئولیت استفاده از آن به‌عهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید

خلاصهٔ کامل‌تر

نویسنده می‌گه برخلاف چیزی که سال‌ها گفته شده، مدل‌های زبانی اون «جعبهٔ سیاه» تمام‌عیار نیستن. شاخه‌ای به اسم «تفسیرپذیری مکانیکی» (mechanistic interpretability) که سعی می‌کنه کارکرد درونی شبکهٔ عصبی رو مهندسی معکوس کنه، پیشرفت‌های بزرگی کرده و مقالهٔ «دربارهٔ زیست‌شناسی یک مدل زبانی بزرگ» از Anthropic یه نقطهٔ عطفه.

به گفتهٔ نویسنده، فهمیدن اینکه مدل به چی «فکر» می‌کنه از خوندن فعالیت تک‌تک نورون‌ها سخت‌تره، چون پدیده‌ای به اسم superposition هست: یه نورون تو کلی مفهوم بی‌ربط شرکت داره و هر مفهوم هم روی کلی نورون پخش شده. پس نمی‌شه معنی رو مستقیم از یه واحد خوند.

خلاصهٔ کامل‌تر این خبر رو می‌تونی با داشتن اشتراک ویژه بخونی!

اشتراک رایگان

دسترسی به خلاصهٔ کوتاه خبر
دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
ارسال اخبار مورد علاقه به ایمیل شما
ارسال اخبار مورد علاقه به تلگرام شما
عدم نمایش تبلیغات

اشتراک ویژه

دسترسی به خلاصهٔ کوتاه خبر
دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
ارسال اخبار مورد علاقه به ایمیل شما
ارسال اخبار مورد علاقه به تلگرام شما
عدم نمایش تبلیغات

ارتقا به اشتراک ویژه

منبع: TLDR Dev — https://www.jay.ai/blog/llms-are-not-a-black-box

اشتراک‌گذاری:

خلاصهٔ کامل‌تر

اخبار مرتبط