ابزار MCG انویدیا؛ ساخت خودکار مستندات مدل هوش مصنوعی
خلاصهٔ کاملتر
انویدیا ابزاری به اسم MCG (تولیدکنندهی model card) معرفی کرده که ساخت مستندات مدل هوش مصنوعی رو خودکار و استاندارد میکنه. زمینهاش اینه که با پیچیدهتر شدن مدلها و سفتتر شدن نظارت قانونی — تحت چارچوبهایی مثل AB-2013 کالیفرنیا و قانون هوش مصنوعی اتحادیه اروپا — تیمها باید قبل از انتشار مدل، مستندات جامع و قابلممیزی تولید کنن. خود model card توضیح میده مدل چطور کار میکنه، کاربرد موردنظرش چیه، با چه دادهای آموزش دیده و چه محدودیتهایی داره؛ چیزی که نهفقط توسعهدهندهها، بلکه سیاستگذارها، تیمهای تدارکات و ارزیابهای ریسک ازش استفاده میکنن.
مشکل اینه که ساختن دستیِ این مستندات کند و خستهکنندهست؛ مستندسازی از توسعه عقب میمونه و متادیتا تا روز انتشار قدیمی میشه. ابزار MCG این کار رو با خوندن مستقیم از کد منبع در کمتر از یک دقیقه انجام میده. این ابزار یه خطلولهی کانتینری با سه مرحلهست: ورودیگیری (Ingestion)، استخراج (Extraction) و رندر (Rendering). یه ارکستریتور مرکزی درخواست رو میگیره (یه URL مثل GitHub و HuggingFace یا یه فایل آپلودشده)، گردشکار رو هماهنگ میکنه و یه model card کامل برمیگردونه؛ هر مرحله یه سرویس جداست، پس میشه اجزا رو بدون دستزدن به بقیه عوض کرد.
قلب ماجرا مرحلهی استخراجه که اسناد رو از یه خطلولهی RAG مبتنی بر میکروسرویسهای استنتاج انویدیا (NIM) رد میکنه. مدل Nemotron RAG کارِ embedding و reranking رو با دقت بالا انجام میده و رتریورهای جدا برای کد، فایلهای config و مستندات، منابع پرسیگنال رو اولویت میدن. استخراج اصلی با مدل GPT-OSS-120B انجام میشه که قطعههای بازیابیشده رو میخونه و طبق قالب MC++ انویدیا، خروجی JSON ساختارمند میسازه؛ بعد همون محتوا به مرحلهی زیرکارتها میره و چهار زیرکارت Model Card++ یعنی سوگیری، تبیینپذیری، حریم خصوصی و امنیت رو تولید میکنه.
این ابزار از سه نظر انعطافپذیره: میتونی مدل زبانی و embedding و reranking رو به NIMهای مختلف یا APIهای سازگار وصل کنی؛ قالب خروجی با یه تمپلیت Markdown کنترل میشه (و خروجیها با CycloneDX سازگارن)؛ و راهنماهای سطحفیلد هم از پایگاههای دانشِ قابلتنظیم میان. کانتینری بودنش یعنی روی محیط داخلی یا کلود خودت با پشتیبانی Kubernetes اجرا میشه، بدون قفلشدن به کلود اختصاصی. از نظر عملکرد، نرخ تکمیل ۹۱٪ و دقت ۷۶٪ گزارش شده؛ وقتی مستندات رو کامل حذف کردن و فقط با کد اجراش کردن، تکمیل به ۶۱٪ و دقت به ۲۸٪ افتاد. نکتهی مهم اینه که ابزار حدس نمیزنه؛ اگه نتونه با اطمینان یه فیلد رو پر کنه، اون رو بهعنوان «یافت نشد» علامت میزنه تا انسان بررسیش کنه. اوراکل هم از اولین شرکایی بوده که این ابزار رو وارد زیرساخت production کرده.
نکات کلیدی:
- ابزار MCG انویدیا ساخت مستندات مدل (model card) رو با خوندن مستقیم کد در کمتر از یک دقیقه خودکار میکنه
- زمینه: سفتتر شدن مقررات مثل AB-2013 کالیفرنیا و قانون هوش مصنوعی اتحادیه اروپا
- خطلولهی سهمرحلهای با RAG و مدلهای انویدیا؛ خروجی نمای کلی + چهار زیرکارت
- ابزار حدس نمیزنه و فیلدهای نامعلوم رو «یافت نشد» علامت میزنه؛ اوراکل از اولین شرکاست




