راهاندازی مدل هوش مصنوعی محلی با Qwen 3.5-9B
نویسنده بعد از آزمایش چند مدل مختلف، به Qwen 3.5-9B با کوانتایزیشن Q4 رسیده که روی مکبوک پرو ۲۴ گیگابایتی با سرعت ~۴۰ توکن در ثانیه، پنجره کانتکست ۱۲۸K و قابلیت استفاده از ابزار کار میکنه. این مدل از طریق LM Studio اجرا میشه و با ابزارهایی مثل Pi و OpenCode قابل استفادهست. راهاندازی کامل بدون نیاز به اینترنت امکانپذیره.
این محتوا بهصورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه میشود و مسئولیت استفاده از آن بهعهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید
خلاصهٔ کاملتر
اجرای یه مدل هوش مصنوعی بهصورت کامل روی دستگاه شخصی — بدون ارسال داده به سرورهای خارجی و بدون نیاز به اینترنت — جذابیت خودش رو داره. نویسنده این مقاله مدتهاست داره با مدلهای محلی (local LLM) آزمایش میکنه و بالاخره به یه ستآپ قابل استفاده رسیده.
انتخاب مدل کار سادهای نیست. مدلهایی مثل Qwen 3.6 Q3، GPT-OSS 20B و Devstral Small 24B از نظر فنی در حافظه جا میشن، ولی در عمل غیرقابل استفادهان. Gemma 4B هم روان اجرا میشه اما با استفاده از ابزار (tool use) مشکل داره. علاوه بر مدل، باید نرمافزار اجراکننده هم انتخاب کنی: Ollama، llama.cpp یا LM Studio — هرکدام محدودیتها و مدلهای خاص خودشون رو دارن.
خلاصهٔ کاملتر این خبر رو میتونی با داشتن اشتراک ویژه بخونی!
اشتراک رایگان
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات
اشتراک ویژه
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات




