‏مدل‌های محلی + مهندس ارزان‌تر در برابر LLMهای مرزی

۲۶ خرداد

قیمت‌گذاری مدل‌های مرزی مثل GPT و Claude در ماه‌های اخیر به‌جای کاهش، چند برابر شده. این مقاله بررسی می‌کنه که ترکیب یه مهندس با حقوق پایین‌تر و یه مدل متن‌باز قوی مثل DeepSeek، از چه نقطه‌ای به‌صرفه‌تر از استفاده خالص از مدل‌های مرزی می‌شه. نتیجه اینه که همین رقابت، یه سقف قیمتی طبیعی برای لب‌های آمریکایی ایجاد می‌کنه.

این محتوا به‌صورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه می‌شود و مسئولیت استفاده از آن به‌عهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید

خلاصهٔ کامل‌تر

یه تصور رایج اینه که هزینه‌ی inference (اجرای مدل‌های زبانی) داره کاهش پیدا می‌کنه، اما واقعیت برای لب‌های مرزی آمریکایی برعکسه. GPT 5.5 کمتر از دو ماه پس از نسخه قبلی منتشر شد و قیمت API رو دو برابر کرد — الان بیش از ۳ برابر GPT-5 هشت ماه پیش قیمت داره. Gemini 3.5 Flash هم سه برابر نسخه قبلی‌اش گران‌تر شده. Anthropic هم با تغییر tokenizer در Opus-4.7، مصرف توکن رو بین ۳۲ تا ۴۷ درصد بیشتر کرده.

نویسنده برای مقایسه، یه نسبت ترکیبی مصرف توکن تعریف کرده: به ازای هر ۱ میلیون توکن ورودی (شامل cache)، حدود ۵۰ هزار توکن خروجی. با در نظر گرفتن نرخ cache hit هر پروایدر، قیمت‌های مقایسه‌ای این‌طوری می‌شن:

خلاصهٔ کامل‌تر این خبر رو می‌تونی با داشتن اشتراک ویژه بخونی!

اشتراک رایگان

دسترسی به خلاصهٔ کوتاه خبر
دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
ارسال اخبار مورد علاقه به ایمیل شما
ارسال اخبار مورد علاقه به تلگرام شما
عدم نمایش تبلیغات

اشتراک ویژه

دسترسی به خلاصهٔ کوتاه خبر
دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
ارسال اخبار مورد علاقه به ایمیل شما
ارسال اخبار مورد علاقه به تلگرام شما
عدم نمایش تبلیغات

ارتقا به اشتراک ویژه

منبع: TLDR Dev — https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs/

اشتراک‌گذاری:

خلاصهٔ کامل‌تر

اخبار مرتبط