مدلهای محلی + مهندس ارزانتر در برابر LLMهای مرزی
قیمتگذاری مدلهای مرزی مثل GPT و Claude در ماههای اخیر بهجای کاهش، چند برابر شده. این مقاله بررسی میکنه که ترکیب یه مهندس با حقوق پایینتر و یه مدل متنباز قوی مثل DeepSeek، از چه نقطهای بهصرفهتر از استفاده خالص از مدلهای مرزی میشه. نتیجه اینه که همین رقابت، یه سقف قیمتی طبیعی برای لبهای آمریکایی ایجاد میکنه.
این محتوا بهصورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه میشود و مسئولیت استفاده از آن بهعهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید
خلاصهٔ کاملتر
یه تصور رایج اینه که هزینهی inference (اجرای مدلهای زبانی) داره کاهش پیدا میکنه، اما واقعیت برای لبهای مرزی آمریکایی برعکسه. GPT 5.5 کمتر از دو ماه پس از نسخه قبلی منتشر شد و قیمت API رو دو برابر کرد — الان بیش از ۳ برابر GPT-5 هشت ماه پیش قیمت داره. Gemini 3.5 Flash هم سه برابر نسخه قبلیاش گرانتر شده. Anthropic هم با تغییر tokenizer در Opus-4.7، مصرف توکن رو بین ۳۲ تا ۴۷ درصد بیشتر کرده.
نویسنده برای مقایسه، یه نسبت ترکیبی مصرف توکن تعریف کرده: به ازای هر ۱ میلیون توکن ورودی (شامل cache)، حدود ۵۰ هزار توکن خروجی. با در نظر گرفتن نرخ cache hit هر پروایدر، قیمتهای مقایسهای اینطوری میشن:
خلاصهٔ کاملتر این خبر رو میتونی با داشتن اشتراک ویژه بخونی!
اشتراک رایگان
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات
اشتراک ویژه
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات




