‏OpenSquilla: رانتایم متن‌باز AI Agent با مصرف توکن ۸۰٪ کمتر

۱۰ خرداد

OpenSquilla نسخه اول خودش رو منتشر کرده؛ یه رانتایم متن‌باز برای AI Agentها که هدفش کاهش هزینه توکن در پروژه‌های بلندمدته. با ترکیب کش هوشمند، روتینگ مبتنی بر پیچیدگی درخواست، و معماری حافظه چهارلایه، ادعا می‌کنه در مقایسه با پیکربندی تک‌مدل ثابت، ۶۰ تا ۸۰ درصد صرفه‌جویی ایجاد می‌کنه. این پروژه زیر لایسنس Apache-2.0 روی GitHub در دسترسه و نیاز به Python 3.12+ داره.

این محتوا به‌صورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه می‌شود و مسئولیت استفاده از آن به‌عهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید

خلاصهٔ کامل‌تر

OpenSquilla اولین نسخه عمومی‌اش رو منتشر کرده: یه رانتایم متن‌باز و self-hostable (یعنی روی سرور خودت اجراش می‌کنی) برای AI Agentها که حول یه مشکل اساسی طراحی شده — اکثر فریمورک‌های موجود هیچ مکانیزم مؤثری برای کنترل مصرف توکن ندارن. این پروژه مخصوص تیم‌هایی‌ه که Agentها رو برای کارهای طولانی‌مدت اجرا می‌کنن و هزینه توکن با گذشت زمان به سقف عملیاتی‌شون تبدیل می‌شه.

در یه تست واقعی با سه نوع درخواست مختلف (یه سوال ساده، یه خلاصه فنی متوسط، و یه تحلیل رقابتی کامل)، مجموعاً ۲۷۹٬۷۶۲ توکن پردازش شد و هزینه کل جلسه فقط ۰.۰۰۹۴ دلار بود. از این میزان، حدود ۸۰ درصد یعنی ۲۲۲٬۸۴۸ توکن مستقیماً از کش سرویس داده شدن، نه اینکه دوباره به مدل ارسال بشن.

خلاصهٔ کامل‌تر این خبر رو می‌تونی با داشتن اشتراک ویژه بخونی!

اشتراک رایگان

دسترسی به خلاصهٔ کوتاه خبر
دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
ارسال اخبار مورد علاقه به ایمیل شما
ارسال اخبار مورد علاقه به تلگرام شما
عدم نمایش تبلیغات

اشتراک ویژه

دسترسی به خلاصهٔ کوتاه خبر
دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
ارسال اخبار مورد علاقه به ایمیل شما
ارسال اخبار مورد علاقه به تلگرام شما
عدم نمایش تبلیغات

ارتقا به اشتراک ویژه

منبع: TLDR AI — https://www.testingcatalog.com/opensquilla-launches-open-source-ai-agent-to-cut-token-costs/

اشتراک‌گذاری:

خلاصهٔ کامل‌تر

اخبار مرتبط