OpenSquilla: رانتایم متنباز AI Agent با مصرف توکن ۸۰٪ کمتر
OpenSquilla نسخه اول خودش رو منتشر کرده؛ یه رانتایم متنباز برای AI Agentها که هدفش کاهش هزینه توکن در پروژههای بلندمدته. با ترکیب کش هوشمند، روتینگ مبتنی بر پیچیدگی درخواست، و معماری حافظه چهارلایه، ادعا میکنه در مقایسه با پیکربندی تکمدل ثابت، ۶۰ تا ۸۰ درصد صرفهجویی ایجاد میکنه. این پروژه زیر لایسنس Apache-2.0 روی GitHub در دسترسه و نیاز به Python 3.12+ داره.
این محتوا بهصورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه میشود و مسئولیت استفاده از آن بهعهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید
خلاصهٔ کاملتر
OpenSquilla اولین نسخه عمومیاش رو منتشر کرده: یه رانتایم متنباز و self-hostable (یعنی روی سرور خودت اجراش میکنی) برای AI Agentها که حول یه مشکل اساسی طراحی شده — اکثر فریمورکهای موجود هیچ مکانیزم مؤثری برای کنترل مصرف توکن ندارن. این پروژه مخصوص تیمهاییه که Agentها رو برای کارهای طولانیمدت اجرا میکنن و هزینه توکن با گذشت زمان به سقف عملیاتیشون تبدیل میشه.
در یه تست واقعی با سه نوع درخواست مختلف (یه سوال ساده، یه خلاصه فنی متوسط، و یه تحلیل رقابتی کامل)، مجموعاً ۲۷۹٬۷۶۲ توکن پردازش شد و هزینه کل جلسه فقط ۰.۰۰۹۴ دلار بود. از این میزان، حدود ۸۰ درصد یعنی ۲۲۲٬۸۴۸ توکن مستقیماً از کش سرویس داده شدن، نه اینکه دوباره به مدل ارسال بشن.
خلاصهٔ کاملتر این خبر رو میتونی با داشتن اشتراک ویژه بخونی!
اشتراک رایگان
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات
اشتراک ویژه
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات




