Wall Attention یه نوع مکانیزمِ توجهه که یه زوالِ ضربیِ کانالبهکانال و گامبهگام رو داخل ضربِ داخلیِ Q و K جا میده تا هر کانالِ کوئری نرخِ فراموشیِ مستقلِ خودش رو داشته باشه.
یک مهندس با پنج سال تجربهی اجرای کافکا و Spark Structured Streaming در پروداکشن، تفاوت معماری شیکاماشکننده با نسخهی واقعاً قابلاتکا را شرح میده.
LlamaIndex نسخهی دوم کتابخانهی پارس LiteParse را منتشر کرده که از صفر با Rust بازنویسی شده، تا ۱۰۰ برابر سریعتره و روی Rust، جاوااسکریپت، پایتون و حتی مرورگر اجرا میشه.
IDA Pro MCP یه سرور MCP هست که به هوش مصنوعی اجازه میده مستقیم با IDA Pro صحبت کنه و فرآیند ریورس انجینیرینگ رو خودکار کنه.
تام آرسن از Hugging Face شش مدل reranker جدید با نام Ettin منتشر کرد که در اندازههای مختلف، عملکرد بهتری نسبت به رقبا دارن و دیتاست و دستور آموزششون هم عمومی شده.
یک بدافزار سرقت کریپتو به نام TrapDoor از طریق ۳۴ پکیج مخرب در سه رجیستری بزرگ پکیجها منتشر شده و توسعهدهندگان حوزه کریپتو، DeFi، هوش مصنوعی و امنیت را هدف قرار داده.
انویدیا LongLive 2.0 رو معرفی کرده؛ زیرساختی برای تولید ویدیوی بلند با کوانتیزاسیون NVFP4 که سرعت اینفرنس رو تا ۴۵.۷ فریم بر ثانیه میرسونه.
uv سرعت و امکانات خوبی داره، اما وقتی نوبت نگهداری پروژه و آپدیت پکیجها میرسه، تجربهی کار باهاش نسبت به ابزارهایی مثل pnpm یا Poetry عقبتره.
سایمون ویلیسون در PyCon US 2026 یه سخنرانی پنجدقیقهای داشت درباره مهمترین اتفاقات شش ماه اخیر دنیای مدلهای زبانی — از جنگ مدلها تا ظهور کدینگ ایجنتهای واقعاً کاربردی.
HRM-Text یه فریمورک کامل برای پیشآموزش مدل زبانی ۱ میلیارد پارامتریه که با حدود ۱۰۰۰ دلار و چند GPU قابل اجراست.
وقتی یه سیستم چندعاملی هوش مصنوعی خراب میکنه، مشکل معمولاً از یه جواب بد نیست — بلکه یه الگوی تکراریه که باید توی هزاران رانِ مختلف پیداش کرد.
تصور کن یه CLI بسازی که وقتی نیاز به قابلیت جدیدی داری، خودش کدش رو مینویسه و بلافاصله اجرا میکنه — بدون ریاستارت، بدون ریدیپلوی.
بایتدنس یه مدل هوش مصنوعی ۳ میلیارد پارامتری معرفی کرده که تولید، ویرایش و درک تصویر و ویدیو رو همزمان توی یه فریمورک واحد انجام میده.
Headroom یه ابزار متنباز هست که همه چیزی که ایجنت هوش مصنوعی میخونه رو قبل از رسیدن به LLM فشرده میکنه و تا ۹۵٪ در مصرف توکن صرفهجویی میکنه.
ابزاری متنباز که واترمارکهای قابلمشاهده و پنهان تصاویر AI — از Gemini تا DALL-E — رو در یک دستور پاک میکنه.
NVIDIA یه راهنمای کامل منتشر کرده برای فاینتیون مدل Cosmos Predict 2.5 با روشهای LoRA و DoRA، تا بشه ویدیوهای مصنوعی از حرکت رباتها تولید کرد و هزینهی جمعآوری دادهی واقعی رو کاهش داد.
OpenSquilla یه رانتایم متنباز و self-hostable برای AI Agentهاست که با ترکیب کش هوشمند، روتینگ مدل و معماری حافظه چندلایه، مصرف توکن رو تا ۸۰٪ کاهش میده.
گوگل و یک سازمان غیرانتفاعی به نام FutureHouse هر کدام یک سیستم هوش مصنوعی ساختن که میتونه از میان انبوه مقالات علمی، فرضیههای درمانی پیدا کنه.
محققان UC Berkeley نشون دادن که LMها در طول پیشآموزش بهجای بلوغ تدریجی، بارها و ناگهانی بین تعمیم واقعی و الگوبرداری سطحی جابهجا میشن.
Agentspan یه فریمورک اپنسورس پایتونه که ایجنتهای هوش مصنوعی رو به workflow های ماندگار تبدیل میکنه — حتی اگه پروسهات کرش کنه، ایجنت از همون جایی که مونده ادامه میده.