GPT-5.5 و Claude Mythos: مدلهای جدید هوش مصنوعی که هکرهای حرفهای رو پشت سر میذارن
ارزیابیهای جدید نشون میده که دو مدل بزرگ هوش مصنوعی، یعنی GPT-5.5 از OpenAI و Claude Mythos Preview از Anthropic، در تستهای تخصصی امنیت سایبری به سطحی رسیدن که قبلاً فقط از متخصصان انسانی انتظار میرفت. GPT-5.5 در چالشهای سطح Expert موفق به کسب نرخ موفقیت ۷۱.۴٪ شده، که از Claude Mythos با ۶۸.۶٪ و GPT-5.4 با ۵۲.۴٪ جلوتره. نمونه بارز این عملکرد اینه که GPT-5.5 یک چالش reverse engineering پیچیده رو که یک متخصص انسانی ۱۲ ساعته حل کرده، در کمتر از ۱۱ دقیقه و با هزینه ۱.۷۳ دلار حل کرده.
این محتوا بهصورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه میشود و مسئولیت استفاده از آن بهعهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید




