GPT-5.5 و Claude Mythos: مدلهای جدید هوش مصنوعی که هکرهای حرفهای رو پشت سر میذارن
ارزیابیهای جدید نشون میده که دو مدل بزرگ هوش مصنوعی، یعنی GPT-5.5 از OpenAI و Claude Mythos Preview از Anthropic، در تستهای تخصصی امنیت سایبری به سطحی رسیدن که قبلاً فقط از متخصصان انسانی انتظار میرفت. GPT-5.5 در چالشهای سطح Expert موفق به کسب نرخ موفقیت ۷۱.۴٪ شده، که از Claude Mythos با ۶۸.۶٪ و GPT-5.4 با ۵۲.۴٪ جلوتره. نمونه بارز این عملکرد اینه که GPT-5.5 یک چالش reverse engineering پیچیده رو که یک متخصص انسانی ۱۲ ساعته حل کرده، در کمتر از ۱۱ دقیقه و با هزینه ۱.۷۳ دلار حل کرده.
این محتوا بهصورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه میشود و مسئولیت استفاده از آن بهعهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید
خلاصهٔ کاملتر
در ارزیابیهای اخیر، دو مدل پیشرفته هوش مصنوعی — GPT-5.5 از OpenAI و Claude Mythos Preview از Anthropic — در تستهای تخصصی امنیت سایبری نتایج چشمگیری نشون دادن. این ارزیابیها روی یه مجموعه ۹۵ تایی از تستهای تخصصی در چهار سطح دشواری انجام شده که مهارتهایی مثل reverse engineering، web exploitation و cryptography رو میسنجه.
تستهای سطح Expert که توسط شرکتهای امنیتی Crystal Peak Security و Irregular طراحی شدن، روی آسیبپذیریهای واقعی و تکنیکهای پیشرفتهای مثل heap overflow، use-after-free، padding-oracle attack و باز کردن بدافزارهای مبهمسازیشده تمرکز دارن. GPT-5.5 در این سطح به نرخ موفقیت ۷۱.۴٪ رسیده، در حالی که Claude Mythos با ۶۸.۶٪، GPT-5.4 با ۵۲.۴٪ و Opus 4.7 با ۴۸.۶٪ پشت سرشه.
خلاصهٔ کاملتر این خبر رو میتونی با داشتن اشتراک ویژه بخونی!
اشتراک رایگان
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات
اشتراک ویژه
- دسترسی به خلاصهٔ کوتاه خبر
- دسترسی به خلاصهٔ کامل/اختصاصی خبر + نکات کلیدی
- ارسال اخبار مورد علاقه به ایمیل شما
- ارسال اخبار مورد علاقه به تلگرام شما
- عدم نمایش تبلیغات




