Claude Opus 4 و Sonnet 4 معرفی شدند؛ جهش بزرگ Anthropic در هوش مصنوعی

پس از انتظار طولانی، شرکت Anthropic نسل جدید هوش مصنوعی خود را معرفی کرد. Claude Opus 4 و Sonnet 4 برای انجام وظایف پیچیده برنامه‌نویسی طراحی شده‌اند. این شرکت با معرفی نسل جدید Claude و Sonnet گام بلند و مهمی در زمینه ی برنامه‌نویسی پیشرفته برداشته است.

در زمینه توسعه هوش مصنوعی، یک سال زمان طولانی‌ای محسوب می‌شود. در حالی که سایر استودیوهای توسعه طی این مدت مدل‌های جدیدی عرضه کرده‌اند، شرکت Anthropic وفادارانه به نسل سوم مدل Claude Opus پایبند مانده بود. اکنون این شرکت که در سال ۲۰۲۱ توسط تعدادی از کارکنان سابق OpenAI تأسیس شد، با Sonnet 4 و Opus 4 گام بلندی به سمت نسل بعدی مدل‌ها برداشته است.

Opus 4 – جای تعجب ندارد – قدرتمندترین سیستم هوش مصنوعی Anthropic تاکنون به شمار می‌رود. اما نکته هیجان‌انگیزتر این است که به گفته مایک کریگر، مدیر ارشد محصول، تفاوت این مدل به‌ویژه برای مشتریان فعلی کاملاً محسوس خواهد بود.

Opus 4: هفت ساعت اجرای پیوسته
طبیعتاً Anthropic نیز نمی‌تواند از “عصر عامل‌محور” که اخیراً توسط مایکروسافت و گوگل اعلام شده، بی‌تأثیر بماند. هر دو مدل جدید Anthropic طوری طراحی شده‌اند که بتوانند وظایف را به‌طور مستقل‌تری انجام دهند. برای اینکه این امکان در مسائل پیچیده نیز وجود داشته باشد، شرکت Anthropic به مدل Opus زمان بیشتری داده است. این مدل می‌تواند برنامه‌هایی را اجرا کند که چندین ساعت به طول می‌انجامند و بدون وقفه پیش بروند. در پروژه‌های نمونه، مدل حدود هفت ساعت بر روی یک پروژه برنامه‌نویسی کار کرده است. کاربران همچنین باید قادر باشند بین پاسخ‌های سریع و فرآیندهای فکری زمان‌برتر و شبیه‌تر به انسان انتخاب کنند.

بر اساس گزارش‌های رسانه‌ای، Anthropic قصد دارد همچنان با تکیه بر توانایی‌های برجسته مدل‌های خود و تمرکز بر ابزارهای کمکی برنامه‌نویسی، در بازار پرتلاطم هوش مصنوعی امتیاز کسب کند. با این حال، پشت صحنه، این شرکت مدت‌ها با مشکل در ارتقای قابل توجه قوی‌ترین مدل Opus خود دست و پنجه نرم می‌کرد. بنابراین در این میان به‌روزرسانی‌هایی برای سایر مدل‌ها منتشر شد، اما برای Opus نه!

پیشتازی در آزمون‌های برنامه‌نویسی
Anthropic نسل جدید مدل‌های Claude-4 را پیشتاز در آزمون‌های وظایف واقعی مهندسی نرم‌افزار معرفی می‌کند. به عنوان مثال، Opus 4 در آزمون SWE Bench عملکرد بهتری نسبت به سایر مدل‌ها داشته و موفق به حل صحیح ۷۲.۵ درصد از مسائل شده است. مدل GPT-4.1 شرکت OpenAI با ۶۹.۱ درصد و Gemini 2.5 Pro با ۶۳.۲ درصد، در برخی موارد به‌طور قابل توجهی عقب‌تر بوده‌اند. نتایج بیشتر این آزمون‌ها در یک پست وبلاگی از سوی Anthropic ارائه شده است.

با معرفی این مدل‌ها، قابلیت استفاده از ابزارهایی مانند جستجوی وب در فرآیندهای استدلالی گسترده نیز مورد آزمایش قرار می‌گیرد. هر دو مدل می‌توانند از ابزارها به‌صورت موازی استفاده کنند، انتظار می‌رود دستورالعمل‌ها را با دقت بیشتری دنبال کنند و – در صورتی که توسعه‌دهندگان به فایل‌های محلی دسترسی بدهند – ظرفیت ذخیره‌سازی بسیار بهتری ارائه دهند. کاربران مدل Sonnet نیز باید پس از جهش از نسخه ۳.۷ به نسخه ۴، بهبودهای قابل توجهی را تجربه کنند.

Anthropic همچنین دستیار برنامه‌نویسی خود با نام Claude Code را به‌طور عمومی در دسترس قرار داده است. این ابزار اکنون از وظایف پس‌زمینه از طریق GitHub Actions و یکپارچه‌سازی بومی با VS Code و JetBrains پشتیبانی می‌کند.

قیمت API ثابت باقی می‌ماند
برای توسعه‌دهندگانی که از API شرکت Anthropic استفاده می‌کنند، چندین قابلیت جدید فعال شده‌اند، از جمله اتصال‌دهنده MCP و API مربوط به فایل‌ها. خوشبختانه Anthropic قیمت‌گذاری نسل قبلی خود را حفظ کرده است: Opus 4 با نرخ ۱۵ دلار (ورودی) یا ۷۵ دلار (خروجی) به ازای هر میلیون توکن، و Sonnet 4 با نرخ ۳ دلار یا ۱۵ دلار به ازای هر میلیون توکن عرضه می‌شود.

البته این برنامه شامل تحریم ها می باشد و برای استفاده از آن باید از ای پی غیر ایرانی استفاده نمود.