پس از انتظار طولانی، شرکت Anthropic نسل جدید هوش مصنوعی خود را معرفی کرد. Claude Opus 4 و Sonnet 4 برای انجام وظایف پیچیده برنامهنویسی طراحی شدهاند. این شرکت با معرفی نسل جدید Claude و Sonnet گام بلند و مهمی در زمینه ی برنامهنویسی پیشرفته برداشته است.
در زمینه توسعه هوش مصنوعی، یک سال زمان طولانیای محسوب میشود. در حالی که سایر استودیوهای توسعه طی این مدت مدلهای جدیدی عرضه کردهاند، شرکت Anthropic وفادارانه به نسل سوم مدل Claude Opus پایبند مانده بود. اکنون این شرکت که در سال ۲۰۲۱ توسط تعدادی از کارکنان سابق OpenAI تأسیس شد، با Sonnet 4 و Opus 4 گام بلندی به سمت نسل بعدی مدلها برداشته است.
Opus 4 – جای تعجب ندارد – قدرتمندترین سیستم هوش مصنوعی Anthropic تاکنون به شمار میرود. اما نکته هیجانانگیزتر این است که به گفته مایک کریگر، مدیر ارشد محصول، تفاوت این مدل بهویژه برای مشتریان فعلی کاملاً محسوس خواهد بود.
Opus 4: هفت ساعت اجرای پیوسته
طبیعتاً Anthropic نیز نمیتواند از “عصر عاملمحور” که اخیراً توسط مایکروسافت و گوگل اعلام شده، بیتأثیر بماند. هر دو مدل جدید Anthropic طوری طراحی شدهاند که بتوانند وظایف را بهطور مستقلتری انجام دهند. برای اینکه این امکان در مسائل پیچیده نیز وجود داشته باشد، شرکت Anthropic به مدل Opus زمان بیشتری داده است. این مدل میتواند برنامههایی را اجرا کند که چندین ساعت به طول میانجامند و بدون وقفه پیش بروند. در پروژههای نمونه، مدل حدود هفت ساعت بر روی یک پروژه برنامهنویسی کار کرده است. کاربران همچنین باید قادر باشند بین پاسخهای سریع و فرآیندهای فکری زمانبرتر و شبیهتر به انسان انتخاب کنند.
بر اساس گزارشهای رسانهای، Anthropic قصد دارد همچنان با تکیه بر تواناییهای برجسته مدلهای خود و تمرکز بر ابزارهای کمکی برنامهنویسی، در بازار پرتلاطم هوش مصنوعی امتیاز کسب کند. با این حال، پشت صحنه، این شرکت مدتها با مشکل در ارتقای قابل توجه قویترین مدل Opus خود دست و پنجه نرم میکرد. بنابراین در این میان بهروزرسانیهایی برای سایر مدلها منتشر شد، اما برای Opus نه!
پیشتازی در آزمونهای برنامهنویسی
Anthropic نسل جدید مدلهای Claude-4 را پیشتاز در آزمونهای وظایف واقعی مهندسی نرمافزار معرفی میکند. به عنوان مثال، Opus 4 در آزمون SWE Bench عملکرد بهتری نسبت به سایر مدلها داشته و موفق به حل صحیح ۷۲.۵ درصد از مسائل شده است. مدل GPT-4.1 شرکت OpenAI با ۶۹.۱ درصد و Gemini 2.5 Pro با ۶۳.۲ درصد، در برخی موارد بهطور قابل توجهی عقبتر بودهاند. نتایج بیشتر این آزمونها در یک پست وبلاگی از سوی Anthropic ارائه شده است.
با معرفی این مدلها، قابلیت استفاده از ابزارهایی مانند جستجوی وب در فرآیندهای استدلالی گسترده نیز مورد آزمایش قرار میگیرد. هر دو مدل میتوانند از ابزارها بهصورت موازی استفاده کنند، انتظار میرود دستورالعملها را با دقت بیشتری دنبال کنند و – در صورتی که توسعهدهندگان به فایلهای محلی دسترسی بدهند – ظرفیت ذخیرهسازی بسیار بهتری ارائه دهند. کاربران مدل Sonnet نیز باید پس از جهش از نسخه ۳.۷ به نسخه ۴، بهبودهای قابل توجهی را تجربه کنند.
Anthropic همچنین دستیار برنامهنویسی خود با نام Claude Code را بهطور عمومی در دسترس قرار داده است. این ابزار اکنون از وظایف پسزمینه از طریق GitHub Actions و یکپارچهسازی بومی با VS Code و JetBrains پشتیبانی میکند.
قیمت API ثابت باقی میماند
برای توسعهدهندگانی که از API شرکت Anthropic استفاده میکنند، چندین قابلیت جدید فعال شدهاند، از جمله اتصالدهنده MCP و API مربوط به فایلها. خوشبختانه Anthropic قیمتگذاری نسل قبلی خود را حفظ کرده است: Opus 4 با نرخ ۱۵ دلار (ورودی) یا ۷۵ دلار (خروجی) به ازای هر میلیون توکن، و Sonnet 4 با نرخ ۳ دلار یا ۱۵ دلار به ازای هر میلیون توکن عرضه میشود.
البته این برنامه شامل تحریم ها می باشد و برای استفاده از آن باید از ای پی غیر ایرانی استفاده نمود.

