Anthropic লঞ্চ করল Claude Sonnet 5 - এজেন্টিক কাজের জন্য সাশ্রয়ীয় নতুন মডেল

AI কোম্পানি Anthropic তাদের নতুন মডেল Claude Sonnet 5 লঞ্চ করেছে, যা এজেন্টিক কাজের জন্যে আগের চেয়ে শক্তিশালী কিন্তু সস্তা। এই মডেলটি প্রায় Opus 4.8 এর মতো পারফরম্যান্স দেবে কিন্তু অনেক কম দামে।

ফাউন্ডেশন মডেল কোম্পানিগুলোর মধ্যে এজেন্টিক সক্ষমতা এখন স্ট্যান্ডার্ড হয়ে উঠেছে। এই প্রেক্ষাপটে Anthropic তাদের মিডসাইজ মডেলের আরও শক্তিশালী এবং এজেন্টিক সংস্করণ Claude Sonnet 5 প্রকাশ করেছে। কোম্পানি একটি ব্লগ পোস্টে জানিয়েছে, এটি পরিকল্পনা করতে পারে, ব্রাউজার এবং টার্মিনালের মতো টুলস ব্যবহার করতে পারে, এবং স্বায়ত্তশাসিতভাবে কাজ চালাতে পারে - যা কয়েক মাস আগেও বড় এবং ব্যয়বহুল মডেল প্রয়োজন ছিল। এই ঘোষণা OpenAI এবং Google এর সাম্প্রতিক প্রকাশের সাথে মিলে যায়। OpenAI গত সপ্তাহে GPT-5.6 Sol প্রিভিউ হিসেবে লঞ্চ করেছে, যা তাদের সবচেয়ে এজেন্টিক মডেল। Google এর Gemini 3.5 Flash মে মাসে এসেছিল, যাকে কথোপকথনভিত্তিক চ্যাটবট থেকে এজেন্টিক টুলে পরিবর্তন হিসেবে উপস্থাপন করা হয়েছিল।

Sonnet 5 এর প্রস্তাব হল এটি Opus 4.8 এর কাছাকাছি পারফরম্যান্স দেবে কিন্তু অনেক কম খরচে। মঙ্গলবার থেকে Claude Sonnet 5 ফ্রি এবং Pro প্ল্যানের জন্য ডিফল্ট মডেল হবে এবং সব সাবস্ক্রিপশনে পাওয়া যাবে। লঞ্চের সময় এটির দাম প্রতি মিলিয়ন ইনপুট টোকেনে ২ ডলার এবং প্রতি মিলিয়ন আউটপুট টোকেনে ১০ ডলার (৩১ আগস্ট পর্যন্ত), এরপর দাম বেড়ে প্রতি মিলিয়ন ইনপুট টোকেনে ৩ ডলার এবং প্রতি মিলিয়ন আউটপুট টোকেনে ১৫ ডলার হবে। এটি Opus 4.8 এবং OpenAI এর GPT-5.5 এবং Google এর Gemini 3.1 Pro এর চেয়ে সস্তা।

নতুন মডেলটি এর পূর্বসূরি Sonnet 4.6 এর তুলনায় এজেন্টিক পারফরম্যান্স, যুক্তি, টুল ব্যবহার, সফটওয়্যার কোডিং এবং জ্ঞানভিত্তিক কাজে উল্লেখযোগ্য উন্নতি দেখায়। একটি বেঞ্চমার্কে Sonnet 5 এজেন্টিক কোডিংয়ে ৬৩.২% স্কোর করে, যেখানে Opus 4.8 এর ৬৯.২% এবং Sonnet 4.6 এর ৫৮.১%। জ্ঞানভিত্তিক কাজের বেঞ্চমার্কে Sonnet 5 আসলে Opus 4.8 কে সামান্য ছাড়িয়ে যায়।

টেস্টারদের মতে, Sonnet 5 জটিল কাজ শেষ করতে দক্ষ, যেখানে আগের সংস্করণ আটকে যেত। এটি নিজেই নিজের আউটপুট চেক করতে পারে। Zapier এর সিনিয়র ইঞ্জিনিয়ার ড্যানিয়েল শেপার্ড বলেন, তারা Claude Sonnet 5 কে Salesforce অ্যাকাউন্ট টায়ার আপডেট করা এবং এন্টারপ্রাইজ গ্রাহকদের লঞ্চ ঘোষণা পাঠানোর দুই-অংশের কাজ দিয়েছিলেন এবং এটি শেষ পর্যন্ত সম্পন্ন করেছে। আগে এটি অর্ধেকে আটকে যেত।

নিরাপত্তার দিক থেকেও Sonnet 5 উন্নতি দেখায়। এটি পূর্বসূরির তুলনায় অবাঞ্ছিত আচরণ যেমন ভুল ব্যবহারে সহযোগিতা এবং প্রতারণার হার কমায়। এটি দূষিত অনুরোধ প্রত্যাখ্যান এবং প্রম্পট-ইনজেকশন আক্রমণ থেকে বাঁচতে বেশি দক্ষ। এটি হ্যালুসিনেশন এবং সাইকোফ্যান্টিক আচরণও কম করে। তবে, Opus 4.8 এবং Claude Mythos Preview এর মতো এটি বিপজ্জনক সাইবারনিরাপত্তা কাজ করার ক্ষমতা একই স্তরের নয়।