প্রযুক্তির জগতে এখন 'লুপ' যুগ! বরিস চার্নির বড় ঘোষণা

ক্লড কোডের স্রষ্টা বরিস চার্নি মেটার স্কেল কনফারেন্সে জানালেন, এআই এজেন্টরা এখন নিজেই অন্য এজেন্টকে প্রম্পট করে কোড লিখছে। এটিকে তিনি সোর্স কোড থেকে এজেন্টে রূপান্তরের মতোই বড় পদক্ষেপ বলে আখ্যায়িত করেছেন।

গত শুক্রবার মেটার @Scale কনফারেন্সে ক্লড কোডের স্রষ্টা বরিস চার্নি হাজির হন। অপ্রত্যাশিতভাবে, শ্রোতাদের প্রথম প্রশ্নটি ছিল লুপ নিয়ে — 'লুপ কি শুধু হাইপ সাইকেল, নাকি এটা আসল?' চার্নির উত্তর ছিল স্পষ্ট: 'হ্যাঁ, এটা আসল।'n

দুই বছর আগে মানুষ নিজেরা সোর্স কোড লিখত। তারপর শুরু হয় এজেন্টদের দিয়ে কোড লেখানোর যুগ। এখন এমন পর্যায়ে পৌঁছেছি যেখানে এজেন্টরা অন্য এজেন্টদের প্রম্পট করে কোড লিখছে। চার্নি বলেন, 'সোর্স কোড থেকে এজেন্টে যে বড় পরিবর্তন হয়েছিল, লুপটাও সেইরকম গুরুত্বপূর্ণ ও বড় পদক্ষেপ।'n

বক্তব্যের শেষভাগে (ভিডিওর প্রায় ৩২ মিনিটে) চার্নি তার নিজের কাজে চলা লুপগুলোর বিস্তারিত বলেন। এক এজেন্ট ক্রমাগত কোড আর্কিটেকচার উন্নত করার উপায় খুঁজছে, আরেকটি ডুপ্লিকেটেড অ্যাবস্ট্রাকশন খুঁজে বের করে যা একত্রিত করা যায়। তারা অন্য কোডারদের মতোই পুল রিকোয়েস্ট সাবমিট করে, এবং কোড ক্রমাগত বদলাতে থাকায় তারা থামে না।n

এটি একটি শক্তিশালী ধারণা, বিশেষত চার্নির মতো গুরুত্বপূর্ণ ব্যক্তির সমর্থনে। এজেন্টিক এআই-এ রূপান্তরের সাথে সাথে বেশিরভাগ ব্যবহারকারীর ফোকাস ছিল এজেন্টদের যতটা সম্ভব ভালোভাবে পরিচালনা করতে: স্পষ্ট লক্ষ্য স্থাপন, অগ্রগতির পৃথক ইউনিট পরীক্ষা, এবং প্রম্পট থেকে দূরে সরতে না দেওয়া। লুপ এটাকে আরও এগিয়ে নেয় এজেন্টদের একটি দলকে ক্রমাগত পেছনে কাজ করার অনুমোদন দিয়ে। এআই-এ অনেক বিশ্বাস রাখতে হয় — কিন্তু মডেলগুলো দ্রুত উন্নত হচ্ছে, এটা বাস্তব কাজ করানোর পরবর্তী ধাপ হতে পারে।n

প্রথমে বুঝতে হবে এটি সম্পূর্ণ নতুন নয়। রিকার্সিভ লুপ — যে ফাংশন নিজেকে কল করে কোনো কাজ পুনরাবৃত্তি করতে, লুপ থামানোর শর্তসহ — এটা ইন্ট্রো কম্পিউটার সাইন্স কোর্সের মূল বিষয়। এই লুপগুলো নন-ডিটারমিনিস্টিক লজিক অনুসরণ করে — অর্থাৎ, এটা একটি সাবএজেন্ট যে লুপ কখন থামাবে তা বেছে নেয় স্পষ্ট শর্তের বদলে — কিন্তু একই মূল পদ্ধতি কাজ করছে। প্রোগ্রামাররা যখনই কাজ সম্পন্ন করতে এআই ব্যবহার শুরু করেছে, তখন এআই-এর তত্ত্বাবধানে এআই সহ রিকার্সিভ লুপের কোনো না কোনো সংস্করণ আসবে তা অনিবার্য ছিল।n

ক্লাসিক কম্পিউটিংয়ের চেয়ে এজেন্টিক লুপ হতে পারে অদ্ভুতভাবে সহজ। সবচেয়ে জনপ্রিয় কৌশলগুলোর একটি হলো 'রালফ লুপ' (রালফ উইগামের নামে), যা মূলত মডেল যা কাজ করেছে তার সারসংক্ষেপ নেয় এবং জিজ্ঞেস করে লক্ষ্য অর্জিত হয়েছে কিনা। এটা এআই মডেলদের অনেকক্ষণ চলার সময় হারিয়ে যাওয়া সমস্যা সমাধানের একটি উপায় — মূলত টাস্ক সম্পন্ন না হওয়া পর্যন্ত মডেলকে এদিক-ওদিক ছুঁড়ে মারা।n

লুপের আরেকটি উপায় হলো সাধারণ টেস্ট-টাইম কম্পিউটের দিকে আরও ঠেলে দেওয়ার অংশ হিসেবে ভাবা। এই মাসের শুরুতে ওপেনএই রিসার্চার নোম ব্রাউন পর্যবেক্ষণ করেছিলেন, আধুনিক মডেল প্রায় যেকোনো সমস্যা সমাধান করতে পারে যদি তাদের যথেষ্ট কম্পিউট দেওয়া হয়। এর মানে হলো একটি সমস্যা নিশ্চিত করার একটি উপায় হলো সমাধান না হওয়া পর্যন্ত কম্পিউট ঢালতে থাকা। হিল-ক্লাইমিং সমস্যার জন্য এটা বিশেষ সত্যি, যেমন কোড বেস উন্নত করা, যেখানে মডেল একটি নির্দিষ্ট থ্রেশহোল্ডে পৌঁছানো পর্যন্ত ক্রমাগত ছোট ছোট উন্নতি করতে পারে। অথবা, চার্নির উদাহরণের মতো, যতক্ষণ কম্পিউট খরচ করার সামর্থ্য আছে ততক্ষণ ক্রমাগত উন্নতি করতে পারে।n

যদি এটা ব্যয়বহুল মনে হয়, তা হওয়া উচিত। এজেন্টিক এআই-এর আগেই, এআই লুপ সাধারণ প্রশ্নোত্তর চ্যাটবটের চেয়ে অনেক দ্রুত টোকেন খরচ করে — এবং কারণ লক্ষ্য হলো লুপ সব সময় চালিয়ে রাখা, তাই কতটা খরচ করা যায় তার কোনো সীমা নেই। এটা অ্যানথ্রোপিকের জন্য ঠিক আছে, যারা মূলত টোকেন বিক্রির ব্যবসায় আছে, কিন্তু বাকি সবার জন্য, এটা কাজ করার একটি ব্যয়বহুল উপায় হতে পারে।n

তবুও, সমস্যার উপর নির্ভর করে এজেন্টিক লুপ যদি সমাধান করতে চায়, এবং টোকেন খরচ, ড্রিফট এবং অন্যান্য ক্লাসিক এআই সমস্যার তত্ত্বাবধানের জন্য সঠিক সেটআপ থাকলে, সুবিধা খরচের চেয়ে বেশি হতে পারে।