ChatGPT-কে টক্কর দিচ্ছে ভারতের নিজস্ব ‘সর্বম এআই’! জেমিনিকেও হারাল এই দেশি স্টার্টআপ

আর্টিফিশিয়াল ইন্টেলিজেন্স বা কৃত্রিম বুদ্ধিমত্তাই যে আগামীর ভবিষ্যৎ, তা নিয়ে এখন আর কোনো সন্দেহ নেই। বিশ্বজুড়ে যখন ওপেনএআই (OpenAI) বা গুগলের মতো টেক জায়ান্টদের দাপট চলছে, তখন ‘আত্মনির্ভর ভারত’-এর মন্ত্রকে হাতিয়ার করে ময়দানে নামল বেঙ্গালুরুর এক স্টার্টআপ। ‘সর্বম এআই’ (Sarvam AI) নামের এই ভারতীয় সংস্থাটি এখন বিশ্বখ্যাত চ্যাটজিপিটি ও গুগল জেমিনিকে কড়া চ্যালেঞ্জের মুখে ফেলে দিয়েছে। এমনকি বেশ কিছু প্রযুক্তিগত মাপকাঠিতে চ্যাটজিপিটি-কেও পিছনে ফেলে দিয়েছে এই দেশীয় এআই মডেল।

সর্বম ভিশন: নির্ভুলতায় সেরা
সর্বম এআই-এর সহ-প্রতিষ্ঠাতা প্রত্যুষ কুমার জানিয়েছেন, তাঁদের নতুন ‘সর্বম ভিশন’ মডেলটি ৩ বিলিয়ন প্যারামিটার বিশিষ্ট একটি ভিশন ল্যাঙ্গুয়েজ মডেল। এটি মূলত ছবির ক্যাপশন দেওয়া, জটিল চার্ট বিশ্লেষণ এবং টেক্সট রেকগনিশনের মতো কাজগুলি নিখুঁতভাবে করতে সক্ষম। পরীক্ষায় দেখা গিয়েছে, এটি ৮৪.৩ শতাংশ নির্ভুল ফলাফল দিচ্ছে, যা জেমিনি ৩ প্রো-এর মতো বিশ্বমানের মডেলকেও টপকে গিয়েছে। ওমনিডকবেঞ্চ (OmniDocBench) পরীক্ষায় এর স্কোর ৯৩.২৮ শতাংশ। এটি ২২টি ভারতীয় ভাষা সমর্থন করে এবং বিজ্ঞানের জটিল ফর্মুলা বা লেআউট অনায়াসেই সমাধান করতে পারে।

দেশি স্পিচ মডেল ‘বুলবুল’:
সর্বম এআই-এর ঝুলিতে রয়েছে আরও একটি শক্তিশালী অস্ত্র— ‘বুলবুল ভি৩’ (Bulbul v3)। এটি মূলত একটি ‘টেক্সট টু স্পিচ’ মডেল। বর্তমানে এটি ১১টি ভারতীয় ভাষায় ৩৫টি আলাদা আলাদা কণ্ঠে কথা বলতে পারে। খুব শীঘ্রই এটি ভারতের ২২টি প্রধান ভাষাতেই উপলব্ধ হবে। এই মডেলটি এতটাই উন্নত যে, এর ভয়েস কোয়ালিটি মানুষের গলার স্বরের খুব কাছাকাছি এবং যান্ত্রিক ত্রুটি নগণ্য।

বেঙ্গালুরুর এই স্টার্টআপ প্রমাণ করে দিচ্ছে যে, এআই বিপ্লবে ভারত আর কেবল ব্যবহারকারী দেশ নয়, বরং প্রথম সারির নির্মাতা হিসেবেও উঠে আসছে। চ্যাটজিপিটি বা জেমিনির মতো বিদেশি অ্যাপের ওপর নির্ভরতা কমিয়ে নিজস্ব ভাষার আভিজাত্য বজায় রেখেই ভারতের এই অগ্রগতি টেক দুনিয়ায় এক নতুন মাইলফলক।