Chat GPT-র মাধ্যমে লেখা শনাক্তের উপায় কী? জেনেনিন কয়েকটি বিষয়

বর্তমান সময়ে কোড লেখা, বড় টেক্সট সংক্ষেপ করা, বা কোনো বিষয়ে পরামর্শ নেওয়ার কাজে চ্যাটজিপিটি (ChatGPT) এখন মানুষের নিত্যসঙ্গী। কিন্তু এই প্রযুক্তির আরেকটি দিক আছে যা ক্রমশ উদ্বেগের কারণ হয়ে দাঁড়াচ্ছে: অনেকেই এআই-জেনারেটেড লেখা তৈরি করে সেগুলোকে নিজেদের লেখা বলে চালিয়ে দিচ্ছেন। এটি শিক্ষক, গবেষক এবং সাধারণ ব্যবহারকারীদের জন্য বড় সমস্যা তৈরি করেছে, কারণ তাদের কাজ শিক্ষার্থীদের লেখার মূল্যায়ন করা বা অনলাইনে পণ্যের রিভিউ দেখে সিদ্ধান্ত নেওয়া। ব্রিটিশ অনলাইন মিডিয়া প্ল্যাটফর্ম কনভারসেশন এক প্রতিবেদনে এই বিষয়টি তুলে ধরেছে।

মানুষ কি এআইয়ের লেখা চিনতে পারছে?

গত কয়েক বছর ধরে গবেষকরা খুঁজে দেখছেন, মানুষ কি আদৌ মানুষের লেখা আর এআইয়ের তৈরি লেখার মধ্যে পার্থক্য করতে পারে? দুঃখজনক হলেও সাম্প্রতিক গবেষণাগুলো বলছে, এটি বেশ কঠিন।

২০২১ সালের গবেষণা: একটি অনলাইন গবেষণায় অংশগ্রহণকারীরা মানুষ ও চ্যাটজিপিটি’র লেখা গল্প, খবরের আর্টিকেল বা রেসিপির মধ্যে পার্থক্য করতে পারেননি; সব লেখাই তাদের কাছে একই রকম লেগেছিল।
ভাষাবিদদের চ্যালেঞ্জ: ভাষাবিদরাও এক্ষেত্রে খুব একটা ভালো করতে পারেননি। ২০২৩ সালের এক গবেষণায় দেখা গেছে, শীর্ষস্থানীয় ভাষাবিজ্ঞান জার্নালের সম্পাদকীয় বোর্ডের সদস্যরাও বুঝতে পারেননি কোন গবেষণাপত্রের সারসংক্ষেপ মানুষ লিখেছে আর কোনটি চ্যাটজিপিটি তৈরি করেছে।
২০২৪ সালের চমকপ্রদ তথ্য: ব্রিটেনের একটি ইউনিভার্সিটিতে পরিচালিত এক গবেষণায় দেখা গেছে, চ্যাটজিপিটি দিয়ে লেখা স্নাতক স্তরের পরীক্ষার ৯৪ শতাংশ উত্তর পরীক্ষকেরা ধরতেই পারেননি!

এই পরিসংখ্যানগুলো স্পষ্ট ইঙ্গিত দেয় যে, মানুষ এক্ষেত্রে খুব একটা দক্ষ নয়।

AI লেখার সম্ভাব্য লক্ষণ

বিশেষজ্ঞরা কিছু লক্ষণ নিয়ে আলোচনা করছেন যা এআই ব্যবহারের ইঙ্গিত দিতে পারে:

বিরল শব্দের ব্যবহার: প্রচলিত ধারণা হলো, বিরল বা অস্বাভাবিক শব্দ লেখকের স্বকীয়তা প্রকাশ করে। কিন্তু গবেষকরা লক্ষ্য করেছেন যে, গত কয়েক বছরে বিজ্ঞান-সম্পর্কিত জার্নালগুলোতে অপেক্ষাকৃত কম ব্যবহৃত শব্দের (যেমন ‘ডেলভস’ বা ‘ক্রিসিয়াল’) সংখ্যা অনেক বেড়ে গিয়েছে, যা এআই ব্যবহারের লক্ষণ হতে পারে। এটি ইঙ্গিত দেয় যে কিছু গবেষক তাদের গবেষণা পত্রের অংশ লিখতে বা সম্পাদনার জন্য এআই ব্যবহার করছেন। এই কাজটি ঠিক না ভুল, তা নিয়ে এখনও বিতর্ক চলছে।
দীর্ঘ ড্যাশের ব্যবহার: আরেকটি গবেষণায় অংশগ্রহণকারীদের জিজ্ঞাসা করা হয়েছিল, তারা কোন বৈশিষ্ট্য দেখে বোঝেন যে কোনো লেখা চ্যাটবট তৈরি করেছে। অনেকেই বেশি পরিমাণে ‘—’ (দীর্ঘ ড্যাশ) ব্যবহারের কথা উল্লেখ করেছেন, যা কম্পিউটার-তৈরি লেখার একটি লক্ষণ হতে পারে। তবে এই গবেষণাতেও অংশগ্রহণকারীরা এআই দিয়ে লেখা ভালোভাবে ধরতে পারেননি।

যদি মানুষ এই পার্থক্য বুঝতে না পারে, তাহলে মানুষের লেখা এবং কৃত্রিম বুদ্ধিমত্তার লেখা আলাদা করার অন্য কোনো উপায় কি থাকতে পারে?

‘স্টাইলোমেট্রি’ কি পারবে উদ্ধার করতে?

কিছু সমাধান পাওয়া যেতে পারে ‘স্টাইলোমেট্রি’র মাধ্যমে। এটি এমন একটি ক্ষেত্র যেখানে গবেষকরা পরিসংখ্যান পদ্ধতি ব্যবহার করে লেখকের লেখার ধরনে থাকা বিভিন্ন পার্থক্য খুঁজে বের করেন। প্রত্যেক লেখকের লেখার ধরনে কিছু ভিন্নতা থাকে, যা বিশ্লেষণ করে লেখককে শনাক্ত করা সম্ভব হয়।

ইউনিভার্সিটি অফ মেমফিস-এর মনোবিজ্ঞান বিভাগের সহযোগী ডিন ও অধ্যাপক রজার জে. ক্রুজ বলেছেন, তিনি তার গবেষণায় দেখিয়েছেন কিভাবে বিতর্কিত বা বেনামে লেখা টেক্সটের সম্ভাব্য লেখককে স্টাইলোমেট্রিক প্রযুক্তির মাধ্যমে নির্ধারণ করা যায়।

জন বারোজ, একজন অস্ট্রেলিয়ান গবেষক, ‘বারোজ ডেল্টা’ নামের একটি কম্পিউটারাইজড কৌশল তৈরি করেছিলেন। এটি লেখায় ব্যবহৃত সাধারণ বা ঘনঘন ব্যবহৃত বিভিন্ন শব্দের ধরণ বিশ্লেষণ করে লেখককে শনাক্ত করতে পারে। অবিশ্বাস্য মনে হলেও, ‘দ্য’, ‘অ্যান্ড’ বা ‘টু’-এর মতো সাধারণ শব্দ ব্যবহার করেও কারা কোনো লেখা লিখেছে তা নির্ধারণ করা যায়। এই পদ্ধতিটি বিস্ময়করভাবে কার্যকর প্রমাণিত হয়েছে।

বারোজের ডেল্টা পদ্ধতি ব্যবহার করে গবেষকরা এমন লেখার পেছনে থাকা আসল লেখককে শনাক্ত করতে পেরেছেন যেখানে লেখক পরিচয় নিয়ে সন্দেহ ছিল। যেমন— ‘উইজার্ড অফ ওজ’ সিরিজের বইটি আসলে এল. ফ্র্যাঙ্ক বাউমের লেখা ছিল না, বরং তার উত্তরসূরি রুথ প্লামলি থম্পসনের লেখা ছিল। তেমনি, ‘কনফেডারেট জেনারেল জর্জ পিকেট’-এর নামে প্রচলিত ভালোবাসার চিঠিগুলোও আসলে তিনি লেখেননি, সেগুলো রচনা করেছিলেন তার স্ত্রী লা সাল করবেল পিকেট।

স্টাইলোমেট্রির সীমাবদ্ধতা এবং নতুন মডেলের আগমন

বারোজের ডেল্টা এবং এর মতো অন্যান্য স্টাইলোমেট্রিক পদ্ধতির একটি বড় সীমাবদ্ধতা হলো, এই পদ্ধতিগুলো কাজ করতে হলে লেখকের কাছ থেকে প্রচুর পরিমাণে লেখা বা টেক্সট দরকার হয়, যাতে পরিসংখ্যানভিত্তিক বিশ্লেষণ নির্ভরযোগ্যভাবে করা যায়। ২০১৬ সালের এক গবেষণায় দেখা গেছে, সঠিকভাবে লেখক শনাক্তের জন্য প্রতিটি লেখকের অন্তত এক হাজার শব্দ লাগতে পারে, যেখানে একজন শিক্ষার্থীর রচনা কেবল দুইশো থেকে তিনশ শব্দের হয়। ফলে এমন বিভিন্ন লেখার ক্ষেত্রে লেখকের পরিচয় শনাক্ত করা কঠিন হয়ে পড়ে।

তবে, সাম্প্রতিক গবেষণাগুলোতে ব্যবহৃত হচ্ছে ‘বিইআরটি’ (BERT) ল্যাঙ্গুয়েজ মডেল, যা বিশাল পরিমাণ মানুষের লেখা এবং চ্যাটবটের তৈরি লেখা দিয়ে প্রশিক্ষিত। এসব মডেল প্রতিটি ধরনের লেখার মধ্যে থাকা নিয়মিত প্যাটার্ন বা ধরণ শিখে ফেলে, অর্থাৎ, কোন ধরনের লেখা মানুষ লেখে আর কোনটা এআই লেখে, সেটার মধ্যে সূক্ষ্ম পার্থক্যও ধরতে পারে। এই পার্থক্য চেনার ক্ষেত্রে বার্ট ৮০ শতাংশ থেকে ৯৮ শতাংশ পর্যন্ত সঠিক হতে পারে।

কিন্তু এই মেশিন লার্নিং মডেলগুলোকে ‘ব্লাক বক্স’ বলা হয়। কারণ গবেষকরা জানেন না, এই মডেলগুলো ঠিক কীভাবে বা লেখার কোন বৈশিষ্ট্য দেখে পার্থক্য করতে পারছে। গবেষকরা এখনও চেষ্টা করছেন এই মডেলগুলোর কাজের পেছনের যুক্তি বা কারণ বোঝার উপায় খুঁজে বের করতে। তবে, এখন পর্যন্ত স্পষ্ট নয় যে, এই মডেলগুলো এমন নির্দিষ্ট কোনো বিশ্বাসযোগ্য সংকেত খুঁজে পাচ্ছে কি না, যা মানুষ নিজেই সহজে চিনতে পারে।

AI লেখার ধরন প্রতিনিয়ত বদলাচ্ছে

এআইয়ের লেখা শনাক্তের আরেকটি বড় চ্যালেঞ্জ হচ্ছে, এই মডেলগুলো নিজেই সময়ের সঙ্গে ক্রমাগত পরিবর্তিত হয় এবং কখনও কখনও এই পরিবর্তন বড় মাত্রায়ও হয়। যেমন, আজকের চ্যাটজিপিটির লেখার ধরন কাল ভিন্ন হতে পারে, কারণ এই মডেলগুলো নিয়মিত আপডেট ও উন্নত হয়। তাই কোনো নির্দিষ্ট নিয়ম বা পদ্ধতি দিয়ে বটের লেখা চেনা অনেক কঠিন হয়ে যায়, কারণ লেখার ধরন বারবার বদলাচ্ছে।

২০২৫ সালের শুরুতে ব্যবহারকারীরা অভিযোগ করতে শুরু করেছিলেন যে, চ্যাটজিপিটি অনেক বেশি ‘অতিথিপরায়ণ’ বা অতিরিক্ত প্রশংসার কথা বলছে, বিশেষ করে ছোটখাটো সমস্যা বা সাধারণ বিভিন্ন প্রশ্নকেও ‘অসাধারণ’ বা ‘ফ্যান্টাস্টিক’ বলে উল্লেখ করেছিল। ওই সময় এসব সমস্যার সমাধান করেছিল চ্যাটজিপিটির নির্মাতা ওপেনএআই। মানুষের লেখার ধরনও সময়ের সঙ্গে সঙ্গে পরিবর্তিত হতে পারে, তবে সাধারণত তা হয় ধীরে ধীরে ও ধাপে ধাপে।

রজার জে. ক্রুজ একটি মজার ঘটনা উল্লেখ করে বলেছেন, তিনি চ্যাটজিপিটি-৪০-কে প্রশ্ন করেছিলেন, “কীভাবে বুঝব কোনো লেখা চ্যাটজিপিটির মাধ্যমে তৈরি? এর কোনো বিশেষ লক্ষণ আছে কি, যেমন শব্দ বাছাই বা বিরামচিহ্ন ব্যবহারের মতোই?” চ্যাটজিপিটি স্বীকার করেছিল যে, মানুষের লেখা আর বটের লেখা আলাদা করা “কিছুটা জটিল” হতে পারে। তবুও চ্যাটজিপিটি তাকে এ নিয়ে ১০-পদক্ষেপের একটি তালিকা দিয়েছিল এবং এর সঙ্গে উদাহরণও ছিল।

বিভিন্ন চ্যাটবট ‘হ্যালুসিনেট’ করতে পারে, অর্থাৎ মাঝেমধ্যে এরা এমন তথ্য দেয় বা এমন কিছু বলে, যা ভুল। তবে চ্যাটবটরা যখন নিজেরা নিজেদের নিয়ে কথা বলে তখন বিস্ময়করভাবে সচেতন মনে হয় এদেরকে।