“এবার সিনেমা বানানো আরও সহজ”-ছবি ও ভিডিও এডিটে Google আনল নতুন AI টুল

সম্প্রতি অনুষ্ঠিত হওয়া Google I/O 2025 সম্মেলনে প্রযুক্তি বিশ্বে আলোড়ন সৃষ্টি করে গুগল উন্মোচন করেছে তাদের অত্যাধুনিক কৃত্রিম বুদ্ধিমত্তা (AI) ভিত্তিক দুটি নতুন টুল – ইমেজ জেনারেটর ‘ইমেজেন ৪’ (Imagen 4) এবং ভিডিও জেনারেটর ‘ভিও ৩’ (Veo 3)। কোম্পানির দাবি, এই টুলগুলি ব্যবহার করে অত্যন্ত বাস্তবসম্মত ছবি এবং ভিডিও তৈরি করা সম্ভব হবে, যা অন্যান্য AI ফটো ও ভিডিও জেনারেটরের তুলনায় অনেক বেশি খুঁটিনাটি ও বিস্তারিত তথ্য ধারণ করতে সক্ষম।

এবারের Google I/O সম্মেলনের অন্যতম আকর্ষণ ছিল ‘ফ্লো’ (Flow) নামক একটি AI-চালিত ভিডিও টুল, যা বিশেষভাবে চলচ্চিত্র নির্মাতা এবং সৃজনশীল পেশাদারদের লক্ষ্য করে তৈরি করা হয়েছে। ব্যবহারকারীরা টেক্সট এবং ইমেজ প্রম্পট ব্যবহার করে ইমেজেন ৪ এবং ভিও ৩ এর মাধ্যমে যথাক্রমে ছবি ও ভিডিও তৈরি করতে পারবেন। উল্লেখযোগ্যভাবে, ভিও ৩ এর সাহায্যে শুধুমাত্র ভিডিওই নয়, তার সাথে স্বয়ংক্রিয়ভাবে তৈরি হওয়া মানানসই অডিও যুক্ত করা হয়েছে, যা ভিডিও কনটেন্ট নির্মাণে এক নতুন মাত্রা যোগ করবে।

Veo 3: ভিডিও জেনারেশনের পরবর্তী ধাপ
গুগল জানিয়েছে যে, ‘ভিও ৩’ তাদের ভিডিও জেনারেশন মডেলের সর্বশেষ এবং উন্নততম সংস্করণ। এটি টেক্সট বা ইমেজ প্রম্পটের ভিত্তিতে স্বল্প দৈর্ঘ্যের ভিডিও ক্লিপ তৈরি করতে পারে। কোম্পানির বক্তব্য অনুযায়ী, ভিও ৩ মডেলে তৈরি ভিডিওগুলি হবে অনেক বেশি বাস্তবসম্মত এবং সেগুলির নড়াচড়া (motion) হবে অনেক উন্নত মানের।

এই পরিষেবা প্রাথমিকভাবে মার্কিন যুক্তরাষ্ট্রে চালু করা হচ্ছে। Google I/O 2025-এ ঘোষণা করা হয়েছে যে, ভিও ৩ বর্তমানে বিটা সংস্করণে উপলব্ধ। মার্কিন যুক্তরাষ্ট্রে ব্যবহারকারীরা জেমিনি অ্যাপ (Gemini app) এবং ফ্লো-এর মাধ্যমে এটি ব্যবহার করতে পারবেন, তবে এর জন্য তাদের গুগল এআই আলট্রা প্ল্যান (Google AI Ultra plan) সাবস্ক্রাইব করা থাকতে হবে।

Veo 2-এর আধুনিকীকরণ
গুগল তাদের পূর্ববর্তী ভিডিও প্ল্যাটফর্ম ভিও ২ (Veo 2)-এর জন্যও একটি গুরুত্বপূর্ণ আপডেট এনেছে। এই আপডেটে রেফারেন্স ইনপুট (Reference Inputs), ক্যামেরা কন্ট্রোল (Camera Controls), আউটপেন্টিং (Outpainting) এবং অবজেক্ট অ্যাড ও রিমুভ (Object Add & Remove) করার মতো উন্নত বিকল্পগুলি যুক্ত করা হয়েছে।

Imagen 4: ২কে রেজোলিউশনে নিখুঁত ছবি
অন্যদিকে, গুগলের নতুন এআই ইমেজ জেনারেটর মডেল ‘ইমেজেন ৪’ ২কে (2K) রেজোলিউশনের ছবি তৈরি করতে সক্ষম। এই ছবিগুলিতে ব্যবহারকারীরা কাপড়ের টেক্সচার, আলোর প্রতিফলন এবং অন্যান্য সূক্ষ্ম বিবরণ অত্যন্ত স্পষ্টভাবে দেখতে পাবেন। এই মডেলটি ফটোরিয়ালিস্টিক ছবি থেকে শুরু করে বিভিন্ন ধরনের ইলাস্ট্রেশন প্রম্পট অনুযায়ী ছবি তৈরিতে পারদর্শী হবে।

ইমেজেন ৪-এর একটি অন্যতম বৈশিষ্ট্য হলো ছবির মধ্যে নির্ভুল বানানসহ টেক্সট যোগ করার ক্ষমতা। এর ফলে ব্যবহারকারীরা সহজেই নিজেদের জন্য পোস্টার বা অন্যান্য সৃজনশীল ডিজাইন তৈরি করতে পারবেন। গুগল বর্তমানে ইমেজেন ৪-কে তাদের জেমিনি, ভার্টেক্স এআই (Vertex AI), হুইস্ক (Whisk) এবং ওয়ার্কস্পেস (Workspace) টুলগুলির সাথে একীভূত করার কাজ করছে, যা ব্যবহারকারীদের জন্য এক সুসংহত অভিজ্ঞতা প্রদান করবে।