“এবার সিনেমা বানানো আরও সহজ”-ছবি ও ভিডিও এডিটে Google আনল নতুন AI টুল

সম্প্রতি অনুষ্ঠিত হওয়া Google I/O 2025 সম্মেলনে প্রযুক্তি বিশ্বে আলোড়ন সৃষ্টি করে গুগল উন্মোচন করেছে তাদের অত্যাধুনিক কৃত্রিম বুদ্ধিমত্তা (AI) ভিত্তিক দুটি নতুন টুল – ইমেজ জেনারেটর ‘ইমেজেন ৪’ (Imagen 4) এবং ভিডিও জেনারেটর ‘ভিও ৩’ (Veo 3)। কোম্পানির দাবি, এই টুলগুলি ব্যবহার করে অত্যন্ত বাস্তবসম্মত ছবি এবং ভিডিও তৈরি করা সম্ভব হবে, যা অন্যান্য AI ফটো ও ভিডিও জেনারেটরের তুলনায় অনেক বেশি খুঁটিনাটি ও বিস্তারিত তথ্য ধারণ করতে সক্ষম।
এবারের Google I/O সম্মেলনের অন্যতম আকর্ষণ ছিল ‘ফ্লো’ (Flow) নামক একটি AI-চালিত ভিডিও টুল, যা বিশেষভাবে চলচ্চিত্র নির্মাতা এবং সৃজনশীল পেশাদারদের লক্ষ্য করে তৈরি করা হয়েছে। ব্যবহারকারীরা টেক্সট এবং ইমেজ প্রম্পট ব্যবহার করে ইমেজেন ৪ এবং ভিও ৩ এর মাধ্যমে যথাক্রমে ছবি ও ভিডিও তৈরি করতে পারবেন। উল্লেখযোগ্যভাবে, ভিও ৩ এর সাহায্যে শুধুমাত্র ভিডিওই নয়, তার সাথে স্বয়ংক্রিয়ভাবে তৈরি হওয়া মানানসই অডিও যুক্ত করা হয়েছে, যা ভিডিও কনটেন্ট নির্মাণে এক নতুন মাত্রা যোগ করবে।
Veo 3: ভিডিও জেনারেশনের পরবর্তী ধাপ
গুগল জানিয়েছে যে, ‘ভিও ৩’ তাদের ভিডিও জেনারেশন মডেলের সর্বশেষ এবং উন্নততম সংস্করণ। এটি টেক্সট বা ইমেজ প্রম্পটের ভিত্তিতে স্বল্প দৈর্ঘ্যের ভিডিও ক্লিপ তৈরি করতে পারে। কোম্পানির বক্তব্য অনুযায়ী, ভিও ৩ মডেলে তৈরি ভিডিওগুলি হবে অনেক বেশি বাস্তবসম্মত এবং সেগুলির নড়াচড়া (motion) হবে অনেক উন্নত মানের।
এই পরিষেবা প্রাথমিকভাবে মার্কিন যুক্তরাষ্ট্রে চালু করা হচ্ছে। Google I/O 2025-এ ঘোষণা করা হয়েছে যে, ভিও ৩ বর্তমানে বিটা সংস্করণে উপলব্ধ। মার্কিন যুক্তরাষ্ট্রে ব্যবহারকারীরা জেমিনি অ্যাপ (Gemini app) এবং ফ্লো-এর মাধ্যমে এটি ব্যবহার করতে পারবেন, তবে এর জন্য তাদের গুগল এআই আলট্রা প্ল্যান (Google AI Ultra plan) সাবস্ক্রাইব করা থাকতে হবে।
Say goodbye to the silent era of video generation: Introducing Veo 3 — with native audio generation. 🗣️
Quality is up from Veo 2, and now you can add dialogue between characters, sound effects and background noise.
Veo 3 is available now in the @GeminiApp for Google AI Ultra… pic.twitter.com/7rcXeBslyU
— Google (@Google) May 20, 2025
Veo 2-এর আধুনিকীকরণ
গুগল তাদের পূর্ববর্তী ভিডিও প্ল্যাটফর্ম ভিও ২ (Veo 2)-এর জন্যও একটি গুরুত্বপূর্ণ আপডেট এনেছে। এই আপডেটে রেফারেন্স ইনপুট (Reference Inputs), ক্যামেরা কন্ট্রোল (Camera Controls), আউটপেন্টিং (Outpainting) এবং অবজেক্ট অ্যাড ও রিমুভ (Object Add & Remove) করার মতো উন্নত বিকল্পগুলি যুক্ত করা হয়েছে।
Imagen 4: ২কে রেজোলিউশনে নিখুঁত ছবি
অন্যদিকে, গুগলের নতুন এআই ইমেজ জেনারেটর মডেল ‘ইমেজেন ৪’ ২কে (2K) রেজোলিউশনের ছবি তৈরি করতে সক্ষম। এই ছবিগুলিতে ব্যবহারকারীরা কাপড়ের টেক্সচার, আলোর প্রতিফলন এবং অন্যান্য সূক্ষ্ম বিবরণ অত্যন্ত স্পষ্টভাবে দেখতে পাবেন। এই মডেলটি ফটোরিয়ালিস্টিক ছবি থেকে শুরু করে বিভিন্ন ধরনের ইলাস্ট্রেশন প্রম্পট অনুযায়ী ছবি তৈরিতে পারদর্শী হবে।
ইমেজেন ৪-এর একটি অন্যতম বৈশিষ্ট্য হলো ছবির মধ্যে নির্ভুল বানানসহ টেক্সট যোগ করার ক্ষমতা। এর ফলে ব্যবহারকারীরা সহজেই নিজেদের জন্য পোস্টার বা অন্যান্য সৃজনশীল ডিজাইন তৈরি করতে পারবেন। গুগল বর্তমানে ইমেজেন ৪-কে তাদের জেমিনি, ভার্টেক্স এআই (Vertex AI), হুইস্ক (Whisk) এবং ওয়ার্কস্পেস (Workspace) টুলগুলির সাথে একীভূত করার কাজ করছে, যা ব্যবহারকারীদের জন্য এক সুসংহত অভিজ্ঞতা প্রদান করবে।