في ديسمبر 2024، طرحت OpenAI
نموذج ذكاء اصطناعي يُدعى "Sora"، وهذه المرة ليس لتوليد النصوص أو الصور، وإنما
مقاطع الفيديو القصيرة. أحدث هذا النموذج ضجةً واسعة بفضل قدراته المذهلة، إذ يستطيع
إنتاج مقاطع فيديو
واقعية ومليئة بالتفاصيل إلى درجة تجعل من الصعب – بل والمستحيل أحيانًا –
التفرقة بينها وبين
الفيديوهات الحقيقية، رغم وجود بعض العيوب البسيطة هنا وهناك. بدورها،
قدمت جوجل
نموذج منافس لتوليد الفيديو – يُدعى Veo 2 – السنة الماضية، والذي لم يبخل علينا
بأي مفاجآت فيما يخص قدراته التي ربما تفوق Sora. في السطور التالية سنستعرض معكم
أبرز ما تحتاجون معرفته عن هذا النموذج وكيفية استخدامه، خاصًة بعدما أصبح متاحًا
اليوم في
روبوت Gemini على الموبايل أو الويب بمختلف اللغات بما في ذلك العربية والإنجليزية.
توليد الفيديوهات باستخدام Gemini
ما هو نموذج Veo 2 ؟
بعد فترة طويلة من إتاحته بشكل حصري للمطورين، أعلنت جوجل مؤخرًا عن إضافة الجيل الثاني من نموذج توليد الفيديوهات Veo إلى روبوت Gemini لتعزيز قدراته في مساعدة المستخدمين على إنشاء تصورات مرئية متحركة عالية الدقة ومفصلة. ولكن يظل الوصول إلى النموذج مقتصر على المشتركين في النسخة المدفوعة من جيميناي والتي تُعرف بـ "Gemini Advanced" وهي أيضًا جزء من خطة Google One AI Premium ويختلف سعر الاشتراك حسب كل دولة، إلا إن جوجل تتيح فترة تجربة مجانية لمدة شهر يمكن خلالها الوصول إلى كل المميزات المتقدمة التي يتمتع بها روبوت Gemini بما في ذلك إنشاء مقاطع فيديو، بالإضافة إلى الوصول إلى نموذج Whisk المتخصص في تحويل الوسائط إلى فيديوهات، فبمناسبة إطلاق Veo 2، كشفت جوجل عن ميزة جديدة تحمل اسم Whisk Animate، والتي تتيح تحريك الصور التي تم توليدها سابقًا عبر Whisk باستخدام قدرات Veo 2 المتقدمة.
وكانت جوجل قد كشفت عن نموذج توليد الفيديوهات Veo لأول مرة في ديسمبر الماضي، مشيرةً
إلى قدرته المحسّنة على فهم فيزيائية العالم الحقيقي، والتعبيرات البشرية
الدقيقة، بالإضافة إلى إمكانية توليد اللقطات السينمائية الصعبة.
تدعي جوجل أن الجيل الثاني من نموذجها يستطيع إنتاج فيديوهات بدقة 4K تمتد لعدة دقائق، إلا
أن هذا ليس ما سيحصل عليه المستخدمون حاليًا. في الوقت الراهن، الحد الأقصى
المتاح هو فيديو لا يتجاوز 8 ثوانٍ؛ بدقة 720p وبنسبة عرض إلى ارتفاع 16:9، ويرجع
ذلك إلى الموارد السحابية الهائلة التي يتطلبها تشغيل النموذج. كما يتم تمييز جميع مقاطع الفيديو التي تم إنشاؤها باستخدام Veo 2 بعلامة SynthID، وهي علامة مائية رقمية مضمنة في كل إطار، تشير إلى أن مقاطع الفيديو تم إنشاؤها بواسطة الذكاء الاصطناعي. أما فيما يخص عدد
الفيديوهات التي يمكن إنشاؤها شهريًا باستخدام Veo 2، فلم تفصح جوجل عن رقم واضح،
بل اكتفت بالإشارة إلى أنها ستُصدر تنبيهًا للمستخدم عندما يقترب من الحد الأقصى.
كيف تستخدم Veo 2 ؟
في الواقع، هناك طريقتين للوصول إلى نموذج Veo 2 من جوجل وإنشاء مقاطع الفيديو بالذكاء الاصطناعي. الطريقة الأولى هي من خلال روبوت Gemini مباشرًة، فإذا كان لديك اشتراك قائم بالفعل في خدمة Gemini Advanced كل ما عليك هو التوجه إلى الموقع الإلكتروني للروبوت عبر أي متصفح أو تطبيق Gemini على هاتفك، ثم اضغط على "Gemini Advanced" الموجودة بأعلى الواجهة على اليمين أو اليسار حتى تظهر قائمة النماذج المتاحة فأختر منه "Veo 2" وإن لم تعثر على هذا الخيار، فلا تقلق؛ جوجل قالت
إن النموذج سيكون متاحًا لجميع المشتركين خلال بضعة أسابيع على الأكثر.
وبعد تحديد النموذج كل ما عليك فعله
هو التفاعل مع الذكاء الاصطناعي كما المعتاد، لكن مع التركيز هذه المرة على وصف
فكرة فيديو في ذهنك (مشهد قصيرة، أو لقطة درامية، إلخ). جوجل تنصحك بكتابة وصف
يُشبه القصة القصيرة بدقة لكي يستطيع النموذج توليد أدق شيء بالنسبة لما تفكر
فيه، لكن تذكر أنك محدود بـ 8 ثوانٍ فقط، هذا أهم شيء. وعند إنتاج الفيديو يمكنك مشاهدته داخل نافذة الدردشة مع إتاحة إمكانية تنزيله وحفظه على جهازك.
في حال لم تكن مشتركًا في Gemini Advanced فلا يزال بوسعك تجربة نموذج Veo 2 بشكل مجاني من خلال منصة المطورين الخاصة بنماذج الذكاء الاصطناعي من جوجل، والمعروفة بأسم AI Studio. فقط قم بزيارة موقع المنصة وتسجيل الدخول باستخدام حساب جوجل المجاني الخاص بك، وعليه تستطيع الآن الوصول إلى كل نماذج الذكاء الاصطناعي قيد التطوير من جوجل، بما في ذلك Veo 2 فقط تأكد من وجودك داخل قسم Video Gen ثم من الجانب الأيمن يمكن تخصيص بعض الإعدادات مثل قياسات الفيديو وعدد النتائج المطلوب توليدها وحتى مدة المقطع. ستجد بالمنتصف أيضًا مجموعة من العينات لفيديوهات مولدة عبر هذا النموذج.
الآن، ما عليك سوى إدخال وصف مفصل للمشهد الذي تريده لإنشاء مقطع فيديو باستخدام Veo 2 مجانًا. وفي غضون دقيقة واحدة، يتم إنتاج مقطع فيديو رائع مدته 8 ثوانٍ بدقة 720 بكسل. يمكنك مشاهدته وتنزيله أو حفظه على خدمة Google Drive.
أما بالنسبة لأداة
Whisk
الموجودة ضمن حزمة Google One AI Premium، فهي غير متوفرة في العديد من الدول
الآن، من بينهم مصر، لكن عمومًا طريقة استخدامها ليست صعبة إطلاقًا. كل ما عليك
فعله هو
الدخول إليها
وإعطائها أي صورة تريد تحويلها إلى صورة متحركة باستخدام خاصية Whisk Animate
الجديدة، وستجد خيارًا لذلك باسم "ANIMATE"، اضغط عليه وأخبر الذكاء الاصطناعي
بكيف تريد أن تحرك هذه الصورة وستتم العملية بنجاح.
ما الفرق بين Veo 2 و Sora ؟
لا يختلف نموذج Veo 2 كثيرًا عن Sora من حيث الأساسيات وطريقة الاستخدام، فكلاهما
يُنتج فيديوهات بدقة 720p، مع فارقٍ بسيط في المدة؛ إذ يصل Veo 2 إلى 8 ثوانٍ،
بينما يمنحك Sora مقطعًا أطول بثانيتين فقط. كذلك، يتطلب استخدام كلٍ من
النموذجين اشتراكًا شهريًا بقيمة 20 دولارًا، سواء من خلال باقة Gemini Advanced
لـ Veo 2، أو عبر ChatGPT Plus لـ Sora (مع إمكانية ترقية الاشتراك إلى ChatGPT Pro مقابل 200 دولار شهريًا لمن يرغب استخدامات أكثر).
لكن التباين الحقيقي لا
يكمن في مدة الفيديو أو دقته أو طريقة الاستخدام أو حتى سعر الاشتراك، بل في جودة
الفيديوهات الناتجة، وفي نوعية الخدمات الإضافية التي توفرها كل باقة، والتي قد
تُرجّح كفة أحد الخيارين بحسب احتياجات المستخدم وتفضيلاته. يُمكنك الاطلاع على
جودة الفيديوهات التي يُنشئها كل نموذج بمجرد البحث عن "Veo 2 Videos" أو "Sora
Videos" على يوتيوب، وبناءً على تفضيلك، قم باختيار النموذج الذي تفضله.