
مخرج الفيديوهات بالذكاء الاصطناعي: كيف يحويل وكيل NanoBanana فكرتك إلى فيديو كامل
وكيل مخرج الفيديوهات بالذكاء الاصطناعي لـ NanoBanana يقوم بأتمتة سير عمل إنتاج الفيديو بالكامل — السيناريو، الشخصيات، المشاهد، لوحة القصة، ومقاطع الفيديو النهائية — من فكرة واحدة من prompt
ملخص سريع
الوكيل الجديد AI Video Director Agent لـ NanoBanana يأخذ فكرة واحدة — جملة واحدة — وينفذ خط الإنتاج الكامل بشكل تلقائي: كتابة السيناريو، تصميم الشخصيات والمشاهد، إنشاء صور مرجعية، تقسيم اللقطات، وتقديم جميع مقاطع الفيديو للتوليد بشكل متوازٍ. لا حاجة لجداول زمنية، أو أدوات، أو خبرة.
📌 النقاط الرئيسية (قراءة 10 ثوانٍ)
- ✅ خط إنتاج كامل في دردلة واحدة: سيناريو → أصول شخصيات/مشاهد → لوحة قصة → مقاطع فيديو
- ✅ توليد فيديو متوازٍ: تم تقديم جميع اللقطات في نفس الوقت — أسرع بنسبة 5 أضعاف من التوليد واحدًا تلو الآخر
- ✅ اتساق الشخصيات والمشاهد: صور المرجعية تحافظ على اتساق الصور عبر كل لقطة
- ✅ فحص الاتساق تلقائي: يكتشف الذكاء الاصطناعي ويصلح التناقضات قبل بدء توليد الفيديو
- ✅ نقاط دخول مرنة: انطلق في أي مرحلة — تخطِ ما قمت به بالفعل
- ⏱️ وقت القراءة: 5 دقائق
المشكلة في "نص إلى فيديو"
كل مختبر ذكاء اصطناعي كبير يقدم الآن text-to-video. تكتب prompt وتحصل على مقطع فيديو. أمر بسيط بما فيه الكفاية — حتى تحتاج إلى أكثر من 5 ثوانٍ من لقطات متسقة.
التحدي الحقيقي ليس في توليد مقطع فيديو واحد. إنه إنتاج تسلسل لقطات: لقطات متعددة بنفس الشخصيات، مواقع متسقة، تقدم منطقي للقصة، وإيقاع متحكم. هذا ما طالما يتطلبه إنتاج الفيديو الاحترافي. وهذا بالضبط ما لا يمكنه نموذج واحد من text-to-video فعله بمفرده.
يحل معظم المبدعون هذه المشكلة بعملية يدوية مؤلمة: توليد مقطع → تعديل prompt → إعادة التوليد → تكرار ذلك لكل لقطة → أمل أن تظل الشخصيات تبدو بنفس الشكل. إنها عملية بطيئة، غير متسقة، وتستنفد الطاقة الإبداعية.
تم بناء AI Video Director لـ NanoBanana لاستبدال تلك العملية اليدوية بالكامل.

خط الإنتاج الكامل، تلقائيًا
يعمل وكيل AI Video Director Agent على خط إنتاج مكون من أربع مراحل داخل دردلة واحدة. إليك بالضبط ما يحدث في كل مرحلة.
المرحلة 1 — السيناريو: المخطط القصصي، الشخصيات والمشاهد
تقدم للوكيل مدخل واحد: هدفك الإبداعي.
"اصنع لي عمل إثارة مدته 30 ثانية حول رائد فضاء يكتشف إشارة فضائية غريبة على المريخ."
تنشئ خطوة createScreenplay للوكيل ثلاثة أشياء في نفس الوقت في مكالمة واحدة:
| المطلوب | ما تحصل عليه |
|---|---|
| المخطط القصصي | العنوان، الملخص، الموضوعات، هيكل الأجزاء (مضبط لمدة الهدف التي اخترتها) |
| الشخصيات | ملفات شخصية كاملة: الاسم، الدور، المظهر (تفاصيل مرئية لتوليد الصور)، الشخصية، التطور الشخصي |
| المشاهد | الموقع، الوقت من اليوم، الشخصيات الحاضرة، النبرة العاطفية، الوصف |
كل شيء موجود في بطاقة واحدة يمكنك مراجعتها قبل المتابعة. يعتمد عدد الشخصيات وعدد المشاهد على نطاق القصة بالكامل — لا يحدد الوكيل حدًا لها بشكل مصطنع.
💡 هل لديك سيناريو بالفعل؟ تخطِ المرحلة 1 بالكامل والصق قائمة لقطاتك مباشرة. سيستمر الوكيل من حيث كنت متوقفًا.
المرحلة 2 — الأصول المرئية: صور مرجعية للشخصيات وصور للمشاهد
قبل توليد أي فيديو، يقوم الوكيل ببناء مكتبة مرئية لإنتاجك.

- صور مرجعية للشخصيات: صورة واحدة لكل شخصية، تم توليدها من وصف المظهر المفصل في المرحلة 1. هذه تعمل كمرجع مرئي لكل لقطة تظهر فيها الشخصية.
- صور مرجعية للمشاهد: صورة واحدة لكل موقع رئيسي، تحدد اللغة المرئية للإضاءة، البيئة والمزاج.
هذا هو ما يميز وكيل AI Video Director Agent عن أداة text-to-video البسيطة. تنتج نماذج توليد الفيديو نتائج أكثر اتساقًا بشكل كبير عندما ترتبط بصورة مرجعية — تظهر نفس الشخصية بنفس الشكل من لقطة لأخرى.
المرحلة 3 — تقسيم اللقطات: لوحة القصة
بعد إنهاء السيناريو والأصول، يقوم الوكيل بإنشاء نص لقطة مفصل لكل مشهد.
تتضمن كل لقطة:
- نوع اللقطة (مقرب، متوسط، واسع، رؤية من الشخص، من فوق)
- زاوية الكاميرا والحركة
- وصف مرئي مصمم خصيصًا لتوليد الفيديو
- إجراءات الشخصية ومؤشرات الحوار
- النبرة العاطفية
- المدة (مضطة لأطول أطوال تدعمها نموذج الفيديو الذي اخترته)
ثم يقوم الوكيل بفحص الاتساق تلقائيًا — يمسح تسلسل اللقطات الكامل بحثًا عن تناقضات في مظهر الشخصيات، منطق الموقع، واتساق الخط الزمني. إذا اكتشاف مشاكل، يقوم بإصلاحها تلقائيًا ويعيد الفحص (حتى جولتين) قبل أن يسألك.
المرحلة 4 — توليد الفيديو: جميع اللقطات بشكل متوازٍ
بمجرد تأكيدك، يقوم الوكيل بتجميع موجه فيديو محسّن prompt لكل لقطة ويقدمها جميعًا في نفس الوقت.
هذا هو المكان الذي يهم فيها الهندسة. معظم سير العمل تولد مقطعًا واحدًا، تنتظر حتى ينتهي، ثم تولد التالي. يستخدم وكيل NanoBanana تقديم متوازٍ — يتم تقديم جميع اللقطات لموفر الفيديو في نفس الوقت، كل لقطة تتحقق من حالتها الخاصة بشكل مستقل. لمشروع من 5 لقطات، هذا يعني أنك ستستغرق وقت مقطع واحد فقط، لا خمسة.
تتحدث بطاقات المقاطع الفيديوية في الوقت الفعلي عند اكتمال عملية التوليد. وعندما يكون المقطع جاهزًا، يظهر مباشرة في النص — لا حاجة للانتقال إلى مكتبة الفيديوهات.
🎬 هل تحتاج لإعادة توليد لقطة واحدة فشلت؟ استخدم أداة اللقطة الفردية لإعادة محاولة هذا المقطع فقط دون إعاقة باقي العمليات.
ما الذي يميز هذا عن الباقي؟
يعمل مثل الإنتاج الفعلي الحقيقي
يعكس سير العملية كيف يتم صنع الفيديو الاحترافي بالفعل: مفهوم → اختيار الممثلين + المواقع → تخطيط المشاهد → التصوير. تتولى الذكاء الاصطناعي كل قرارات الحرفية في كل خطوة، ولكن الهيكل يضمن أن كل مرحلة تُعلم المرحلة التالية — فالشخصيات التي تم تحديدها في المرحلة 1 ستظهر في أوصاف اللقطات في المرحلة 3، وصور المواقع من المرحلة 2 تثبت الـ prompts البصرية في المرحلة 4.
مرن، وليس صارمًا
سير العملية هو مسار افتراضي، وليس شرطًا. يمكن للمستخدمين المتقدمين:
- البدء من المرحلة 3 إذا كان لديك سيناريو موجود مسبقًا
- تخطي عملية توليد أصول الشخصيات لفيديوهات بأسلوب الرسوم المتحركة
- إعادة توليد لقطة واحدة دون إعادة تشغيل السير الكامل للعملية
- تغيير نموذج الفيديو أو المدة المستهدفة في خطوة التجميع
الرصيدات الائتمانية متوقعة دائمًا
كل مرحلة لها تكلفة ثابتة تظهر قبل أن تقم بالتأكيد:
| المرحلة | التكلفة |
|---|---|
| السيناريو (مخطط + شخصيات + مشاهد) | 3 رصيدات ائتمانية |
| صور مرجع للشخصيات | 3 رصيدات ائتمانية / شخصية |
| صور مرجع للمشاهد | 3 رصيدات ائتمانية / مشاهد |
| تفكيك اللقطات | 3 رصيدات ائتمانية |
| توليد الفيديو | تختلف حسب النموذج والمدة |
تتطلب العمليات عالية التكلفة (توليد الفيديو) تأكيدًا صريحًا قبل خصم الرصيدات الائتمانية. إذا فشل أي مقطع في الإرسال، فسيتم خصم الرصيدات فقط للمقاطع الناجحة.
من هذا المنتج لمن؟
المبدعون المنفردون لديهم فكرة قصة ولكن ليس لديهم فريق إنتاج. يتولى الوكيل كل قرارات الحرفية — أنت فقط تقبل أو تعدل في كل مرحلة.
فرق التسويق الذين يحتاجون إلى فيديوهات منتجات، إعلانات علامة تجارية، أو محتوى اجتماعي على نطاق واسع. حدد شخصية علامتك التجارية مرة واحدة، وأعد استخدام صورة المرجع عبر إنتاجات غير محدودة.
المطورون والوكالات الذين يريدون تقديم إنتاج فيديوهات بالذكاء الاصطناعي كخدمة. سير العملية المنظمة تعني نتائج متوقعة ونقاط قرار قابلة للتتبع.
المخرجون الفيلميين الذين يكتشفون الذكاء الاصطناعي الذين يريدون اختبار أفكار سردية بسرعة قبل الالتزام بالتصوير الكامل. مرحلة تخطيط المشاهد وحدها تستحق الثمن.
جربه الآن
مُدير الفيديوهات بالذكاء الاصطناعي متاح حاليًا على NanoBanana. افتح دردشة جديدة، وصف فكرة فيديو الخاص بك، وسيقوم الوكيل بإرشادك عبر سير العملية.
هل نفدت رصيداتك الائتمانية؟ تحقق من صفحة الأسعار — تبدأ الرصيدات من 20 دولارًا لـ 900 رصيد.
الأسئلة الشائعة
كم من الوقت تستغرق سير العملية الكاملة؟
تستغرق عملية توليد السيناريو 30–60 ثانية. تعتمد عملية توليد الأصول على عدد الشخصيات والمشاهد (حوالي 10–15 ثانية لكل منهما). تعتمد وقت توليد الفيديو على النموذج والمدة — عادةً 2–5 دقائق لكل مقطع، ولكن بما أن جميع المقاطع تُرسل بشكل متزامن، فإن إجمالي وقت الانتظار يساوي وقت مقطع واحد، لا جميع المقاطع معًا.
هل يمكنني استخدام صور المرجع الخاصة بي بدلاً من توليدها؟
نعم. يمكنك تخطي مرحلة توليد الأصول وتقديم صور المرجع الخاصة كمرجع للإطار الأول لتوليد الفيديو. وصف صورك في الدردشة وسوف يستخدمها الوكيل في خطوة التجميع.
أي نماذج الفيديو مدعومة؟
يعمل الوكيل مع جميع نماذج الفيديو المتاحة على NanoBanana، بما في ذلك Seedance 2.0، Veo 3.1 Lite، WAN 2.7، وغيرها. يمكنك اختيار النموذج في خطوة التجميع. تختلف النماذج المختلفة في المدة المدعومة وتكلفة الرصيدات الائتمانية.
هل يعمل فقط لفيديوهات قصيرة؟
لا. تقوم خطوة السيناريو بضبط عدد الأفعال والمشاهد على المدة المستهدفة لديك. فيديو 10 ثوانٍ سيحصل على فعل واحد و 1–2 مشاهد. فيديو 2 دقائق سيحصل على 3 أفعال ومشاهد أكثر بنسبة تناسبية. يُفضل الوكيل الإنتاجات المترابطة والمضادة للملل ما لم تطلب بشكل صريح إنتاج أطول.
ماذا يحدث إذا فشل توليد مقطع فيديو؟
تم وضع علامة على المقاطع الفاشلة في جلستك. يمكنك إعادة محاولة اللقطات الفردية دون إعادة تشغيل المسار الكامل للعملية. لا يتم خصم الأرصدة إلا للمقاطع التي تم تقديمها بنجاح.
هل توجد طريقة لتحرير السيناريو قبل إنشاء الأصول؟
نعم. بعد اكتمال المرحلة 1، تعرض بطاقة السيناريو المخطط الكامل، ملفات تعريف الشخصيات وقائمة المشاهد. يمكنك طلب من الوكيل (Agent) مراجعة أي عنصر باللغة الطبيعية قبل الانتقال إلى المرحلة التالية.
هل يمكنني إنشاء صور فقط دون فيديو؟
بالتأكيد. أداة Generate Image المباشرة متاحة دائمًا — لا تتطلب مسار عمل الوكيل. اطلب من الوكيل إنشاء صورة وسيتعامل معها في خطوة واحدة، خارج سير إنتاج الفيديو.
كيف تعمل عملية فحص الاستمرارية؟
بعد اكتمال تفكيك اللقطات، يقوم الوكيل (Agent) بتشغيل checkContinuity — وهي خطوة من الذكاء الاصطناعي تقرأ كل اللقطات بشكل متسلسل وتشير إلى المشاكل مثل: تغيير لون شعر شخصية بين اللقطات، أو مشهد يحدث في الليل يتبعه مشهد في ضوء النهار المشرق بدون انتقال زمني، أو القطعة التمثيلية التي تختفي بين اللقطات. يمكن إصلاح المشاكل تلقائيًا عندما يكون ذلك ممكنًا، ويتم الإبلاغ عنها عندما لا يكون ذلك ممكنًا.
المزيد من المقالات

Seedance 2.0: الدليل الشامل لتوليد الفيديو بالذكاء الاصطناعي متعدد الوسائط الخاص بـ ByteDance
استكشف Seedance 2.0، نموذج الذكاء الاصطناعي الثوري لإنشاء الفيديوهات من ByteDance، الذي يتميز بإدخال متعدد الوسائط، ومزامنة أصلية للصوت والفيديو، وإخراج بدقة 2K، وتحكم إبداعي بمستوى المخرجين المحترفين

Veo 3.1 Lite Prompt الدليل: أكثر من 20 Prompt جاهز للاستخدام لفيديوهات الذكاء الاصطناعي السينمائية
تعلم بالضبط كيفية استخدام prompt Veo 3.1 Lite للحصول على نتائج سينمائية. يغطي أنواع اللقطات، حركة الكاميرا، الصوت، وأكثر من 20 prompt جاهز للنسخ واللصق عبر مختلف الأنواع — بدون حشو زائد

PixVerse V6 مقابل V5.6: أدوات التحكم بالكاميرا، الصوت، ومحرك اللقطات المتعددة
تم إطلاق PixVerse V6 في 30 مارس 2026. مقارنة بـ V5.6، يضيف أكثر من 20 أداة تحكم لكاميرات السينما، وصوت أصلي مدمج، ومحرك لقطات متعددة، ويرفع الحد الأقصى لمدة المقطع إلى 15 ثانية بدقة 1080p. إليك تحليل مفصل مباشر للاختلافات.