
Wan 2.7: نموذج الفيديو الجديد من Alibaba مع التحكم في الإطار الأول ومقاطع مدتها 15 ثانية
يجلب Wan 2.7 ميزة التحكم في الإطار الأول والأخير، وإدخال الفيديو multi-reference، والتحرير المستند إلى التعليمات إلى تشكيلة نماذج الفيديو مفتوحة المصدر من Alibaba. إليكم ما تغير مقارنة بـ Wan 2.6
ملخص سريع — 5 أشياء يجب معرفتها
- ✅ التحكم في الإطار الأول والأخير (FLF2V) — حدد الإطار الافتتاحي والإطار الختامي، ويقوم Wan 2.7 بملء الحركة بينهما
- ✅ ما يصل إلى 5 مدخلات فيديو مرجعية — قم بتغذية مقاطع مرجعية متعددة لتوجيه الشخصية، البيئة، وأسلوب الحركة
- ✅ مقاطع مدتها تصل إلى 15 ثانية — أطول بثلاث مرات من نماذج Wan السابقة
- ✅ تحرير الفيديو بناءً على التعليمات — غير الخلفيات، الإضاءة، أو الأسلوب عبر اللغة الطبيعية
- ❌ لا يوجد إخراج أصلي لـ 4K — أقصى دقة هي 1080P؛ لم يتم تأكيد حالة الإصدار مفتوح المصدر عند الإطلاق
ما هو Wan 2.7؟
Wan 2.7 هو أحدث نموذج لتوليد الفيديو من مختبر Tongyi التابع لـ Alibaba. تم إتاحته في مارس 2026 عبر واجهة برمجة التطبيقات WaveSpeedAI (wavespeed.ai) ومن خلال منصة DashScope التابعة لـ Alibaba Cloud، مع انتظار الإصدار الرسمي لـ GitHub
Wan هي عائلة Alibaba الرائدة مفتوحة المصدر لتوليد الفيديو. تم إصدار Wan 2.1 بموجب ترخيص Apache 2.0 وحظي بتبني كبير من المطورين. يعد Wan 2.7 النسخة الأكثر قدرة حتى الآن، حيث يضيف مجموعة من عناصر التحكم الاحترافية التي كانت تفتقر إليها الإصدارات السابقة.
تم بناء النموذج على بنية Diffusion Transformer + Flow Matching — يقدر عدد معاملاته بحوالي 27 مليار معامل. هذا يضعه في نفس الفئة المعمارية للجيل الحالي من نماذج الفيديو عالية الأداء، حيث يستخدم مطابقة التدفق الكامن بدلاً من الانتشار النمطي القديم DDPM لتوليد أسرع وأكثر استقراراً.
ما الذي تغير مقارنة بـ Wan 2.6
Wan 2.7 ليس تحديثاً بسيطاً. إليك الفرق العملي في الميزات:
| الميزة | Wan 2.6 | Wan 2.7 |
|---|---|---|
| نص إلى فيديو | ✅ | ✅ |
| صورة إلى فيديو | ✅ | ✅ |
| التحكم في الإطار الأول والأخير (FLF2V) | ❌ | ✅ |
| إدخال فيديو متعدد المراجع | ❌ | ✅ (حتى 5) |
| إدخال صورة شبكي 9 خلايا | ❌ | ✅ |
| تحرير الفيديو بناءً على التعليمات | ❌ | ✅ |
| مزامنة الشفاه متعددة اللغات | ❌ | ✅ |
| أقصى مدة للمقطع | ~5 ثواني | 15 ثانية |
| أقصى دقة | 1080P | 1080P |
الإضافات كبيرة جداً. التحكم في الإطار الأول والأخير، وإدخال multi-reference، وتحرير التعليمات هي كلها قدرات سير عمل احترافية كانت مفقودة في Wan 2.6.

الميزات الجديدة الرئيسية بالتفصيل
التحكم في الإطار الأول / الأخير (FLF2V)
يتيح لك FLF2V تحديد كل من الإطار الأول والأخير للفيديو، ثم يقوم Wan 2.7 بتوليد الحركة بينهما. هذه واجهة تحكم مهمة للعمل التجاري — يمكنك ضبط تكوين بدء محدد، وتحديد الموقع الذي تنتهي فيه اللقطة، وترك النموذج يتعامل مع حركة الكاميرا والموضوع في المنتصف.
حالات الاستخدام:
- لقطات المنتجات التي تحتاج فيها أن يبدأ العنصر في المنتصف وينتهي بزاوية محددة
- حركات الشخصيات التي تحتاج فيها أن تكون تغييرات الوضع دقيقة في كلا الطرفين
- الانتقالات السينمائية بين تكوينين محددين
إدخال فيديو متعدد المراجع
يقبل Wan 2.7 ما يصل إلى 5 مقاطع فيديو مرجعية في نفس الوقت. يقرأها النموذج لضمان اتساق الشخصية، أسلوب البيئة، وأنماط الحركة في المقطع الذي يتم توليده. هذا أكثر تطوراً من المرجع أحادي الصورة ويعالج واحدة من الشكاوى المستمرة حول توليد الفيديو: الشخصيات التي لا تحافظ على مظهر متسق عبر اللقطات.
للاستخدام التجاري، هذا يعني أنه يمكنك تقديم أمثلة لكيفية تحرك المنتج، كيف يبدو الشخص، أو أي أسلوب بيئة تريد — ويطبق النموذج هذا السياق على عمليات توليد جديدة.
إدخال صورة شبكي 9 خلايا
يقبل إدخال الشبكة 9 خلايا ترتيب 3×3 من الصور كمدخل واحد. يقرأ النموذج جميع الإطارات التسعة لفهم السياق، الشخصية، أو البيئة من زوايا متعددة. هذا مفيد بشكل خاص لأعمال اتساق الشخصية حيث لا تلتقط صورة مرجعية واحدة تفاصيل كافية.
تحرير الفيديو بناءً على التعليمات
بدلاً من إعادة التوليد من الصفر، يقبل Wan 2.7 تعليمات بلغة طبيعية لتعديل فيديو موجود. يمكنك وصف ما تريد تغييره — لون الخلفية، جو الإضاءة، ملابس الموضوع، أو الأسلوب البصري — ويطبق النموذج التعديل مع الحفاظ على الحركة الأصلية.
هذا يقلل من تكلفة التكرار بشكل كبير لإنتاج الفيديو التجاري، حيث تعد التعديلات الصغيرة على حركة معتمدة أمراً شائعاً.
مزامنة الشفاه متعددة اللغات
يضيف Wan 2.7 دعم مزامنة الشفاه متعددة اللغات، مما يعني أن حركات الكلام المتولدة للشخصيات يمكن مزامنتها مع الصوت بلغات مختلفة. هذه ميزة مهمة لسير عمل التوطين.
المواصفات الفنية
| المواصفة | Wan 2.7 |
|---|---|
| البنية المعمارية | Diffusion Transformer + Flow Matching |
| عدد المعاملات | ~27 مليار (تقديري) |
| الدقات | 480P, 720P, 1080P |
| المدد الزمنية | 2–15 ثانية |
| نسب العرض إلى الارتفاع | 16:9, 9:16, 1:1 |
| الأنماط | T2V, I2V, FLF2V, تحرير بالتعليمات |
| الوصول عبر واجهة برمجة التطبيقات | WaveSpeedAI, Alibaba Cloud DashScope |
| مفتوح المصدر | مخطط له Apache 2.0 (الحالة معلقة عند الإطلاق) |
| وقت المعالجة | ~30 ثانية إلى دقيقتين لمقطع 5 ثواني بدقة 1080P |
القيود المعروفة
لا يوجد نموذج مثالي. إليك ما لا يفعله Wan 2.7:
- لا يوجد إخراج أصلي لـ 4K. أقصى دقة هي 1080P. إذا كنت بحاجة إلى 4K لللافتات الرقمية، العرض المسبق للسينما، أو العرض على الشاشات الكبيرة، ستحتاج إلى استخدام نموذج مختلف أو تكبير الدقة في مرحلة ما بعد الإنتاج.
- لم يتم تأكيد الإصدار مفتوح المصدر عند الإطلاق. كان Wan 2.1 مفتوح المصدر بالكامل بموجب ترخيص Apache 2.0. لم يتم الإعلان رسمياً عن حالة الإصدار مفتوح المصدر لـ Wan 2.7 وقت كتابة هذا المقال — تحقق من Alibaba Wan GitHub للحصول على آخر التحديثات.
- لم يتم نشر تسعيرة رسمية. يجب التحقق من أسعار واجهة برمجة التطبيقات على منصات WaveSpeedAI و DashScope في تلك المنصات. النقطة المرجعية هي أسعار واجهة برمجة التطبيقات لـ Wan 2.6، ولكن قد تختلف أسعار Wan 2.7.
- نموذج جديد، اختبار مجتمعي محدود. Wan 2.7 حديث الإصدار. لا يزال الاختبار المجتمعي الأوسع الموجود للنماذج القديمة في طور التراكم.
كيفية استخدام Wan 2.7
الخيار 1: استخدم NanoBanana (لا يتطلب إعداد واجهة برمجة تطبيقات)
اذهب إلى مولد الفيديو Wan 2.7 على NanoBanana. اكتب prompt، واختر المدة ونسبة العرض إلى الارتفاع، ثم أنشئ. لا يلزم مفتاح واجهة برمجة تطبيقات أو حساب DashScope.
الخيار 2: WaveSpeedAI API
أنشئ حسابًا على wavespeed.ai. يتوفر Wan 2.7 كنقطة نهاية لواجهة برمجة التطبيقات. أرسل طلب POST مع prompt، الوضع (T2V أو I2V)، المدة (2–15 ثانية)، الدقة (480P، 720P، 1080P)، ونسبة العرض إلى الارتفاع.
الخيار 3: Alibaba Cloud DashScope
إذا كنت تستخدم بالفعل خدمات Alibaba Cloud، يمكن الوصول إلى Wan 2.7 من خلال واجهة برمجة تطبيقات DashScope. استخدم وحدة تحكم DashScope لإنشاء مفاتيح واجهة برمجة التطبيقات وقم بالإشارة إلى معرف نموذج Wan 2.7 في طلباتك.
الأسئلة الشائعة
جرب Wan 2.7 الآن
→ أنشئ باستخدام Wan 2.7 — بواسطة text-to-video و image-to-video، لا يتطلب إعداد واجهة برمجة تطبيقات.
الإفصاح
حقائق النموذج ووصف الميزات مستمدة من مواد الإصدار الرسمية لـ Wan 2.7 من مختبر Alibaba Tongyi (مارس 2026) ووثائق واجهة برمجة تطبيقات WaveSpeedAI. حالة إصدار الكود المفتوح والتسعير الرسمي كانا قيد الانتظار للتأكيد وقت النشر — تحقق منهما في GitHub الرسمي لـ Alibaba Wan و wavespeed.ai على الترتيب.
المؤلف
المزيد من المقالات

PixVerse V6 مقابل V5.6: أدوات التحكم بالكاميرا، الصوت، ومحرك اللقطات المتعددة
تم إطلاق PixVerse V6 في 30 مارس 2026. مقارنة بـ V5.6، يضيف أكثر من 20 أداة تحكم لكاميرات السينما، وصوت أصلي مدمج، ومحرك لقطات متعددة، ويرفع الحد الأقصى لمدة المقطع إلى 15 ثانية بدقة 1080p. إليك تحليل مفصل مباشر للاختلافات.

Google Veo 3.1 Lite: نصف تكلفة Veo 3.1 Fast، ونفس السرعة
Google أطلقت Veo 3.1 Lite في 31 مارس 2026 — وهو النموذج الأكثر ملاءمة للسعر في عائلة Veo بسعر 0.05 دولار/ثانية بدقة 720 بكسل. إليك ما يمكنه فعله، وما لا يمكنه، وما إذا كان مناسبًا لسير عملك.

Veo 3.1 Lite Image-to-Video: تحويل صور المنتجات إلى مقاطع فيديو في أقل من دقيقة
كيفية استخدام وضع Veo 3.1 Lite image-to-video لإنشاء عروض توضيحية للمنتجات، ومحتوى لوسائل التواصل الاجتماعي، وفيديوهات للعلامات التجارية من الصور الثابتة — مع أمثلة حقيقية ونصائح لسير العمل