
Wan 2.7 vs Wan 2.6: 실제로 무엇이 달라졌을까
Wan 2.7에는 Wan 2.6에 없었던 첫/마지막 프레임 제어, 9-그리드 이미지 입력, multi-reference 비디오, 명령어 편집 기능이 추가되었습니다. 어떤 점이 바뀌었고 각 버전을 언제 사용해야 하는지 실용적으로 정리했습니다
요약 — 변경된 5가지 사항
- ✅ Wan 2.7에 시작/종료 프레임 제어 (FLF2V) 추가 — 2.6에는 없음
- ✅ Wan 2.7은 최대 5개의 참조 비디오 입력 지원 — 2.6에는 multi-reference 입력 자체가 없었음
- ✅ Wan 2.7에 9그리드 이미지 입력 추가 — 2.6은 단일 이미지 참조만 사용
- ✅ Wan 2.7에 명령 기반 비디오 편집 추가 — 전체 재생성 없이 기존 클립 편집 가능
- ✅ Wan 2.7 최대 길이는 15초 — Wan 2.6은 약 5초로 제한되어 있었음
간단한 스펙 비교
| 기능 | Wan 2.6 | Wan 2.7 |
|---|---|---|
| 아키텍처 | Diffusion Transformer | Diffusion Transformer + Flow Matching |
| 최대 길이 | ~5초 | 15초 |
| 최대 해상도 | 1080P | 1080P |
| 화면비 | 16:9, 9:16, 1:1 | 16:9, 9:16, 1:1 |
| 텍스트-투-비디오 | ✅ | ✅ |
| 이미지-투-비디오 | ✅ | ✅ |
| 시작/종료 프레임 제어 | ❌ | ✅ |
| 다중 참조 비디오 (최대 5개) | ❌ | ✅ |
| 9그리드 이미지 입력 | ❌ | ✅ |
| 명령 기반 편집 | ❌ | ✅ |
| 다국어 립싱크 | ❌ | ✅ |
| 오픈소스 | Apache 2.0 (확정) | 계획됨 (상태 대기 중) |
| API 접근 | 다양한 제3자 API | WaveSpeedAI, DashScope |
Wan 2.7의 신규 기능 (Wan 2.6에 없던 것)
이것들은 Wan 2.7을 사소한 개선이 아닌 실질적인 업그레이드로 만들어주는 추가 기능들입니다.
시작/종료 프레임 제어
이것이 대표 기능입니다. FLF2V(First-Last Frame to Video)를 사용하면 클립의 시작 프레임과 종료 프레임을 모두 지정할 수 있습니다. 모델이 그 사이의 모든 내용을 생성합니다.
기능의 의의: Wan 2.6에서는 텍스트 prompt나 시작 이미지만 제공하고 모델이 움직임을 생성하는 방식이었기 때문에, 촬영이 최종적으로 어떻게 끝날지 통제할 수 없었습니다. FLF2V를 사용하면 두 끝점을 모두 설정할 수 있습니다. 이 기능은 다음 경우에 유용합니다:
- 특정 각도로 제품 샷의 시작과 끝을 맞춰야 할 때
- 캐릭터를 정해진 동선에 따라 애니메이션화해야 할 때
- 승인된 두 컴포지션 사이의 트랜지션을 제작할 때
이 기능 하나만으로도 Wan 2.7은 단순 생성 도구에서 감독형 애니메이션 도구에 더 가까워졌습니다.
다중 참조 비디오 입력 (최대 5개)
Wan 2.6은 image-to-video 생성의 시작점으로 단일 이미지만 참조할 수 있었습니다. Wan 2.7은 최대 5개의 참조 비디오를 동시에 입력받을 수 있습니다. 모델은 모든 참조를 종합해서 캐릭터의 외형, 움직임 스타일, 환경 맥락을 추론합니다.
기능의 의의: 단일 이미지 참조는 한계가 있습니다. 한 각도에서 촬영된 피사체는 카메라가 움직일 때 일관성을 유지하지 못할 수 있습니다. 다른 각도, 다른 포즈, 다른 조명으로 촬영된 5개의 참조 비디오를 제공하면 모델이 생성된 클립 전체에서 시각적 일관성을 유지하는 데 훨씬 더 많은 정보를 활용할 수 있습니다.
반복적으로 사용되는 캐릭터나 제품 에셋을 다루는 브랜드나 에이전시에게는 매우 실용적인 개선입니다.
9그리드 이미지 입력
9그리드는 3×3 격자로 배열된 9장의 이미지를 하나의 입력으로 받습니다. 모델은 9개의 프레임을 함께 처리해서 피사체나 환경을 여러 각도에서 이해합니다.
기능의 의의: 단일 참조 사진은 하나의 시점만 담을 수 있습니다. 9장이면 피사체를 360도로 파악할 수 있습니다. 이는 단일 프레임으로는 공간 이해가 부족한 캐릭터 일관성 유지나 환경 정의에 특히 유용합니다.
명령 기반 비디오 편집
기존 비디오 클립이 있으면, Wan 2.7은 자연어 명령을 적용해서 클립을 수정할 수 있습니다. 예: 배경을 흰색에서 짙은 나무 무늬로 변경, 자켓 색을 빨간색에서 남색으로 변경, 조명을 더 따뜻하게 조정, 환경에 비 추가
기능의 의의: Wan 2.6에서는 생성된 클립이 90%는 맞는데 한 군데만 수정이 필요해도 재-prompt 후 전체를 재생성해야만 했기 때문에 시간과 비용이 소모되었습니다. 명령 기반 편집은 전체 재생성 없이 목표 지점만 수정할 수 있게 해줍니다. 이는 이미지 생성 도구에서는 표준 기능이었고, Wan 2.7이 이 기능을 비디오로 가져온 것입니다.
최대 길이: 15초
Wan 2.6은 최대 약 5초였습니다. Wan 2.7은 이를 15초로 늘렸습니다. 길이가 3배 늘어나면서 모델이 한 번의 생성으로 만들어낼 수 있는 것의 범위가 달라집니다: 전체 제품 데모, 완성된 짧은 장면, 여러 비트가 들어간 서사적 장면을 생성할 수 있게 됩니다.
5초 길이 클립의 경우는 둘 다 생성할 수 있기 때문에 차이가 없습니다. 5초를 넘어가는 어떤 작업이든, 둘 중에서는 Wan 2.7이 유일한 선택지입니다.
그래도 Wan 2.6을 사용해야 할 경우
스펙상으로는 Wan 2.7이 더 나은 모델입니다. 하지만 일부 상황에서는 Wan 2.6이 실용적인 장점이 있습니다:
오픈소스 가용성. 2.x 라인의 기반인 Wan 2.1은 Apache 2.0 라이선스로 완전 오픈소스였습니다. 워크플로우에 로컬 실행, 자체 호스팅, 오프라인 파이프라인 통합이 필요하다면, 오픈소스 Apache 2.0 라인의 Wan 2.6 모델을 사용할 수 있고 문서도 잘 갖춰져 있습니다. 출시 시점에 Wan 2.7의 오픈소스 상태는 확정되지 않고 대기 중이었습니다.
기 구축된 API 연동. Wan 2.6은 더 오랜 기간 제3자 API를 통해 제공되었습니다. 이미 사용 중인 툴체인이 Wan 2.6을 제공하는 제공업체와 연결되어 있다면, 전환하려면 새 연동 테스트가 필요합니다.
간단한 T2V 및 I2V 작업. 사용 사례가 5초 이하 클립의 간단한 text-to-video 또는 image-to-video 작업이라면, Wan 2.6으로도 충분합니다. 간단한 생성 작업에는 Wan 2.7의 새로운 기능들이 필요하지 않습니다.
비용 불확실성. WaveSpeedAI와 DashScope의 Wan 2.7 가격은 해당 플랫폼에서 직접 확인하셔야 합니다. 대량 배치 작업의 경우 초당 가격이 두 버전 간에 다를 수 있으므로 작업을 진행하기 전에 확인하시기 바랍니다.
결정 표
| 시나리오 | 사용 |
|---|---|
| 5초보다 긴 클립이 필요한 경우 | Wan 2.7 |
| 첫 프레임/마지막 프레임 제어가 필요한 경우 | Wan 2.7 |
| 샷 전반의 캐릭터 일관성 (multi-reference) | Wan 2.7 |
| 완전 재생성 없이 기존 클립 편집 | Wan 2.7 |
| 클립이 5초 이하이고 간단한 T2V인 경우 | 둘 다 가능 — Wan 2.7 권장 |
| 오늘 바로 로컬 / 자가 호스팅 실행이 필요한 경우 | Wan 2.6 (오픈소스 확정) |
| 이미 안정적인 Wan 2.6 파이프라인을 사용 중이고 마이그레이션 예산이 없는 경우 | Wan 2.6 |
결론
Wan 2.7은 주요 버전 업그레이드입니다. 첫 프레임/마지막 프레임 제어, multi-reference 비디오 입력, 9격자 이미지 입력, 명령 편집, 15초 길이 지원 모두 Wan 2.6에 없는 기능입니다. 대부분의 새로운 제작 작업에는 Wan 2.7이 올바른 선택입니다.
예외는 오픈소스 자가 호스팅 실행이 필수인 상황(Apache 2.0 라인의 Wan 2.6은 현재 사용 가능하며, Wan 2.7의 오픈소스 상태는 확정 전입니다)이거나, 기존에 통합된 Wan 2.6이 안정적이고 마이그레이션 비용이 얻는 이점보다 큰 경우입니다.
→ NanoBanana에서 Wan 2.7 사용해보기 — text-to-video 및 image-to-video, 별도 API 설정이 필요하지 않습니다.
자주 묻는 질문
고지 사항
기능 비교는 알리바바 통의 연구소(Alibaba Tongyi Lab)의 공식 Wan 2.7 릴리스 자료(2026년 3월)와 Wan 2.6에 대한 공개 정보를 기반으로 합니다. 작성 시점에 Wan 2.7 공식 가격이 확정되지 않았기 때문에 가격 비교는 상대적 표현을 사용했습니다 — 제작 결정을 내리기 전에 wavespeed.ai와 알리바바 클라우드 DashScope에서 현재 요금을 확인하시기 바랍니다.
더 많은 글

Veo 3.1 Lite 이미지-동영상 변환: 제품 사진을 1분 이내에 클립으로 변환하세요
Veo 3.1 Lite의 image-to-video 모드를 활용해 정지 사진으로 제품 데모, 소셜 미디어 콘텐츠, 브랜드 동영상을 제작하는 방법을 실제 예시와 작업 흐름 팁과 함께 설명합니다

Seedance 2.0: ByteDance의 멀티모달 AI 비디오 생성 완전 가이드
멀티모달 입력, 기본 오디오-비디오 동기화, 2K 해상도 출력, 디렉터 수준의 창의적 제어 기능을 갖춘 ByteDance의 혁신적인 AI 비디오 모델 Seedance 2.0을 살펴보세요

PixVerse V6: 시네마 카메라 컨트롤, 네이티브 오디오, 15초 클립
PixVerse가 2026년 3월 30일 V6를 출시했습니다 — 20개 이상의 시네마 카메라 컨트롤, 네이티브 오디오 동기화, 멀티샷 엔진, 최대 15초 길이의 1080p 네이티브 출력을 지원합니다. 어떤 점이 바뀌었고 여러분의 워크플로우에 적합한지 알아보겠습니다.