AI 영상 생성, 지금 어디까지 왔나?
2024년 초만 해도 AI로 만든 영상은 손가락이 6개이거나, 사람이 기괴하게 움직이거나, 물체가 녹아내리는 등 어색함이 많았습니다. 그로부터 1년이 조금 지난 지금, AI 영상의 품질은 전문 영상 스튜디오 수준에 근접했습니다.
OpenAI의 Sora가 공개되고, Runway Gen-3가 출시되고, Kling AI가 한국에서 주목받으면서 "텍스트로 영상 만들기"는 이제 특수한 기술이 아니라 누구나 쓸 수 있는 도구가 되었습니다. 이번 수업에서는 주요 도구의 특징을 파악하고, 직접 영상 클립을 만들어봅니다.
주요 AI 영상 생성 도구 비교
Sora (OpenAI) 최대 1분 길이의 고해상도 영상을 생성합니다. 물리적 일관성(물이 흐르는 방식, 그림자의 움직임 등)이 다른 도구에 비해 뛰어납니다. ChatGPT Plus 구독에 포함되어 있어 접근이 비교적 쉽습니다. 단, 생성 시간이 다소 걸리고 편집 기능은 제한적입니다.
Runway Gen-3 Alpha Hollywood 영화 스튜디오에서도 활용하는 영상 생성 도구입니다. 텍스트뿐 아니라 이미지를 업로드해서 영상으로 변환하는 "이미지 to 영상" 기능이 강합니다. 초기 이미지를 넣고 "이 장면에서 카메라가 서서히 줌 인하면서 바람에 커튼이 흔들린다"고 입력하면 그대로 동작하는 영상이 나옵니다.
Kling AI 중국 Kuaishou에서 만든 도구로 국내에서 접근이 비교적 쉽고 한국어 프롬프트도 잘 지원합니다. 무료 플랜에서도 매일 일정 크레딧을 제공하여 실습용으로 적합합니다. 5초~10초 영상 클립 생성에 강점이 있습니다.
Luma Dream Machine 빠른 생성 속도와 무료 플랜이 특징입니다. 처음 AI 영상을 접하는 분들에게 추천합니다. 하루 5개 무료로 생성 가능하며, 결과물 품질도 최근 크게 향상되었습니다.
Veo 2 (Google) 구글이 출시한 영상 생성 AI로 2025년부터 Google AI Studio에서 접근할 수 있습니다. 특히 카메라 움직임 제어에서 강점을 보여줍니다.
영상 프롬프트 작성법
이미지 프롬프트와 영상 프롬프트의 가장 큰 차이는 "움직임"입니다. 영상은 시간이 흐르는 매체이기 때문에, 무엇이 어떻게 움직이는지를 구체적으로 묘사해야 합니다.
기본 구조: 피사체 + 동작/움직임 + 카메라 움직임 + 분위기 + 배경 설정
나쁜 예: "서울 거리" 좋은 예: "비 내리는 밤 서울 을지로 골목길, 노란 우산을 든 여성이 천천히 걸어가는 뒷모습, 카메라는 뒤에서 따라가며 서서히 줌 인, 네온사인 불빛이 젖은 아스팔트에 반사, 슬로우 모션, 영화적인 색감"
카메라 무빙 키워드 완전 가이드
영상의 분위기를 결정하는 것은 피사체만큼이나 카메라 움직임입니다.
줌(Zoom):
- 줌 인: slow zoom in, push in
- 줌 아웃: zoom out, pull back
패닝(Panning):
- 좌우 패닝: camera pans left, camera pans right
- 상하 틸트: camera tilts up, camera tilts down
트래킹(Tracking):
- 피사체 따라가기: tracking shot, follow shot
- 옆에서 따라가기: dolly shot, side tracking
드론·조감:
- 위에서 아래로: aerial view, bird's eye view, drone shot
- 높은 곳에서 내려오기: crane shot
분위기 있는 카메라:
- 핸드헬드 느낌: handheld camera, slight shake
- 고정 카메라: static shot, locked off
- 360도 회전: 360 orbit, rotating shot
짧지만 임팩트 있는 영상 만들기
SNS에서 주목받는 영상의 공통점이 있습니다. 처음 3초 안에 시선을 잡아야 하고, 10~15초 이내에 핵심 메시지를 전달해야 합니다. AI로 만든 짧은 클립도 마찬가지입니다.
좋은 첫 장면의 조건: 강렬한 색감 또는 움직임, 궁금증을 유발하는 구도, 즉각적인 감정 반응을 이끄는 장면.
실습 과제
Kling AI(무료) 또는 Luma Dream Machine을 활용하여 5~10초 영상 클립을 3개 만들어봅니다.
- 나의 일상 또는 관심사를 담은 영상 (예: 좋아하는 음식, 취미, 직업 관련 장면)
- 카메라 무빙 키워드를 3가지 이상 사용한 영상
- 수업 마지막 10분에 각자 만든 영상 공유 및 피드백
