지역 사회 배우다 도구 라이브러리 여가

한국어

집 > 하드웨어 튜토리얼 > 하드웨어 검토 > Google, 'Vlogger' 모델 출시: 사진 한 장으로 10초짜리 동영상 생성

Google, 'Vlogger' 모델 출시: 사진 한 장으로 10초짜리 동영상 생성

WBOY

풀어 주다： 2024-03-21 12:21:38

앞으로

1074명이 탐색했습니다.

Google에서 새로운 비디오 프레임워크를 출시했습니다.

얼굴 사진과 연설 녹음만 있으면 실제와 같은 연설 비디오를 얻을 수 있습니다.

영상 길이는 가변적이며 현재 보이는 예시는 최대 10초 입니다.

입 모양이나 표정 모두 매우 자연스럽다는 것을 알 수 있습니다.

입력 이미지가 상체 전체를 덮는 경우 다양한 동작으로 사용할 수도 있습니다.

谷歌发布“ Vlogger ”模型：单张图片生成 10 秒视频

읽은 후 네티즌들은 다음과 같이 말했습니다.

이를 사용하면 더 이상 머리와 옷을 정리할 필요가 없습니다. 앞으로도 온라인 화상회의를 위해 좋은 옷을 입으세요.

그럼 인물 사진을 찍고 음성 오디오를 녹음하세요(수동 개 머리)

谷歌发布“ Vlogger ”模型：单张图片生成 10 秒视频

목소리로 인물 사진을 제어해 동영상을 생성하세요

이 프레임워크를 VLOGGER라고 합니다.

주로 확산 모델을 기반으로 하며 두 부분으로 구성됩니다.

하나는 인간과 3D 모션의 무작위 확산 모델입니다.

다른 하나는 텍스트-이미지 모델을 향상하기 위한 새로운 확산 아키텍처입니다.

谷歌发布“ Vlogger ”模型：单张图片生成 10 秒视频

그 중 전자는 오디오 파형을 입력으로 사용하여 눈, 표정 및 몸짓, 전반적인 신체 자세 등 캐릭터의 신체 제어 동작을 생성하는 역할을 담당합니다.

후자는 대규모 이미지 확산 모델을 확장하고 방금 예측된 동작을 사용하여 해당 프레임을 생성하는 데 사용되는 시간 차원 이미지 대 이미지 모델입니다.

결과가 특정 캐릭터 이미지에 일치하도록 하기 위해 VLOGGER는 매개변수 이미지의 포즈 맵도 입력으로 사용합니다.

VLOGGER 교육은 매우 큰 데이터 세트(MENTOR라는 이름)에서 완료됩니다.

얼마나 크나요? 길이는 2,200시간이며, 80만 개의 캐릭터 영상을 담고 있습니다.

그 중 테스트 세트의 영상 길이도 120시간, 총 4,000자입니다.

Google은 VLOGGER의 가장 뛰어난 성능은 다양성이라고 소개했습니다.

아래 그림과 같이 최종 픽셀 이미지의 색상이 어두울수록(빨간색) 액션이 풍부해집니다.

谷歌发布“ Vlogger ”模型：单张图片生成 10 秒视频

업계의 이전 유사한 방법과 비교할 때 VLOGGER의 가장 큰 장점은 모든 사람을 교육할 필요가 없고 얼굴 인식 및 자르기에 의존하지 않으며 생성된 비디오가 완전하다는 것입니다(얼굴과 입술 모두 포함). , 신체 움직임 포함) 등

谷歌发布“ Vlogger ”模型：单张图片生成 10 秒视频

구체적으로는 다음 표와 같습니다.

얼굴 재현 방식으로는 이러한 영상 생성을 오디오와 텍스트로 제어할 수 없습니다.

Audio-to-motion은 오디오를 3D 얼굴 움직임으로 인코딩하여 오디오를 생성할 수 있지만 생성되는 효과는 충분히 현실적이지 않습니다.

립싱크는 다양한 테마의 동영상을 처리할 수 있지만 입 움직임만 시뮬레이션할 수 있습니다.

비교해보면 후자의 두 가지 방식인 SadTaker와 Styletalk는 Google VLOGGER에 가장 근접한 성능을 발휘하지만 신체를 제어할 수 없고 영상을 추가로 편집할 수 없다는 점에서 실패합니다.

谷歌发布“ Vlogger ”模型：单张图片生成 10 秒视频

영상 편집이라고 하면, 아래 사진처럼 VLOGGER 모델의 응용 중 하나가 바로 캐릭터가 눈을 감거나, 왼쪽 눈만 감거나, 눈 전체를 뜨게 할 수 있다는 것입니다. 한 번의 클릭으로:

谷歌发布“ Vlogger ”模型：单张图片生成 10 秒视频

또 다른 응용 프로그램은 비디오 번역입니다:

예를 들어 원본 비디오의 영어 음성을 동일한 입 모양을 가진 스페인어로 변경합니다.

네티즌들은 불만을 표시했습니다

결국 "기존 규칙"에 따라 Google은 해당 모델을 공개하지 않았으며 이제 우리가 볼 수 있는 것은 더 많은 효과와 논문뿐입니다.

글쎄, 불만이 많습니다:

모델의 이미지 품질, 립싱크가 일치하지 않음, 여전히 로봇처럼 보입니다.

그래서 일부 사람들은 부정적인 리뷰를 주저하지 않고 남겼습니다.

이게 구글 수준인가요?

谷歌发布“ Vlogger ”模型：单张图片生成 10 秒视频

"VLOGGER"라는 이름을 붙여서 죄송합니다.

谷歌发布“ Vlogger ”模型：单张图片生成 10 秒视频

——OpenAI의 소라와 비교하면 네티즌의 발언은 정말 무리가 없습니다. .

어떻게 생각하세요?

추가 효과:

https://enriccorona.github.io/vlogger/

전체 보고서:

https://enriccorona.github.io/vlogger/paper.pdf

위 내용은 Google, 'Vlogger' 모델 출시: 사진 한 장으로 10초짜리 동영상 생성의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨：

Google 기계 인간 번역하다 효과 영어 아름다운 그림 비디오 편집

원천：myzaker.com

이전 기사：화웨이, 삼성·퀄컴 제치고 3년 연속 유럽 특허출원 순위 1위 다음 기사：Lanzhou는 모든 노력을 기울일 것을 주장합니다. ToB 장면을 구현하려면 10B 매개변수를 가진 대형 모델이면 충분합니다.

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

NullPointerException은 무엇이며 어떻게 해결합니까?

2024-10-22 09:46:29
초보자에서 코더까지: C 기초로 시작되는 여정

2024-10-13 13:53:41
PHP로 웹 개발 잠금 해제: 초보자 가이드

2024-10-12 12:15:51
C에 대한 이해: 새로운 프로그래머를 위한 명확하고 간단한 길

2024-10-11 22:47:31
코딩 잠재력 발휘: 완전 초보자를 위한 C 프로그래밍

2024-10-11 19:36:51
내면의 프로그래머를 깨워보세요: 완전 초보자를 위한 C

2024-10-11 15:50:41
C로 일상을 자동화하세요: 초보자를 위한 스크립트 및 도구

2024-10-11 15:07:41
PHP가 쉬워졌습니다: 웹 개발의 첫 번째 단계

2024-10-11 14:21:21
Python으로 무엇이든 빌드하기: 창의력을 발휘하기 위한 초보자 가이드

2024-10-11 12:59:11
코딩의 핵심: 초보자를 위한 Python의 힘 활용

2024-10-11 12:17:31

최신 이슈

PHP에서 좌표가 경계 객체 내부에 있는지 확인하는 방법은 무엇입니까? 좌표가 몇 개 있는데 이 좌표가 정확히 Google 지도 경계(북동부 및 남서부) 내에 있는지 확인하고 싶습니다. 예: AvailableLat:40.712776A...

에서 2024-04-05 00:25:54

0

1

1401

모든 것을 시도했지만 여전히 HTML 콘텐츠가 표시되지 않습니다. 기본적으로 html 문서의 내용은 브라우저에 아무 것도 표시되지 않습니다. 내가 만든 이 HTML 문서는 다른 HTML 파일에서 링크되었습니다. 브라우저에서 이 ...

에서 2024-04-04 19:16:15

0

1

3496

HTML 태그 <a></a>와 <a href=""></a>의 차이점은 무엇입니까? 일부 웹사이트에서는 텍스트 영역에 [url]웹사이트 주소[/url]를 사용하는데 거기에 앵커 텍스트를 추가할 수 없습니다. 누군가 이에 대해 설명해 줄 수 있나요...

에서 2024-04-02 22:46:16

0

2

403

다른 버튼에 포커스가 있거나 포커스가 있을 때 버튼의 포커스 상태를 어떻게 트리거하나요? 참조 보기 (버튼) 라이브러리 이름을 선택하거나 클릭하면 다음 비활성 버튼이 활성화되도록(밝은 빨간색으로 바뀜) 싶습니다. 구글링을 해보니 각도에 (흐림) 및 (...

에서 2024-04-02 16:49:31

0

1

336

BeautifulSoup을 사용하여 특정 Google 날씨 텍스트를 긁는 방법은 무엇입니까? BeautifulSoup을 사용하여 Python에서 코스 텍스트 "New York City, USA"를 찾는 방법은 무엇입니까? 연습을 위해 비...

에서 2024-04-01 14:06:14

0

1

308

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿