Stable Diffusion XL Turbo(SDXL Turbo)는 집에서도 놀라운 속도로 상세한 이미지를 생성합니다.
화요일 Stability AI 회사는 "Stable Diffusion XL Turbo"라는 인공 지능 영상 합성 모델을 출시했습니다. 이 모델은 서면 프롬프트를 기반으로 이미지를 빠르게 생성할 수 있습니다. 실제로 이 모델은 웹캠과 같은 소스의 이미지를 신속하게 변환할 수 있기 때문에 회사에서 이 모델을 "실시간" 이미지 생성기로 홍보할 정도로 빠릅니다.
SDXL Turbo의 주요 혁신은 이전 버전에서 요구했던 20~50단계보다 훨씬 적은 한 단계로 이미지 출력을 생성할 수 있다는 것입니다. Stability AI는 이러한 효율성 향상을 ADD(적대 확산 증류)라는 기술에 기인합니다. ADD는 모델이 기존 이미지 합성 모델로부터 학습하는 부분 추출과 실제 이미지와 생성된 이미지를 구별하는 모델의 능력을 향상시키는 적대적 손실을 사용하여 출력의 신뢰성을 향상시킵니다.
ADD 기술에 초점을 맞춰 화요일에 발표된 연구 논문에서 Stability AI는 모델의 내부 작동을 자세히 설명합니다. SDXL Turbo의 장점 중 하나는 특히 단일 단계 이미지 출력을 생성할 때 GAN(생성적 적대 신경망)과 유사하다는 것입니다.
SDXL Turbo의 이미지는 더 높은 해상도에서 SDXL로 제작된 이미지만큼 상세하지 않으므로 이전 모델을 완전히 대체할 수는 없습니다. 하지만 놀라운 속도로 시간을 절약해 줍니다
이를 시험해 보기 위해 우리는 Auto111을 사용하여 Nvidia RTX 3060에서 기본적으로 SDXL Turbo를 실행했습니다(SDXL 가중치와 동일한 가중치 적용). 20단계에 비해 약 4초 만에 3단계 1024×1024 이미지가 생성되었습니다. 유사한 디테일의 SDXL 이미지 26.4초가 소요됩니다. 작은 이미지는 훨씬 빠르게 생성되며(512×768의 경우 1초 미만) 물론 RTX 3090 또는 4090과 같은 더 강력한 그래픽 카드를 사용하면 생성 시간도 더 빨라질 수 있습니다. Stability의 마케팅과는 달리 SDXL Turbo 이미지는 이미지당 약 3~5단계에서 가장 세부적인 부분이 있다는 사실을 발견했습니다.
SDXL Turbo의 생성 속도는 소위 "실시간"입니다. Stability AI에 따르면 강력한 AI 조정 그래픽 프로세서인 NVIDIA A100에서 이 모델은 인코딩, 단일 노이즈 제거 단계 및 디코딩을 포함하여 207ms 내에 512×512 이미지를 생성할 수 있습니다. 일관성 문제가 해결될 수 있다면 이러한 속도는 AI 비디오 필터의 실시간 생성이나 실험적인 비디오 게임 이미지 생성으로 이어질 수 있습니다. 이 경우 일관성이란 여러 프레임이나 세대에 걸쳐 동일한 테마를 유지하는 것을 의미합니다.
현재 SDXL Turbo는 비상업적 연구 라이센스에 따라 제공되므로 개인적, 비상업적 목적으로 사용이 제한됩니다. 이 움직임은 이미 Stable Diffusion 커뮤니티에서 일부 비판을 받았지만 Stability AI는 상업적 응용이 가능하며 관심 있는 사람들이 더 많은 정보를 얻기 위해 연락하도록 초대한다고 말했습니다.
한편 Stability AI는 최근 한 투자자가 CEO Emad Mostaque의 사임을 촉구하는 등 내부 경영 문제에 직면해 있습니다. Stability AI 경영진은 회사를 더 큰 기업에 매각할 가능성을 모색해 온 것으로 알려졌으나 이것이 Stability AI가 신제품을 출시하는 속도에는 영향을 미치지 않았습니다. 지난주에 회사는 정지 이미지를 짧은 비디오 클립으로 변환하는 Stable Video Diffusion이라는 소프트웨어를 출시했습니다
Stability AI는 이미지 편집 플랫폼 Clipdrop에서 SDXL Turbo 기능의 베타 데모를 제공했습니다. Hugging Face에서 비공식 라이브 데모를 무료로 체험해 볼 수도 있습니다. 분명히 훈련 데이터의 출처 부족과 오용 가능성을 포함하여 모든 일반적인 주의 사항이 적용됩니다. 이러한 답이 없는 질문에도 불구하고 AI 이미지 합성의 기술 발전은 확실히 둔화되지 않습니다.
친구들이 마음에 든다면 "Know What's New"를 팔로우해주세요!
위 내용은 Stable Diffusion XL Turbo는 '실시간' 속도로 AI 이미지를 생성할 수 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!