Meta는 최근 AI 번역 제품군인 Seamless Communication을 출시했습니다. 이 키트에는 4개의 AI 모델이 포함되어 있습니다. Meta는 이 AI 키트가 화자의 감정을 정확하게 재현할 수 있고 단 2초의 지연만으로 동시 통역 기능을 달성하는 동시에 거의 100개 언어로 입력을 지원할 수 있다고 주장합니다.
Seamless Communication은 메타가 자체 AI 연구 조직인 'Fundamental AI Research' 설립 10주년을 기념해 발표한 연구 결과라고 합니다.
메타는 키트에 번역 가속화를 위한 '2세대 SeamlessM4T 모델', 해석 모델 'Seamless Expressive', 동시번역 모델 'Seamless Streaming', 종합 모델 'Seamless'가 포함되어 있다고 밝혔습니다. 다음은 IT House에서 편집한 관련 정보입니다.
SeamlessM4T 모델은 번역 속도를 높이기 위해 사용자의 말하기 내용을 기반으로 번역 프로세스 중에 가능한 후속 텍스트를 자동으로 연결할 수 있다고 주장합니다
Seamless Expressive는 기존 AI 번역이 사용자의 억양, 멈춤, 단어 강조를 포착할 수 없는 문제를 해결할 수 있다고 전해지는 해석 모델입니다. 번역 품질을 유지하면서 사용자의 감정, 스타일, 말하는 속도도 유지할 수 있습니다. , 일시 정지 및 리듬을 통해 번역된 콘텐츠에 더 많은 감정적 정보를 제공합니다
Seamless Streaming은 2초 지연으로 음성 및 텍스트 번역을 제공하는 데 중점을 두고 실시간 통역, 음성-텍스트 번역(S2TT) 및 자동 음성 인식(ASR)을 지원하는 동시 통역 모델입니다.
종합 모델 Seamless는 위의 세 가지 언어 모델을 통합하여 보편적인 시나리오를 촉진합니다.
현재 Meta는 GitHub와 HuggingFace 웹사이트에 샘플 비디오를 게시했습니다. 관심 있는 친구들은 여기를 클릭하여 볼 수 있습니다.
위 내용은 Meta, AI 번역 제품군 출시 Seamless Communication의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!