21.06.2023 05:17:13 Autor: Lao Wang
Meta hat kürzlich ein Sprachmodell mit künstlicher Intelligenz namens Voicebox auf den Markt gebracht. Im Vergleich zu Modellen, die sich normalerweise auf Text und Bilder konzentrieren, erstellt Voicebox Sprachnachrichten für Antworten. Berichten zufolge kann dieses Modell Audiodetails und Klangfarben in nur 2 Sekunden von Audiobeispielen genau identifizieren und die Textergebnisse in Sprachausgabe umwandeln. Derzeit unterstützt Voicebox Englisch, Französisch, Deutsch und Spanisch. Voicebox kann die fehlenden Teile basierend auf dem Inhalt vor und nach dem Sprachclip ergänzen.
Diese Technologie kann natürliche und realistische Spracheffekte für virtuelle Assistenten oder NPCs im Metaverse bereitstellen. Voicebox kann Menschen mit geschädigten Stimmbändern dabei helfen, eine gewisse Barrierefreiheit zu erreichen. Allerdings befindet sich Voicebox noch im Forschungs- und Entwicklungsstadium. Meta sagte, dass eine solche Technologie der künstlichen Intelligenz im Hinblick auf falsche Fälschungen potenziell schädlich sein kann, weshalb das Unternehmen hart daran arbeitet, Wege zu finden, um effektiv zwischen echter Sprache und von der Voicebox generiertem Audio zu unterscheiden. Das Modell wird erst dann öffentlich zugänglich gemacht, wenn eine Lösung gefunden ist.
Das obige ist der detaillierte Inhalt vonMeta veröffentlicht das Sprach-KI-Modell Voicebox, um virtuellen Assistenten bei der Kommunikation mit NPCs zu helfen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!