VASA-1 - Microsoft Research

Microsoft hat einen Videogenerator VASA-1 entwickelt, der aus einem Foto und einer Audioaufnahme von Sprache ein Video erstellt, der aber nicht für die Öffentlichkeit bestimmt ist.

Ein Forschungsteam bei Microsoft hat ein KI-Tool entwickelt, das aus einem Foto und einer Sprachaufnahme, bei der das Foto zu sprechen scheint, erstaunlich realistische Videoclips erzeugen kann. Sie nennen das Framework VASA, wobei die erste Version den Namen VASA-1 trägt, der sich auf die „visuellen affektiven Fähigkeiten“ der erzeugten Avatare bezieht. Das Tool ist nicht nur in der Lage, eine wertvolle Synchronisation zwischen Lippen und Ton zu erzeugen, sondern kann auch eine breite Palette von ausdrucksstarken Gesichtsausdrücken und natürlichen Kopfbewegungen simulieren.

VASA-1 - Microsoft Research

Navigation

Be active

Kontakt