Meta mengumumkan kerangka kerja AI audio2photoreal, yang dapat menghasilkan adegan dialog karakter dengan memasukkan file sulih suara

Bit News Meta baru-baru ini mengumumkan kerangka kerja AI yang disebut audio2photoreal, yang mampu menghasilkan serangkaian model karakter NPC yang realistis dan secara otomatis "menyinkronkan bibir" dan "berpose" model karakter dengan bantuan file sulih suara yang ada.

Laporan penelitian resmi menunjukkan bahwa setelah menerima file sulih suara, kerangka fotoreal Audio2 pertama-tama akan menghasilkan serangkaian model NPC, dan kemudian menggunakan teknologi kuantisasi dan algoritma difusi untuk menghasilkan tindakan model, di mana teknologi kuantisasi menyediakan referensi sampel tindakan untuk kerangka kerja dan difusi Algoritma digunakan untuk meningkatkan efek tindakan karakter yang dihasilkan oleh bingkai.

Empat puluh tiga persen dari evaluator dalam eksperimen terkontrol "sangat puas" dengan adegan dialog karakter yang dihasilkan oleh bingkai, sehingga para peneliti merasa bahwa kerangka fotoreal Audio2 mampu menghasilkan gerakan "lebih dinamis dan ekspresif" daripada produk pesaing di industri. Dilaporkan bahwa tim peneliti kini telah membuat kode dan dataset yang relevan menjadi publik di GitHub.

AUDIO4.24%

Lihat Asli

Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.

1 Suka

Hadiah
1
Komentar
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
#BTC#
192k postingan
#ETH#
120k postingan
#PI#
94k postingan
4#GateioInto11#
76k postingan
5#ContentStar#
64k postingan
6#BOME#
59k postingan
7#GT#
56k postingan
8#DOGE#
53k postingan
9#MAGA#
52k postingan
10#SLERF#
51k postingan

Sematkan

peta situs