Masa Depan Suara AI dalam Pengembangan Game

Suara AI terdengar lebih realistis saat ini daripada sebelumnya dalam sejarah teknologi suara sintetis.

Apa yang dimulai sebagai text-to-speech (TTS) sederhana, dikombinasikan dengan ratusan jam dialog yang direkam. Telah berkembang menjadi suara AI yang terdengar lebih alami, disintesis hanya dari beberapa jam audio.

Anda dapat melihat sampel audio suara realistis di sini dan di sini. Ini adalah sampel dari Replica Studios, di mana karakter utamanya berhadapan dengan monster di dalam gua.

Mengapa ini penting? Kemajuan terbaru dalam AI suara menghadirkan sejumlah peluang baru untuk materi iklan, pengembang game, media game, dan banyak lagi.

Leviathan Games, pengembang judul yang menampilkan IP terkenal seperti Spider-Man. Dan The Lord of the Rings, telah mulai menggunakan AI suara dalam siklus pengembangannya. “Materi iklan akan selalu mencari batas baru untuk mendorong batas kreatif. Lihatlah bagaimana perangkat lunak animasi 3D telah berubah selama dekade terakhir, ”kata Wyeth Ridgway, pemilik dan direktur teknis Leviathan Games. “Animator Pixar mengubah arah industri dengan mengembangkan perangkat lunak mereka sendiri yang mengganggu untuk pemodelan, rendering, animasi, dan kilat. Dan sekarang kami melihat kesejajaran dengan kemajuan teknologi AI suara yang berpotensi mengubah perkembangan game secara total. ”

Voice AI adalah dunia yang terpisah dari text-to-speech serentak

Tradisional, atau rangkaian, TTS bekerja dengan menyatukan, atau menggabungkan, suara rekaman yang berbeda untuk membentuk kata dan kalimat. Diperlukan aktor suara untuk merekam ratusan jam dialog, dan banyak pekerjaan manual untuk memberi label suara ini dengan hati-hati.

Karena itu, sangat sulit untuk menambahkan dukungan untuk suara baru dengan TTS serentak.

Menurut Susan Bennett, suara asli Siri, dia merekam ratusan frase dan kalimat untuk mendapatkan semua kombinasi suara dalam bahasa Inggris. Dan butuh empat jam sehari, lima hari seminggu, selama lima bulan untuk mendapatkan rekaman awal. dan pembaruan selesai.

Voice AI sangat berbeda.

Pada akhir 2016, DeepMind mendemonstrasikan WaveNet. Jaringan saraf dalam pertama yang dapat secara meyakinkan memodelkan suara manusia dengan rekaman audio yang jauh lebih sedikit. Diperlukan pekerjaan yang sangat mendasar untuk memberi label pada data pelatihan.

Sejak itu kami telah melihat teknik pembelajaran mendalam yang lebih baru yang menggunakan LSTM dan GAN sehingga. Ketika dilatih hanya dalam beberapa jam rekaman audio. AI akan belajar mengucapkan kata-kata dan membuat suara yang bahkan bukan bagian dari set pelatihan asli. Sekaligus menawarkan kustomisasi yang kaya dalam hal kemampuan emosi dan ekspresif.

Anda dapat mendengarkan beberapa contoh perubahan nada ekspresif di sini dan di sini. Ini berasal dari Replica Studios ’Agartha. Sebuah game yang terinspirasi Lord of the Rings di mana musuh menyerang benteng. (Bayangkan Pertempuran Helm’s Deep dari The Two Towers).

Kemajuan dalam penelitian, dikombinasikan dengan penyebaran komputasi awan, membuat teknologinya lebih mudah diakses dari sebelumnya. Karena itu, mungkin ini saat tepat bagi pengembang game menjelajahi AI dan memanfaatkan efisiensi yang signifikan dalam waktu dan biaya. Dan untuk janji masa depan yang lebih besar, lebih personal, dan menarik.

Pembuatan prototipe dialog memenuhi skalabilitas

Perkembangan game penuh dengan peluang untuk merangkul AI suara.

Pikirkan game triple-A seperti Red Dead Redemption 2 atau seri The Witcher yang memiliki ratusan ribu baris dialog yang direkam. Ini adalah pekerjaan yang sangat besar, dan mahal, mengingat waktu yang dibutuhkan untuk memesan waktu studio dengan pengisi suara. Merekam dialog, mengedit, merevisi naskah, dan merekam ulang, sesuai kebutuhan, selama pengembangan.

Desain game adalah proses berulang. Desainer menguji dan mengumpulkan umpan balik pengguna di banyak area berbeda menggunakan prototipe game sebelum diluncurkan. Seperti pengalaman pengguna pertama kali (FTUE), mekanisme game tertentu, animasi, interaksi karakter pemain, dan banyak lagi.

Namun, pembuatan prototipe tidak memiliki alat yang ramah pengembang untuk pembuatan suara dalam game. Mengingat biaya produksi untuk mengulang, menyempurnakan. Dan dialog yang sempurna, termasuk membawa kembali pengisi suara untuk beberapa rekaman, dibutuhkan sumber daya yang besar. Dan itulah mengapa studio game sering kali mengabaikannya.

Tapi ini berubah dengan kelayakan dan peningkatan aksesibilitas AI suara untuk pembuatan prototipe cepat di antara desainer game.

Untuk studio yang lebih kecil, solusi AI suara dapat memberikan penghematan yang signifikan. Sekaligus meningkatkan standar kualitas produksi (seperti yang telah kita lihat pada perangkat lunak animasi).

Untuk studio yang lebih besar, keuntungannya adalah waktu, biaya, dan efisiensi produksi. Bayangkan seberapa besar suara AI dapat berdampak positif pada jadwal pengembangan. Dan tanggal rilis Red Dead Redemption 2 jika digunakan untuk membuat prototipe lebih dari 500 jam rekaman dialog.

Mencapai titik balik untuk pencelupan dengan AI suara

Meskipun ada ratusan ribu game indie saat ini yang memiliki sedikit dialog suara. Ini semua dapat berubah dalam beberapa tahun mendatang. Pada saat yang sama, studio game yang lebih besar dapat segera mengeksplorasi narasi cerita. Yang lebih dalam dengan lebih banyak NPC yang berinteraksi dengan pemain.

Dengarkan contoh audio berikut dari Protokol Pertahanan dari Replica Studios di sini. Adegan ini tentang kapten kapal dan AI (yang mengambil inspirasi dari GlaDOS Portal yang lancang) yang menghadapi serangan musuh.

Saat aktor suara merangkul penggunaan teknologi suara AI. Pengembang game akan memiliki akses ke perpustakaan suara AI yang kaya untuk dipilih untuk game mereka. Sementara aktor suara dapat membuat aliran pendapatan baru untuk diri mereka sendiri melalui pasar suara yang efisien. Bar kualitas juga akan meningkat.

Aktor suara mulai menyambut baik perubahan industri mereka. Simon J. Smith, seorang penulis/sutradara dan artis suara, berkata: “Banyak yang tidak mengharapkannya. Tetapi saya optimis tentang masa depan AI dan bagaimana hal itu dapat membantu memperluas peluang untuk melisensikan suara IP saya. Melihat bahwa suara AI berada pada jalur evolusi yang sama dengan animasi. Dan dengan itu akan membawa lebih banyak permintaan serta aksesibilitas untuk melisensikan pekerjaan saya untuk dialog game. Yang dirancang oleh studio dalam berbagai ukuran. ”

Karena peningkatan terus berlanjut di antara algoritme AI yang mempelajari pola bicara manusia (perkembangan NLP yang terus-menerus). Dan aplikasi sintesis ucapan menggunakan standar industri Speech Synthesis Markup Language (SSML). Kami memasuki tahap di mana pengembang mulai memiliki alat yang diperlukan di ujung jari mereka. Untuk membuat suara dalam game text-to-speech berkualitas tinggi, benar-benar dalam skala besar.

Berikut contoh audio lainnya dari Replica Studios.

Ini masih awal, tapi kami tidak jauh dari visi ini. Dan saat teknologi mendapatkan momentum, pengembang game dan pembuat konten, aktor suara. Dan bakat lainnya akan selaras untuk menciptakan ekosistem ini.

Personalisasi pemain dalam game yang dinamis

Tapi bagaimana dengan kasus penggunaan di luar pembuatan prototipe cepat? Dampak AI suara lebih dari sekadar efisiensi dan skalabilitas.

Teknologi Voice AI akan membuka cara baru untuk memenuhi keinginan akan lebih banyak personalisasi dalam game.

Pemain menghabiskan waktu berjam-jam untuk menyempurnakan kreasi avatar mereka dalam game. Seperti Fallout 4 atau Fortnite dan segera dengan Cyberpunk 2077. Dari tampilan fisik karakter hingga pakaian dan aksesori hingga gaya berjalannya, kustomisasi adalah bagian dari pengalaman pemain.

Kemungkinan tidak terbatas bagi AI suara untuk memungkinkan narasi dalam game yang benar-benar dipersonalisasi dan dinamis dengan suara karakter.

Marco DeMiroz adalah salah satu pendiri dan mitra umum The Venture Reality Fund. Yang melihat bagaimana suara AI dapat meningkatkan pengalaman bermain game VR dengan dialog dan gameplay khusus. DeMiroz berkata, “Bayangkan kemampuan untuk secara dinamis memasukkan audio dan alur cerita ke dalam game. Seorang pemain dapat membuat avatar pribadi mereka seperti yang mereka lakukan saat ini. Dan sekarang akan memiliki sejumlah pilihan lucu, aneh, dan lebih untuk memilih suara avatar mereka. Dan avatar mereka dapat berinteraksi dengan NPC dan karakter lain dengan suara unik mereka sendiri yang dibuat oleh pemain juga. Selain itu, AI suara dapat memberikan suara yang sangat realistis dan disesuaikan. Yang dapat secara dinamis mengubah alur game per pemain berdasarkan keterampilan dan perkembangan mereka sendiri. Suara dapat secara otomatis beradaptasi dengan vektor baru dalam alur game untuk memberi pemain pengalaman yang dipersonalisasi dan berkualitas tinggi. ”

Masa Depan Teknologi AI

Sementara text-to-speech real-time memungkinkan dialog langsung dalam game, janji masa depan teknologi AI suara adalah mengubah teks menjadi pertunjukan. Di sini perancang permainan dapat membuat cerita dan naskah. Dan setiap pemain dapat memainkan peran dalam narasi menggunakan suara mereka sendiri. Atau bahkan memilih suara selebriti berlisensi untuk memerankan karakter kunci tertentu. Bayangkan etalase tempat pemain dapat memilih Samuel L. Jackson untuk menyuarakan avatar mereka (seperti dia melisensikan suaranya untuk asisten Alexa).

Berikut adalah contoh karakter dari Pertahanan Bulan dari Replica Studios. Ini adalah game fiksi ilmiah di mana Anda berperan sebagai anggota ras alien.

Atau bayangkan masa depan di mana pengembang game dapat mengintegrasikan dialog komentator esports secara dinamis ke dalam game. Seperti membawa update Piala Dunia ke FIFA atau update Sunday Night Football ke Madden NFL.

Untuk keterlibatan serta retensi pemain, pengembang game dapat menjelajahi elemen ucapan dinamis baru. Yang benar-benar mendorong batasan kreatif dan membuka jenis mekanisme permainan baru.

Di mana suara AI menuju pada tahun 2021

Sebagai ucapan sintetis dan alat kreatif yang memungkinkan penyesuaian ucapan dan kemajuan skalabilitas. Kami akan melihat perubahan mendasar dalam keterlibatan kami dengan teknologi suara digital yang mendukung AI. Ini akan bergeser dari yang utamanya bersifat transaksional“Alexa, beri tahu saya cuaca”. Ke yang didasarkan pada interaksi dinamis dan hubungan antara karakter dalam narasi atau pengalaman digital apa pun.

Kemajuan dalam teknologi yang mendasari AI suara terus berlanjut pada saat ini. Didorong oleh keinginan pasar akan alat kreatif yang lebih kuat dan suara sintetis yang terdengar lebih alami. Teknologi Voice AI saat ini didorong oleh analisis data yang lebih baik, pendekatan yang lebih baru untuk model prosodi. Dan atribut vokal lainnya yang semuanya menambah cara kita memandang dan mengevaluasi kualitas suara sintetis. Ini adalah perubahan langkah signifikan yang tidak dapat diprediksi oleh siapa pun.

Pada saat yang sama, kami mengantisipasi peningkatan investasi. Dalam manajemen hak digital dan fitur keamanan untuk IP suara digital memasuki tahun 2021. Yang akan meningkatkan lebih banyak aktor suara dan selebriti lainnya yang bermigrasi ke pasar digital. Kami mengantisipasi bahwa sebagai alat, teknologi sintesis suara. Dan bentuk pasar selama tahun depan, ini akan semakin memotivasi pembuat konten dan desainer game untuk merangkul teknologi AI suara. Ini jelas merupakan pasar yang harus diperhatikan, apalagi mulai merangkul saat Anda mempertimbangkan peta jalan pengembangan game untuk waktu dekat.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *