Dunia kecerdasan buatan kembali mengalami lompatan yang mengesankan berkat NVIDIA, yang dihadirkan Fugatto, sebuah model avant-garde yang menjanjikan merevolusi cara suara dihasilkan dan diubah. Alat ini dirancang untuk menawarkan solusi canggih di bidang seperti musik, video game, dan periklanan. Dengan kemampuan unik untuk mengubah dan membuat audio dari awal, Fugatto bertujuan untuk menjadi permata teknologi sejati.
Nama Fugatto berasal dari istilah musik klasik, membangkitkan kompleksitas dan kemahiran fugue, tetapi diterapkan pada lingkungan suara modern. Jika Anda pernah membayangkan membuat lagu dari deskripsi sederhana atau mengubah suara yang sudah ada menjadi sesuatu yang benar-benar baru, AI ini mampu mewujudkannya.
Mesin yang memadukan inovasi dan presisi
NVIDIA Fugatto menonjol karena kemampuannya menghasilkan audio dari teks. Dari melodi piano yang melankolis dengan ritme jazz hingga badai yang berkembang menjadi fajar dengan kicauan burung – kemungkinannya praktis tidak terbatas. Teknik inferensinya, yang disebut ComposableART, memungkinkan Anda menggabungkan perintah yang dipelajari sebelumnya untuk membuat suara khusus dan unik yang tidak terbatas pada data pelatihan asli.
Fitur revolusioner lainnya adalah modifikasi audio yang ada. Apa artinya ini? Bayangkan memuat file suara dan bisa mengubah aksen atau nada emosionalnya, atau mengambil melodi gitar dan mengubahnya menjadi karya cello. Dalam demonstrasi, hal itu bahkan mungkin terjadi mengubah baris piano sehingga terdengar seperti nyanyian suara manusia. Aplikasi berkisar dari pembuatan efek film hingga alat pendidikan tingkat lanjut.

Potensi Fugatto di industri kreatif
Fugatto bertujuan untuk merevolusi sektor kreatif seperti musik, bioskop atau video game. Bryan Catanzaro, wakil presiden penelitian pembelajaran mendalam terapan di NVIDIA, menyoroti hal itu «AI Generatif ditakdirkan untuk mengubah musik dan desain suara secara radikal». Pencipta tidak hanya akan mampu mengotomatiskan tugas-tugas rutin, tetapi juga bereksperimen dengan suara yang benar-benar baru dan adaptif.
Misalnya, pengembang game dapat menggunakan Fugatto untuk menghasilkan efek dinamis yang merespons perubahan secara real time dalam permainan. Demikian pula musisi dan produser bisa lagu prototipe dengan cepat, menambahkan pengaturan dan varian tanpa memerlukan peralatan mahal atau sesi yang panjang.
Apa yang ada di balik tantangan pelatihan dan etika?
Menurut NVIDIA, model ini telah ada dilatih pada data sumber terbuka, menggunakan server DGX dengan 32 akselerator H100 dan memproses total 2.500 miliar parameter. Namun, tidak semuanya merupakan kabar baik. Perusahaan telah mengindikasikan hal itu implementasi publik Fugatto masih dalam perdebatan, karena masalah etika merupakan hambatan yang signifikan.
Ketakutan akan potensi penyalahgunaan teknologi generatif, seperti membuat konten palsu, memanipulasi suara untuk misinformasi, atau pelanggaran hak cipta, telah membuat NVIDIA mengambil sikap hati-hati. Meskipun Fugatto menggunakan kumpulan data terbuka, tidak jelas apakah Fugatto dapat menghasilkan konten seperti itu melanggar hak kekayaan intelektual atau mereproduksi suara atau musik artis yang sudah ada secara berbahaya.
Sekilas tentang masa depan Fugatto
Model ini bukanlah kasus yang terisolasi dalam dunia AI generatif. Perusahaan seperti Google atau Meta juga telah mengembangkan teknologi serupa, meski dengan pendekatan berbeda. Misalnya, Google memperkenalkan MusicLM, sebuah sistem yang mampu menghasilkan musik dari teks, namun memutuskan untuk tidak mempublikasikannya karena masalah hukum terkait plagiarisme.
Terlepas dari tantangan yang ada, Fugatto menunjukkan bahwa tren kecerdasan buatan mengarah ke arah yang sama alat multifungsi. Meskipun beberapa model sebelumnya diperlukan untuk tugas-tugas tertentu, kini satu sistem dapat melakukannya melakukan beberapa operasi, mulai dari mensintesis musik hingga mentransformasi audio dengan tingkat penyesuaian yang belum pernah terjadi sebelumnya.
Meskipun masih belum ada tanggal spesifik untuk peluncuran pasarnya, Fugatto muncul sebagai tolok ukur pencapaian teknologi AI generatif. Industri kreatif, mulai dari permainan hingga musik, akan mempunyai sekutu dalam model ini yang tidak hanya akan mengurangi upaya teknis, namun juga membuka pintu menuju kemungkinan artistik yang luas dan belum pernah terjadi sebelumnya.
Saya seorang penggila teknologi yang telah mengubah minat "geek"-nya menjadi sebuah profesi. Saya telah menghabiskan lebih dari 10 tahun hidup saya menggunakan teknologi mutakhir dan mengutak-atik semua jenis program hanya karena rasa ingin tahu. Sekarang saya memiliki spesialisasi dalam teknologi komputer dan video game. Hal ini karena selama lebih dari 5 tahun saya telah menulis untuk berbagai website tentang teknologi dan video game, membuat artikel yang berupaya memberikan informasi yang Anda butuhkan dalam bahasa yang dapat dimengerti oleh semua orang.
Jika Anda memiliki pertanyaan, pengetahuan saya berkisar dari segala sesuatu yang berhubungan dengan sistem operasi Windows serta Android untuk ponsel. Dan komitmen saya adalah kepada Anda, saya selalu bersedia meluangkan beberapa menit dan membantu Anda menyelesaikan pertanyaan apa pun yang mungkin Anda miliki di dunia internet ini.