- Το OpenAI αναπτύσσει ένα εργαλείο για τη δημιουργία μουσικής από κείμενο ή ήχο.
- Συνεργάζεται με φοιτητές της Σχολής Juilliard για να σχολιάζει τις βαθμολογίες και να δημιουργεί δεδομένα προπόνησης.
- Οι χρήσεις θα κυμαίνονταν από συνοδεία οργάνων έως μουσική για βίντεο και διαφημίσεις.
- Θα ανταγωνιστεί τις Suno και Udio σε ένα πλαίσιο νομικής αβεβαιότητας και πιθανών μοντέλων διανομής.
Ανοιχτή Τεχνητή Νοημοσύνη πρόοδοι σε ένα εργαλείο που θα επιτρέψει συνθέστε μουσική από κείμενα και ηχητικά δείγματα, σύμφωνα με αρκετές εξειδικευμένες δημοσιεύσεις. Η ιδέα είναι ότι Οποιοσδήποτε χρήστης μπορεί να ζητήσει μια μελωδία, ένα συγκεκριμένο στυλ ή μια συγκεκριμένη συνοδεία και να λάβει ένα έτοιμο προς χρήση αποτέλεσμα..
Πηγές που επικαλείται το The Information και άλλα μέσα ενημέρωσης αναφέρουν ότι το σύστημα θα μπορούσε Προσθέστε μουσική σε υπάρχοντα βίντεο ή δημιουργήστε ορχηστρικά κομμάτια για ήδη ηχογραφημένα φωνητικά, όπως μια γραμμή κιθάρας, ένα μπάσο ή ρυθμικές βάσεις. Δεν υπάρχει πρόγραμμα κυκλοφορίας Δεν έχει ακόμη αποφασιστεί εάν θα κυκλοφορήσει ως ανεξάρτητο προϊόν ή ως ενσωματωμένο σε υπηρεσίες όπως το ChatGPT ή την εφαρμογή βίντεο Sora.
Τι γνωρίζουμε για το έργο

Το εργαλείο που βρίσκεται υπό ανάπτυξη θα δεχόταν μηνύματα κειμένου και ηχητικά μηνύματα για δημιουργία από θραύσματα για ολοκλήρωση κομματιών σύμφωνα με τις οδηγίεςΣε πρακτικά σενάρια, προορίζεται ως βοηθός που διευκολύνει συνοδείες, ενορχηστρώσεις και μουσικά σκηνικά χωρίς την ανάγκη προηγμένης εκπαίδευσης.
Σύμφωνα με τις διαθέσιμες πληροφορίες, η OpenAI διερευνά Πολλαπλές λειτουργίες χρήσης: δημιουργία από την αρχή, υποστήριξη για φωνητικά κομμάτια και soundtrack για βίντεοΑυτή η προσέγγιση θα διεύρυνε γρήγορα την εμβέλεια των δημιουργών οπτικοακουστικών μέσων, των podcasters και των επωνυμιών που αναζητούν προσαρμοσμένη μουσική.
Πιθανές χρήσεις και ενσωμάτωση

Μεταξύ των εφαρμογών που εξετάζονται, οι πηγές αναφέρουν την δημιουργία συγκεκριμένων συνοδειών (π.χ. κιθάρες) και σύνθεση μουσικής για κλιπΣτον εμπορικό τομέα, εξετάζονται διαφημιστικές καμπάνιες με προσαρμοσμένο ήχο και ροές εργασίας που συνδέονται με υπάρχοντα δημιουργικά εργαλεία.
Μια άλλη δυνατότητα είναι η ενσωμάτωση με πλατφόρμες OpenAI: Μια σύνδεση με το ChatGPT θα απλοποιούσε την αλληλεπίδραση με τη φυσική γλώσσα, ενώ μια σύνδεση με τον Sora θα διευκόλυνε την επεξεργασία μουσικής προσαρμοσμένης σε σκηνές βίντεο που δημιουργούνται από τεχνητή νοημοσύνη. Ωστόσο, αυτή είναι μια υπόθεση χωρίς επίσημη επιβεβαίωση προς το παρόν.
Συνεργασία με την Juilliard και δεδομένα εκπαίδευσης

Μία από τις πιο εντυπωσιακές πτυχές είναι η συνεργασία με φοιτητές της Σχολής Juilliard, ο οποίος θα σχολίαζε τις παρτιτούρες για να παρέχει δεδομένα υψηλής ποιότητας. Αυτή η σχολίαση περιλαμβάνει δομή, αρμονία και εκφραστικές αποχρώσεις, με σκοπό να διδάξει στο μοντέλο τόσο τη μουσική μορφή όσο και την πρόθεση.
Η εργασία με σχολιασμένες παρτιτούρες μπορεί να προσφέρει μια πιο δομημένη βάση από την απλή χρήση ηχητικών κομματιών, βοηθώντας το σύστημα να μάθει προόδους, δυναμικές και ενορχήστρωση. Επιπλέον, αυτή η προσέγγιση στοχεύει να μείωση των νομικών κινδύνων στη λήψη δεδομένων και στη βελτίωση της συνέπειας των παραγόμενων συνθέσεων.
Ανταγωνιστές και νομικό πλαίσιο

Η κίνηση αυτή θα έθετε το OpenAI σε άμεσο ανταγωνισμό με το νεοσύστατες επιχειρήσεις όπως η Suno και η Udio, καθώς και άλλοι παράγοντες με παραγωγικά μουσικά μοντέλα (π.χ. προσπάθειες της Google ή της ElevenLabs). Ο τομέας, εν τω μεταξύ, βρίσκεται υπό έλεγχο λόγω πρόσφατων αγωγών που Αμφισβητούν τη χρήση προστατευμένου υλικού για την εκπαίδευση μοντέλων.
Σε αυτό το πλαίσιο, έχουν προκύψει μηνύματα από τον επικεφαλής της OpenAI σχετικά με η ευκολία αυτού οι κάτοχοι δικαιωμάτων συμμετέχουν στα έσοδαΜένει να δούμε πώς θα υλοποιηθεί ένας μηχανισμός αποζημίωσης, ένα βασικό ζήτημα για την ευρωπαϊκή και παγκόσμια μουσική βιομηχανία.
Ιστορικό και τεχνικές προκλήσεις
Το OpenAI δοκίμασε ήδη την παραγωγή μουσικής το 2020 με το Jukebox., ένα πείραμα που δεν υλοποιήθηκε σε εμπορικό προϊόν. Τα τελευταία χρόνια, η εταιρεία έχει επικεντρωθεί σε Μοντέλα ήχου για μετατροπή κειμένου σε ομιλία και ομιλία σε κείμενοκαι τώρα επιστρέφει στη μουσική με μεγαλύτερες φιλοδοξίες.
Οι τεχνικές προκλήσεις περιλαμβάνουν τη διατήρηση ενός μεγάλης κλίμακας συνοχή στις συνθέσεις, ποιότητα δεδομένων και υπολογιστικό κόστοςΗ διαφάνεια όσον αφορά την εκπαίδευση και την ανθρώπινη εποπτεία κατά τη διάρκεια της δημιουργικής φάσης θα είναι επίσης ζωτικής σημασίας για την επίτευξη χρήσιμων κομματιών που θα γίνουν αποδεκτά από μουσικούς και παραγωγούς.
Εάν το έργο είναι επιτυχές, θα μπορούσε να διευκολύνει την πρόσβαση σε Ευρωπαίους και Ισπανούς δημιουργούς. Soundtrack και διασκευές κατόπιν αιτήματος σε χαμηλότερο κόστος, αν και οι συζητήσεις σχετικά με την πνευματική ιδιοκτησία, την αδειοδότηση και την ιχνηλασιμότητα θα συνεχιστούν. Η αντίδραση του κλάδου θα εξαρτηθεί από σαφείς συμφωνίες και την πραγματική ποιότητα των demos όταν κυκλοφορήσουν.
Είμαι λάτρης της τεχνολογίας που έχει μετατρέψει τα «γκικ» ενδιαφέροντά του σε επάγγελμα. Έχω περάσει περισσότερα από 10 χρόνια της ζωής μου χρησιμοποιώντας τεχνολογία αιχμής και ασχολούμαι με όλα τα είδη προγραμμάτων από καθαρή περιέργεια. Τώρα έχω ειδικευτεί στην τεχνολογία υπολογιστών και στα βιντεοπαιχνίδια. Αυτό οφείλεται στο γεγονός ότι για περισσότερα από 5 χρόνια εργάζομαι γράφοντας για διάφορους ιστότοπους σχετικά με την τεχνολογία και τα βιντεοπαιχνίδια, δημιουργώντας άρθρα που επιδιώκουν να σας δώσουν τις πληροφορίες που χρειάζεστε σε μια γλώσσα κατανοητή από όλους.
Αν έχετε απορίες, οι γνώσεις μου κυμαίνονται από οτιδήποτε σχετίζεται με το λειτουργικό σύστημα Windows καθώς και με Android για κινητά τηλέφωνα. Και η δέσμευσή μου είναι απέναντί σας, είμαι πάντα πρόθυμος να αφιερώσω λίγα λεπτά και να σας βοηθήσω να επιλύσετε τυχόν απορίες που μπορεί να έχετε σε αυτόν τον κόσμο του Διαδικτύου.