Le 10 novembre 2023 à 11:01:44 :
Le 10 novembre 2023 à 11:00:51 dzqdqzzdqzdqdzq a écrit :
Le 10 novembre 2023 à 10:56:18 :
Le 10 novembre 2023 à 10:53:07 dzqdqzzdqzdqdzq a écrit :
Le 10 novembre 2023 à 10:50:59 :
Le souci actuel avec les IA génératives qui produisent de la musique, c'est la complexité du format. Là où pour une image tu as un format rgb*hauteur*largeur qui se stocke dans assez peu d'espace, pour une musique tu as un format WAV (évolution d'ondes au fil du temps) et ça prend un temps fou à process.
Tu as déjà des réseaux de neurones génératifs qui peuvent créer de la musique à partir d'un prompt, mais 10 secondes de musique ça prend facilement 2 minutes à générer, et ce même avec du bon matériel.
Bref, on a encore quelques progrès à faire
Ah ok donc les fichiers wav ont plus de "3 dimensions"
Non, pas nécessairement. Un fichier wav a 2 dimensions : l'amplitude de ton onde à un instant t et le temps.
Le souci c'est pas le nombre de dimensions, c'est l'échelle de la donnée avec laquelle tu travailles. Une image ça peut être 500*500 pixels, un fichier wav échantillonné à 44,1 kHz et en 16 bits a une résolution temporelle de 1/44100 secondes, soit 0,000226758 secondes. Déjà plus que 500*500, rien que pour un fichier de son de 1 seconde.
Mais pourtant le timbre de certains instruments ont une courbe 3D non ?
Oui, là je ne parle que d'un fichier wav (rendu final), je ne parle même pas des instruments utilisés pour composer un titre.
Ah oui c'est vrai ce qui compte c'est le rendu final