Chargement en cours

avec   ·   par
avec   ·   par
En chargement...
Erreur de chargement.

La machine à prédire des succès est-elle à nos portes?

Par
François Lemay

À la base, le projet était de créer une application qui classerait automatiquement, par genre, la musique sauvegardée dans une discothèque numérique. Le résultat final? Un ensemble d’algorithmes capables de déterminer si une chanson peut devenir ou non un succès sur les palmarès. Est-ce vraiment possible, et si oui, qu’est-ce que ça donne?

L’histoire commence au printemps dernier alors que Kai Middlebrook avait comme projet de mettre au point cette application qui lui permettrait de classer, sans effort, sa musique par style musical. Or, pour ce faire, il faut des données. Beaucoup de données. Et ça tombe bien : le service d’écoute en continu Spotify permet justement à des chercheurs d’utiliser certaines des données générées par les utilisateurs. Voilà donc une bonne base pour commencer le travail!

Quelques mois plus tard, alors qu’il est en train de travailler à son projet, Middlebrook en discute avec son bon ami, Kian Sheik, qui est lui aussi un spécialiste de l’analyse de données, en plus d’être mélomane. Durant la conversation, alors que Middlebrook lui parle de son projet, les deux amis se mettent à discuter du fait que la majorité des chansons qui obtiennent du succès se ressemblent énormément.

Pourquoi, alors, ne pas transformer le projet et vérifier s’il est possible de programmer une intelligence artificielle capable d’évaluer et de reconnaître les caractéristiques qui font qu’une chanson se hisse en haut des palmarès?

C’est ce qu’ils ont fait!

La machine à évaluer le succès

À la base du projet, les chercheurs ont utilisé les données rattachées à près de deux millions de titres offerts sur Spotify, par exemple le tempo, l’humeur (la chanson est-elle joyeuse ou triste?), la tonalité, le volume, etc. Par la suite, ils ont utilisé les palmarès Billboard Top 100 des 30 dernières années.

L’idée maîtresse était de voir si les chansons qui avaient obtenu du succès partageaient des valeurs similaires et si les deux amis pouvaient utiliser ces mêmes valeurs afin de prédire si une chanson avait un certain potentiel futur.

Par la suite, Middlebrook et Sheik ont créé quatre modèles différents de traitement de données (régression logistique, forêt d'arbres décisionnels, machine à vecteurs de support et réseau de neurones artificiel, pour ceux que cela intéresse) afin de classer les chansons dans deux catégories distinctes : succès (1) ou non-succès (0).

L’avantage de ces modèles, selon les deux chercheurs, est qu’ils peuvent s’améliorer à l’usage. Plus ils analysent des chansons, meilleurs ils sont.

Une fois les modèles entraînés, ils ont nourri et comparé les résultats avec ceux des palmarès Billboard et les résultats sont, ma foi, assez ahurissants : entre 86 et 99 % de taux de réussite, en fonction de l’algorithme utilisé. Rien de moins!

Les conséquences

Ces résultats, s’ils sont encourageants en ce qui a trait à la mise au point de systèmes prédictifs musicaux, inquiètent quand même ceux qui les ont pensés.

Pour les compagnies de disques, l’un des enjeux principaux est le taux de réussite en ce qui concerne la découverte de nouveaux artistes ou groupes et leur succès éventuel. Parce que pour découvrir un artiste inédit et lui faire signer un contrat, il faut passer au travers de milliers de chansons reçues; aller voir des spectacles; bref, faire de la prospection.

Cela signifie qu’il faut plusieurs heures, à plusieurs employés, pour découvrir un éventuel succès, et cela coûte cher. S’il est maintenant possible de nourrir une bête informatique qui va décider, en avance, des artistes dans lesquels il faut investir, cela devient inquiétant parce que, pour l’instant, les différents modèles ne tiennent pas compte d’un facteur important : l’attrait de la nouveauté.

Parce qu'au fond, tout ce que ces algorithmes ont réussi est de prédire le passé. Or, le facteur lié à la nouveauté représente une partie importante du succès éventuel d’une chanson. Et ça, même Mike Smith – le cadre de Decca Records qui a décidé de ne pas faire signer de contrat aux Beatles parce que, selon lui, les groupes de guitares n’avaient pas d’avenir – n’aurait pas pu le prédire.

Imaginez ce qu’en aurait pensé une machine...