Géométrie de l’information et musique

Samedi 10 octobre 2009

Ircam, Salle I. Stravinsky
1, place I. Stravinsky 75004 Paris
(Entrée libre dans la mesure des places disponibles)

Organisateur de la séance : Arshia Cont, Ircam, Département Médiation Recherche/Création. Cette séance organisée dans le cadre du projet PEPS Interactions Maths/ST2I "Géométrie de l’Interaction et Musique".

Programme PDF

Programme

Résumés

Arnaud Dessein (Ircam)

Un survol sur la géométrie de l’information et ses applications

En guise d’introduction à la thématique de la journée, nous proposons un court survol sur quelques aspects de base de la géométrie de l’information et ses applications dans différents domaines.

Hichem Snoussi (Université de Troyes)

Filtrage particulaire sur les variétés riemanniennes

Au vu de la complexité et de la non linéarité des problèmes d’optimisation en ligne, on est souvent amené à considérer des schémas d'inférence approximatifs de type Monte Carlo. L'approche de Monte Carlo séquentielle (SMC), aussi connue sous le nom d'algorithme de filtrage particulaire, permet de calculer récursivement dans le temps une approximation stochastique de la distribution a posteriori. L’adaptation de cette technique pour l’estimation en ligne d'objets géométriques appartenant à une variété riemannienne consiste à représenter la densité de probabilité a posteriori par un ensemble d'échantillons aléatoires, appelés particules, générées sur la variété riemannienne. Chaque particule représente un état probable de l'état du système et le poids de chaque particule représente une mesure du degré de confiance en cette dernière. Le processus d’échantillonnage est réalisé en deux étapes : échantillonnage aléatoire sur l’espace tangent et projection sur la variété différentiable avec le mapping exponentiel. La décision est ensuite prise par le calcul du barycentre intrinsèque des particules pondérées par leurs poids respectifs. Le calcul du barycentre peut s’implémenter par un simple algorithme de gradient adapté à la structure géométrique de la variété riemannienne [Snoussi 2009]. Ce travail sera illustré par le tracking de matrices de covariance du bruit sur la variété riemannienne des matrices définies positives.

Bibliographie

Frédéric Barbaresco (Thales)

Géométrie, médiane et diffusion de spectres de fréquences acoustiques : Ou Comment "médianiser" ou "diffuser" des morceaux de musiques

La théorie de la Géométrie de l'Information introduite de façon parallèle par Rao et Chentsov, et la Géométrie Symplectique telle qu'introduite par Carl Ludwig Siegel permet de définir une métrique entre matrices de covariance d'une série temporelle (la matrice de covariance définissant le spectre de fréquences acoustiques présentes dans le signal). La géométrie naturelle de ces matrices de covariance symétriques (ou hermitiennes) définies positives est une géométrie Riemannienne symétrique. Il s'agit d'un espace métrique à courbure négative. Il est alors possible de calculer de façon explicite la géodésique (plus court chemin sur la variété) entre matrices de covariance. Sur la base de travaux du géomètre Herman Karcher, on définie un flot de gradient qui converge vers la médiane de N matrices de covariances (appelé point de Fermat-Weber en Physique) en minimisant le critère égale à la somme des distances géodésiques à l'ensemble des N matrices (ceci étant l'approche classique du barycentre de Fréchet qui converge vers la moyenne). Sur la base de ce flot et par analogie avec l'équation de diffusion de Fourier, on définie une équation de diffusion sur un graphe de matrices de covariances et cherchons via l'équation de Campbell-Hausdorff à remonter à l'équation de diffusion à temps continu.

Le problème de la "médiane dans un espace métrique" est un problème plus vaste qui recouvre des liens avec les sciences sociales par exemple (redécouverte des travaux de Condorcet sur la notion de "vote médian" par J.F. Marcotorchino et P. Michaux).

Le procédé s'applique également indifféremment à des ondes acoustiques pulsées ou électromagnétiques. Dans le domaine électromagnétique, le signal est complexe et les fréquences sont des vitesses Doppler avec des applications en Radar, Echographie Doppler et Lidar.

Bibliographie

Arshia Cont (Ircam)

Vers une théorie de l’information des flux audio avec des applications dans l’extraction incrémentale de données

Dans cet exposé, nous proposons une méthode pour la représentation de la dynamique temporelle de la musique et du son environnemental en utilisant des méthodes de la géométrie de l’information avec des applications directes à l'extraction automatique des régularités dans les flux audio et en temps réel. Le cadre proposé permet la construction de boules métriques au cours des flux audio où chaque boule représente une sous-partie du signal audio quasi stationnaire, puis utilise un algorithme d'apprentissage séquentiel appelé Audio Oracle afin de détecter les régularités structurelles entre les boules. Le cadre proposé n'utilise aucune information a priori sur la structure syntaxique de la musique ou du signal audio. Cela est dû principalement au fait qu’au lieu d’analyser et formaliser l'information contenue, nous contrôlons les changements de l'information audio qui se déroule dans le temps. Les méthodes proposées sont basées sur la géométrie des structures d'information statistique sur le spectre du signal audio, et en particulier utilisent la bijection entre les familles génériques de divergences de Bregman et les distributions exponentielles. Grâce à ces outils, on définit une géométrie de l'information qui se rapproche d'un espace métrique de similarité, et l’on redéfinit des notions générales dans l’extraction des données musicales comme la similarité entre entités, en utilisant des méthodes pour traiter le caractère non-stationnaire des signaux audio. Nous montrerons ensuite de nouveaux résultats sur la découverte de la structure des sons naturels et les enregistrements musicaux, ainsi qu’un algorithme de fouillage des données musicales nommé Guidage basé sur le cadre proposé.

Bibliographie