Géométrie de l’information et musique

Samedi 10 octobre 2009

Ircam, Salle I. Stravinsky
1, place I. Stravinsky 75004 Paris
(Entrée libre dans la mesure des places disponibles)

Organisateur de la séance : Arshia Cont, Ircam, Département Médiation Recherche/Création. Cette séance organisée dans le cadre du projet PEPS Interactions Maths/ST2I "Géométrie de l’Interaction et Musique".

Programme PDF

Programme

14h30 - 14h40 Moreno Andreatta & Carlos Agon – Mot de bienvenu et présentation de la neuvième saison du séminaire MaMuX
14h40 – 15h00 Arnaud Dessein – Un survol sur la géométrie de l’information et ses applications
15h00 – 15h45 Hichem Snoussi – Filtrage particulaire sur les variétés riemanniennes

16h00 - 16h45 Frédéric Barbaresco – Géométrie, médiane et diffusion de spectres de fréquences acoustiques : Ou Comment "médianiser" ou "diffuser" des morceaux de musiques

17h15 - 18h00 Arshia Cont & Arnaud Dessein – Vers une théorie de l’information des flux audio avec des applications dans l’extraction incrémentale de données
Discussion finale
Cocktail dinatoire

Résumés

Arnaud Dessein (Ircam)

Un survol sur la géométrie de l’information et ses applications

En guise d’introduction à la thématique de la journée, nous proposons un court survol sur quelques aspects de base de la géométrie de l’information et ses applications dans différents domaines.

Hichem Snoussi (Université de Troyes)

Filtrage particulaire sur les variétés riemanniennes

Au vu de la complexité et de la non linéarité des problèmes d’optimisation en ligne, on est souvent amené à considérer des schémas d'inférence approximatifs de type Monte Carlo. L'approche de Monte Carlo séquentielle (SMC), aussi connue sous le nom d'algorithme de filtrage particulaire, permet de calculer récursivement dans le temps une approximation stochastique de la distribution a posteriori. L’adaptation de cette technique pour l’estimation en ligne d'objets géométriques appartenant à une variété riemannienne consiste à représenter la densité de probabilité a posteriori par un ensemble d'échantillons aléatoires, appelés particules, générées sur la variété riemannienne. Chaque particule représente un état probable de l'état du système et le poids de chaque particule représente une mesure du degré de confiance en cette dernière. Le processus d’échantillonnage est réalisé en deux étapes : échantillonnage aléatoire sur l’espace tangent et projection sur la variété différentiable avec le mapping exponentiel. La décision est ensuite prise par le calcul du barycentre intrinsèque des particules pondérées par leurs poids respectifs. Le calcul du barycentre peut s’implémenter par un simple algorithme de gradient adapté à la structure géométrique de la variété riemannienne [Snoussi 2009]. Ce travail sera illustré par le tracking de matrices de covariance du bruit sur la variété riemannienne des matrices définies positives.

Bibliographie

[Snoussi 2009] H. Snoussi and C. Richard, " Monte Carlo Tracking on the Riemannian Manifold of Multivariate Normal Distributions ", in IEEE DSP'09, 04-07 january 2009, Florida (invited paper)
[Snoussi 2007] H. Snoussi, " Bayesian Information Geometry. Application to Prior Selection on Statistical Manifolds ", in P.W. Hawkes, Advances in Imaging and Electron Physics, 2007

Frédéric Barbaresco (Thales)

Géométrie, médiane et diffusion de spectres de fréquences acoustiques : Ou Comment "médianiser" ou "diffuser" des morceaux de musiques

La théorie de la Géométrie de l'Information introduite de façon parallèle par Rao et Chentsov, et la Géométrie Symplectique telle qu'introduite par Carl Ludwig Siegel permet de définir une métrique entre matrices de covariance d'une série temporelle (la matrice de covariance définissant le spectre de fréquences acoustiques présentes dans le signal). La géométrie naturelle de ces matrices de covariance symétriques (ou hermitiennes) définies positives est une géométrie Riemannienne symétrique. Il s'agit d'un espace métrique à courbure négative. Il est alors possible de calculer de façon explicite la géodésique (plus court chemin sur la variété) entre matrices de covariance. Sur la base de travaux du géomètre Herman Karcher, on définie un flot de gradient qui converge vers la médiane de N matrices de covariances (appelé point de Fermat-Weber en Physique) en minimisant le critère égale à la somme des distances géodésiques à l'ensemble des N matrices (ceci étant l'approche classique du barycentre de Fréchet qui converge vers la moyenne). Sur la base de ce flot et par analogie avec l'équation de diffusion de Fourier, on définie une équation de diffusion sur un graphe de matrices de covariances et cherchons via l'équation de Campbell-Hausdorff à remonter à l'équation de diffusion à temps continu.

Le problème de la "médiane dans un espace métrique" est un problème plus vaste qui recouvre des liens avec les sciences sociales par exemple (redécouverte des travaux de Condorcet sur la notion de "vote médian" par J.F. Marcotorchino et P. Michaux).

Le procédé s'applique également indifféremment à des ondes acoustiques pulsées ou électromagnétiques. Dans le domaine électromagnétique, le signal est complexe et les fréquences sont des vitesses Doppler avec des applications en Radar, Echographie Doppler et Lidar.

Bibliographie

[1] F. Barbaresco & G. Bouyt, " Espace Riemannien symétrique et géométrie des espaces de matrices de covariance : équations de diffusion et calculs de médianes ", colloque GRETSI'09, Dijon, Sept. 2009
[2] F. Barbaresco, " New Foundation of Radar Doppler and Array Processing based on German Mathematical Works: Geometry of Metric Spaces with negative curvature and Von-Mangoldt-Cartan-Hadamard Manifolds ", IRS'09, Hamburg, Sept. 2009
[3] F. Barbaresco, " Interactions between Symmetric Cone and Information Geometries ", LIX Fall Colloquium ETCV’08, Ecole Polytechnique, Springer Lecture Notes in Computer Science, vol.5416, pp. 124-163, 2009, http://www.springerlink.com/content/978-3-642-00825-2
[4] F. Barbaresco, " Applications of Information Geometry to Radar Signal Processing ", Video Lectures, http://videolectures.net/etvc08_barbaresco_aoigt/
[5] M. Arnaudon and X. Li, " Barycentres of measures transported by stochastic flows ", Ann. Probab. 33, no. 4, pp.1509-1543, 2005
[6] C.L. Siegel, Symplectic Geometry, Acad. Press, 1964
[7] M. Émery, G. Mokobodzki, " Sur le barycentre d'une probabilité dans une variété ", Séminaire de probabilités de Strasbourg, n° 25, p. 220-233, 1991
[8] H. Karcher, " Riemannian center of mass and mollifier smoothing ", Comm. Pure Applied Math., n°30, pp.509-541,1977
[9] A. Terras, Harmonic Analysis on Symmetric Spaces and Applications II, Springer-Verlag, 1988
[10] V. Arsigny " Log-Euclidean metrics for fast and simple calculus on diffusion tensors ", in Magnetic Resonance in Medicine, Volume 56 Issue 2, Pages 411 - 421, June 2006.
[11] M. Calvo, J. Oller, " A distance between multivariate normal distributions based in an embedding into the Siegel Group ", Journal of Multivariate Analysis, vol. 35, pp. 223-242, 1990
[12] M. Calvo, J. Oller, " An explicit solution of information geodesic equations for the multivariate normal model ", Statistics and Decisions, vol. 9, pp. 119-138, 1991
[13] Huiling Le, " Estimation of Riemannian Barycenters ", Proc. London Math. Soc., pp. 193-200, 2004
[14] Harris, W. F., " The average eye ", Ophthalmic Physiol. Opt., n°24, pp. 580–585, 2004
[15] H.C.F. von Mangoldt, " Über diejenigen Punkte auf positiv gekrümmten flächen, welche die eigenschaft haben, dass die von ihnen ausgehenden geodätischen Linien nie aufhören, kürzeste Linien zu sein ", J. Reine Angew.Math., n° 91, pp. 23-52, 1881
[16] E. Kähler, " Über eine bemerkenswerte Hermitesche Metrik ", Abh., Math. Sem. Hamburg Univ., n° 9, pp. 173-186, 1933
[17] K. T. Sturm, " Probability measures on metric spaces of nonpositive curvature ", Contemp. Math. 338 , 357-390, 2003
[18] E. Cartan, " Sur les domaines bornés homogènes de l'espace de n variables complexes ", Abh. Math. Semin. hamb. Univ., n° 11, pp.116-162, 1935. (www.numdam.org)
[19] C.R. Rao, " Information and Accuracy attainable in the estimation of statistical parameters ", Bull. Calcutta Math. Soc., n° 37, pp. 81-91, 1945
[20] S. Yoshizawa and K. Tanabe, " Dual Differential Geometry associated with the Kullback-Leibler Information on the Gaussian Distributions and its 2-parameter Deformations ", SUT Journal of Mathematics, vol. 35, n° 1, pp. 113-137, 1999
[21] T.Ando and al., " Geometric Means ", Linear Algebra Appl., vol.385, pp.305-334, 2004
[22] F. Bruhat and J. Tit s, " Groupes réductifs sur un corps local ", IHES, n° 41, pp. 5-251, 1972
[23] H. Cartan, " Ouverts fondamentaux pour le groupe modulaire ", Séminaire Henri Cartan, tome n° 10, n° 1, exp. n°3, p. 1-12, 1957
[24] N.N. Chentsov, " Statistical Decision Rules and Optimal Inferences ", Trans. of Math. Monog., n° 53, Amer. Math. Society, Providence, 1982
[25] J. Faraut and A. Koranyi, Analysis on Symmetric Cones, Oxford University Press, 1994
[26] K. Koufany, Analyse et Géométrie des domaines bornés symétriques, HDR, Institut de Mathematiques Elie Cartan, Nancy, Nov. 2006
[27] C. P. Niculescu, " An Extension of the Mazur-Ulam Theorem ", American Institute of Physics Proc., vol. 729, n° 248-256, 2004
[28] M. Berger, Panoramic View of Riemannian Geometry, Springer, 2004

Arshia Cont (Ircam)

Vers une théorie de l’information des flux audio avec des applications dans l’extraction incrémentale de données

Dans cet exposé, nous proposons une méthode pour la représentation de la dynamique temporelle de la musique et du son environnemental en utilisant des méthodes de la géométrie de l’information avec des applications directes à l'extraction automatique des régularités dans les flux audio et en temps réel. Le cadre proposé permet la construction de boules métriques au cours des flux audio où chaque boule représente une sous-partie du signal audio quasi stationnaire, puis utilise un algorithme d'apprentissage séquentiel appelé Audio Oracle afin de détecter les régularités structurelles entre les boules. Le cadre proposé n'utilise aucune information a priori sur la structure syntaxique de la musique ou du signal audio. Cela est dû principalement au fait qu’au lieu d’analyser et formaliser l'information contenue, nous contrôlons les changements de l'information audio qui se déroule dans le temps. Les méthodes proposées sont basées sur la géométrie des structures d'information statistique sur le spectre du signal audio, et en particulier utilisent la bijection entre les familles génériques de divergences de Bregman et les distributions exponentielles. Grâce à ces outils, on définit une géométrie de l'information qui se rapproche d'un espace métrique de similarité, et l’on redéfinit des notions générales dans l’extraction des données musicales comme la similarité entre entités, en utilisant des méthodes pour traiter le caractère non-stationnaire des signaux audio. Nous montrerons ensuite de nouveaux résultats sur la découverte de la structure des sons naturels et les enregistrements musicaux, ainsi qu’un algorithme de fouillage des données musicales nommé Guidage basé sur le cadre proposé.

Bibliographie

[1] A. Cont, Modeling Musical Anticipation: From the time of music to the music of time, PhD thesis, University of Paris 6 and University of California in San Diego, October 2008. Disponible en ligne à l’adresse : http://cosmal.ucsd.edu/arshia/index.php?n=Main.Thesis
[2] A. Cont, S. Dubnov and G. Assayag. " On the Information Geometry of Audio Streams with Applications to Automatic Structure Discovery ", IEEE Transactions on Audio, Speech and Language Processing, 2009. (submitted).