10h00 – 18h
Ircam, Salle I. Stravinsky
1, place I. Stravinsky 75004 Paris
Entrée libre dans la mesure des places disponibles
Cette séance conclusive du séminaire MaMuX est consacrée aux structures de graphes, d'arbres et d'automates en informatique et en musique. La séance, clôturant dix ans d'existence du séminaire, accueillera également un concert d'improvisation assistée par ordinateur à l'aide du logiciel OMAX (avec la participation de Vincent Lê Quang, saxophoniste et Professeur au CNSMDP, classe d'Improvisation Générative).
Finding common motifs from a set of strings coding biological sequences is an important problem in Molecular Biology. Several versions of the motif finding problem have been proposed in the literature and for each version, numerous algorithms have been developed. However, many of these algorithms fall under the category of heuristics. In this talk, we concentrate on the Simple Motif Problem (SMP) and we propose two exact algorithms, called SMS-Forbid and SMS-H-Forbid for this version of motif finding problem. These algorithms are base on a Minimal Forbidden Patterns Approach.
In the last couple of years many works have been related to Abelian complexity and efficient algorithms for Abelian pattern matching have been designed. However, apart of the greedy off-line algorithm, neither efficient nor on-line algorithm is known for computing all the Abelian periods of a given word. In this talk we present several and efficient off-line and on-line algorithms for computing all the Abelian periods of a given word. (Joint work with G. Fici, T. Lecroq and E. Prieur).
Nous présenterons une nouvelle structure informatique pour l'alignement des séquences sous le nom de Multi Factor Graph (MFG). L'avantage de MFG par rapport aux structures existantes conçues pour "exact matching" (automates et arbres des suffixes) est le coût réduit en espace pour sa construction (<2N) via un algorithme linéaire en temps et efficace concernant la gestion de mémoire. Dans cet exposé nous présenterons le travail fondamental mené autour de MFG (formalismes, algorithmes des constructions, complexité et requêtes primitives). Puis nous ferrons le lien avec les applications musicales basées sur des modèles séquentiels, notamment l'improvisation d'ordinateur et plus généralement la synthèse fondée sur les données. Dans ce cadre, nous évoquerons des stratégies permettant de contrôler la génération du contenu musical à l'aide des requêtes primitives liés à MFG.
Je présenterai quelques résultats récents autour de la représentation efficace (codage) des distances dans les arbres et plus généralement dans les graphes. En deuxième partie j'évoquerai la construction d'oracle répondant à des requêtes plus complexes, prenant en compte, par exemple, la suppression de sommets ou d'arêtes.
Given a family of protein sequences and the associated distance tree, we shall explain how important information related to the functional activity (protein interactions), the folding dynamics and the conformational changes of a protein is encoded in DNA sequences. A fine reading of the conservation and co-evolution signals between residues in the sequences lead to predictions that are confirmed experimentally. The role of the topology of the distance tree in the encoding will be highlighted.
Au cours de cette présentation je présenterai les méthodes représentation de données hiérarchiques. Je terminerai pour une nouvelle technique basée sur l’utilisation de courbe fractale. Cette méthode permet la représentation des arborescences en utilisant la métaphore des cartes géographiques.
Les chaînes de Markov ont de nombreuses applications pour la modélisation de processus temporels tels que la structure de textes ou de mélodies. L'hypothèse de mémoire limitée permet d'utiliser les chaînes de Markov pour engendrer des séquences à l'aide d'algorithmes gloutons (ou greedy).
Dans de nombreuses applications, telles que la composition ou l'improvisation musicales, il est essentiel de contrôler la structure des séquences engendrées. Les contraintes de contrôle induisent en général des dépendances entre éléments distants, ce qui viole l'hypothèse de Markov. Il est de ce fait impossible de contrôler la génération de séquences markoviennes à l'aide d'algorithmes gloutons.
Nous montrons qu'en revisitant les chaînes de Markov dans le contexte de la satisfaction de contraintes il est possible de contrôler la génération de séquences. Nous introduisons pour ce faire une classe de contraintes, appelée Markov constraints, et démontrons deux résultats:
1) La génération de séquences Markoviennes avec des contraintes de contrôle arbitraires peut être vue comme un problème d'optimisation de contraintes (Constraint Optimization Problem) et montrons qu'une implémentation efficace des "Markov Constraints" permet de le résoudre;
2) Si l'on se restreint à un type particulier de contraintes de contrôle, il est possible de compiler les dépendances entre éléments distants de la séquence dans une chaîne de Markov, non homogène. Il est dans ce cas possible de contrôler la génération de séquence à l'aide d'algorithmes gloutons;
Nous illustrons le premier résultat avec un problème de composition musicale: la génération d'une grille d'accords de Blues complexe et montrons que le second résultat permet de construire des applications d'improvisation en jazz.
Basé sur l'algorithme de l'Oracle des Facteurs (Allauzen et al. 1999 & Lefebvre et al. 2000) le logiciel d'improvisation OMax est maintenant dans sa quatrième version. De la cartographie motivique d'une séquence musicale encodée dans le graphe de suffixe, l'on passe à la variation musicale en navigant et recombinant des éléments du discours. Après quelques rappels sur le fonctionnement interne d'OMax, nous présenterons les aspects visuels et interactifs d'OMax en interaction avec un musicien. Puis nous laisserons place à la musique avec une petite performance avec le saxophoniste Vincent Lê Quang.
Références bibliographiques :