Cette page est une forme de revue de presse des travaux et projets auxquels j’ai contribué. Vous y trouverez des liens vers des tutos Youtube, des articles en ligne ainsi que les publications et présentations de mes travaux de R&D. Vous retrouverez également mes publications académiques sur ResearchGate
- Indépendant : DEA Photonique 2020 | Vidéos youtube | Makeme 2019 |
- Acsystème : Matlab Conférence 2018 | ENSAI 2016 | LMCS 2014
- IRISA : Speech Communication 2009 | Interstice.info | EUROSPEECH 05
- Thèse : Mémoire de Thèse | CORESA 01 | EUROSPEECH 01 | ICA 2001 | GRESTI 2001 | CFA 2000 | JEP 2000 | Codage audio
- DEA : Fourier Fractionnaire | SPC 2000 | GRETSI 99 | Rapport DEA
- ENSEA : Matrix-Pencil | Réseau local CAN
DEA Photonique d’Angers 2020
Présentation et discussion réalisée pour les étudiants de DEA photonique à Angers. Ils devaient réaliser un projet de photobooth à base de transfert de style en Deep Learning. Après une présentation de mes différents Je leur ai apporté des solutions techniques et des idées créatives pour la mise en place de leur photobooth.
Voir la présentation en ligne, et son code source
📽️ Vidéos Youtube
Pour les vidéos présentées ci-dessous, j’ai utilisé uniquement des logiciels gratuits :
- OBS Studio qui me permet de faire un montage vidéo simple en même temps que je parle pour passer de la webcam à une capture de fenêtre de travail. Ce logiciel est simple à prendre en main, efficace et génère des vidéos de très bonne qualité avec un taux de compression record. Il m’a permis de faire la majorité des vidéos en une prise sans édition supplémentaire.
- Da Vinci Resolve : logiciel de montage gratuit et puissant qui m’a permis d’ajouter un jingle, du texte. Une bonne alternative aux produits adobe.
- Reveal JS et Hugo : pour créer des supports de présentations en se focalisant sur le contenu écrit en Markdown. La mise en ligne est assurée par l’intégration continue avec Gitlab. Voir par exemple : présentation IMTS
Institut Solacroup 2020
Réalisations de tutorials pour la formation développeur Web / Web Mobile sur la chaîne Youtube de l’Institut Solacroup. Thèmes abordés :
- Migrer son code d’un serveur local vers un hébergeur
- Test et audit d’une page Web
- Présentation de la JAMSTACK pour générer des sites statiques et exemple de création d’un blog avec Hugo
- Utilisation et animation des images SVG
- Astuces diverses informatiques
- Explications pratiques pour la préparation d’un oral, la rédaction du dossier professionnel ou encore l’examen professionnel
Bien vivre en Bretagne Romantique 2020
Pour l’association Bien Vivre en Bretagne Romantique, j’ai participé à la mise en place du site de e-commerce pour un marché ambulant. Dans ce cadre j’ai aussi réalisé de vidéos d’explication sur le fonctionnement du site d’e-commerce pour les producteurs locaux
- Chaîne Youtube de bien vivre en Bretagne Romantique.
- Support de présentation en ligne, code source, fait avec reveal-hugo
Portrait de Makers par Makeme
Retrouver un portrait de mon parcours de Maker réalisé par Makeme en 2019
Matlab Conference 2018
Le machine learning au secours du diagnostic moteur
Yves Français (PSA), Gireg Lanoë (Acsystème), Gilles Gonon(Acsystème), Samuel Prat (Acsystème)
Résumé
PSA et Acsystème travaillent depuis un an à l’élaboration d’une nouvelle stratégie de diagnostic afin d’identifier les dysfonctionnements des organes groupes moto-propulseurs (GMP). Cette stratégie se base sur une méthode d’analyse graphique de type portrait de phase, analyse qui permet de déterminer les axes les plus discriminants entre des essais nominaux et des essais en défaut.
Une fois ces axes déterminés, nous utilisons des méthodes type réseau de neurones ou approximation de gaussiennes pour calculer sur chaque point de mesure sa probabilité d’être un point en défaut ou nominal. Ces méthodes utilisent MATLAB® et Statistics and Machine Learning Toolbox™.
Ensuite, un algorithme de décision est mis en place pour lever une éventuelle alerte sur l’essai étudié. Cette méthode permet ainsi de tracer des défauts de manière beaucoup plus précise (distinction défauts électriques et mécaniques notamment) et d’éviter de mauvaises déposes en après-vente.
ENSAI 2016
L’ENSAI est l’École Nationale de la Statistique et de l’Analyse de l’Information. Elle maintient un lien fort avec les entreprises aussi bien pour le conseil que pour la veille technologique. Dans ce cadre j’ai été invité à une présentation des travaux d’Acsystème et une table ronde sur la Data :
- Participation aux 20 ans de l’ENSAI lors d’une Table ronde sur la data : comment passer de la donnée brute à la création de valeur ?
- Les matinales de Rennes Atalante : matinale sur l’apport des mathématiques au processus d’innovation des entreprises, vidéo de présentation
LMCS 2014
Gilles Gonon, Mise au point d’un algorithme de palettisation 3D hétérogène en ligne, Acsystème, 2014. Plus d’information sur le site d’Acsystème.
Résumé : Acsystème travaille depuis plusieurs années sur la mise au point d’algorithmes innovants pour répondre à la problématique de palettisation hétérogène en ligne. Nous avons développé une solution modulaire permettant de gérer des cas et des contraintes différentes d’empilage. Cette solution d’empilage a été déclinée dans deux cas de production où les pièces arrivent en ligne pour être palettisées, et où la visibilité sur les pièces à venir n’est que de quelques pièces.
Téléchargement : PDF - PDF de la présentation
Speech Communication 2009
Probabilistic scoring using decision trees for fast and scalable speaker recognition
Résumé
In the context of fast and low cost speaker recognition, this article investigates several techniques based on decision trees. A new approach is introduced where the trees are used to estimate a score function rather than returning a decision among classes. This technique is developed to approximate the GMM log-likelihood ratio (LLR) score function. On top of this approach, different solutions are derived to improve the accuracy of the proposed trees. The first one studies the quantization of the LLR function to create classification trees on the LLR values. The second one makes use of knowledge on the GMM distribution of the acoustic features in order to build oblique trees. A third extension consists in using a low-complexity score function in each of the tree leaves. Series of comparative experiments are performed on the NIST 2005 speaker recognition evaluation data in order to evaluate the impact of the proposed improvements in terms of efficiency, execution time and algorithmic complexity. Considering a baseline system with an Equal Error Rate (EER) of 9.6% on the NIST 2005 evaluation, the best tree-based configuration achieves an EER of 12.9%, with a computational cost adapted to embedded devices and an execution time suitable for real-time speaker identification.
@article{gonon:inria-00544959,
TITLE = {{Probabilistic scoring using decision trees for fast and scalable speaker recognition}},
AUTHOR = {Gonon, Gilles and Bimbot, Fr{\'e}d{\'e}ric and Gribonval, R{\'e}mi},
JOURNAL = {{Speech Communication}},
PUBLISHER = {{Elsevier : North-Holland}},
VOLUME = {51},
NUMBER = {11},
PAGES = {1065 - 1081},
YEAR = {2009},
DOI = {10.1016/j.specom.2009.02.007},
KEYWORDS = {Biometric authentication}
}
Téléchargement : PDF
EUROSPEECH 05
Decision Trees with Improved Efficiency for Fast Speaker Verification
Gilles Gonon, Rémi Gribonval, Frédéric Bimbot
Résumé
Classification and regression trees (CART) are convenient for low complexity speaker recognition on embedded devices. However, former attempts at using trees performed quite poorly compared to state of the art results with Gaussian Mixture Models (GMM). In this article, we introduce some solutions to improve the efficiency of the tree-based approach. First, we propose to use at the tree construction level different types of information from the GMM used in state of the art techniques. Then, we model the score function within each leaf of the tree by a linear score function. Considering a baseline state of the art system with an equal error rate (EER) of 8.6% on the NIST 2003 evaluation, a previous CART method provides typical EER ranging between 16% and 18% while the proposed improvements decrease the EER to 11.5%, with a computational cost suitable for embedded devices.
@inproceedings{gileurospeech05,
author = "Gilles Gonon and R\'emi Gribonval and Fr\'ed\'eric Bimbot",
title = "Decision Trees with Improved Efficiency for Fast Speaker Verification.",
booktitle = "$9^{th}$ European conference on speech communication and technology, EUROSPEECH 05",
page = {2661-2664},
volume = 4,
year = 2005,
month = septembre
}
Interstice Info 2007
De la reconnaissance automatique du locuteur à la signature vocale
Gilles Gonon & Frédéric Bimbot
Publication sur le site de vulgarisation de l’INRIA intertices.info
Résumé
La reconnaissance automatique du locuteur recherche des méthodes pour extraire les caractéristiques vocales propres à chaque individu. Ces caractéristiques servent à créer une signature vocale qui permette d’authentifier la voix de chacun.
🎓 Thèse
Proposition d’un schéma adaptatif dans le plan temps-fréquence basé sur des critères entropiques. Application au codage audio.
Gilles Gonon
Résumé
Les représentations adaptées contribuent à l’étude et au traitement des informations portées par les signaux en permettant une analyse pertinente différente pour chaque signal. Les solutions existantes proposent des critères d’adaptation dans les domaines temporel et fréquentiel mais souffrent d’un manque de souplesse des critères pour une représentation adaptée dans le plan temps-fréquence. Ce travail de thèse porte sur l’élaboration d’une représentation utilisant successivement des segmentations temporelle et fréquentielle adaptées au signal plus souple que les solutions existantes. Le schéma proposé est appliqué dans un codeur perceptuel par transformée de type haute fidélité. Le schéma de représentation développé segmente tout d’abord le signal temporellement à l’aide d’un critère entropique local. Pour cela, un estimateur d’entropie locale est étudié analytiquement et le critère fournit un indice des variations d’entropie du signal propice à une segmentation automatique séparant les zones transitoires et les zones stationnaires. Les tranches temporelles ainsi délimitées sont alors décomposées en paquets d’ondelettes et une recherche de la meilleure base permet l’adaptation en fréquence de la représentation. À ce titre, une extension de la recherche de meilleure base est proposée pour augmenter le dictionnaire des bases disponibles par rapport au cas dyadique. À l’issue de cette analyse le signal est localisé dans des atomes du plan temps-fréquence. Dans la partie application, un schéma de codage orginal permettant l’inclusion de notre représentation est présenté. Le détail de l’implémentation du codeur est fourni jusqu’à la composition de la trame binaire. Ce codeur est ensuite évalué par des tests subjectifs comparant les signaux compressés aux originaux et aux signaux du standard MPEG-1 Layer 3 pour un débit de 96 kbit/s. Les résultats montrent que l’utilisation du schéma de représentation adapté dans un codeur est compétitif avec les solutions des codeurs standards bien que de nombreuses améliorations soient encore possibles.
@phdthesis{gilthese2002,
author = "Gilles Gonon",
title = "Proposition d'un schéma adaptatif dans le plan temps-fréquence basé sur des critères entropiques. Application au codage audio.",
year = 2002,
month = june
}
CORESA 01
Un schéma de représentation adaptatif en temps et en fréquence pour le codage audio.
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
Cet article présente un schéma de codage adaptatif en temps et en fréquence. La segmentation temporelle est effectuée à l’aide du critère entropique local et la segmentation fréquentielle est basée sur une extension de l’algorithme de recherche de la meilleure base à partir de la décomposition en paquets d’ondelettes. L’allocation utilise des critères énergétiques et psychoacoustiques pour pallier aux problèmes de sélectivité fréquentielle des paquets d’ondelettes. Les premiers résultats subjectifs informels sont satisfaisants pour des rapports de compression de l’ordre de 10 à 15.
@inproceedings{gilcoresa01,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = "Un schéma de représentation adaptatif en temps et en fréquence pour le codage audio. ",
booktitle = "Actes des $7^e$ Journ\'ees d'\'etude et d'\'echange CORESA 2001, Dijon, France",
page = {59-62}
year = 2001,
month = novembre
}
EUROSPEECH 01
Improved entropic gain and adaptive time-frequency segmentation. Application to audio coding
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
In the search for adaptive representation of speech signals, the Wavelet Packet Decomposition (WPD) has been proved to be a efficient tool because of its frequency adaptation skills through the best basis search algorithm. The entropic minimization of this algorithm is bounded by two artifacts : the dyadic structure of the decomposition and the lack of temporal segmentation. We propose here a low cost extended tree in the WPD which improves the best basis search by reducing the entropy of the base and which is still compatible with the classical WPD. The decomposition also allows perfect reconstruction. The entropic test is updated to take into account the new basis. The preliminary use of a temporal segmentation, based on the Local Entropic Criterion highly improves the entropic gain of the global analysis. The results are shown on experimental speech signals comparing the gain of our scheme versus a usual WPD.
@inproceedings{gileurospeech01,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = "Improved entropic gain and adaptive time-frequency segmentation. Application to audio coding.",
booktitle = "$7^{th}$ European conference on speech communication and technology, EUROSPEECH 01",
page = {2661-2664},
volume = 4,
year = 2001,
month = septembre
}
ICA 2001
Extended Best Basis Familly Tree and Entropy Diminution, Application to Audio Coding
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
The Wavelet Packet Decomposition (WPD) is a efficient tool in audio coding because of its frequency adaptation skills through the best basis search algorithm. The entropic minimization of this algorithm is bounded by the dyadic structure of the decomposition. In order to decrease the entropy of the best basis, a low cost extended tree in the WPD is used. It is still compatible with the classical WPD and insures perfect reconstruction. The entropic test is updated to take into account the new basis. We present an example of the resulting best basis on a simulation signal and evaluate the average entropic gain obtained on various audio signals. Une version détaillée est aussi disponible (anglais ou français).
@inproceedings{gilica01,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = " Extended Best Basis Familly Tree and Entropy Diminution, Application to Audio Coding ",
booktitle = "International Congress of Acoustics, ICA 01, Rome",
year = 2001,
month = may
}
GRETSI 2001
Segmentation multibande adaptée basée sur le Critère Entropique Local pour le codage audio
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
Ce travail présente une nouvelle approche pour la segmentation des signaux audios. Le détecteur utilisé est non paramétrique et basé sur le Critère Entropique Local appliqué aux sous-bandes issues d’une analyse multirésolution, la transformée en ondelettes discrète (TOD). L’utilisation de la TOD permet d’augmenter la diversité des ruptures détectées et le taux de bonnes détections. Un post-traitement permettant de réduire le nombre de fausses alarmes est aussi présenté. Les résultats sont appliqués à un signal de simulation multicomposante bruité.
@inproceedings{gilgretsi01,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = "Segmentation multibande adaptée basée sur le Critère Entropique Local pour le codage audio",
booktitle = "18$^{ème}$ colloque GRETSI",
year = 2001,
month = sep
}
CFA 2000
Construction d’un banc de filtres pseudo-QMF pour la recherche de meilleure base
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
Dans le cadre du traitement des signaux audio (restauration, codage), il est intéressant de travailler sur des sous-bandes fréquentielles du signal. Dans des travaux précédents ont été proposées des extensions des bases dyadiques utilisées avec l’algorithme de choix de la meilleure base. Cet article présente une méthode simple pour construire le banc de filtres correspondant à ces nouvelles bases. Ces filtres réalisés à partir des filtres QMF permettent de générer le père de deux sous-bandes adjacentes mais provenant de pères différents dans la structure dyadique.
@inproceedings{gilcfa00,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = "Construction d'un banc de filtres pseudo-QMF pour la recherche de meilleure base",
booktitle = "V$^{ème}$ Congrès de la Société Francaise d'Acoustique - CFA 2000",
year = 2000,
month = sep,
optnote =""
}
JEP 2000
Extension de la recherche de meilleure base pour la Décomposition en Paquets d’Ondelettes. Application à l’analyse en sous-bandes de la parole
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
In the audio signal processing area (coding or restauration), subband analysis shows to be an efficient tool. Extensions of the dyadic basis usually used in Best Basis search have been proposed in former work. This article review these extensions and presents an easy way to construct the filter bank associated with such basis. The filters, designed from any usual Quadrature Mirror Filters and preserving their reconstruction properties, allow to generate the father of two adjacent subbands not coming from the same father in the dyadic decomposition and thus to perform the entropic test between these subbands, which is not otherwise possible. We then apply this new Best Basis on a speech signal wavelet packet decomposition.
@inproceedings{giljep00,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = "Extension de la recherche de meilleure base pour la décomposition en paquets d'ondelettes. Application à l'analyse en sous-bandes de la parole",
booktitle = "XXIII$^{èmes}$ Journées d'Études sur la Parole - JEP 2000 ",
year = 2000,
month = jun
}
Fourier Fractionnaire
SPC 2000
Filtering in fractional Fourier domains : Application to the Biot’s waves
Gilles Gonon, Zine El Abidine Fellah, Claude Depollier
Résumé
In this paper we present a method to separate the compressional waves which propagate in a porous medium when it is subject to a mechanical excitation. We start this work by reviewing the Biot’s theory which describes the propagation of ultrasonic pulses in a porous elastic medium. This modelling shows that three kinds of waves propagate in such media: two compressional waves and one shear wave, each one with its own velocity. Because of the dispersive nature of porous media, the identification of the compressional waves is often difficult by a traditionnal filtering while this identification is a compelling need to extract the part of the informations about the elastic parameters, the porosity and the permeability of the medium contained in each of them. For that we propose a filtering method using the fractional Fourier transform as foundation. The interpretation of this transformation as a rotation in the time-frequency plane and its relationships with time-frequency representations allow the filtering of signal in a single fractional Fourier domain.
@inproceedings{giliasted00,
author = "Gilles Gonon and Zine El abidine Fellah and Claude Depollier",
title = "Filtering in Fractional Fourier Domains: Application to the Biot's Waves ",
booktitle = "Congrès IASTED SPC 2000 ",
year = 2000,
month = sep
}
GRETSI 1999
Estimation des paramètres d’un sinus glissant par Transformée de Fourier Fractionnaire
Gilles Gonon, Claude Depollier
Résumé
La Transformée de Fourier Fractionnaire (notée {\bf FRT}), introduite par Namias en 1980, permet une analyse des signaux dans des domaines intermédiaires entre les domaines temporel et fréquentiel. Suivant un angle donné du plan temps fréquence, elle décompose le signal sur une base orthogonale de sinus glissants. Elle est donc adaptée à l’analyse de signaux multicomposantes formés de sinus glissants et permet une estimation robuste au bruit de la pente et de l’offset qui sont les deux paramètres essentiels des sinus glissants.
@inproceedings{gilgretsi99,
author = "Gilles Gonon and Claude Depollier",
title = "Estimation des paramètres d'un sinus glissant par Transformée de Fourier Fractionnaire",
booktitle = "17$^{ème}$ colloque du GRETSI",
year = 1999,
month = sep
}
Rapport DEA Acoustique 1998
La transformée de Fourier Fractionnaire
Gilles Gonon, Stage encadré par Claude Depollier
Résumé
Ce rapport présente la transformée de Fourier fractionnaire et quelques applications en traitement du signal, comme le filtrage dans le plan temps fréquence ou la détection de chirp linéaire.
Codage audio
Rapport biliographique sur le codage audio
Gilles Gonon
Résumé
Ce rapport biliographique détaillant les différentes étapes de la compression audio,à savoir l’analyse du signal, les phénomènes psychoacoustiques, l’allocation binaire et le codage entropique a été réalisé dans le but de présenter les différentes types de codeurs existants.
ENSEA
Matrix-Pencil
Estimation des partiels d’une corde guitare par la méthode de Matrix Pencil
Gilles Gonon
Résumé
Mise en place de la méthode paramétrique basée sur l’algorithme de Matrix Pencil pour estimer l’inharmonicité des partiels de guitare due aux faibles vibrations de la table d’harmonie.
Stage ENSEA 1997
Liaison d’une caméra de type webcam à un réseau CAN
Gilles Gonon
Résumé
Stage réalisé en 1997 au laboratoire DISCA de l’UPV (Université Polytechnique de Valencia).
Téléchargement : non disponible