Cette page est une forme de revue de presse des travaux et projets auxquels jâai contribuĂ©. Vous y trouverez des liens vers des tutos Youtube, des articles en ligne ainsi que les publications et prĂ©sentations de mes travaux de R&D. Vous retrouverez Ă©galement mes publications acadĂ©miques sur ResearchGate
- Indépendant : DEA Photonique 2020 | Vidéos youtube | Makeme 2019 |
- AcsystÚme : Matlab Conférence 2018 | ENSAI 2016 | LMCS 2014
- IRISA : Speech Communication 2009 | Interstice.info | EUROSPEECH 05
- ThĂšse : MĂ©moire de ThĂšse | CORESA 01 | EUROSPEECH 01 | ICA 2001 | GRESTI 2001 | CFA 2000 | JEP 2000 | Codage audio
- DEA : Fourier Fractionnaire | SPC 2000 | GRETSI 99 | Rapport DEA
- ENSEA : Matrix-Pencil | RĂ©seau local CAN
DEA Photonique dâAngers 2020
Présentation et discussion réalisée pour les étudiants de DEA photonique à Angers. Ils devaient réaliser un projet de photobooth à base de transfert de style en Deep Learning. AprÚs une présentation de mes différents Je leur ai apporté des solutions techniques et des idées créatives pour la mise en place de leur photobooth.
Voir la présentation en ligne, et son code source
đœïž VidĂ©os Youtube
Pour les vidĂ©os prĂ©sentĂ©es ci-dessous, jâai utilisĂ© uniquement des logiciels gratuits :
- OBS Studio qui me permet de faire un montage vidĂ©o simple en mĂȘme temps que je parle pour passer de la webcam Ă une capture de fenĂȘtre de travail. Ce logiciel est simple Ă prendre en main, efficace et gĂ©nĂšre des vidĂ©os de trĂšs bonne qualitĂ© avec un taux de compression record. Il mâa permis de faire la majoritĂ© des vidĂ©os en une prise sans Ă©dition supplĂ©mentaire.
- Da Vinci Resolve : logiciel de montage gratuit et puissant qui mâa permis dâajouter un jingle, du texte. Une bonne alternative aux produits adobe.
- Reveal JS et Hugo : pour crĂ©er des supports de prĂ©sentations en se focalisant sur le contenu Ă©crit en Markdown. La mise en ligne est assurĂ©e par lâintĂ©gration continue avec Gitlab. Voir par exemple : prĂ©sentation IMTS
Institut Solacroup 2020
RĂ©alisations de tutorials pour la formation dĂ©veloppeur Web / Web Mobile sur la chaĂźne Youtube de lâInstitut Solacroup. ThĂšmes abordĂ©s :
- Migrer son code dâun serveur local vers un hĂ©bergeur
- Test et audit dâune page Web
- PrĂ©sentation de la JAMSTACK pour gĂ©nĂ©rer des sites statiques et exemple de crĂ©ation dâun blog avec Hugo
- Utilisation et animation des images SVG
- Astuces diverses informatiques
- Explications pratiques pour la prĂ©paration dâun oral, la rĂ©daction du dossier professionnel ou encore lâexamen professionnel
Bien vivre en Bretagne Romantique 2020
Pour lâassociation Bien Vivre en Bretagne Romantique, jâai participĂ© Ă la mise en place du site de e-commerce pour un marchĂ© ambulant. Dans ce cadre jâai aussi rĂ©alisĂ© de vidĂ©os dâexplication sur le fonctionnement du site dâe-commerce pour les producteurs locaux
- ChaĂźne Youtube de bien vivre en Bretagne Romantique.
- Support de présentation en ligne, code source, fait avec reveal-hugo
Portrait de Makers par Makeme
Retrouver un portrait de mon parcours de Maker réalisé par Makeme en 2019
Matlab Conference 2018
Le machine learning au secours du diagnostic moteur
Yves Français (PSA), Gireg Lanoë (AcsystÚme), Gilles Gonon(AcsystÚme), Samuel Prat (AcsystÚme)
Résumé
PSA et AcsystĂšme travaillent depuis un an Ă lâĂ©laboration dâune nouvelle stratĂ©gie de diagnostic afin dâidentifier les dysfonctionnements des organes groupes moto-propulseurs (GMP). Cette stratĂ©gie se base sur une mĂ©thode dâanalyse graphique de type portrait de phase, analyse qui permet de dĂ©terminer les axes les plus discriminants entre des essais nominaux et des essais en dĂ©faut.
Une fois ces axes dĂ©terminĂ©s, nous utilisons des mĂ©thodes type rĂ©seau de neurones ou approximation de gaussiennes pour calculer sur chaque point de mesure sa probabilitĂ© dâĂȘtre un point en dĂ©faut ou nominal. Ces mĂ©thodes utilisent MATLABÂź et Statistics and Machine Learning Toolboxâą.
Ensuite, un algorithme de dĂ©cision est mis en place pour lever une Ă©ventuelle alerte sur lâessai Ă©tudiĂ©. Cette mĂ©thode permet ainsi de tracer des dĂ©fauts de maniĂšre beaucoup plus prĂ©cise (distinction dĂ©fauts Ă©lectriques et mĂ©caniques notamment) et dâĂ©viter de mauvaises dĂ©poses en aprĂšs-vente.
ENSAI 2016
LâENSAI est lâĂcole Nationale de la Statistique et de lâAnalyse de lâInformation. Elle maintient un lien fort avec les entreprises aussi bien pour le conseil que pour la veille technologique. Dans ce cadre jâai Ă©tĂ© invitĂ© Ă une prĂ©sentation des travaux dâAcsystĂšme et une table ronde sur la Data :
- Participation aux 20 ans de lâENSAI lors dâune Table ronde sur la data : comment passer de la donnĂ©e brute Ă la crĂ©ation de valeur ?
- Les matinales de Rennes Atalante : matinale sur lâapport des mathĂ©matiques au processus dâinnovation des entreprises, vidĂ©o de prĂ©sentation
LMCS 2014
Gilles Gonon, Mise au point dâun algorithme de palettisation 3D hĂ©tĂ©rogĂšne en ligne, AcsystĂšme, 2014. Plus dâinformation sur le site dâAcsystĂšme.
RĂ©sumĂ© : AcsystĂšme travaille depuis plusieurs annĂ©es sur la mise au point dâalgorithmes innovants pour rĂ©pondre Ă la problĂ©matique de palettisation hĂ©tĂ©rogĂšne en ligne. Nous avons dĂ©veloppĂ© une solution modulaire permettant de gĂ©rer des cas et des contraintes diffĂ©rentes dâempilage. Cette solution dâempilage a Ă©tĂ© dĂ©clinĂ©e dans deux cas de production oĂč les piĂšces arrivent en ligne pour ĂȘtre palettisĂ©es, et oĂč la visibilitĂ© sur les piĂšces Ă venir nâest que de quelques piĂšces.
Téléchargement : PDF - PDF de la présentation
Speech Communication 2009
Probabilistic scoring using decision trees for fast and scalable speaker recognition
Résumé
In the context of fast and low cost speaker recognition, this article investigates several techniques based on decision trees. A new approach is introduced where the trees are used to estimate a score function rather than returning a decision among classes. This technique is developed to approximate the GMM log-likelihood ratio (LLR) score function. On top of this approach, different solutions are derived to improve the accuracy of the proposed trees. The first one studies the quantization of the LLR function to create classification trees on the LLR values. The second one makes use of knowledge on the GMM distribution of the acoustic features in order to build oblique trees. A third extension consists in using a low-complexity score function in each of the tree leaves. Series of comparative experiments are performed on the NIST 2005 speaker recognition evaluation data in order to evaluate the impact of the proposed improvements in terms of efficiency, execution time and algorithmic complexity. Considering a baseline system with an Equal Error Rate (EER) of 9.6% on the NIST 2005 evaluation, the best tree-based configuration achieves an EER of 12.9%, with a computational cost adapted to embedded devices and an execution time suitable for real-time speaker identification.
@article{gonon:inria-00544959,
TITLE = {{Probabilistic scoring using decision trees for fast and scalable speaker recognition}},
AUTHOR = {Gonon, Gilles and Bimbot, Fr{\'e}d{\'e}ric and Gribonval, R{\'e}mi},
JOURNAL = {{Speech Communication}},
PUBLISHER = {{Elsevier : North-Holland}},
VOLUME = {51},
NUMBER = {11},
PAGES = {1065 - 1081},
YEAR = {2009},
DOI = {10.1016/j.specom.2009.02.007},
KEYWORDS = {Biometric authentication}
}
Téléchargement : PDF
EUROSPEECH 05
Decision Trees with Improved Efficiency for Fast Speaker Verification
Gilles Gonon, Rémi Gribonval, Frédéric Bimbot
Résumé
Classification and regression trees (CART) are convenient for low complexity speaker recognition on embedded devices. However, former attempts at using trees performed quite poorly compared to state of the art results with Gaussian Mixture Models (GMM). In this article, we introduce some solutions to improve the efficiency of the tree-based approach. First, we propose to use at the tree construction level different types of information from the GMM used in state of the art techniques. Then, we model the score function within each leaf of the tree by a linear score function. Considering a baseline state of the art system with an equal error rate (EER) of 8.6% on the NIST 2003 evaluation, a previous CART method provides typical EER ranging between 16% and 18% while the proposed improvements decrease the EER to 11.5%, with a computational cost suitable for embedded devices.
@inproceedings{gileurospeech05,
author = "Gilles Gonon and R\'emi Gribonval and Fr\'ed\'eric Bimbot",
title = "Decision Trees with Improved Efficiency for Fast Speaker Verification.",
booktitle = "$9^{th}$ European conference on speech communication and technology, EUROSPEECH 05",
page = {2661-2664},
volume = 4,
year = 2005,
month = septembre
}
Interstice Info 2007
De la reconnaissance automatique du locuteur Ă la signature vocale
Gilles Gonon & Frédéric Bimbot
Publication sur le site de vulgarisation de lâINRIA intertices.info
Résumé
La reconnaissance automatique du locuteur recherche des mĂ©thodes pour extraire les caractĂ©ristiques vocales propres Ă chaque individu. Ces caractĂ©ristiques servent Ă crĂ©er une signature vocale qui permette dâauthentifier la voix de chacun.
đ ThĂšse
Proposition dâun schĂ©ma adaptatif dans le plan temps-frĂ©quence basĂ© sur des critĂšres entropiques. Application au codage audio.
Gilles Gonon
Résumé
Les reprĂ©sentations adaptĂ©es contribuent Ă lâĂ©tude et au traitement des informations portĂ©es par les signaux en permettant une analyse pertinente diffĂ©rente pour chaque signal. Les solutions existantes proposent des critĂšres dâadaptation dans les domaines temporel et frĂ©quentiel mais souffrent dâun manque de souplesse des critĂšres pour une reprĂ©sentation adaptĂ©e dans le plan temps-frĂ©quence. Ce travail de thĂšse porte sur lâĂ©laboration dâune reprĂ©sentation utilisant successivement des segmentations temporelle et frĂ©quentielle adaptĂ©es au signal plus souple que les solutions existantes. Le schĂ©ma proposĂ© est appliquĂ© dans un codeur perceptuel par transformĂ©e de type haute fidĂ©litĂ©. Le schĂ©ma de reprĂ©sentation dĂ©veloppĂ© segmente tout dâabord le signal temporellement Ă lâaide dâun critĂšre entropique local. Pour cela, un estimateur dâentropie locale est Ă©tudiĂ© analytiquement et le critĂšre fournit un indice des variations dâentropie du signal propice Ă une segmentation automatique sĂ©parant les zones transitoires et les zones stationnaires. Les tranches temporelles ainsi dĂ©limitĂ©es sont alors dĂ©composĂ©es en paquets dâondelettes et une recherche de la meilleure base permet lâadaptation en frĂ©quence de la reprĂ©sentation. Ă ce titre, une extension de la recherche de meilleure base est proposĂ©e pour augmenter le dictionnaire des bases disponibles par rapport au cas dyadique. Ă lâissue de cette analyse le signal est localisĂ© dans des atomes du plan temps-frĂ©quence. Dans la partie application, un schĂ©ma de codage orginal permettant lâinclusion de notre reprĂ©sentation est prĂ©sentĂ©. Le dĂ©tail de lâimplĂ©mentation du codeur est fourni jusquâĂ la composition de la trame binaire. Ce codeur est ensuite Ă©valuĂ© par des tests subjectifs comparant les signaux compressĂ©s aux originaux et aux signaux du standard MPEG-1 Layer 3 pour un dĂ©bit de 96 kbit/s. Les rĂ©sultats montrent que lâutilisation du schĂ©ma de reprĂ©sentation adaptĂ© dans un codeur est compĂ©titif avec les solutions des codeurs standards bien que de nombreuses amĂ©liorations soient encore possibles.
@phdthesis{gilthese2002,
author = "Gilles Gonon",
title = "Proposition d'un schéma adaptatif dans le plan temps-fréquence basé sur des critÚres entropiques. Application au codage audio.",
year = 2002,
month = june
}
CORESA 01
Un schéma de représentation adaptatif en temps et en fréquence pour le codage audio.
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
Cet article prĂ©sente un schĂ©ma de codage adaptatif en temps et en frĂ©quence. La segmentation temporelle est effectuĂ©e Ă lâaide du critĂšre entropique local et la segmentation frĂ©quentielle est basĂ©e sur une extension de lâalgorithme de recherche de la meilleure base Ă partir de la dĂ©composition en paquets dâondelettes. Lâallocation utilise des critĂšres Ă©nergĂ©tiques et psychoacoustiques pour pallier aux problĂšmes de sĂ©lectivitĂ© frĂ©quentielle des paquets dâondelettes. Les premiers rĂ©sultats subjectifs informels sont satisfaisants pour des rapports de compression de lâordre de 10 Ă 15.
@inproceedings{gilcoresa01,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = "Un schéma de représentation adaptatif en temps et en fréquence pour le codage audio. ",
booktitle = "Actes des $7^e$ Journ\'ees d'\'etude et d'\'echange CORESA 2001, Dijon, France",
page = {59-62}
year = 2001,
month = novembre
}
EUROSPEECH 01
Improved entropic gain and adaptive time-frequency segmentation. Application to audio coding
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
In the search for adaptive representation of speech signals, the Wavelet Packet Decomposition (WPD) has been proved to be a efficient tool because of its frequency adaptation skills through the best basis search algorithm. The entropic minimization of this algorithm is bounded by two artifacts : the dyadic structure of the decomposition and the lack of temporal segmentation. We propose here a low cost extended tree in the WPD which improves the best basis search by reducing the entropy of the base and which is still compatible with the classical WPD. The decomposition also allows perfect reconstruction. The entropic test is updated to take into account the new basis. The preliminary use of a temporal segmentation, based on the Local Entropic Criterion highly improves the entropic gain of the global analysis. The results are shown on experimental speech signals comparing the gain of our scheme versus a usual WPD.
@inproceedings{gileurospeech01,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = "Improved entropic gain and adaptive time-frequency segmentation. Application to audio coding.",
booktitle = "$7^{th}$ European conference on speech communication and technology, EUROSPEECH 01",
page = {2661-2664},
volume = 4,
year = 2001,
month = septembre
}
ICA 2001
Extended Best Basis Familly Tree and Entropy Diminution, Application to Audio Coding
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
The Wavelet Packet Decomposition (WPD) is a efficient tool in audio coding because of its frequency adaptation skills through the best basis search algorithm. The entropic minimization of this algorithm is bounded by the dyadic structure of the decomposition. In order to decrease the entropy of the best basis, a low cost extended tree in the WPD is used. It is still compatible with the classical WPD and insures perfect reconstruction. The entropic test is updated to take into account the new basis. We present an example of the resulting best basis on a simulation signal and evaluate the average entropic gain obtained on various audio signals. Une version détaillée est aussi disponible (anglais ou français).
@inproceedings{gilica01,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = " Extended Best Basis Familly Tree and Entropy Diminution, Application to Audio Coding ",
booktitle = "International Congress of Acoustics, ICA 01, Rome",
year = 2001,
month = may
}
GRETSI 2001
Segmentation multibande adaptée basée sur le CritÚre Entropique Local pour le codage audio
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
Ce travail prĂ©sente une nouvelle approche pour la segmentation des signaux audios. Le dĂ©tecteur utilisĂ© est non paramĂ©trique et basĂ© sur le CritĂšre Entropique Local appliquĂ© aux sous-bandes issues dâune analyse multirĂ©solution, la transformĂ©e en ondelettes discrĂšte (TOD). Lâutilisation de la TOD permet dâaugmenter la diversitĂ© des ruptures dĂ©tectĂ©es et le taux de bonnes dĂ©tections. Un post-traitement permettant de rĂ©duire le nombre de fausses alarmes est aussi prĂ©sentĂ©. Les rĂ©sultats sont appliquĂ©s Ă un signal de simulation multicomposante bruitĂ©.
@inproceedings{gilgretsi01,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = "Segmentation multibande adaptée basée sur le CritÚre Entropique Local pour le codage audio",
booktitle = "18$^{Ăšme}$ colloque GRETSI",
year = 2001,
month = sep
}
CFA 2000
Construction dâun banc de filtres pseudo-QMF pour la recherche de meilleure base
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
Dans le cadre du traitement des signaux audio (restauration, codage), il est intĂ©ressant de travailler sur des sous-bandes frĂ©quentielles du signal. Dans des travaux prĂ©cĂ©dents ont Ă©tĂ© proposĂ©es des extensions des bases dyadiques utilisĂ©es avec lâalgorithme de choix de la meilleure base. Cet article prĂ©sente une mĂ©thode simple pour construire le banc de filtres correspondant Ă ces nouvelles bases. Ces filtres rĂ©alisĂ©s Ă partir des filtres QMF permettent de gĂ©nĂ©rer le pĂšre de deux sous-bandes adjacentes mais provenant de pĂšres diffĂ©rents dans la structure dyadique.
@inproceedings{gilcfa00,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = "Construction d'un banc de filtres pseudo-QMF pour la recherche de meilleure base",
booktitle = "V$^{Úme}$ CongrÚs de la Société Francaise d'Acoustique - CFA 2000",
year = 2000,
month = sep,
optnote =""
}
JEP 2000
Extension de la recherche de meilleure base pour la DĂ©composition en Paquets dâOndelettes. Application Ă lâanalyse en sous-bandes de la parole
Gilles Gonon, Silvio Montrésor, Marc Baudry
Résumé
In the audio signal processing area (coding or restauration), subband analysis shows to be an efficient tool. Extensions of the dyadic basis usually used in Best Basis search have been proposed in former work. This article review these extensions and presents an easy way to construct the filter bank associated with such basis. The filters, designed from any usual Quadrature Mirror Filters and preserving their reconstruction properties, allow to generate the father of two adjacent subbands not coming from the same father in the dyadic decomposition and thus to perform the entropic test between these subbands, which is not otherwise possible. We then apply this new Best Basis on a speech signal wavelet packet decomposition.
@inproceedings{giljep00,
author = "Gilles Gonon and Silvio Montrésor and Marc Baudry",
title = "Extension de la recherche de meilleure base pour la décomposition en paquets d'ondelettes. Application à l'analyse en sous-bandes de la parole",
booktitle = "XXIII$^{Ăšmes}$ JournĂ©es d'Ătudes sur la Parole - JEP 2000 ",
year = 2000,
month = jun
}
Fourier Fractionnaire
SPC 2000
Filtering in fractional Fourier domains : Application to the Biotâs waves
Gilles Gonon, Zine El Abidine Fellah, Claude Depollier
Résumé
In this paper we present a method to separate the compressional waves which propagate in a porous medium when it is subject to a mechanical excitation. We start this work by reviewing the Biotâs theory which describes the propagation of ultrasonic pulses in a porous elastic medium. This modelling shows that three kinds of waves propagate in such media: two compressional waves and one shear wave, each one with its own velocity. Because of the dispersive nature of porous media, the identification of the compressional waves is often difficult by a traditionnal filtering while this identification is a compelling need to extract the part of the informations about the elastic parameters, the porosity and the permeability of the medium contained in each of them. For that we propose a filtering method using the fractional Fourier transform as foundation. The interpretation of this transformation as a rotation in the time-frequency plane and its relationships with time-frequency representations allow the filtering of signal in a single fractional Fourier domain.
@inproceedings{giliasted00,
author = "Gilles Gonon and Zine El abidine Fellah and Claude Depollier",
title = "Filtering in Fractional Fourier Domains: Application to the Biot's Waves ",
booktitle = "CongrĂšs IASTED SPC 2000 ",
year = 2000,
month = sep
}
GRETSI 1999
Estimation des paramĂštres dâun sinus glissant par TransformĂ©e de Fourier Fractionnaire
Gilles Gonon, Claude Depollier
Résumé
La TransformĂ©e de Fourier Fractionnaire (notĂ©e {\bf FRT}), introduite par Namias en 1980, permet une analyse des signaux dans des domaines intermĂ©diaires entre les domaines temporel et frĂ©quentiel. Suivant un angle donnĂ© du plan temps frĂ©quence, elle dĂ©compose le signal sur une base orthogonale de sinus glissants. Elle est donc adaptĂ©e Ă lâanalyse de signaux multicomposantes formĂ©s de sinus glissants et permet une estimation robuste au bruit de la pente et de lâoffset qui sont les deux paramĂštres essentiels des sinus glissants.
@inproceedings{gilgretsi99,
author = "Gilles Gonon and Claude Depollier",
title = "Estimation des paramÚtres d'un sinus glissant par Transformée de Fourier Fractionnaire",
booktitle = "17$^{Ăšme}$ colloque du GRETSI",
year = 1999,
month = sep
}
Rapport DEA Acoustique 1998
La transformée de Fourier Fractionnaire
Gilles Gonon, Stage encadré par Claude Depollier
Résumé
Ce rapport présente la transformée de Fourier fractionnaire et quelques applications en traitement du signal, comme le filtrage dans le plan temps fréquence ou la détection de chirp linéaire.
Codage audio
Rapport biliographique sur le codage audio
Gilles Gonon
Résumé
Ce rapport biliographique dĂ©taillant les diffĂ©rentes Ă©tapes de la compression audio,Ă savoir lâanalyse du signal, les phĂ©nomĂšnes psychoacoustiques, lâallocation binaire et le codage entropique a Ă©tĂ© rĂ©alisĂ© dans le but de prĂ©senter les diffĂ©rentes types de codeurs existants.
ENSEA
Matrix-Pencil
Estimation des partiels dâune corde guitare par la mĂ©thode de Matrix Pencil
Gilles Gonon
Résumé
Mise en place de la mĂ©thode paramĂ©trique basĂ©e sur lâalgorithme de Matrix Pencil pour estimer lâinharmonicitĂ© des partiels de guitare due aux faibles vibrations de la table dâharmonie.
Stage ENSEA 1997
Liaison dâune camĂ©ra de type webcam Ă un rĂ©seau CAN
Gilles Gonon
Résumé
Stage rĂ©alisĂ© en 1997 au laboratoire DISCA de lâUPV (UniversitĂ© Polytechnique de Valencia).
Téléchargement : non disponible