Slim Essid

Documents

Présentation

Publications

gael-richard

	Audiovisual Analysis of Music Performances: Overview of an Emerging Field Zhiyao Duan , Slim Essid , Cynthia Liem , Gael Richard , Gaurav Sharma IEEE Signal Processing Magazine, 2019, 36 (1), pp.63-73 Article dans une revue hal-02287983v1
	Weakly Supervised Representation Learning for Audio-Visual Scene Analysis Sanjeel Parekh , Slim Essid , Alexey Ozerov , Ngoc Q. K. Duong , Patrick Pérez IEEE/ACM Transactions on Audio, Speech and Language Processing, 2019 Article dans une revue hal-02399993v1
	Audio-Visual Analysis of Music Performances Zhiyao Duan , Slim Essid , Cynthia Liem , Gael Richard , Gaurav Sharma IEEE Signal Processing Magazine, inPress Article dans une revue hal-01893410v1
	Feature Learning with Matrix Factorization Applied to Acoustic Scene Classification Victor Bisot , Romain Serizel , Slim Essid , Gael Richard IEEE/ACM Transactions on Audio, Speech and Language Processing, 2017, 25 (6), pp.1216 - 1229. ⟨10.1109/TASLP.2017.2690570⟩ Article dans une revue hal-01362864v2
	TPT-Dance&Actions : un corpus multimodal d'activités humaines Aymeric Masurelle , Ahmed Rida Sekkat , Slim Essid , Gael Richard Traitement du Signal, 2015, ⟨10.3166/TS.32.443-475⟩ Article dans une revue hal-02704820v1
	Learning Optimal Features for Polyphonic Audio-to-Score Alignment Cyril Joder , Slim Essid , Gael Richard IEEE Transactions on Audio, Speech and Language Processing, 2013 Article dans une revue hal-02704714v1
	A multi-modal dance corpus for research into interaction between humans in virtual environments Slim Essid , Marc Gowing , Georgios Kordelas , Anil Aksay , P. Kelly Journal on Multimodal User Interfaces, 2012, pp.1-14. ⟨10.1007/s12193-012-0109-5⟩ Article dans une revue hal-02286487v1
	A Conditional Random Field Framework for Robust and Scalable Audio-to-Score Matching Cyril Joder , Slim Essid , Gael Richard IEEE Transactions on Audio, Speech and Language Processing, 2011 Article dans une revue hal-02653026v1
	Temporal Integration for Audio Classification With Application to Musical Instrument Classification Cyril Joder , Slim Essid , Gael Richard IEEE Transactions on Audio, Speech and Language Processing, 2009, 17, ⟨10.1109/TASL.2008.2007613⟩ Article dans une revue hal-02652782v1
	On the Correlation of Automatic Audio and Visual Segmentations of Music Videos Olivier Gillet , Slim Essid , Gael Richard IEEE Transactions on Circuits and Systems for Video Technology, 2007, 17, ⟨10.1109/TCSVT.2007.890831⟩ Article dans une revue hal-02652635v1
	Musical instrument recognition by pairwise classification strategies Gael Richard , Slim Essid , Bertrand David IEEE Transactions on Audio, Speech and Language Processing, 2006, 14 (4), pp.1401- 1412. ⟨10.1109/TSA.2005.860842⟩ Article dans une revue hal-00477671v1
	Instrument recognition in polyphonic music based on automatic taxonomies Slim Essid , Gael Richard , Bertrand David IEEE Transactions on Audio, Speech and Language Processing, 2006, 14 (1), pp.68-80. ⟨10.1109/TSA.2005.860351⟩ Article dans une revue hal-00477670v1

	Resilient Multiple Choice Learning: A learned scoring scheme with application to audio scene analysis Victor Letzelter , Mathieu Fontaine , Mickaël Chen , Patrick Pérez , Slim Essid Advances in neural information processing systems, Dec 2023, New Orleans, United States Communication dans un congrès hal-04216055v1
	Latent and Adversarial Data Augmentation for Sound Event Detection and Classification David Perera , Slim Essid , Gaël Richard International workshop on Detection and Classiffication of Acoustic Scenes and Events (DCASE), Nov 2022, Nancy, France Communication dans un congrès hal-03782827v1
	Impact de perturbations internes sur l'entraînement de réseaux profonds pour la détection d'évènements sonores David Perera , Slim Essid , Gael Richard Colloque Francophone de Traitement du Signal et des Images (GRETSI), Sep 2022, Nancy, France Communication dans un congrès hal-03759651v1
	NEURO-STEERED MUSIC SOURCE SEPARATION WITH EEG-BASED AUDITORY ATTENTION DECODING AND CONTRASTIVE-NMF Giorgia Cantisani , Slim Essid , Gael Richard 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Jun 2021, Toronto (virtual conference), Canada. ⟨10.1109/ICASSP39728.2021.9413841⟩ Communication dans un congrès hal-02978978v4
	User-guided one-shot deep model adaptation for music source separation Giorgia Cantisani , Alexey Ozerov , Slim Essid , Gael Richard 2021 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), IEEE, Oct 2021, New Paltz, NY, United States Communication dans un congrès hal-03219350v3
	MAD-EEG: an EEG dataset for decoding auditory attention to a target instrument in polyphonic music Giorgia Cantisani , Gabriel Trégoat , Slim Essid , Gael Richard Speech, Music and Mind (SMM), Satellite Workshop of Interspeech 2019, Sep 2019, Vienna, Austria Communication dans un congrès hal-02291882v3
	Decoding auditory attention in polyphonic music based on EEG: a new dataset and a preliminary study Giorgia Cantisani , Slim Essid , Gael Richard Auditory EEG Signal Processing (AESoP) symposium, Sep 2019, Leuven, Belgium Communication dans un congrès hal-03175885v1
	EEG-BASED DECODING OF AUDITORY ATTENTION TO A TARGET INSTRUMENT IN POLYPHONIC MUSIC Giorgia Cantisani , Slim Essid , Gael Richard 2019 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Oct 2019, New Paltz, NY, United States Communication dans un congrès hal-02291896v1
	IDENTIFY, LOCATE AND SEPARATE: AUDIO-VISUAL OBJECT EXTRACTION IN LARGE VIDEO COLLECTIONS USING WEAK SUPERVISION Sanjeel Parekh , Alexey Ozerov , Slim Essid , Ngoc Duong , Patrick Pérez IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Oct 2019, New Paltz, United States Communication dans un congrès hal-02380780v1
	Weakly Supervised Representation Learning for Unsynchronized Audio-Visual Events Sanjeel Parekh , Slim Essid , Alexey Ozerov , Ngoc Q K Duong , Patrick Pérez CVPR Workshop, 2018, Salt Lake city, United States Communication dans un congrès hal-02713307v1
	Motion informed audio source separation Sanjeel Parekh , Slim Essid , Alexey Ozerov , Ngoc Duong , Patrick Pérez IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2017), Mar 2017, New Orleans, United States Communication dans un congrès hal-01447977v1
	Supervised Group Nonnegative Matrix Factorisation With Similarity Constraints And Applications To Speaker Identification Romain Serizel , Victor Bisot , Slim Essid , Gael Richard IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Mar 2017, New Orleans, United States Communication dans un congrès hal-01484744v1
	Overlapping sound event detection with supervised Nonnegative Matrix Factorization Victor Bisot , Slim Essid , Gael Richard 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Mar 2017, New Orleans, France. pp.31-35, ⟨10.1109/ICASSP.2017.7951792⟩ Communication dans un congrès hal-02713341v1
	Nonnegative Feature Learning Methods for Acoustic Scene Classification Victor Bisot , Romain Serizel , Slim Essid , Gael Richard DCASE 2017 - Workshop on Detection and Classification of Acoustic Scenes and Events, Nov 2017, Munich, Germany Communication dans un congrès hal-01636627v1
	Guiding Audio Source Separation by Video Object Information Sanjeel Parekh , Slim Essid , Alexey Ozerov , Quang-Khanh-Ngoc Duong , Patrick Perez IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Oct 2017, New Paltz, New York, United States Communication dans un congrès hal-02287698v1
	Leveraging deep neural networks with nonnegative representations for improved environmental sound classification Victor Bisot , Romain Serizel , Slim Essid , Gael Richard IEEE International Workshop on Machine Learning for Signal Processing MLSP, Sep 2017, Tokyo, Japan Communication dans un congrès hal-01576857v1
	Acoustic scene classification with matrix factorization for unsupervised feature learning Victor Bisot , Romain Serizel , Slim Essid , Gael Richard ICASSP, Mar 2016, Shangai, China Communication dans un congrès hal-02287267v1
	Mini-batch stochastic approaches for accelerated multiplicative updates in nonnegative matrix factorisation with beta-divergence Romain Serizel , Slim Essid , Gael Richard IEEE International Workshop on Machine Learning for Signal Processing (MLSP 2016), Sep 2016, Salerne, Italy Communication dans un congrès hal-01393964v1
	Group nonnegative matrix factorisation with speaker and session variability compensation for speaker identification Romain Serizel , Slim Essid , Gael Richard ICASSP, Mar 2016, Shangai, China. pp.5470 - 5474 Communication dans un congrès hal-02288453v1
	Group Non-Negative Matrix Factorisation With Speaker And Session Similarity Constraints For Speaker Identification Romain Serizel , Slim Essid , Gael Richard IEEE International Conference on Acoustics, Speech, and Signal Processing, Mar 2016, Shangai, China Communication dans un congrès hal-01393968v1
	SUPERVISED NONNEGATIVE MATRIX FACTORIZATION FOR ACOUSTIC SCENE CLASSIFICATION Victor Bisot , Romain Serizel , Slim Essid , Gael Richard IEEE international evaluation campaign on detection and classification of acousitc scenes and events (DCASE 2016), Sep 2016, Budapest, Hungary Communication dans un congrès hal-02943480v1
	Machine listening techniques as a complement to video image analysis in forensics Romain Serizel , Victor Bisot , Slim Essid , Gael Richard IEEE International Conference on Image Processing, Sep 2016, Phoenix, AZ, United States. pp.948-952, ⟨10.1109/ICIP.2016.7532497⟩ Communication dans un congrès hal-01393959v1
	Hog and Subband power distribution image features for acoustic scene classification Victor Bisot , Slim Essid , Gael Richard EUSIPCO, Sep 2015, Nice, France. pp.719-723 Communication dans un congrès hal-02287266v1
	Gesture recognition using a NMF-based representation of motion-traces extracted from depth silhouettes Aymeric Masurelle , Slim Essid , Gael Richard 2014 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 14), May 2014, Florence, Italy Communication dans un congrès hal-00990252v1
	Exploring new features for music classification Rémi Foucard , Slim Essid , Gael Richard , Mathieu Lagrange WIAMIS, Jul 2013, Paris, France. ⟨10.1109/WIAMIS.2013.6616154⟩ Communication dans un congrès hal-01126767v1
	Etiquetage automatique de l'audio : une approche de boosting régressif basée sur une fusion souple d'annotateurs Rémi Foucard , Slim Essid , Mathieu Lagrange , Gael Richard Coresa, 2013, NA, France Communication dans un congrès hal-01106754v1
	MULTIMODAL CLASSIFICATION OF DANCE MOVEMENTS USING BODY JOINT TRAJECTORIES AND STEP SOUNDS Aymeric Masurelle , Slim Essid , Gael Richard International Workshop on Image and Audio Analysis for Multimedia Interactive Services WIAMIS, Nov 2013, Paris, France. pp.1-4, ⟨10.1109/WIAMIS.2013.6616151⟩ Communication dans un congrès hal-00904461v1
	A regressive boosting approach to automatic audio tagging based on soft annotator fusion Rémi Foucard , Slim Essid , Mathieu Lagrange , Gael Richard IEEE ICASSP, Mar 2012, Kyoto, Japan. ⟨10.1109/ICASSP.2012.6287820⟩ Communication dans un congrès hal-01132529v1
	A multimodal dance corpus for research into real-time interaction between humans in online virtual environments Slim Essid , Xinyu Lin , Marc Gowing , Georgios Kordelas , Anil Aksay ICMI WORKSHOP ON MULTIMODAL CORPORA FOR MACHINE LEARNING, Nov 2011, Alicante, Spain Communication dans un congrès hal-02278689v1
	Hidden Discrete Tempo Model: A tempo-aware timing model for audio-to-score alignment Cyril Joder , Slim Essid , Gael Richard ICASSP 2011 - 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), May 2011, Prague, France. pp.397-400, ⟨10.1109/ICASSP.2011.5946424⟩ Communication dans un congrès hal-02714059v1
	Optimizing the mapping from a symbolic to an audio representation for music-to-score alignment Cyril Joder , Slim Essid , Gael Richard 2011 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Oct 2011, New Paltz, France. pp.121-124, ⟨10.1109/ASPAA.2011.6082330⟩ Communication dans un congrès hal-02943613v1
	Interactive Classification of Sound Objects for Polyphonic Electro-Acoustic Music Annotation Sébastien Gulluni , Slim Essid , Olivier Buisson , Gael Richard AES Conference, 2011, Ilmenau, Germany Communication dans un congrès hal-02713989v1
	AN INTERACTIVE SYSTEM FOR ELECTRO-ACOUSTIC MUSIC ANALYSIS Sébastien Gulluni , Slim Essid , Olivier Buisson , Gael Richard ISMIR, 2011, Miami, United States Communication dans un congrès hal-02713906v1
	An audio-driven virtual dance-teaching assistant Slim Essid , Yves Grenier , Mounira Maazaoui , Gael Richard , Robin Tournemenne the 19th ACM international conference, Nov 2011, Scottsdale, France. pp.675, ⟨10.1145/2072298.2072416⟩ Communication dans un congrès hal-02713825v1
	Multi-scale temporal fusion by boosting for music classification Rémi Foucard , Slim Essid , Mathieu Lagrange , Gael Richard ISMIR, 2011, Miami, United States. pp.663-668 Communication dans un congrès hal-00639097v1
	A MULTIMODAL APPROACH TO INITIALISATION FOR TOP-DOWN SPEAKER DIARIZATION OF TELEVISION SHOWS Simon Bozonnet , Félicien Vallet , Nicholas Evans , Slim Essid , Gael Richard Eusipco, 2010, aalborg, Denmark Communication dans un congrès hal-02747730v1
	Approche hiérarchique pour un alignement musique-sur-partition efficace Cyril Joder , Slim Essid , Gael Richard Compression et Représentation des Signaux Audiovisuels (CORESA), Oct 2010, Lyon, France Communication dans un congrès hal-02943620v1
	A comparative study of tonal acoustic features for a symbolic level music-to-score alignment Cyril Joder , Slim Essid , Gael Richard 2010 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2010, Mar 2010, Dallas, France. pp.409-412, ⟨10.1109/ICASSP.2010.5495784⟩ Communication dans un congrès hal-02747785v1
	YAAFE, AN EASY TO USE AND EFFICIENT AUDIO FEATURE EXTRACTION SOFTWARE Benoît Mathieu , Slim Essid , Thomas Fillon , Jacques Prado , Gael Richard ISMIR, 2010, Utrecht, Netherlands Communication dans un congrès hal-02747689v1
	Robust visual features for the multimodal identification of unregistered speakers in TV talk-shows Félicien Vallet , Slim Essid , Jean Carrive , Gael Richard 2010 17th IEEE International Conference on Image Processing (ICIP 2010), Sep 2010, Hong Kong, France. pp.1469-1472, ⟨10.1109/ICIP.2010.5653393⟩ Communication dans un congrès hal-02747558v1
	A conditional random field viewpoint of symbolic audio-to-score matching Cyril Joder , Slim Essid , Gael Richard the international conference, Oct 2010, Firenze, France. pp.871, ⟨10.1145/1873951.1874100⟩ Communication dans un congrès hal-02747590v1
	AN IMPROVED HIERARCHICAL APPROACH FOR MUSIC-TO-SYMBOLIC SCORE ALIGNMENT Cyril Joder , Slim Essid , Gael Richard ISMIR, 2010, Utrecht, Netherlands Communication dans un congrès hal-02747659v1
	Descripteurs visuels robustes pour l'identification de locuteurs dans des émissions televisées de talk-shows Vallet Félicien , Slim Essid , Jean Carrive , Gaël Richard Compression et Représentation des Signaux Audiovisuels (CORESA), Oct 2010, Lyon, France Communication dans un congrès hal-02943621v1
	Interactive Segmentation of Electro-Acoustic Music Sébastien Gulluni , Slim Essid , Olivier Buisson , Gael Richard 2nd International Workshop on Machine Learning and Music (MML - ECML - PKDD), Sep 2009, Bled, Slovenia Communication dans un congrès hal-02943665v1
	Incorporating prior knowledge on the digital media creation process into audio classifiers M. Lardeur , S. Essid , Gael Richard , M. Haller , T. Sikora ICASSP 2009 - 2009 IEEE International Conference on Acoustics, Speech and Signal Processing, Apr 2009, Taipei, France. pp.1653-1656, ⟨10.1109/ICASSP.2009.4959918⟩ Communication dans un congrès hal-03117240v1
	Étude des descripteurs acoustiques pour l'alignement temporel audio-sur-partition musicale Cyril Joder , Slim Essid , Gaël Richard GRETSI, Sep 2009, Dijon, France Communication dans un congrès hal-02943624v1
	Étude des descripteurs acoustiques pour l'alignement temporel audio-sur-partition musicale Cyril Joder , Slim Essid , Gael Richard Colloque GRETSI, 2009, dijon, France Communication dans un congrès hal-03117111v1
	ON THE ROBUSTNESS OF AUDIO FEATURES FOR MUSICAL INSTRUMENT CLASSIFICATION S Wegener , M Haller , J J Burred , T Sikora , Slim Essid 16th European Signal Processing Conference, Aug 2008, Lausanne, Switzerland Communication dans un congrès hal-02943672v1
	ALIGNMENT KERNELS FOR AUDIO CLASSIFICATION WITH APPLICATION TO MUSIC INSTRUMENT RECOGNITION Cyril Joder , Slim Essid , Gaël Richard 16th European Signal Processing Conference, Aug 2008, Lausanne, Switzerland Communication dans un congrès hal-02943674v1
	TOWARDS POLYPHONIC MUSICAL INSTRUMENTS RECOGNITION Gael Richard , Pierre Leveau , Laurent Daudet , Slim Essid , Bertrand David 19th INTERNATIONAL CONGRESS ON ACOUSTICS, Sep 2007, Madrid, Spain Communication dans un congrès hal-02943678v1
	Combined Supervised and Unsupervised Approaches for Automatic Segmentation of Radiophonic Audio Streams Gael Richard , Mathieu Ramona , Slim Essid 2007 IEEE International Conference on Acoustics, Speech, and Signal Processing, Apr 2007, Honolulu, France. pp.II-461-II-464, ⟨10.1109/ICASSP.2007.366272⟩ Communication dans un congrès hal-02943676v1
	On the usefulness of differentiated transient/steady-state processing in machine recognition of musical instruments Slim Essid , Pierre Leveau , Gael Richard , Laurent Daudet , Bertrand David AES 118th convention, May 2005, Barcelona, Spain Communication dans un congrès hal-02946881v1
	MUSICAL INSTRUMENT RECOGNITION BASED ON CLASS PAIRWISE FEATURE SELECTION Slim Essid , Gael Richard , Bertrand David International Conference on Music Information Retrieval (ISMIR), Oct 2004, Barcelona, Spain Communication dans un congrès hal-02946907v1
	Efficient musical instrument recognition on solo performance music using basic features Slim Essid , Gael Richard , Bertrand David AES 25th conference, Jun 2004, London, United Kingdom Communication dans un congrès hal-02946911v1
	MUSICAL INSTRUMENT RECOGNITION ON SOLO PERFORMANCES Slim Essid , Gaël Richard , Bertrand David European Signal Processing Conference (EUSIPCO, Sep 2004, Vienna, Austria Communication dans un congrès hal-02946903v1

	Multimodal Music Recording Remastering Giorgia Cantisani , Slim Essid , Gael Richard DMRN+13: Digital Music Research Network One-day Workshop 2018, Dec 2018, London, United Kingdom Poster de conférence hal-03187638v1

	Acoustic Features for Environmental Sound Analysis Romain Serizel , Victor Bisot , Slim Essid , Gael Richard Tuomas Virtanen; Mark D. Plumbley; Dan Ellis. Computational Analysis of Sound Scenes and Events, Springer International Publishing AG, pp.71-101, 2017, 978-3-319-63449-4. ⟨10.1007/978-3-319-63450-0_4⟩ Chapitre d'ouvrage hal-01575619v1
	Fusion of Multimodal Information in Music Content Analysis Slim Essid , Gael Richard Multimodal Music Processing, Dagstuhl Follow-Ups,, Schloss Dagstuhl--Leibniz-Zentrum fuer Informatik,, 2012 Chapitre d'ouvrage hal-02653102v1
	Feature Extraction for Multimedia Analysis Rachid Benmokhtar , Huet Benoit , Gael Richard , Thierry Declerck , Slim Essid Multimedia Semantics: Metadata, Analysis and Interaction, Wiley, 2011 Chapitre d'ouvrage hal-02653016v1
	Machine Learning Techniques for Multimedia Analysis Slim Essid , Marine Campedel , Gael Richard , Tomas Piatrik , Rachid Benmokhtar Multimedia Semantics: Metadata, Analysis and Interaction, 2011 Chapitre d'ouvrage hal-02943615v1
	High-level TV talk show structuring centered on speakers' interventions Félicien Vallet , Slim Essid , Jean Carrive , Gael Richard TV Content Analysis: Techniques and Applications, CRC Press, Taylor Francis LLC, 2011 Chapitre d'ouvrage hal-02653090v1

	Procédé de classification et de localisation d'événements audiovisuels et appareil correspondant, produit-programme lisible par ordinateur et support d'informations lisible par ordinateur Quang-Khanh-Ngoc Duong , Alexey Ozerov , Sanjeel Parekh , Slim Essid , Gael Richard France, Patent n° : EP3540634. 2018 Brevet hal-02651256v1
	Procédé de traitement d'un signal audio et dispositif électronique correspondant, produit-programme lisible par ordinateur non transitoire et support d'informations lisible par ordinateur Sanjeel Parekh , Alexey Ozerov , Quang-Khanh-Ngoc Duong , Gael Richard , Slim Essid France, Patent n° : EP3392882 A1. 2018 Brevet hal-02651234v1

	EEG-based Decoding of Auditory Attention to a Target Instrument for Neuro-steered Music Source Separation Giorgia Cantisani , Slim Essid , Gael Richard 2021 Pré-publication, Document de travail hal-04349308v2
	Identify, locate and separate: Audio-visual object extraction in large video collections using weak supervision Sanjeel Parekh , Alexey Ozerov , Slim Essid , Ngoc Q. K. Duong , Patrick Pérez 2018 Pré-publication, Document de travail hal-01914532v1

Slim Essid

Présentation

Publications

Audiovisual Analysis of Music Performances: Overview of an Emerging Field

Weakly Supervised Representation Learning for Audio-Visual Scene Analysis

Audio-Visual Analysis of Music Performances

Feature Learning with Matrix Factorization Applied to Acoustic Scene Classification

TPT-Dance&Actions : un corpus multimodal d'activités humaines

Learning Optimal Features for Polyphonic Audio-to-Score Alignment

A multi-modal dance corpus for research into interaction between humans in virtual environments

A Conditional Random Field Framework for Robust and Scalable Audio-to-Score Matching

Temporal Integration for Audio Classification With Application to Musical Instrument Classification

On the Correlation of Automatic Audio and Visual Segmentations of Music Videos

Musical instrument recognition by pairwise classification strategies

Instrument recognition in polyphonic music based on automatic taxonomies

Resilient Multiple Choice Learning: A learned scoring scheme with application to audio scene analysis

Latent and Adversarial Data Augmentation for Sound Event Detection and Classification

Impact de perturbations internes sur l'entraînement de réseaux profonds pour la détection d'évènements sonores

NEURO-STEERED MUSIC SOURCE SEPARATION WITH EEG-BASED AUDITORY ATTENTION DECODING AND CONTRASTIVE-NMF

User-guided one-shot deep model adaptation for music source separation

MAD-EEG: an EEG dataset for decoding auditory attention to a target instrument in polyphonic music

Decoding auditory attention in polyphonic music based on EEG: a new dataset and a preliminary study

EEG-BASED DECODING OF AUDITORY ATTENTION TO A TARGET INSTRUMENT IN POLYPHONIC MUSIC

IDENTIFY, LOCATE AND SEPARATE: AUDIO-VISUAL OBJECT EXTRACTION IN LARGE VIDEO COLLECTIONS USING WEAK SUPERVISION

Weakly Supervised Representation Learning for Unsynchronized Audio-Visual Events

Motion informed audio source separation

Supervised Group Nonnegative Matrix Factorisation With Similarity Constraints And Applications To Speaker Identification

Overlapping sound event detection with supervised Nonnegative Matrix Factorization

Nonnegative Feature Learning Methods for Acoustic Scene Classification

Guiding Audio Source Separation by Video Object Information

Leveraging deep neural networks with nonnegative representations for improved environmental sound classification

Acoustic scene classification with matrix factorization for unsupervised feature learning

Mini-batch stochastic approaches for accelerated multiplicative updates in nonnegative matrix factorisation with beta-divergence

Group nonnegative matrix factorisation with speaker and session variability compensation for speaker identification

Group Non-Negative Matrix Factorisation With Speaker And Session Similarity Constraints For Speaker Identification

SUPERVISED NONNEGATIVE MATRIX FACTORIZATION FOR ACOUSTIC SCENE CLASSIFICATION

Machine listening techniques as a complement to video image analysis in forensics

Hog and Subband power distribution image features for acoustic scene classification

Gesture recognition using a NMF-based representation of motion-traces extracted from depth silhouettes

Exploring new features for music classification

Etiquetage automatique de l'audio : une approche de boosting régressif basée sur une fusion souple d'annotateurs

MULTIMODAL CLASSIFICATION OF DANCE MOVEMENTS USING BODY JOINT TRAJECTORIES AND STEP SOUNDS

A regressive boosting approach to automatic audio tagging based on soft annotator fusion

A multimodal dance corpus for research into real-time interaction between humans in online virtual environments

Hidden Discrete Tempo Model: A tempo-aware timing model for audio-to-score alignment

Optimizing the mapping from a symbolic to an audio representation for music-to-score alignment

Interactive Classification of Sound Objects for Polyphonic Electro-Acoustic Music Annotation

AN INTERACTIVE SYSTEM FOR ELECTRO-ACOUSTIC MUSIC ANALYSIS

An audio-driven virtual dance-teaching assistant

Multi-scale temporal fusion by boosting for music classification

A MULTIMODAL APPROACH TO INITIALISATION FOR TOP-DOWN SPEAKER DIARIZATION OF TELEVISION SHOWS

Approche hiérarchique pour un alignement musique-sur-partition efficace

A comparative study of tonal acoustic features for a symbolic level music-to-score alignment

YAAFE, AN EASY TO USE AND EFFICIENT AUDIO FEATURE EXTRACTION SOFTWARE

Robust visual features for the multimodal identification of unregistered speakers in TV talk-shows

A conditional random field viewpoint of symbolic audio-to-score matching

AN IMPROVED HIERARCHICAL APPROACH FOR MUSIC-TO-SYMBOLIC SCORE ALIGNMENT

Descripteurs visuels robustes pour l'identification de locuteurs dans des émissions televisées de talk-shows

Interactive Segmentation of Electro-Acoustic Music

Incorporating prior knowledge on the digital media creation process into audio classifiers

Étude des descripteurs acoustiques pour l'alignement temporel audio-sur-partition musicale

Étude des descripteurs acoustiques pour l'alignement temporel audio-sur-partition musicale

ON THE ROBUSTNESS OF AUDIO FEATURES FOR MUSICAL INSTRUMENT CLASSIFICATION

ALIGNMENT KERNELS FOR AUDIO CLASSIFICATION WITH APPLICATION TO MUSIC INSTRUMENT RECOGNITION

TOWARDS POLYPHONIC MUSICAL INSTRUMENTS RECOGNITION

Combined Supervised and Unsupervised Approaches for Automatic Segmentation of Radiophonic Audio Streams

On the usefulness of differentiated transient/steady-state processing in machine recognition of musical instruments

MUSICAL INSTRUMENT RECOGNITION BASED ON CLASS PAIRWISE FEATURE SELECTION

Efficient musical instrument recognition on solo performance music using basic features

MUSICAL INSTRUMENT RECOGNITION ON SOLO PERFORMANCES

Multimodal Music Recording Remastering

Acoustic Features for Environmental Sound Analysis

Fusion of Multimodal Information in Music Content Analysis

Feature Extraction for Multimedia Analysis

Machine Learning Techniques for Multimedia Analysis

High-level TV talk show structuring centered on speakers' interventions

Procédé de classification et de localisation d'événements audiovisuels et appareil correspondant, produit-programme lisible par ordinateur et support d'informations lisible par ordinateur

Procédé de traitement d'un signal audio et dispositif électronique correspondant, produit-programme lisible par ordinateur non transitoire et support d'informations lisible par ordinateur

EEG-based Decoding of Auditory Attention to a Target Instrument for Neuro-steered Music Source Separation

Identify, locate and separate: Audio-visual object extraction in large video collections using weak supervision