Tapez votre recherche ici
  • Équipes
  • Membres
  • Projets
  • Événements
  • Appels
  • Emplois
  • publications
  • Logiciel
  • Outils
  • Réseau
  • Équipement

Un petit guide pour l'utilisation de la recherche avancée :

  • Tip 1. Utilisez "" afin de chercher une expression exacte.
    Exemple : "division cellulaire"
  • Tip 2. Utilisez + afin de rendre obligatoire la présence d'un mot.
    Exemple : +cellule +stem
  • Tip 3. Utilisez + et - afin de forcer une inclusion ou exclusion d'un mot.
    Exemple : +cellule -stem
e.g. searching for members in projects tagged cancer
Search for
Compteur
IN
OUT
Contenu 1
  • member
  • team
  • department
  • center
  • program_project
  • nrc
  • whocc
  • project
  • software
  • tool
  • patent
  • Personnel Administratif
  • Chargé(e) de Recherche Expert
  • Directeur(trice) de Recherche
  • Assistant(e) de Recherche Clinique
  • Professeur(e)
  • Etudiant(e) M2
  • Aide technique
  • Chercheur(euse) Contractuel(le)
  • Chercheur(euse) Permanent(e)
  • Pharmacien(ne)
  • Etudiant(e) en thèse
  • Médecin
  • Post-doctorant(e)
  • Chef(fe) de Projet
  • Chargé(e) de Recherche
  • Ingénieur(e) de Recherche
  • Chercheur(euse) Retraité(e)
  • Technicien(ne)
  • Etudiant(e)
  • Vétérinaire
  • Visiteur(euse) Scientifique
  • Directeur(trice) Adjoint(e) de Centre
  • Directeur(trice) Adjoint(e) de Départment
  • Directeur(trice) Adjoint(e) de Centre National de Référence
  • Directeur(trice) Adjoint(e) de Plateforme
  • Directeur(trice) de Centre
  • Directeur(trice) de Départment
  • Directeur(trice) d'Institut
  • Directeur(trice) de Centre National de Référence
  • Chef(fe) de Groupe
  • Responsable de Plateforme
  • Responsable opérationnel et administratif
  • Responsable de Structure
  • Président(e) d'honneur de Département
  • Coordinateur(trice) du Labex
Contenu 2
  • member
  • team
  • department
  • center
  • program_project
  • nrc
  • whocc
  • project
  • software
  • tool
  • patent
  • Personnel Administratif
  • Chargé(e) de Recherche Expert
  • Directeur(trice) de Recherche
  • Assistant(e) de Recherche Clinique
  • Professeur(e)
  • Etudiant(e) M2
  • Aide technique
  • Chercheur(euse) Contractuel(le)
  • Chercheur(euse) Permanent(e)
  • Pharmacien(ne)
  • Etudiant(e) en thèse
  • Médecin
  • Post-doctorant(e)
  • Chef(fe) de Projet
  • Chargé(e) de Recherche
  • Ingénieur(e) de Recherche
  • Chercheur(euse) Retraité(e)
  • Technicien(ne)
  • Etudiant(e)
  • Vétérinaire
  • Visiteur(euse) Scientifique
  • Directeur(trice) Adjoint(e) de Centre
  • Directeur(trice) Adjoint(e) de Départment
  • Directeur(trice) Adjoint(e) de Centre National de Référence
  • Directeur(trice) Adjoint(e) de Plateforme
  • Directeur(trice) de Centre
  • Directeur(trice) de Départment
  • Directeur(trice) d'Institut
  • Directeur(trice) de Centre National de Référence
  • Chef(fe) de Groupe
  • Responsable de Plateforme
  • Responsable opérationnel et administratif
  • Responsable de Structure
  • Président(e) d'honneur de Département
  • Coordinateur(trice) du Labex
Recherche
Revenir
Haut de page
Partagez
© Recherche
Publication : Journal of chemical information and modeling

Comparing the Influence of Simulated Experimental Errors on 12 Machine Learning Algorithms in Bioactivity Modeling Using 12 Diverse Data Sets

Domaines Scientifiques
Maladies
Organismes
Applications
Technique

Publié sur Journal of chemical information and modeling - 18 Jun 2015

Cortes-Ciriano I, Bender A, Malliavin TE

Lien vers Pubmed [PMID] – 26038978

J Chem Inf Model 2015 Jul;55(7):1413-25

To date, no systematic study has assessed the effect of random experimental errors on the predictive power of QSAR models. To address this shortage, we have benchmarked the noise sensitivity of 12 learning algorithms on 12 data sets (15,840 models in total), namely the following: Support Vector Machines (SVM) with radial and polynomial (Poly) kernels, Gaussian Process (GP) with radial and polynomial kernels, Relevant Vector Machines (radial kernel), Random Forest (RF), Gradient Boosting Machines (GBM), Bagged Regression Trees, Partial Least Squares, and k-Nearest Neighbors. Model performance on the test set was used as a proxy to monitor the relative noise sensitivity of these algorithms as a function of the level of simulated noise added to the bioactivities from the training set. The noise was simulated by sampling from Gaussian distributions with increasingly larger variances, which ranged from zero to the range of pIC50 values comprised in a given data set. General trends were identified by designing a full-factorial experiment, which was analyzed with a normal linear model. Overall, GBM displayed low noise tolerance, although its performance was comparable to RF, SVM Radial, SVM Poly, GP Poly, and GP Radial at low noise levels. Of practical relevance, we show that the bag fraction parameter has a marked influence on the noise sensitivity of GBM, suggesting that low values (e.g., 0.1-0.2) for this parameter should be set when modeling noisy data. The remaining 11 algorithms display a comparable noise tolerance, as a smooth and linear degradation of model performance is observed with the level of noise. However, SVM Poly and GP Poly display significant noise sensitivity at high noise levels in some cases. Overall, these results provide a practical guide to make informed decisions about which algorithm and parameter values to use according to the noise level present in the data.

https://www.ncbi.nlm.nih.gov/pubmed/26038978