Tapez votre recherche ici
  • Équipes
  • Membres
  • Projets
  • Événements
  • Appels
  • Emplois
  • publications
  • Logiciel
  • Outils
  • Réseau
  • Équipement

Un petit guide pour l'utilisation de la recherche avancée :

  • Tip 1. Utilisez "" afin de chercher une expression exacte.
    Exemple : "division cellulaire"
  • Tip 2. Utilisez + afin de rendre obligatoire la présence d'un mot.
    Exemple : +cellule +stem
  • Tip 3. Utilisez + et - afin de forcer une inclusion ou exclusion d'un mot.
    Exemple : +cellule -stem
e.g. searching for members in projects tagged cancer
Rechercher
Compteur
IN
OUT
Contenu 1
  • member
  • team
  • department
  • center
  • program_project
  • nrc
  • whocc
  • project
  • software
  • tool
  • patent
  • Personnel Administratif
  • Chargé(e) de Recherche Expert
  • Directeur(trice) de Recherche
  • Assistant(e) de Recherche Clinique
  • Infirmier(e) de Recherche Clinique
  • Chercheur(euse) Clinicien(ne)
  • Manager de département
  • Etudiant(e) en alternance
  • Professeur(e)
  • Professeur Honoraire
  • Aide technique
  • Etudiant(e) M2
  • Chercheur(euse) Contractuel(le)
  • Personnel infirmier
  • Chercheur(euse) Permanent(e)
  • Pharmacien(ne)
  • Etudiant(e) en thèse
  • Médecin
  • Post-doctorant(e)
  • Prize
  • Chef(fe) de Projet
  • Chargé(e) de Recherche
  • Ingénieur(e) de Recherche
  • Chercheur(euse) Retraité(e)
  • Technicien(ne)
  • Etudiant(e)
  • Vétérinaire
  • Visiteur(euse) Scientifique
  • Directeur(trice) Adjoint(e) de Centre
  • Directeur(trice) Adjoint(e) de Départment
  • Directeur(trice) Adjoint(e) de Centre National de Référence
  • Directeur(trice) Adjoint(e) de Plateforme
  • Directeur(trice) de Centre
  • Directeur(trice) de Départment
  • Directeur(trice) d'Institut
  • Directeur(trice) de Centre National de Référence
  • Chef(fe) de Groupe
  • Responsable de Plateforme
  • Responsable opérationnel et administratif
  • Responsable de Structure
  • Président(e) d'honneur de Département
  • Coordinateur(trice) du Labex
Contenu 2
  • member
  • team
  • department
  • center
  • program_project
  • nrc
  • whocc
  • project
  • software
  • tool
  • patent
  • Personnel Administratif
  • Chargé(e) de Recherche Expert
  • Directeur(trice) de Recherche
  • Assistant(e) de Recherche Clinique
  • Infirmier(e) de Recherche Clinique
  • Chercheur(euse) Clinicien(ne)
  • Manager de département
  • Etudiant(e) en alternance
  • Professeur(e)
  • Professeur Honoraire
  • Aide technique
  • Etudiant(e) M2
  • Chercheur(euse) Contractuel(le)
  • Personnel infirmier
  • Chercheur(euse) Permanent(e)
  • Pharmacien(ne)
  • Etudiant(e) en thèse
  • Médecin
  • Post-doctorant(e)
  • Prize
  • Chef(fe) de Projet
  • Chargé(e) de Recherche
  • Ingénieur(e) de Recherche
  • Chercheur(euse) Retraité(e)
  • Technicien(ne)
  • Etudiant(e)
  • Vétérinaire
  • Visiteur(euse) Scientifique
  • Directeur(trice) Adjoint(e) de Centre
  • Directeur(trice) Adjoint(e) de Départment
  • Directeur(trice) Adjoint(e) de Centre National de Référence
  • Directeur(trice) Adjoint(e) de Plateforme
  • Directeur(trice) de Centre
  • Directeur(trice) de Départment
  • Directeur(trice) d'Institut
  • Directeur(trice) de Centre National de Référence
  • Chef(fe) de Groupe
  • Responsable de Plateforme
  • Responsable opérationnel et administratif
  • Responsable de Structure
  • Président(e) d'honneur de Département
  • Coordinateur(trice) du Labex
Recherche

← Go to Research

Revenir
Haut de page
Partagez
© Recherche
Publication : Physical review. E

Approximate information for efficient exploration-exploitation strategies.

Domaines Scientifiques
Maladies
Organismes
Applications
Technique

Publié sur Physical review. E - 01 mai 2024

Barbier-Chebbah A, Vestergaard CL, Masson JB

Lien vers Pubmed [PMID] – 38907409

Lien DOI – 10.1103/PhysRevE.109.L052105

Phys Rev E 2024 May; 109(5): L052105

This paper addresses the exploration-exploitation dilemma inherent in decision-making, focusing on multiarmed bandit problems. These involve an agent deciding whether to exploit current knowledge for immediate gains or explore new avenues for potential long-term rewards. We here introduce a class of algorithms, approximate information maximization (AIM), which employs a carefully chosen analytical approximation to the gradient of the entropy to choose which arm to pull at each point in time. AIM matches the performance of Thompson sampling, which is known to be asymptotically optimal, as well as that of Infomax from which it derives. AIM thus retains the advantages of Infomax while also offering enhanced computational speed, tractability, and ease of implementation. In particular, we demonstrate how to apply it to a 50-armed bandit game. Its expression is tunable, which allows for specific optimization in various settings, making it possible to surpass the performance of Thompson sampling at short and intermediary times.