Tapez votre recherche ici
  • Équipes
  • Membres
  • Projets
  • Événements
  • Appels
  • Emplois
  • publications
  • Logiciel
  • Outils
  • Réseau
  • Équipement

Un petit guide pour l'utilisation de la recherche avancée :

  • Tip 1. Utilisez "" afin de chercher une expression exacte.
    Exemple : "division cellulaire"
  • Tip 2. Utilisez + afin de rendre obligatoire la présence d'un mot.
    Exemple : +cellule +stem
  • Tip 3. Utilisez + et - afin de forcer une inclusion ou exclusion d'un mot.
    Exemple : +cellule -stem
e.g. searching for members in projects tagged cancer
Rechercher
Compteur
IN
OUT
Contenu 1
  • member
  • team
  • department
  • center
  • program_project
  • nrc
  • whocc
  • project
  • software
  • tool
  • patent
  • Personnel Administratif
  • Chargé(e) de Recherche Expert
  • Directeur(trice) de Recherche
  • Assistant(e) de Recherche Clinique
  • Infirmier(e) de Recherche Clinique
  • Chercheur(euse) Clinicien(ne)
  • Manager de département
  • Etudiant(e) en alternance
  • Professeur(e)
  • Professeur Honoraire
  • Aide technique
  • Etudiant(e) M2
  • Chercheur(euse) Contractuel(le)
  • Personnel infirmier
  • Chercheur(euse) Permanent(e)
  • Pharmacien(ne)
  • Etudiant(e) en thèse
  • Médecin
  • Post-doctorant(e)
  • Prize
  • Chef(fe) de Projet
  • Chargé(e) de Recherche
  • Ingénieur(e) de Recherche
  • Chercheur(euse) Retraité(e)
  • Technicien(ne)
  • Etudiant(e)
  • Vétérinaire
  • Visiteur(euse) Scientifique
  • Directeur(trice) Adjoint(e) de Centre
  • Directeur(trice) Adjoint(e) de Départment
  • Directeur(trice) Adjoint(e) de Centre National de Référence
  • Directeur(trice) Adjoint(e) de Plateforme
  • Directeur(trice) de Centre
  • Directeur(trice) de Départment
  • Directeur(trice) d'Institut
  • Directeur(trice) de Centre National de Référence
  • Chef(fe) de Groupe
  • Responsable de Plateforme
  • Responsable opérationnel et administratif
  • Responsable de Structure
  • Président(e) d'honneur de Département
  • Coordinateur(trice) du Labex
Contenu 2
  • member
  • team
  • department
  • center
  • program_project
  • nrc
  • whocc
  • project
  • software
  • tool
  • patent
  • Personnel Administratif
  • Chargé(e) de Recherche Expert
  • Directeur(trice) de Recherche
  • Assistant(e) de Recherche Clinique
  • Infirmier(e) de Recherche Clinique
  • Chercheur(euse) Clinicien(ne)
  • Manager de département
  • Etudiant(e) en alternance
  • Professeur(e)
  • Professeur Honoraire
  • Aide technique
  • Etudiant(e) M2
  • Chercheur(euse) Contractuel(le)
  • Personnel infirmier
  • Chercheur(euse) Permanent(e)
  • Pharmacien(ne)
  • Etudiant(e) en thèse
  • Médecin
  • Post-doctorant(e)
  • Prize
  • Chef(fe) de Projet
  • Chargé(e) de Recherche
  • Ingénieur(e) de Recherche
  • Chercheur(euse) Retraité(e)
  • Technicien(ne)
  • Etudiant(e)
  • Vétérinaire
  • Visiteur(euse) Scientifique
  • Directeur(trice) Adjoint(e) de Centre
  • Directeur(trice) Adjoint(e) de Départment
  • Directeur(trice) Adjoint(e) de Centre National de Référence
  • Directeur(trice) Adjoint(e) de Plateforme
  • Directeur(trice) de Centre
  • Directeur(trice) de Départment
  • Directeur(trice) d'Institut
  • Directeur(trice) de Centre National de Référence
  • Chef(fe) de Groupe
  • Responsable de Plateforme
  • Responsable opérationnel et administratif
  • Responsable de Structure
  • Président(e) d'honneur de Département
  • Coordinateur(trice) du Labex
Recherche
Revenir
Haut de page
Partagez
© Recherche
Publication :

Approximate information for efficient exploration-exploitation strategies Information approximée pour des stratégies d’exploration-exploitation efficaces

Domaines Scientifiques
Maladies
Organismes
Applications
Technique

Publié sur - 03 juil. 2023

Alex Barbier--Chebbah, Christian L. Vestergaard, Jean-Baptiste Masson

Lien vers HAL – hal-04147006

2023

This paper addresses the exploration-exploitation dilemma inherent in decision-making, focusing on multi-armed bandit problems. The problems involve an agent deciding whether to exploit current knowledge for immediate gains or explore new avenues for potential long-term rewards. We here introduce a novel algorithm, approximate information maximization (AIM), which employs an analytical approximation of the entropy gradient to choose which arm to pull at each point in time. AIM matches the performance of Infomax and Thompson sampling while also offering enhanced computational speed, determinism, and tractability. Empirical evaluation of AIM indicates its compliance with the Lai & Robbins asymptotic bound and demonstrates its robustness for a range of priors. Its expression is tunable, which allows for specific optimization in various settings.