About
Genomic taxonomy of bacterial strains and emergence of antibiotic resistance
Abstract:
Infectious diseases are a global public health concern, particularly due to antimicrobial-resistance in some pathogenic bacteria. Klebsiella pneumoniae is one of the most worrying multiresistant bacteria. Corynebacterium diphtheriae, which causes diphtheria, remains largely susceptible to first-line antibiotics, including penicillin, and can be controlled through vaccination, but re-emerges when vaccination coverage is insufficient. Among the effective infection control measures, the accurate detection and identification of these pathogens, as well as their epidemiological monitoring, play a key role. In the recent years, the implementation of whole-genome sequencing (WGS) has revolutionised bacterial genotyping, by providing discrimination at the strain level. Genomic sequencing also enables the detection of variants and their important characteristics, such as virulence or antimicrobial resistance.
The research work of this thesis is structured around two main axes.
The first axis provides bioinformatic analyses of the population structure of antimicrobial resistance in C. diphtheriae. A genome-wide association study (GWAS) was performed to determine the genetic basis behind the resistance phenotypes, as well as the associations with diphtheria toxin production and other strain characteristics. A new penicillin resistance gene was discovered on a mobile element in C. diphtheriae. A genotyping tool was developed specifically for C. diphtheriae, for which the links between genotypes and clinical phenotypes are poorly known. This tool consolidates and facilitates the detection and genotyping of the main virulence factors and resistance genes, as well as the use of strain nomenclatures from assembled genomes. It also enables the prediction of biovars and toxicity of strains.
The second axis relates to infra-species genomic taxonomy. A new approach of genome-based classification and nomenclature of strains was developed using K. pneumoniae as a model. This work describes the design and implementation of a barcoding system that combines Single Linkage MultiLevel (MLSL) clustering and Life Identification Number (LIN) codes, both based on the same core-genome MLST (cgMLST) typing scheme. This innovative taxonomic approach, widely applicable to other bacterial species, yields precise and stable nomenclatures. A study of the phylogenetic structure of C. diphtheriae was also carried out, with the implementation of a cgMLST scheme on the basis of which a genomic taxonomy of strains was proposed.
Based on the contributions and concepts presented above, several case studies were carried out: identification and characterisation of a new species (C. rouxii), previously misidentified as C. diphtheriae; genomic epidemiology of diphtheria in different world regions or clinical sources. These applications of genomic taxonomy in combination with antimicrobial resistance gene detection illustrate the potential of the methods and tools developed during this thesis to support genomic research and surveillance of pathogenic bacteria.
Keywords: pathogen tracking, strain nomenclature, genomic classification, antibiotic resistance
Résumé :
Les maladies infectieuses font partie des préoccupations mondiales en santé publique, en particulier en raison de la résistance aux antimicrobiens chez certaines bactéries pathogènes. L’espèce Klebsiella pneumoniae est identifiée comme l’une des bactéries multirésistantes les plus préoccupantes. Corynebacterium diphtheriae, responsable de la diphtérie, reste largement sensible aux antibiotiques de première intention dont la pénicilline et peut être contrôlée par les vaccins, mais ré-émerge lorsque la couverture vaccinale est insuffisante. Parmi les moyens de contrôle des maladies infectieuses, la détection et l’identification précise de ces agents pathogènes, ainsi que leur suivi épidémiologique, jouent un rôle primordial. La mise en œuvre du séquençage génomique a révolutionné le génotypage bactérien grâce à son haut pouvoir discriminant, qui permet la distinction des agents pathogènes à l’échelle des souches. Le séquençage génomique permet également la détection de variants et de leurs caractéristiques importantes, telles que leur virulence ou leur résistance.
Les travaux de recherche de cette thèse s’articulent sur deux axes principaux.
Le premier axe apporte des analyses bio-informatiques de la structure populationnelle de la résistance aux antibiotiques chez C. diphtheriae. Une étude d’association génomique (GWAS) a été réalisée pour définir les bases moléculaires de la résistance, ainsi que les associations avec la production de toxine diphtérique et d’autres caractéristiques des souches. Un nouveau gène de résistance à la pénicilline a été découvert sur un élément mobile chez C. diphtheriae. Un outil de génotypage a été développé spécifiquement pour C. diphtheriae, pour laquelle les liens entre génotypes et phénotypes cliniques sont mal connus. Cet outil consolide et facilite la détection et le génotypage des principaux facteurs de virulence et des gènes de résistance, ainsi que l’usage des nomenclatures des souches à partir de génomes assemblés. Il permet également de prédire les biovars et la toxicité des souches.
Le second axe est consacré à la taxonomie génomique infra-spécifique. Une nouvelle approche de classification et de nomenclature génomiques est proposée en utilisant comme modèle l’espèce K. pneumoniae. Ces travaux détaillent la conception et l’implémentation d’un système de codes-barres qui combine le regroupement par Single Linkage MultiLevel (MLSL) et les LIN (Life Identification Number) codes, tous deux basés sur le même schéma de typage core-genome MLST (cgMLST). Cette approche taxonomique innovante résulte en une nomenclature infra-spécifique précise et stable, qui est de plus largement déployable chez les autres espèces bactériennes. Une étude de la structure phylogénétique de C. diphtheriae a également été réalisée, avec la mise en œuvre d’un système cgMLST sur la base duquel une taxonomie génomique des souches a été proposée.
Sur la base des nouveaux apports et concepts précédemment exposés, plusieurs études de cas ont été réalisées : mise en évidence et caractérisation d’une nouvelle espèce bactérienne (C. rouxii), précédemment confondue avec C. diphtheriae ; et épidémiologie génomique de la diphtérie dans différentes régions du monde, ou à partir de sources cliniques humaines et animales. Ces applications de la taxonomie génomique associée à la détection des gènes de résistance aux antibiotiques illustrent le potentiel des méthodes et des outils développés durant cette thèse afin de contribuer à la recherche et à la surveillance génomique des bactéries pathogènes.
Mots clés : classification génomique, suivi des pathogènes, nomenclature de souches, résistance aux antibiotiques
Location
Building: Bâtiment Jacques Monod (66)
Room: Amphi Agnès Ullmann
Address: Institut Pasteur, Rue du Docteur Roux, Paris, France