Recombination in pe/ppe genes contributes to genetic variation in Mycobacterium tuberculosis lineages
ppe gene
Epidemiology
genotype
major histocompatibility antigen
FOS: Health sciences
Gene
Epitopes
bacterial genome
Pathology
genetics
Phylogeny
Tuberculosis Lineage
Recombination, Genetic
epitope
genetic recombination
https://purl.org/pe-repo/ocde/ford#1.06.07
Bacterial
Life Sciences
Genomics
3. Good health
Multigene Family
sequence alignment
Medicine
570
Genotype
Evolution
DNA sequence
610
gene sequence
Microbiology
Article
Variable Selective Pressure
Diagnosis, Treatment, and Epidemiology of Nontuberculous Mycobacterial Diseases
Evolution, Molecular
03 medical and health sciences
Genetic
Health Sciences
genomics
Genetics
Tuberculosis
procedures
Polymorphism
Molecular Biology
Biology
molecular evolution
bacterium isolate
Molecular
DNA
Proline-glutamate (PE and PPE)
bacterial DNA
Genomics/methods
genetic selection
Genes
FOS: Biological sciences
Mutation
Gene expression
mutation
0301 basic medicine
protein binding
phylogeny
Vaccines -- Design
single nucleotide polymorphism
vaccine
genetic variability
proline
Ribosome Structure and Translation Mechanisms
Genome
Single Nucleotide
Proline Glutamate
pe gene
DNA, Bacterial/genetics
Infectious Diseases
Mycobacterium tuberculosis/genetics
glutamic acid
bacterial gene
Biotechnology
Research Article
DNA, Bacterial
Polymorphism, Single Nucleotide
Mycobacterium
Biochemistry, Genetics and Molecular Biology
Major Histocompatibility Complex Molecule
Genetic variation
Selection, Genetic
multigene family
Mycobacterium tuberculosis -- Genetic aspects
nonhuman
Mycobacterium tuberculosis -- Vaccination
DNA microarray
Mycobacterium Tuberculosis Complex
Bacteriology
Sequence Analysis, DNA
Mycobacterium tuberculosis
gene structure
Recombination
Genes, Bacterial
Genome, Bacterial
DOI:
10.1186/s12864-016-2467-y
Publication Date:
2016-02-28T23:33:53Z
AUTHORS (30)
ABSTRACT
Approximately 10 % of the Mycobacterium tuberculosis genome is made up of two families of genes that are poorly characterized due to their high GC content and highly repetitive nature. The PE and PPE families are typified by their highly conserved N-terminal domains that incorporate proline-glutamate (PE) and proline-proline-glutamate (PPE) signature motifs. They are hypothesised to be important virulence factors involved with host-pathogen interactions, but their high genetic variability and complexity of analysis means they are typically disregarded in genome studies. To elucidate the structure of these genes, 518 genomes from a diverse international collection of clinical isolates were de novo assembled. A further 21 reference M. tuberculosis complex genomes and long read sequence data were used to validate the approach. SNP analysis revealed that variation in the majority of the 168 pe/ppe genes studied was consistent with lineage. Several recombination hotspots were identified, notably pe_pgrs3 and pe_pgrs17. Evidence of positive selection was revealed in 65 pe/ppe genes, including epitopes potentially binding to major histocompatibility complex molecules. This, the first comprehensive study of the pe and ppe genes, provides important insight into M. tuberculosis diversity and has significant implications for vaccine development.<br/>يتكون ما يقرب من 10 ٪ من جينوم المتفطرة السلية من عائلتين من الجينات التي تتميز بشكل سيئ بسبب محتواها العالي من GC وطبيعتها المتكررة للغاية. تتميز عائلات PE و PPE بمجالات N - terminal المحفوظة للغاية والتي تتضمن زخارف توقيع proline - glutamate (PE) و proline - proline - glutamate (PPE). من المفترض أن تكون عوامل ضراوة مهمة مرتبطة بتفاعلات المضيف الممرض، ولكن تنوعها الوراثي العالي وتعقيد التحليل يعني أنه يتم تجاهلها عادة في دراسات الجينوم. لتوضيح بنية هذه الجينات، تم تجميع 518 جينومًا من مجموعة دولية متنوعة من العزلات السريرية من جديد. تم استخدام 21 مرجعًا إضافيًا لجينومات M. Tuberculosis المعقدة وبيانات تسلسل القراءة الطويلة للتحقق من صحة النهج. كشف تحليل SNP أن التباين في غالبية جينات pe/ppe البالغ عددها 168 جينًا التي تمت دراستها كان متسقًا مع النسب. تم تحديد العديد من النقاط الساخنة لإعادة التركيب، ولا سيما pe_pgrs3 و pe_pgrs17. تم الكشف عن دليل على الانتقاء الإيجابي في 65 جينًا من جينات pe/ppe، بما في ذلك الحواتم التي يحتمل أن تكون مرتبطة بالجزيئات المعقدة الرئيسية للتوافق النسيجي. توفر هذه، وهي أول دراسة شاملة لجينات PE و PEP، نظرة ثاقبة مهمة حول تنوع مرض السل، ولها آثار كبيرة على تطوير اللقاحات.<br/>Environ 10 % du génome de Mycobacterium tuberculosis est constitué de deux familles de gènes mal caractérisés en raison de leur teneur élevée en GC et de leur nature hautement répétitive. Les familles PE et EPI sont caractérisées par leurs domaines N-terminaux hautement conservés qui incorporent des motifs de signature proline-glutamate (PE) et proline-proline-glutamate (EPI). On suppose qu'ils sont des facteurs de virulence importants impliqués dans les interactions hôte-pathogène, mais leur grande variabilité génétique et la complexité de leur analyse font qu'ils ne sont généralement pas pris en compte dans les études du génome. Pour élucider la structure de ces gènes, 518 génomes d'une collection internationale diversifiée d'isolats cliniques ont été assemblés de novo. 21 autres génomes complexes de référence de M. tuberculosis et des données de séquences lues à long terme ont été utilisés pour valider l'approche. L'analyse SNP a révélé que la variation dans la majorité des 168 gènes pe/ppe étudiés était cohérente avec la lignée. Plusieurs hotspots de recombinaison ont été identifiés, notamment pe_pgrs3 et pe_pgrs17. Des preuves de sélection positive ont été révélées dans 65 gènes pe/ppe, y compris des épitopes se liant potentiellement aux principales molécules du complexe d'histocompatibilité. Cette première étude approfondie des gènes pe et ppe fournit des informations importantes sur la diversité de M. tuberculosis et a des implications importantes pour le développement de vaccins.<br/>Aproximadamente el 10 % del genoma de Mycobacterium tuberculosis está formado por dos familias de genes que están mal caracterizados debido a su alto contenido de GC y su naturaleza altamente repetitiva. Las familias de PE y PPE se caracterizan por sus dominios N-terminales altamente conservados que incorporan motivos distintivos de prolina-glutamato (PE) y prolina-prolina-glutamato (PPE). Se supone que son factores de virulencia importantes involucrados en las interacciones huésped-patógeno, pero su alta variabilidad genética y complejidad de análisis significa que generalmente no se tienen en cuenta en los estudios del genoma. Para dilucidar la estructura de estos genes, se ensamblaron de novo 518 genomas de una diversa colección internacional de aislados clínicos. Se utilizaron otros 21 genomas del complejo de M. tuberculosis de referencia y datos de secuencias de lectura larga para validar el enfoque. El análisis de SNP reveló que la variación en la mayoría de los 168 genes pe/ppe estudiados era consistente con el linaje. Se identificaron varios puntos calientes de recombinación, en particular pe_pgrs3 y pe_pgrs17. Se reveló evidencia de selección positiva en 65 genes pe/ppe, incluidos epítopos que potencialmente se unen a moléculas del complejo mayor de histocompatibilidad. Este, el primer estudio exhaustivo de los genes pe y ppe, proporciona información importante sobre la diversidad de M. tuberculosis y tiene implicaciones significativas para el desarrollo de vacunas.<br/>
SUPPLEMENTAL MATERIAL
Coming soon ....
REFERENCES (59)
CITATIONS (71)
EXTERNAL LINKS
PlumX Metrics
RECOMMENDATIONS
FAIR ASSESSMENT
Coming soon ....
JUPYTER LAB
Coming soon ....