Recombination in pe/ppe genes contributes to genetic variation in Mycobacterium tuberculosis lineages

ppe gene Epidemiology genotype major histocompatibility antigen FOS: Health sciences Gene Epitopes bacterial genome Pathology genetics Phylogeny Tuberculosis Lineage Recombination, Genetic epitope genetic recombination https://purl.org/pe-repo/ocde/ford#1.06.07 Bacterial Life Sciences Genomics 3. Good health Multigene Family sequence alignment Medicine 570 Genotype Evolution DNA sequence 610 gene sequence Microbiology Article Variable Selective Pressure Diagnosis, Treatment, and Epidemiology of Nontuberculous Mycobacterial Diseases Evolution, Molecular 03 medical and health sciences Genetic Health Sciences genomics Genetics Tuberculosis procedures Polymorphism Molecular Biology Biology molecular evolution bacterium isolate Molecular DNA Proline-glutamate (PE and PPE) bacterial DNA Genomics/methods genetic selection Genes FOS: Biological sciences Mutation Gene expression mutation 0301 basic medicine protein binding phylogeny Vaccines -- Design single nucleotide polymorphism vaccine genetic variability proline Ribosome Structure and Translation Mechanisms Genome Single Nucleotide Proline Glutamate pe gene DNA, Bacterial/genetics Infectious Diseases Mycobacterium tuberculosis/genetics glutamic acid bacterial gene Biotechnology Research Article DNA, Bacterial Polymorphism, Single Nucleotide Mycobacterium Biochemistry, Genetics and Molecular Biology Major Histocompatibility Complex Molecule Genetic variation Selection, Genetic multigene family Mycobacterium tuberculosis -- Genetic aspects nonhuman Mycobacterium tuberculosis -- Vaccination DNA microarray Mycobacterium Tuberculosis Complex Bacteriology Sequence Analysis, DNA Mycobacterium tuberculosis gene structure Recombination Genes, Bacterial Genome, Bacterial
DOI: 10.1186/s12864-016-2467-y Publication Date: 2016-02-28T23:33:53Z
ABSTRACT
Approximately 10 % of the Mycobacterium tuberculosis genome is made up of two families of genes that are poorly characterized due to their high GC content and highly repetitive nature. The PE and PPE families are typified by their highly conserved N-terminal domains that incorporate proline-glutamate (PE) and proline-proline-glutamate (PPE) signature motifs. They are hypothesised to be important virulence factors involved with host-pathogen interactions, but their high genetic variability and complexity of analysis means they are typically disregarded in genome studies. To elucidate the structure of these genes, 518 genomes from a diverse international collection of clinical isolates were de novo assembled. A further 21 reference M. tuberculosis complex genomes and long read sequence data were used to validate the approach. SNP analysis revealed that variation in the majority of the 168 pe/ppe genes studied was consistent with lineage. Several recombination hotspots were identified, notably pe_pgrs3 and pe_pgrs17. Evidence of positive selection was revealed in 65 pe/ppe genes, including epitopes potentially binding to major histocompatibility complex molecules. This, the first comprehensive study of the pe and ppe genes, provides important insight into M. tuberculosis diversity and has significant implications for vaccine development.<br/>يتكون ما يقرب من 10 ٪ من جينوم المتفطرة السلية من عائلتين من الجينات التي تتميز بشكل سيئ بسبب محتواها العالي من GC وطبيعتها المتكررة للغاية. تتميز عائلات PE و PPE بمجالات N - terminal المحفوظة للغاية والتي تتضمن زخارف توقيع proline - glutamate (PE) و proline - proline - glutamate (PPE). من المفترض أن تكون عوامل ضراوة مهمة مرتبطة بتفاعلات المضيف الممرض، ولكن تنوعها الوراثي العالي وتعقيد التحليل يعني أنه يتم تجاهلها عادة في دراسات الجينوم. لتوضيح بنية هذه الجينات، تم تجميع 518 جينومًا من مجموعة دولية متنوعة من العزلات السريرية من جديد. تم استخدام 21 مرجعًا إضافيًا لجينومات M. Tuberculosis المعقدة وبيانات تسلسل القراءة الطويلة للتحقق من صحة النهج. كشف تحليل SNP أن التباين في غالبية جينات pe/ppe البالغ عددها 168 جينًا التي تمت دراستها كان متسقًا مع النسب. تم تحديد العديد من النقاط الساخنة لإعادة التركيب، ولا سيما pe_pgrs3 و pe_pgrs17. تم الكشف عن دليل على الانتقاء الإيجابي في 65 جينًا من جينات pe/ppe، بما في ذلك الحواتم التي يحتمل أن تكون مرتبطة بالجزيئات المعقدة الرئيسية للتوافق النسيجي. توفر هذه، وهي أول دراسة شاملة لجينات PE و PEP، نظرة ثاقبة مهمة حول تنوع مرض السل، ولها آثار كبيرة على تطوير اللقاحات.<br/>Environ 10 % du génome de Mycobacterium tuberculosis est constitué de deux familles de gènes mal caractérisés en raison de leur teneur élevée en GC et de leur nature hautement répétitive. Les familles PE et EPI sont caractérisées par leurs domaines N-terminaux hautement conservés qui incorporent des motifs de signature proline-glutamate (PE) et proline-proline-glutamate (EPI). On suppose qu'ils sont des facteurs de virulence importants impliqués dans les interactions hôte-pathogène, mais leur grande variabilité génétique et la complexité de leur analyse font qu'ils ne sont généralement pas pris en compte dans les études du génome. Pour élucider la structure de ces gènes, 518 génomes d'une collection internationale diversifiée d'isolats cliniques ont été assemblés de novo. 21 autres génomes complexes de référence de M. tuberculosis et des données de séquences lues à long terme ont été utilisés pour valider l'approche. L'analyse SNP a révélé que la variation dans la majorité des 168 gènes pe/ppe étudiés était cohérente avec la lignée. Plusieurs hotspots de recombinaison ont été identifiés, notamment pe_pgrs3 et pe_pgrs17. Des preuves de sélection positive ont été révélées dans 65 gènes pe/ppe, y compris des épitopes se liant potentiellement aux principales molécules du complexe d'histocompatibilité. Cette première étude approfondie des gènes pe et ppe fournit des informations importantes sur la diversité de M. tuberculosis et a des implications importantes pour le développement de vaccins.<br/>Aproximadamente el 10 % del genoma de Mycobacterium tuberculosis está formado por dos familias de genes que están mal caracterizados debido a su alto contenido de GC y su naturaleza altamente repetitiva. Las familias de PE y PPE se caracterizan por sus dominios N-terminales altamente conservados que incorporan motivos distintivos de prolina-glutamato (PE) y prolina-prolina-glutamato (PPE). Se supone que son factores de virulencia importantes involucrados en las interacciones huésped-patógeno, pero su alta variabilidad genética y complejidad de análisis significa que generalmente no se tienen en cuenta en los estudios del genoma. Para dilucidar la estructura de estos genes, se ensamblaron de novo 518 genomas de una diversa colección internacional de aislados clínicos. Se utilizaron otros 21 genomas del complejo de M. tuberculosis de referencia y datos de secuencias de lectura larga para validar el enfoque. El análisis de SNP reveló que la variación en la mayoría de los 168 genes pe/ppe estudiados era consistente con el linaje. Se identificaron varios puntos calientes de recombinación, en particular pe_pgrs3 y pe_pgrs17. Se reveló evidencia de selección positiva en 65 genes pe/ppe, incluidos epítopos que potencialmente se unen a moléculas del complejo mayor de histocompatibilidad. Este, el primer estudio exhaustivo de los genes pe y ppe, proporciona información importante sobre la diversidad de M. tuberculosis y tiene implicaciones significativas para el desarrollo de vacunas.<br/>
SUPPLEMENTAL MATERIAL
Coming soon ....
REFERENCES (59)
CITATIONS (71)
EXTERNAL LINKS
PlumX Metrics
RECOMMENDATIONS
FAIR ASSESSMENT
Coming soon ....
JUPYTER LAB
Coming soon ....