Cerrar pancarta

2022-09-17 13:08:46 By : Ms. Rose wu

Gracias por visitar nature.com.Está utilizando una versión de navegador con soporte limitado para CSS.Para obtener la mejor experiencia, le recomendamos que utilice un navegador más actualizado (o desactive el modo de compatibilidad en Internet Explorer).Mientras tanto, para garantizar un soporte continuo, mostramos el sitio sin estilos ni JavaScript.Nature Communications volumen 13, Número de artículo: 5139 (2022) Citar este artículoLos genomas de referencia específicos de la edad del microbioma intestinal humano pueden proporcionar una mayor resolución para los análisis metagenómicos, incluida la clasificación taxonómica, la investigación genómica a nivel de cepa y la caracterización funcional.Presentamos el catálogo Early-Life Gut Genomes (ELGG) con 32 277 genomas que representan 2172 especies de 6122 metagenomas fecales recolectados de niños menores de 3 años que abarcan el modo de parto, la edad gestacional, el patrón de alimentación y la geografía.El ELGG expandió sustancialmente la diversidad filogenética en un 38 % sobre los genomas microbianos aislados y el panorama genómico del microbioma de la vida temprana al aumentar el reclutamiento de lecturas metagenómicas al 82,8 %.Más del 60% de las especies ELGG carecen de un representante aislado.Los genomas conespecíficos de las especies más abundantes de los niños diferían en diversidad de genes y funciones en comparación con los adultos.Los genomas ELGG codifican más de 80 millones de secuencias de proteínas, formando el catálogo Early-Life Gut Proteins (ELGP) con más de cuatro millones de grupos de proteínas, el 29,5% de los cuales carecían de anotaciones funcionales.Las referencias de ELGG y ELGP brindaron nuevos conocimientos sobre el microbioma intestinal humano en la vida temprana y facilitarán los estudios para comprender el desarrollo y los mecanismos de las alteraciones del microbioma intestinal humano en la vida temprana.Se ha sugerido que el microbioma intestinal humano, el vasto ecosistema microbiano presente en el tracto gastrointestinal, desempeña funciones diversas y cruciales en la salud del huésped y diversas enfermedades a lo largo de la vida1,2.La adquisición y el desarrollo del microbioma intestinal en los primeros años de vida tienen efectos duraderos en la estructura y función de esta comunidad microbiana más adelante en la vida3.A pesar del número cada vez mayor de estudios que brindan información sustancial sobre el microbioma intestinal en la vida temprana4,5,6,7,8,9, los análisis metagenómicos extensos resueltos del genoma del microbioma intestinal en la vida temprana siguen siendo escasos.Tener genomas de referencia extensos y de alta calidad del microbioma intestinal humano en la vida temprana puede mejorar la resolución y precisión de los análisis taxonómicos y funcionales, lo cual es esencial para impulsar futuros estudios de microbioma en la vida temprana.Se han realizado enormes esfuerzos para aumentar la cantidad de genomas de referencia aislados del intestino humano, como el Proyecto del Microbioma Humano (HMP)10, la Colección del Genoma de Bacterias Gastrointestinales Humanas (HGG)11 y la Referencia del Genoma Cultivable (CGR)12, sin embargo , los genomas de referencia actualmente disponibles que representan el microbioma intestinal humano todavía están subrepresentados13,14.Por lo tanto, en paralelo al cultivo, se cree que el ensamblaje de novo de lecturas metagenómicas de escopeta y el agrupamiento en genomas ensamblados por metagenoma (MAG), un enfoque independiente del cultivo y sin referencia, es una estrategia útil para descubrir de manera eficiente la diversidad microbiana potencial que es recalcitrante a los enfoques de cultivo actuales en el laboratorio.El uso de MAG ha proporcionado una expansión masiva del árbol de la vida desde diferentes nichos ambientales15,16,17.Los estudios han descrito algunos de los cambios dinámicos del microbioma, incluida la composición taxonómica y la adaptación funcional específica de la cepa, que se producen durante los primeros años de vida en comparación con la edad adulta18.Por ejemplo, la mayoría de las cepas de Bifidobacterium que dominaron el microbioma intestinal durante la lactancia y se disiparon más tarde en la vida suelen tener una gran cantidad de grupos de genes responsables de la utilización de los oligosacáridos de la leche humana (HMO);mientras que estos grupos de genes ya no están presentes en la mayoría de las cepas de bifidobacterias después del destete19,20.Comprender las diferencias específicas de la cepa en el contenido y la función de los genes también requiere genomas representativos del microbioma intestinal de la vida temprana.Estudios previos de MAG analizaron muestras exclusivamente de fuentes intestinales no humanas21, o del intestino humano pero con una proporción relativamente baja de muestras fecales de vida temprana13,15.Además, la unificación de los genomas intestinales humanos, incluidos los MAG y los genomas aislados, ha brindado sustancialmente nuevos conocimientos sobre la riqueza, la diversidad y la capacidad de cultivo del microbioma intestinal en varios niveles taxonómicos y funcionales22.Sin embargo, actualmente no existe un catálogo a gran escala de MAG disponibles específicamente diseñados para el microbioma intestinal en los primeros años de vida.Por lo tanto, para llenar este vacío, analizamos específicamente 6122 metagenomas fecales de niños menores de los primeros 3 años de vida y generamos un conjunto de 32 277 MAG agrupados en 2172 grupos a nivel de especie junto con 86 678 654 genes que representan 4 036 936 grupos de genes, formando el Catálogos Early-Life Gut Genomes (ELGG) y Proteins (ELGP), respectivamente.Con estas completas colecciones de secuencias, caracterizamos el perfil taxonómico y funcional del microbioma intestinal de la vida temprana a nivel del genoma e interrogamos las variaciones genómicas presentes en el microbioma intestinal de los niños asociadas con varios factores clínicos.Para dilucidar las diferencias en el microbioma intestinal de la vida temprana a nivel del genoma y también para expandir los genomas de nuevos linajes intestinales humanos durante la vida temprana, empleamos una combinación de ensamblaje metagenómico y agrupamiento en 6122 metagenomas distribuidos en varios países en cuatro continentes de niños. desde el nacimiento hasta los tres años (Fig. 1a; Datos complementarios 1).En comparación con los metagenomas que se usaron para construir el Genoma Gastrointestinal Humano Unificado (UHGG)22, los metagenomas de 1904 se superpusieron.Los MAG se produjeron mediante tres herramientas de binning diferentes (es decir, MetaBAT23, MaxBin24 y CONCOCT25), y luego se integraron y refinaron para eliminar duplicados y mejorar la calidad de los genomas ensamblados con metaWRAP26 (Fig. 1b).Después de esta canalización, un total de 42 054 MAG cumplieron o superaron la calidad media (≥50 % de integridad y <10 % de contaminación) según el estándar "información mínima sobre un genoma ensamblado en metagenoma" (mimag)27.para proporcionar control calidad del más estricto, seleccionamos aquellos genomas que tenían una integridad> 50 % y una contaminación < 5 % junto con una puntuación de calidad del genoma (definida como integridad: 5 × contaminación, QS) > 50 y sin quimerismo (aprobado por GUNC28) , lo que resultó en 32,277 MAG para análisis posteriores, al que nos referimos como el catálogo ELGG (Fig. 1c, d; Datos complementarios 2).El tamaño medio de los 32.277 MAG fue de 2,59 megabases (Mb) (rango intercuartílico, IQR = 2,08–3,75 MB) con valores de N50 entre 1,7 kilobases y 2,8 Mb.En el catálogo de ELGG, 25 303 MAG (que representan el 78,4 % del conjunto de datos total) estaban >90 % completos (IQR = 97,3–99,7 %) y <5 % contaminados (iqr = 0,00–1,04 %), en lo sucesivo denominados 'casi genomas "completos".un subconjunto de 4614 mag (18,2% los casi completos) tenía genes rrna 5 s, 16 s y 23 así como al menos 18 trna estándar, que pueden clasificarse preliminares "alta calidad" según el estándar mimag27.la proporción relativamente baja recuperados alta calidad fue comparable con estudios previos a gran escala intestinales humanos13,22 debido desafío típico ensamblados partir metagenomas lecturas cortas.el resto del catálogo elgg consta 6974 media (>50 % de integridad y <5 % de contaminación) (fig. 1d).las otras estadísticas del genoma (incluido el número contig y n50, la profundidad abundancia relativa) respaldaron alta calidad constante los mag casi completos en comparación con media, incluso cuando estos últimos se estratificaron según qs umbral 75 ( figura 1c).a proporción metagenomas fecales estratificados por características clínicas que incluyen edad, género, modo parto, edad gestacional patrones alimentación.b descripción general canalización computacional para generar catálogos elgg elgp.c métricas completo (n =25 303), medio puntuación (qs)> 75 (n = 2063) y medio con QS ≤ 75 (n = 4911).CPM copias por millón de lecturas.Los recuadros muestran el rango intercuartílico (IQR), con la línea horizontal como la mediana, los bigotes que indican el rango de los datos (hasta 1,5 × IQR) y los puntos más allá de los bigotes como valores atípicos.d Puntuaciones de integridad y contaminación para cada uno de los 32 277 genomas.QS = integridad–5 × contaminación.En línea con estudios previos15,22, el catálogo ELGG se investigó más a fondo a nivel de heterogeneidad de cepas por genoma mediante el uso de CMSeq15, que se ha sugerido que representa una medida útil para evaluar la calidad del genoma.Descubrimos que la heterogeneidad de cepa mediana (proporción de posiciones polimórficas) de los genomas del catálogo ELGG fue del 0,005 % (IQR = 0,001–0,031 %; Fig. 1c), que es mucho menor que el catálogo UHGG (0,06 %) que incluía el muestras de intestino humano de todas las edades22.Los genomas casi completos mostraron un nivel más bajo de heterogeneidad de cepas en comparación con los genomas de calidad media del catálogo ELGG (Fig. 1c).Para ampliar nuestra comprensión de las funciones del microbioma intestinal en la vida temprana, se predijeron las secuencias de codificación de proteínas (CDS) para cada una de las 32 277 MAG, lo que dio como resultado un total de 86 678 654 genes.Esto representó el 54,9% de todos los genes cuando se tomaron en cuenta los contigs no agrupados de las 6122 muestras metagenómicas.Después de agrupar las secuencias de proteínas con una identidad de aminoácidos del 95%, obtuvimos 4.036.936 grupos de proteínas, formando el catálogo ELGP.El análisis de rarefacción indicó que aún no se alcanzó un punto de saturación ya que la cantidad de grupos ELGP aumentó constantemente en función de la cantidad de MAG incluidos (Fig. 2a), y este patrón también se observó con la inclusión de todos los contigs de 6122 muestras (Suplementario Fig. 1a), lo cual estaba en línea con observaciones anteriores22,29.Sin embargo, al eliminar los grupos de proteínas con una secuencia de proteínas, la cantidad de grupos de proteínas se acercó a la saturación (Fig. 2a; Fig. 1a complementaria).Esto puede sugerir que aunque los genes microbianos del microbioma intestinal de los niños todavía se subestiman, es probable que la mayoría de los genes no descubiertos sean raros.Además, comparamos nuestro catálogo de genes de vida temprana con la gran base de datos de proteínas, Proteína gastrointestinal humana unificada (UHGP), que incluye principalmente genes microbianos del intestino de adultos y agrupados en un 95% de identidad de proteínas (n = 20,239,340)22.Esto reveló que 2,9 millones de grupos de genes de ELGP se superponían con el catálogo de UHGP, pero había una gran proporción (27,3 %, n = 1 076 116) de ELGP no representada en UHGP, y el número total de proteínas de 1 076 116 grupos representaba 5,4 % cuando se tienen en cuenta los 86 678 654 genes que subyacen a la singularidad del microbioma intestinal de los niños.Entre los representantes de grupos de proteínas exclusivamente de ELGP o UHGP, el 27,6 % (n = 296 624) y el 30,1 % (n = 3 972 835) de los representantes estaban anotados respectivamente con una función conocida, y el resto de los grupos eran proteínas putativas o hipotéticas (Fig. 2b).Por lo tanto, nuestros resultados proporcionan una colección completa del espacio proteico del microbioma intestinal en etapas tempranas de la vida que puede servir como referencia para la investigación del microbioma intestinal en etapas tempranas de la vida.un análisis de rarefacción de la cantidad de grupos de proteínas del microbioma intestinal de la vida temprana con una identidad de aminoácidos del 95 % en función de la cantidad de genomas incluidos.Las curvas se representan para todos los grupos de proteínas y después de excluir los grupos de proteínas individuales (que contienen solo una secuencia de proteínas).b Superposición entre ELGP (naranja) y UHGP (azul), ambos agrupados en un 95 % de identidad de aminoácidos.Las barras en la parte inferior indican el número de proteínas que codifican los representantes del grupo de tres categorías (exclusivo de ELGP, superposición y exclusivo de UHGP), estratificados como proteínas conocidas, putativas e hipotéticas.c Número de proteínas con anotación funcional en las cinco categorías funcionales y su grado de superposición.Las barras verticales representan el número de proteínas únicas (color) para cada categoría funcional o compartidas (negras) entre las categorías funcionales específicas.Las barras horizontales en el panel inferior indican el número total de proteínas con anotación funcional en cada categoría funcional.d Dinámica de la tasa de caracterización de proteínas de ELGP junto con la edad de los niños.e Anotación funcional COG del catálogo ELGP agrupado en 95% de identidad de aminoácidos.Solo se representan las funciones con >5000 genes.f Dinámica de la tasa de anotación funcional COG del catálogo ELGP agrupado al 95 % de identidad de aminoácidos en respuesta a la edad de los niños.Las barras verticales de izquierda a derecha representan la edad de los niños a los 0, 1, 3, 6, 12, 18, 24, 30 y 36 meses.El asterisco (*) indica la diferencia significativa (prueba de Wilcoxon de dos colas, FDR < 0,05) entre la tasa de anotación funcional COG del catálogo ELGP al nacer y niños de 36 meses.Para dilucidar mejor la diversidad funcional del microbioma intestinal de la vida temprana, anotamos las funciones genéticas del catálogo ELGP con las bases de datos actualmente disponibles, incluidos los grupos de genes ortólogos (COG), los módulos KEGG, las categorías de la Comisión de enzimas (EC) de nivel 4, Gene Ontologías (GOs) y enzimas activas de carbohidratos (CAZy).Descubrimos que un total del 70,5 % de los genes de ELGP coincidían con al menos una de las bases de datos de COG (n = 2 844 021 genes en 24 categorías funcionales), EC (n = 722 946 genes que coinciden con 2658 enzimas), KEGG (n = 533 759 genes de 674 módulos), GO (n = 256 861 genes de 10 461 grupos ortólogos) y CAZy (n = 46 392 genes que coinciden con 104 familias) (Fig. 2c).Estos resultados mostraron que se anotó una mediana del 88,7 % (IQR = 85,9–91,0 %) de los genes por genoma en la ELGG, y esta tasa fue menor en los genomas de niños a los 36 meses de edad (una mediana del 89,1 % al nacer vs. 86,5% a los 36 meses, modelo lineal, p < 0,0001) (fig. 2d).Según la distribución de las funciones de los COG que coincidían con la mayor cantidad de genes ELGP, los genes más abundantes con una función conocida presente en el ELGP estaban involucrados en la transcripción, replicación/recombinación/reparación, biogénesis de la pared celular/membrana/envoltura y transporte de carbohidratos y metabolismo (Fig. 2e).Las familias más representadas de EC, KEGG y GO fueron ADN helicasa (EC: 3.6.4.12), M00178 (ribosoma, bacteria) y proceso biológico (GO: 0008150).La familia de hidrolasas de glucósido predominante en el catálogo de ELGP fue GH13, dirigida a la hidrólisis de una amplia gama de glucanos simples y complejos, incluidos di, oligo y polisacáridos, así como sustratos relacionados, como almidón, amilosa y pululano30 (Fig. .1b).Nuevamente observamos que la mayoría de las categorías de COG investigadas (11/19) estaban bien caracterizadas en los primeros meses y luego disminuyeron gradualmente a medida que los niños envejecían (es decir, prueba de Wilcoxon, FDR <0.05, en comparación con el gen anotado por genomas desde el nacimiento hasta el de ≥36 meses) (Fig. 2f).Para explorar la cantidad de especies cultivables que se incluyeron en el catálogo de ELGG, agrupamos 32 277 MAG junto con 187 555 genomas de referencia aislados de NCBI RefSeq y dos estudios de cultivo de intestino humano11,12.Los grupos a nivel de especie (SGB para contenedores de genoma a nivel de especie) se calcularon utilizando un enfoque basado en la distancia de varios pasos con al menos un 95 % de identidad de nucleótidos promedio (ANI) y al menos un 30 % de superposición de la fracción de alineación (AF) (Métodos) .Se generaron un total de 23 307 SGB y los MAG del catálogo ELGG se distribuyeron en 2172 SGB (Fig. 3; Datos complementarios 3).Entre los 2172 SGB, solo 774 SGB contenían genomas de referencia aislados (denominados cSGB para SGB cultivados) que contenían 86 283 genomas de referencia aislados y 29 367 MAG.Una gran proporción del 99,8 % (n = 86 132) de 86 238 genomas de referencia aislados estaban casi completos (Fig. 2 complementaria).Los otros 1398 SGB contenían exclusivamente 2910 MAG en total (denominados uSGB para SGB no cultivados), lo que indica que el 64,4% de los ELGG SGB (9% del total de MAG) carecen de genomas aislados (Fig. 3a).En comparación con los 4644 representantes de UHGG que utilizaron un límite de distancia de 0,05 (95 % ANI), el 13,4 % de los SGB de ELGG no coincidieron con UHGG.Al contar el número de MAG dentro de cada SGB, se observó que los cSGB representaban los grupos más grandes, mientras que los uSGB tendían a ser los más raros, con 1003 de uSGB representados por un solo genoma, lo que estaba en línea con los estudios previos que reconstruían MAG a partir de la microbiota ambiental y asociada al huésped15,16,22.Curiosamente, los cSGB con> 50% de MAG superaron en número a los uSGB con 0-50% de MAG para grupos que contienen tres o más genomas, lo que subraya el poder de descubrimiento de grandes cohortes metagenómicas (Fig. 3b).La diversidad filogenética microbiana humana de la vida temprana de los SGB bacterianos 2171 aumentó en un 38% con los uSGB, lo que indica la utilidad de estos genomas para mejorar la clasificación de secuencias del microbioma de la vida temprana (Fig. 3c).La mediana de las distancias por pares de los genomas dentro de los SGB fue de 0,020 (IQR = 0,014–0,029) cuando se incluyeron referencias y MAG, y de 0,020 (IQR = 0,013–0,029) cuando solo se consideraron los MAG.a Superposición de SGB que contienen tanto MAG como genomas de referencia aislados.Los SGB que contienen MAG y genomas de referencia se denominan SGB cultivados (cSGB), los SGB sin genomas de referencia se denominan SGB no cultivados (uSGB) y los que contienen exclusivamente genomas de referencia se denominan SGB no tempranos.b El número de cSGB y uSGB en función del número de genoma dentro de cada SGB.La puntuación no cultivada se calcula como la proporción de MAG en el total de genomas pertenecientes a ese SGB.c El árbol filogenético del microbioma intestinal de los primeros años de vida construido con 2171 genomas bacterianos representativos del catálogo ELGG.d El número de taxones cultivados en diferentes resoluciones de 2172 genomas representativos.e Se mostró el número de MAG en cada SGB y solo los 40 SGB más representados.Se representa gráficamente el factor clínico (es decir, modo de parto, edad gestacional y edad) relacionado con las MAG por especie.Además, anotamos taxonómicamente cada especie representativa utilizando el Genome Taxonomy Database Toolkit (GTDB-Tk) basado en la base de datos GTDB que consta de> 311,000 genomas bacterianos y> 6000 arqueas que se componen de genomas aislados, MAG y genomas amplificados.Encontramos que el catálogo ELGG cubría 14 filos conocidos (13 para bacterias y 1 para arqueas), 18 clases conocidas (17 para bacterias y 1 para arqueas), 55 órdenes conocidas (54 para bacterias y 1 para arqueas) y 382 géneros conocidos. (381 para bacterias y 1 para arqueas) (Fig. 3d; Datos complementarios 3).Además, todavía había 214 uSGB, incluidos 339 MAG, que no estaban clasificados a nivel de especie, lo que indica la falta de representación microbiana en la base de datos GTDB actual.Los cinco principales géneros clasificados por uSGB fueron Collinsella (71 uSGB con 143 MAG), Streptococcus (33 uSGB con 43 MAG), Haemophilus D (13 uSGB con 17 MAG), Veillonella (13 uSGB con 14 MAG) y Bifidobacterium (9 uSGB con 14 MAG). 16 MAG).En comparación con la colección UHGG que se compone principalmente de genomas microbianos de adultos22, el filo Firmicutes_A (705 SGB con 7765 MAG en el catálogo de ELGG) ocupó la mayor proporción de SGB en microbiomas intestinales de niños y adultos, seguido de Firmicutes (390 SGB, 7102 MAG), Actinobacteriota (359 SGB, 6188 MAG), Proteobacteria (336 SGB, 5409 MAG) y Firmicutes_C (165 SGB, 2007 MAG) (Fig. 3a complementaria).Todos estos cinco filos principales en el microbioma intestinal de los niños estuvieron representados por más del 60% de los uSGB (Figura complementaria 3b).Cuando se comparó con una resolución taxonómica más alta, se observó una clara diferencia entre la microbiota intestinal de niños y adultos.Los MAG ensamblados a partir del microbioma intestinal de los niños consistían principalmente en el género Streptococcus (164 SGB, 2112 MAG), Collinsella (129 SGB, 534 MAG), Veillonella (89 SGB, 1501 MAG), Haemophilus D (78 SGB, 418 MAG) y Bifidobacterium (58 SGB, 4604 MAG) (Fig. 3a complementaria);mientras que los principales géneros del catálogo de la UHGG fueron Collinsella, Prevotella, Streptococcus, Bacteroides y Alistipes.A nivel de especie, los SGB más representados en el catálogo de ELGG fueron Escherichia coli, Enterococcus faecalis, Bifidobacterium longum, Staphylococcus epidermidis y Bifidobacterium breve, que diferían completamente de los genomas del catálogo de UHGG (Fig. 3e).Además, estratificamos los MAG dentro de cada especie según el modo de parto [vaginal y cesárea (cesárea)], la edad gestacional (a término y prematuros) y la edad de los niños en el momento del muestreo.Los MAG pertenecientes a las especies E. faecalis, S. epidermidis, Clostridium spp., Veillonella spp., Klebsiella spp. y Streptococcus vestibularis fueron reconstruidos principalmente de niños nacidos por cesárea y/o prematuros.Estas especies son potencialmente patógenas y comúnmente asociadas al ambiente hospitalario4,31.La mayoría de estos MAG se derivaron de muestras fecales recolectadas durante el primer año de vida, lo que destaca la especificidad del catálogo ELGG para el microbioma intestinal de los primeros años de vida.En particular, algunos MAG no se reconstruyeron desde los primeros meses después del nacimiento, sino que se obtuvieron en un momento posterior, como Anaerostipes hadrus y Ruminococcus_E bromli_B.El análisis de rarefacción del número total de SGB en función del número de MAG indicó que la especie del catálogo ELGG no se ha acercado a la saturación, lo que destaca que aún quedan más especies por descubrir en el microbioma intestinal de los niños (Fig. 3c complementaria).Sin embargo, de acuerdo con el análisis de rarefacción basado en genomas del catálogo UHGG22, este estado no saturado se atribuyó principalmente a miembros raros de la microbiota intestinal, ya que había 1206 SGB con solo un MAG del catálogo ELGG (Figura complementaria 3d).Al considerar solo los SGB que contienen al menos dos MAG conespecíficos, el número de especies estaba mucho más cerca de la saturación (Fig. 3c complementaria).Al observar la prevalencia geográfica de los SGB en cada continente (es decir, Asia, Europa, América del Norte y Oceanía), las especies más prevalentes en todo el mundo incluyeron E. coli, B. longum y E. faecalis (Fig. 4 complementaria).Mientras tanto, hubo una serie de SGB con varias tasas de prevalencia en cada continente.Por ejemplo, las especies de Clostridium spp., Klebsiella michiganensis, Citrobacter freundii y Clostridioides difficile fueron más prevalentes en las muestras de América del Norte, lo que puede atribuirse a la alta proporción (77 %) de muestras fecales recolectadas de niños prematuros.Para investigar la reproducibilidad de los SGB del catálogo ELGG, agrupamos el subconjunto de MAG con >50 % de integridad del genoma y <5 % de contaminación y libres de quimerismo de un conjunto común de 941 metagenomas de Bäckhed et al.32 y Vatanen et al. 33 que estaban disponibles en otros dos estudios MAG intestinales humanos previos (es decir, Nayfach et al.13 y Pasolli et al.15) (Datos complementarios 4).Se aplicaron diferentes enfoques de ensamblaje y clasificación en los tres estudios, es decir, Pasolli et al.ensamblado y agrupado con metaSPAdes y MetaBAT2;Nayfach et al.usó MegaHIT y una combinación de MaxBin2, MetaBAT2, CONCOCT y DAS Tool para ensamblaje, clasificación y refinamiento.Observamos que el patrón del número de MAG producido a partir de cada muestra fue consistente en los tres estudios, pero se observó un ligero aumento (prueba de Wilcoxon, p < 0,01) en el número total de MAG con nuestra tubería (n = 5203) en comparación con Nayfach et al.(n = 4284) y Pasolli et al.(n = 4728), respectivamente (Fig. 5a complementaria).Al calcular la proporción de SGB compartidos por muestra con otro estudio (denominado similitud de SGB, Métodos), la mediana de la similitud de SGB del estudio actual en comparación con los otros dos estudios anteriores alcanzó el 100 % tanto para Nayfach et al. al., y Pasolli et al.(Fig. 5b complementaria).Además, los MAG conespecíficos reconstruidos a partir de las mismas muestras por diferentes estudios tenían una mediana de ANI y AF de 99,9 % y 93,9 %, respectivamente (95,0 % AF con MAG casi completos y 85,3 % AF con MAG de calidad media; Figura complementaria 5c ).Estos resultados sugieren una alta reproducibilidad de las herramientas populares de ensamblaje y binning utilizadas en reconstrucciones genómicas a gran escala, en línea con comparaciones previas22.Bifidobacterium representa el género dominante en la microbiota intestinal de los niños y es conocido como el miembro microbiano pionero que influye en la sucesión de la microbiota y la capacidad del huésped para utilizar HMO prebióticos en una etapa temprana de la vida.Recientemente se ha indicado que el agotamiento de Bifidobacterium o de sus genes para la utilización de HMO está implicado en la inflamación sistémica del huésped y el desequilibrio inmunitario34.Con base en la anotación GTDB, ampliamos en gran medida la diversidad de Bifidobacterium dentro de las especies en un rango de 4 (B. longum) a 12 (Bifidobacterium kashiwanohense) veces en comparación con los genomas de referencia pertenecientes a los ocho principales SGB de Bifidobacterium que contenían más de 100 MAG.El SGB más grande es B. longum con 296 genomas de referencia y 1306 MAG agregados, seguido de B. breve (107 genomas de referencia; 830 MAG), Bifidobacterium bifidum (91 genomas de referencia; 823 MAG) y Bifidobacterium pseudocatenulatum (77 genomas de referencia; 446 MAG) (Fig. 4a).El pan-genoma de cada SGB se define como la suma de los genes, incluidos los genes básicos y accesorios de todos los genomas dentro de ese SGB35.El ELGG aumentó el tamaño del pan-genoma por especie hasta un rango de 5385 (Bifidobacterium dentium con 2337 exclusivamente de MAG) a 10,759 (B. longum con 3522 exclusivamente de MAG) que fueron más altos que los genomas de referencia (Fig. 4b ).Esto puede indicar la gran proporción de funciones metabólicas de bifidobacterias que no se han descubierto en base a los enfoques de cultivo actuales.Al cuantificar la abundancia de estos genomas en las muestras metagenómicas, encontramos que la abundancia relativa de especies de bifidobacterias disminuyó a medida que los niños tenían entre el nacimiento y los 3 años (Fig. 4d).Además, encontramos un nivel más bajo de heterogeneidad de cepas en muestras de vida temprana (primeros 6 meses), lo que puede reflejar los componentes dietéticos relativamente simples (p. ej., lactancia materna) en este período.a El número de genomas estratificados por MAG y genomas de referencia.b El gráfico de pan-genoma representado por el número acumulado de genes en función del número de genomas estratificados por MAG y genomas de referencia.c La tasa de anotación funcional en las bases de datos de COG, KEGG, GO, EC y CAZy para cada especie estratificada por genes básicos y accesorios.El número entre paréntesis indica el número de genes con anotación funcional.d Dinámica de la abundancia relativa y heterogeneidad de cepas de MAG en respuesta a la edad de los niños.e El número de genes homólogos coincidentes con un grupo de genes bien caracterizado responsable de la utilización de HMO de cada especie.Los recuadros muestran el rango intercuartílico (IQR), con la línea vertical como la mediana, los bigotes que indican el rango de los datos (hasta 1,5 × IQR) y los puntos más allá de los bigotes como valores atípicos.f El glicobioma (columnas) coloreado por el número de genes por genoma (filas) de cada especie anotado con la base de datos CAZy.Se traza el valor escalado log10 (después de agregar un pseudorrecuento de 1 × 10−5 para evitar valores no finitos resultantes de un gen cero).A continuación, anotamos funcionalmente los pan-genomas de cada especie de Bifidobacterium mapeándolos en la amplia gama de bases de datos que incluyen COG, KEGG, GO, EC y CAZy, y encontramos que una proporción de genes entre 30.9% (para B. dentium ) y el 39,2% (para Bifidobacterium adolescenciais) carecían de coincidencia con alguna base de datos.Cuando estratificamos los genes como básicos y accesorios, la mayoría de los genes no coincidentes eran accesorios (solo una proporción de 56.0–64.6% de genes coincidentes), y más del 92% de los genes centrales estaban anotados (Fig. 4c).Según las categorías de COG, la replicación / recombinación / reparación, el transporte y el metabolismo de carbohidratos, la transcripción y el transporte y el metabolismo de aminoácidos fueron las funciones conocidas más prevalentes (Fig. 6a complementaria).Además, un total de 271 módulos KEGG fueron codificados por las ocho especies de bifidobacterias presentes en ELGG (Figura complementaria 6b; Datos complementarios 5), con las funciones principales relacionadas con el sistema de transporte de azúcar múltiple (M00207), estructura ribosómica (M00178) , sistema de transporte ABC putativo (M00258) y sistema de transporte de rafinosa/estaquiosa/melibiosa (M00196), lo que refleja sus altas capacidades de metabolismo de carbohidratos.Como los principales degradadores microbianos de carbohidratos en el tracto gastrointestinal temprano en la vida, perfilamos aún más el glicobioma de las especies de bifidobacterias en función de los perfiles CAZy (Fig. 4f).Se observaron un total de 26 glucósidos hidrolasas (GH), 7 glicosiltransferasas (GT), dos módulos de unión a carbohidratos (CBM) y una carbohidrato esterasa (CE) en ocho especies de bifidobacterias, incluidos genomas de referencia y MAG.En particular, GH13 (seguido de GT2, GT4, GH3 y GH31) fueron las familias CAZy más prevalentes dentro del glicobioma bifidobacteriano, que ha demostrado tener la capacidad de descomponer una amplia gama de carbohidratos dominantes en la dieta30.En comparación con los genomas de referencia, los MAG en el ELGG se anotaron con familias de genes superiores y/o distintas involucradas en el metabolismo de los carbohidratos.Por ejemplo, los MAG de B. bifidum contienen 27 familias CAZy, 10 de las cuales no se encontraron en los genomas aislados de referencia.Las familias CAZy presentes en MAG pero ausentes en los genomas aislados de referencia incluyeron GH3, GH5, GH9, GH43, GH127, GH38, CE10, GH8, CBM6 y GH94.Teniendo en cuenta la lactancia materna durante la infancia, exploramos más a fondo el potencial funcional de los MAG en términos de utilización de HMO al investigar la presencia de un grupo de genes descrito como involucrado en el transporte y la degradación de HMO en B. infantis (ATCC 15967).Los MAG del clado de la subespecie B. longum, B. infantis, portaban una gran cantidad de homólogos de HMO (236 de 261 MAG tenían al menos 15 homólogos, lo que representa el 50% del grupo de genes HMO) (Fig. 4e), mientras que solo dos MAG de B. longum portaban un grupo de genes relacionados con el metabolismo de HMO, lo que indica la capacidad distinta en la utilización de HMO de especies de bifidobacterias.Al comparar la abundancia relativa de B. infantis con otros genomas de B. longum, se observó una mayor abundancia (prueba de Wilcoxon, p < 0,0001) de B. infantis en todos los continentes excepto en Oceanía (Fig. 6c complementaria), lo que indica la ventaja competitiva de cepas de B. infantis en la vida temprana que puede ser conferida por la presencia del grupo de genes HMO.Para evaluar qué tan representativo es ELGG como referencia genómica para los metagenomas del intestino humano en la vida temprana, comparamos la tasa de mapeo de 353 muestras fecales de niños envejecidas dentro de los primeros 3 años con el catálogo de ELGG y otras dos colecciones de referencia a gran escala, es decir, CIBIO (n = 4930)15 y UHGG (n = 4644)22.Usando Bowtie2, obtuvimos una tasa de mapeo mediana de 82,8% (IQR = 72,7–88,8%) con el catálogo ELGG.Este nivel de clasificación fue superior al obtenido con los catálogos CIBIO y UHGG [69,5% (RIC = 61,1-76,4%) y 71,2% (RIC = 62,1-77,8%) respectivamente;Prueba de Wilcoxon, p <0,0001] (Fig. 7a complementaria; Datos complementarios 6).Más información sobre el diseño de la investigación está disponible en el Resumen de informes de investigación de Nature vinculado a este artículo.Nat.comúnZheng, D., Liwinski, T. & Elinav, E. Interacción entre la microbiota y la inmunidad en la salud y la enfermedad.Resolución celularWang, S. et al.Nat.comúnHill, CJ et al.Tendencias Genet.Un catálogo de genomas de referencia del microbioma humano.Ciencia 328, 994–999 (2010).Forster, SC et al.Nat.Biotecnología.Nat.Biotecnología.et al.Nat.Microbiol.Nat.Biotecnología.Nat.Biotecnología.Nat.Microbiol.Nat.Microbiol.Un catálogo unificado de 204 938 genomas de referencia del microbioma intestinal humano.Nat.Biotecnología.Nat.Nat.Biotecnología.Genoma Biol.Qin, J. et al.Un catálogo de genes microbianos del intestino humano establecido por secuenciación metagenómica.Naturaleza 464, 59–65 (2010).Tendencias Microbiol.Nat.comúnBackheed, F. et al.Korpela, K. et al.La suplementación con probióticos restaura la composición y función normal de la microbiota en los lactantes tratados con antibióticos y nacidos por cesárea.Microbioma 6, 182 (2018).Nat.Medicina.Korpela, K. et al.PLoS Med.Historia natural del microbioma intestinal infantil e impacto del tratamiento con antibióticos en la diversidad y estabilidad de las cepas bacterianas.cienciaTraducirMedicina.Genoma Res.25, 1043–1055 (2015).Lowe, TM & Eddy, SR tRNAscan-SE: un programa para mejorar la detección de genes de ARN de transferencia en la secuencia genómica.Ácidos Nucleicos Res.25, 955–964 (1997).Genoma Biol.Estado J.suaveNat.Biotecnología.Genoma Biol.mol.Biol.Evol.Ácidos Nucleicos Res.Ácidos Nucleicos Res.Alcock, BP et al.CARD 2020: vigilancia del resistoma antibiótico con la base de datos integral de resistencia a los antibióticos.Ácidos Nucleicos Res.48, D517–D525 (2020).Soy.Estadística(2019).Departamento de Medicina Veterinaria, Universidad de Cambridge, Cambridge, Reino UnidoTambién puede buscar este autor en PubMed Google ScholarTambién puede buscar este autor en PubMed Google ScholarTambién puede buscar este autor en PubMed Google ScholarTambién puede buscar este autor en PubMed Google ScholarTambién puede buscar este autor en PubMed Google ScholarTambién puede buscar este autor en PubMed Google ScholarTambién puede buscar este autor en PubMed Google ScholarTambién puede buscar este autor en PubMed Google ScholarTodos los autores leyeron, editaron y aprobaron el manuscrito.Los autores declaran no tener conflictos de intereses.Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios.Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material.Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor.Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedItAl enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad.Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.Regístrese para recibir el boletín informativo Nature Briefing: lo que importa en ciencia, gratis en su bandeja de entrada todos los días.