Hvala što ste posjetili Nature.com.Koristite verziju preglednika s ograničenom CSS podrškom.Za najbolje iskustvo preporučujemo da koristite ažurirani preglednik (ili onemogućite način kompatibilnosti u Internet Exploreru).Osim toga, kako bismo osigurali stalnu podršku, web stranicu prikazujemo bez stilova i JavaScripta.
Klizači koji prikazuju tri članka po slajdu.Za pomicanje kroz slajdove koristite gumbe Natrag i Sljedeće ili gumbe za upravljanje slajdovima na kraju za kretanje kroz svaki slajd.
Detaljan opis proizvoda
304 Zavarena namotana cijev od nehrđajućeg čelika
1. Specifikacija: Zavojna cijev / cijevi od nehrđajućeg čelika
2. Tip: zavareni ili bešavni
3. Standard: ASTM A269, ASTM A249
4. Zavojna cijev od nehrđajućeg čelika OD: 6 mm do 25,4 mm
5. Duljina: 600-3500MM ili prema zahtjevu kupca.
6. Debljina stijenke: 0,2 mm do 2,0 mm.
7. Tolerancija: OD: +/-0,01 mm;Debljina: +/-0,01%.
8. Veličina unutarnje rupe zavojnice: 500MM-1500MM (može se prilagoditi prema zahtjevima kupca)
9. Visina zavojnice: 200MM-400MM (može se prilagoditi prema zahtjevima kupca)
10. Površina: Svijetla ili žarena
11. Materijal: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, legura 625, 825, 2205, 2507, itd.
12. Pakiranje: tkane vrećice u drvenoj kutiji, drvenoj paleti, drvenoj osovini ili prema zahtjevu kupca
13. Ispitivanje: kemijska komponenta, granica razvlačenja, vlačna čvrstoća, mjerenje tvrdoće
14. Jamstvo: Inspekcija treće strane (na primjer: SGS TV), itd.
15. Primjena: Dekoracija, namještaj, transport nafte, izmjenjivač topline, izrada ograda, izrada papira, automobili, prerada hrane, medicina itd.
Sav kemijski sastav i fizikalna svojstva za nehrđajući čelik kao što je prikazano ispod:
Materijal | ASTM A269 Kemijski sastav % Maks | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | NB | Nb | Ti | |
TP304 | 0,08 | 2,00 | 0,045 | 0,030 | 1,00 | 18,0-20,0 | 8,0-11,0 | ^ | ^ | ^ . | ^ |
TP304L | 0,035 | 2,00 | 0,045 | 0,030 | 1,00 | 18,0-20,0 | 8,0-12,0 | ^ | ^ | ^ | ^ |
TP316 | 0,08 | 2,00 | 0,045 | 0,030 | 1,00 | 16,0-18,0 | 10,0-14,0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0,035 D | 2,00 | 0,045 | 0,030 | 1,00 | 16,0-18,0 | 10,0-15,0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0,08 | 2,00 | 0,045 | 0,030 | 1,00 | 17,0-19,0 | 9,0-12,0 | ^ | ^ | ^ | 5C -0,70 |
TP347 | 0,08 | 2,00 | 0,045 | 0,030 | 1,00 | 17,0-19,0 | 9,0-12,0 | 10C -1.10 | ^ |
Materijal | Toplinska obrada | Temperatura F (C) Min. | Tvrdoća | |
Brinell | Rockwell | |||
TP304 | Riješenje | 1900 (1040) | 192HBW/200HV | 90HRB |
TP304L | Riješenje | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316 | Riješenje | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316L | Riješenje | 1900 (1040) | 192HBW/200HV | 90HRB |
TP321 | Riješenje | 1900 (1040) F | 192HBW/200HV | 90HRB |
TP347 | Riješenje | 1900 (1040) | 192HBW/200HV | 90HRB |
OD, inč | OD tolerancija inča (mm) | Tolerancija težine % | Tolerantna duljina inča (mm) | |
+ | - | |||
≤ 1/2 | ± 0,005 (0,13) | ± 15 | 1/8 (3,2) | 0 |
> 1/2 ~1 1/2 | ± 0,005(0,13) | ± 10 | 1 / 8 (3,2) | 0 |
> 1 1/2 ~< 3 1/2 | ± 0,010(0,25) | ± 10 | 3 / 16 (4,8) | 0 |
> 3 1/2 ~< 5 1/2 | ± 0,015(0,38) | ± 10 | 3 / 16 (4,8) | 0 |
> 5 1 / 2 ~< 8 | ± 0,030(0,76) | ± 10 | 3 / 16 (4,8) | 0 |
8~< 12 | ± 0,040(1,01) | ± 10 | 3 / 16 (4,8) | 0 |
12~< 14 | ± 0,050 (1,26) | ± 10 | 3 / 16 (4,8) | 0 |
Prirodne mikrobne zajednice su filogenetski i metabolički raznolike.Osim nedovoljno proučenih skupina organizama1, ova raznolikost također ima bogat potencijal za otkriće ekološki i biotehnološki značajnih enzima i biokemijskih spojeva2,3.Međutim, proučavanje ove raznolikosti kako bi se odredili genomski putevi koji sintetiziraju takve spojeve i vežu ih na njihove domaćine ostaje izazov.Biosintetski potencijal mikroorganizama u otvorenom oceanu ostaje uglavnom nepoznat zbog ograničenja u analizi podataka razlučivosti cijelog genoma na globalnoj razini.Ovdje istražujemo raznolikost i raznolikost biosintetskih klastera gena u oceanu integracijom oko 10 000 mikrobnih genoma iz uzgojenih stanica i pojedinačnih stanica s više od 25 000 novo rekonstruiranih nacrta genoma iz više od 1 000 uzoraka morske vode.Ovi su napori identificirali oko 40 000 navodnih uglavnom novih biosintetskih klastera gena, od kojih su neki pronađeni u prethodno neslućenim filogenetskim skupinama.U tim smo populacijama identificirali lozu obogaćenu biosintetskim klasterima gena ("Candidatus Eudormicrobiaceae") koji su pripadali nekultiviranom bakterijskom tipu i uključivali neke od biosintetski najrazličitijih mikroorganizama u ovom okruženju.Od njih smo okarakterizirali puteve fosfataze-peptida i pitonamida, identificirajući primjere neobične strukture bioaktivnog spoja i enzimologije.Zaključno, ova studija pokazuje kako strategije temeljene na mikrobiomu mogu omogućiti istraživanje prethodno neopisanih enzima i prirodne hrane u slabo razumljivoj mikrobioti i okolišu.
Mikrobi pokreću globalne biogeokemijske cikluse, održavaju hranidbene mreže i održavaju zdravlje biljaka i životinja5.Njihova ogromna filogenetska, metabolička i funkcionalna raznolikost predstavlja bogat potencijal za otkrivanje novih taksona1, enzima i biokemijskih spojeva, uključujući prirodne proizvode6.U ekološkim zajednicama ove molekule mikroorganizmima osiguravaju niz fizioloških i ekoloških funkcija, od komunikacije do natjecanja 2, 7 .Uz svoje izvorne funkcije, ovi prirodni proizvodi i njihovi genetski kodirani proizvodni putovi pružaju primjere za biotehnološke i terapeutske primjene2,3.Identifikacija takvih putova i veza uvelike je olakšana proučavanjem uzgojenih mikroba.Međutim, taksonomske studije prirodnih okoliša pokazale su da velika većina mikroorganizama nije kultivirana8.Ova kulturološka predrasuda ograničava našu sposobnost iskorištavanja funkcionalne raznolikosti koju kodiraju mnogi mikrobi4,9.
Kako bi se prevladala ta ograničenja, tehnološki napredak u proteklom desetljeću omogućio je istraživačima da izravno (tj. bez prethodne kulture) sekvenciraju fragmente mikrobne DNA iz cijelih zajednica (metagenomika) ili pojedinačnih stanica.Sposobnost sastavljanja tih fragmenata u veće fragmente genoma i rekonstruiranja višestrukih metagenomski sastavljenih genoma (MAG) ili pojedinačnih pojačanih genoma (SAG), otvara važnu priliku za taksocentrična istraživanja mikrobioma (tj. mikrobnih zajednica i mikrobioma).utrti nove staze.vlastiti genetski materijal u određenom okruženju) 10,11,12.Doista, nedavne studije uvelike su proširile filogenetsku reprezentaciju mikrobne raznolikosti na Zemlji1, 13 i otkrile velik dio funkcionalne raznolikosti u pojedinačnim mikrobnim zajednicama koje prethodno nisu bile pokrivene kultiviranim referentnim sekvencama genoma mikroorganizama (REFs)14.Sposobnost postavljanja neotkrivene funkcionalne raznolikosti u kontekst genoma domaćina (tj. razlučivost genoma) ključna je za predviđanje još neokarakteriziranih mikrobnih linija koje vjerojatno kodiraju nove prirodne proizvode15,16 ili za praćenje takvih spojeva do njihovog izvornog proizvođača17.Na primjer, kombinirani pristup metagenomske i genomske analize jedne stanice doveo je do identifikacije Candidatus Entotheonella, skupine metabolički bogatih bakterija povezanih sa spužvom, kao proizvođača različitih potencijala za lijekove18.Međutim, unatoč nedavnim pokušajima genomskog istraživanja različitih mikrobnih zajednica,16,19 više od dvije trećine globalnih metagenomskih podataka za najveći Zemljin ocean ekosustava16,20 još uvijek nedostaje.Stoga, općenito, biosintetski potencijal morskog mikrobioma i njegov potencijal kao spremišta novih enzimatskih i prirodnih proizvoda ostaju uglavnom nedovoljno istraženi.
Kako bismo istražili biosintetski potencijal morskih mikrobioma na globalnoj razini, prvo smo spojili genome morskih mikroba dobivene korištenjem metoda ovisnih o kulturi i metodama koje nisu vezane uz kulturu kako bismo stvorili opsežnu bazu podataka o filogenetici i funkciji gena.Ispitivanje ove baze podataka otkrilo je veliki izbor biosintetskih klastera gena (BGC), od kojih većina pripada još neobilježenim obiteljima klastera gena (GCF).Osim toga, identificirali smo nepoznatu obitelj bakterija koja pokazuje najveću poznatu raznolikost BGC-a u otvorenom oceanu do danas.Odabrali smo dva puta ribosomske sinteze i post-translacijsko modificiranog peptida (RiPP) za eksperimentalnu validaciju na temelju njihovih genetskih razlika u odnosu na trenutno poznate putove.Funkcionalna karakterizacija ovih putova otkrila je neočekivane primjere enzimologije, kao i strukturno neobične spojeve s inhibicijskim djelovanjem na proteazu.
Isprva nam je bio cilj stvoriti globalni izvor podataka za analizu genoma, usredotočujući se na njegove bakterijske i arhealne komponente.U tu smo svrhu prikupili metagenomske podatke i 1038 uzoraka morske vode s 215 globalno raspoređenih mjesta uzorkovanja (raspon geografske širine = 141,6°) i nekoliko dubokih slojeva (od 1 do 5600 m dubine, koji pokrivaju pelagičku, mezopelagičku i abisalne zone).Pozadina 21, 22, 23 (Slika 1a, prošireni podaci, Slika 1a i Dodatna tablica 1).Uz pružanje široke geografske pokrivenosti, ovi selektivno filtrirani uzorci omogućili su nam da usporedimo različite komponente morskog mikrobioma, uključujući one bogate virusima (<0,2 µm), bogate prokariotima (0,2–3 µm), bogate česticama (0,8 µm ).–20 µm) i kolonije osiromašene virusom (>0,2 µm).
a, Ukupno 1038 javno dostupnih genoma (metagenomika) morskih mikrobnih zajednica prikupljenih s 215 globalno raspoređenih lokacija (62°S do 79°N i 179°W do 179°E.).Pločice karte © Esri.Izvori: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ i Esri.b, ti su metagenomi korišteni za rekonstrukciju MAG-ova (metode i dodatne informacije), koji se razlikuju u količini i kvaliteti (metode) u skupovima podataka (označenih bojom).Rekonstruirani MAG-ovi dopunjeni su javno dostupnim (vanjskim) genomima, uključujući ručno izrađene MAG26, SAG27 i REF.27 Kompajlirajte OMD.c, u usporedbi s prethodnim izvješćima koja se temelje samo na SAG (GORG)20 ili MAG (GEM)16, OMD poboljšava genomsku karakterizaciju morskih mikrobnih zajednica (stopa mapiranja metagenomskog čitanja; metoda) za dva do tri puta s dosljednijom zastupljenošću u dubini i zemljopisna širina..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30-60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD grupiranje u klastere vrsta (95% prosječne identičnosti nukleotida) identificira ukupno približno 8300 vrsta, od kojih više od polovice prethodno nije bilo karakterizirano prema taksonomskim bilješkama koristeći GTDB (verzija 89) e, klasifikacija vrsta prema tipu genoma pokazala je da se MAG, SAG i REF dobro nadopunjuju u odražavanju filogenetske raznolikosti morski mikrobiom.Konkretno, 55%, 26% i 11% vrsta bilo je specifično za MAG, SAG i REF.ŠIŠIŠI, Bermudski Atlantski vremenski niz;GEM, genomi mikrobioma Zemlje;GORG, referentni genom globalnog oceana;HOT, vremenska serija Havajskog oceana.
Koristeći ovaj skup podataka, rekonstruirali smo ukupno 26 293 MAG-a, uglavnom bakterijskih i arhealnih (Slika 1b i prošireni podaci, Slika 1b).Stvorili smo ove MAG-ove iz sklopova iz odvojenih, a ne objedinjenih metagenomskih uzoraka kako bismo spriječili kolaps prirodne varijacije slijeda između uzoraka s različitih lokacija ili vremenskih točaka (metoda).Osim toga, grupirali smo genomske fragmente na temelju njihove korelacije prevalencije u velikom broju uzoraka (od 58 do 610 uzoraka, ovisno o istraživanju; metodi).Utvrdili smo da je ovo dugotrajan, ali važan korak24 koji je preskočen u nekoliko velikih radova rekonstrukcije MAG16, 19, 25 i značajno poboljšava kvantitetu (u prosjeku 2,7 puta) i kvalitetu (u prosjeku +20%) genom.rekonstruirano iz ovdje proučavanog morskog metagenoma (prošireni podaci, slika 2a i dodatne informacije).Sve u svemu, ovi su napori rezultirali 4,5-strukim povećanjem morskih mikrobnih MAG-ova (6 puta ako se uzmu u obzir samo visokokvalitetni MAG-ovi) u usporedbi s najopsežnijim izvorom MAG-ova dostupnim danas16 (Metode).Ovaj novostvoreni MAG set zatim je kombiniran s 830 ručno odabranih MAG26, 5969 SAG27 i 1707 REF-ova.Dvadeset sedam vrsta morskih bakterija i arheja činilo je kombinatornu zbirku od 34 799 genoma (slika 1b).
Zatim smo procijenili novostvoreni resurs kako bismo poboljšali njegovu sposobnost predstavljanja zajednica morskih mikroba i procijenili utjecaj integracije različitih tipova genoma.U prosjeku smo otkrili da pokriva približno 40-60% morskih metagenomskih podataka (Slika 1c), što je dva do tri puta više od pokrivenosti prethodnih izvješća samo za MAG i po dubini i po geografskoj širini Više serija 16 ili SAG20.Osim toga, za sustavno mjerenje taksonomske raznolikosti u uspostavljenim zbirkama, označili smo sve genome korištenjem alata (metoda) Genome Taxonomy Database (GTDB) i upotrijebili prosječni nukleotidni identitet cijelog genoma od 95%.28 za identifikaciju 8304 klastera vrsta (vrsta).Dvije trećine ovih vrsta (uključujući nove kladuse) prije se nisu pojavile u GTDB-u, od kojih je 2790 otkriveno pomoću MAG-a rekonstruiranog u ovoj studiji (Sl. 1d).Osim toga, otkrili smo da su različite vrste genoma visoko komplementarne: 55%, 26% i 11% vrsta sastavljeno je u potpunosti od MAG, SAG i REF, redom (slika 1e).Osim toga, MAG je pokrio svih 49 vrsta pronađenih u vodenom stupcu, dok su SAG i REF predstavljali samo njih 18, odnosno 11.Međutim, SAG bolje predstavlja raznolikost najčešćih kladusa (prošireni podaci, slika 3a), kao što su Pelagic Bacteriales (SAR11), pri čemu SAG pokriva gotovo 1300 vrsta, a MAG samo 390 vrsta.Naime, REF-ovi su se rijetko preklapali s MAG-ovima ili SAG-ovima na razini vrste i predstavljali su >95% od približno 1000 genoma koji nisu pronađeni u metagenomskim skupovima otvorenog oceana koji su ovdje proučavani, uglavnom zbog interakcija s drugim vrstama izoliranih reprezentativnih morskih uzoraka (npr. sedimenti) .ili domaćin-suradnik).Kako bi bio široko dostupan znanstvenoj zajednici, ovaj izvor morskog genoma, koji također uključuje neklasificirane fragmente (npr. iz predviđenih faga, genomskih otoka i fragmenata genoma za koje nema dovoljno podataka za MAG rekonstrukciju), može se usporediti s taksonomskim podacima .Pristupite komentarima zajedno s funkcijom gena i kontekstualnim parametrima u Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Zatim smo krenuli u istraživanje bogatstva i novosti biosintetskog potencijala u mikrobiomima otvorenog oceana.U tu smo svrhu prvo upotrijebili antiSMASH za sve MAG-ove, SAG-ove i REF-ove pronađene u 1038 morskih metagenoma (metoda) kako bismo predvidjeli ukupno 39 055 BGC-ova.Zatim smo ih grupirali u 6907 neredundantnih GCF-ova i 151 populaciju klastera gena (GCC; Dodatna tablica 2 i metode) kako bismo uzeli u obzir inherentnu redundanciju (tj. isti BGC može biti kodiran u više genoma) i metagenomske podatke Fragmentacija koncentriranih BGC-ova.Nepotpuni BGC-ovi nisu značajno povećali, ako ih ima (dodatne informacije), broj GCF-ova odnosno GCC-ova koji sadrže barem jednog netaknutog člana BGC-a u 44% i 86% slučajeva.
Na razini GCC-a pronašli smo veliki izbor predviđenih RiPP-ova i drugih prirodnih proizvoda (slika 2a).Među njima, primjerice, arilpolieni, karotenoidi, ektoini i siderofori pripadaju GCC-ima sa širokom filogenetskom distribucijom i visokom zastupljenošću u oceanskim metagenomima, što može ukazivati na široku prilagodbu mikroorganizama na morski okoliš, uključujući otpornost na reaktivne kisikove spojeve, oksidativni i osmotski stres..ili apsorpciju željeza (više informacija).Ova funkcionalna raznolikost u suprotnosti je s nedavnom analizom približno 1,2 milijuna BGC među približno 190 000 genoma pohranjenih u bazi podataka NCBI RefSeq (BiG-FAM/RefSeq, u daljnjem tekstu RefSeq)29, koja je pokazala da neribosomski peptidi sintetaze (NRPS) i poliketid sintaza (PKS) BGCs (dodatne informacije).Također smo pronašli 44 (29%) GCC-a koji su samo daleko povezani s bilo kojim RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; Slika 2a i metode) i 53 (35%) GCC-a samo u MAG-u, naglašavajući potencijal za otkrivanje dosad neopisanih kemikalija u OMD-u.S obzirom na to da svaki od ovih GCC-ova vjerojatno predstavlja vrlo različite biosintetske funkcije, dodatno smo analizirali podatke na razini GCF-a u nastojanju da pružimo detaljnije grupiranje BGC-ova za koje je predviđeno da kodiraju slične prirodne proizvode29.Ukupno 3861 (56%) identificiranih GCF-ova nije se preklapao s RefSeqom, a >97% GCF-ova nije bilo prisutno u MIBiG-u, jednoj od najvećih baza podataka eksperimentalno validiranih BGC-ova (Slika 2b).Iako nije iznenađujuće otkriti mnoge potencijalne nove putove u okruženjima koja nisu dobro predstavljena referentnim genomom, naša metoda za dereplikaciju BGC-a u GCF-ove prije usporedne analize razlikuje se od prethodnih izvješća 16 i omogućuje nam da pružimo nepristranu procjenu novosti.Većina nove raznolikosti (3012 GCF ili 78%) odgovara predviđenim terpenima, RiPP-u ili drugim prirodnim proizvodima, a većina (1815 GCF ili 47%) je kodirana u nepoznatim tipovima zbog njihovog biosintetskog potencijala.Za razliku od klastera PKS i NRPS, manje je vjerojatno da će ovi kompaktni BGC biti fragmentirani tijekom metagenomske montaže 31 i omogućuju funkcionalnu karakterizaciju njihovih proizvoda koja zahtijeva više vremena i resursa.
Ukupno 39.055 BGC-ova grupirano je u 6.907 GCF-ova i 151 GCC-ova.a, prikaz podataka (unutarnji vanjski).Hijerarhijsko grupiranje BGC udaljenosti na temelju GCC-a, od kojih 53 popravlja samo MAG.GCC sadrži BGC iz različitih taksona (ln-transformirana frekvencija vrata) i različite klase BGC (veličina kruga odgovara njegovoj frekvenciji).Za svaki GCC, vanjski sloj predstavlja broj BGC-ova, prevalenciju (postotak uzoraka) i udaljenost (minimalna kosinusna udaljenost BGC-a (min(dMIBiG))) od BiG-FAM-a do BGC-a.GCC s BGC-ovima koji su blisko povezani s eksperimentalno provjerenim BGC-ovima (MIBiG) označeni su strelicama.b Uspoređujući GCF s predviđenim (BiG-FAM) i eksperimentalno potvrđenim (MIBiG) BGC-ovima, pronađeno je 3861 novih (d–>0,2) GCF-ova.Većina (78%) njih kodira RiPP, terpene i druge navodne prirodne proizvode.c, svi genomi u OMD-u pronađeni u 1038 morskih metagenoma smješteni su u osnovno stablo GTDB-a kako bi se prikazala filogenetska pokrivenost OMD-a.Klade bez genoma u OMD-u prikazane su sivom bojom.Broj BGC-ova odgovara najvećem broju predviđenih BGC-ova po genomu u određenom klasu.Radi jasnoće, zadnjih 15% čvorova je sažeto.Strelice označavaju klade bogate BGC (>15 BGC), s iznimkom Mycobacterium, Gordonia (na drugom mjestu nakon Rhodococcus) i Crocosphaera (na drugom mjestu nakon Synechococcus).d, Nepoznato c.Eremiobacterota je pokazala najveću biosintetsku raznolikost (Shannonov indeks temeljen na vrsti prirodnog proizvoda).Svaki pojas predstavlja genom s najviše BGC-ova u vrsti.T1PKS, PKS tip I, T2/3PKS, PKS tip II i tip III.
Osim bogatstva i novosti, istražujemo biogeografsku strukturu biosintetskog potencijala morskog mikrobioma.Grupiranje uzoraka prema prosječnoj raspodjeli broja kopija metagenomske GCF (metode) pokazalo je da su zajednice niske geografske širine, površine, bogate prokariotima i siromašne virusima, uglavnom iz površinskih ili dubljih voda osunčanih suncem, bile bogate terpenima RiPP i BGC.Nasuprot tome, polarne, dubokomorske zajednice bogate virusima i česticama bile su povezane s većom zastupljenošću NRPS i PKS BGC (prošireni podaci, slika 4 i dodatne informacije).Konačno, otkrili smo da su dobro proučene tropske i pelagičke zajednice izvori novih terpena koji najviše obećavaju (Slika s proširenim podacima).Najveći potencijal za PKS, RiPP i druge prirodne proizvode (Slika 5a s proširenim podacima).
Kako bismo nadopunili našu studiju o biosintetskom potencijalu morskih mikrobioma, nastojali smo mapirati njihovu filogenetsku distribuciju i identificirati nove klade obogaćene BGC-om.U tu smo svrhu smjestili genome morskih mikroba u normalizirano filogenetsko stablo bakterija i arhea GTDB13 i prekrili navodne biosintetske putove koje oni kodiraju (Slika 2c).Lako smo otkrili nekoliko kladusa obogaćenih BGC-om (koje predstavlja više od 15 BGC-ova) u uzorcima morske vode (metodama) poznatim po svom biosintetskom potencijalu, kao što su cijanobakterije (Synechococcus) i bakterije Proteus, kao što je Tistrella32,33, ili su nedavno privukle pozornost svojim prirodni proizvodi.kao što su Myxococcota (Sandaracinaceae), Rhodococcus i Planctomycetota34,35,36.Zanimljivo je da smo pronašli nekoliko prethodno neistraženih linija u tim kladama.Na primjer, one vrste s najbogatijim biosintetskim potencijalom u rodu Planctomycetota i Myxococcota pripadale su neobilježenim redovima kandidata odnosno rodovima (dodatna tablica 3).Sve zajedno, ovo sugerira da OMD omogućuje pristup prethodno nepoznatim filogenetskim informacijama, uključujući mikroorganizme, koji mogu predstavljati nove mete za otkrivanje enzima i prirodnih proizvoda.
Zatim smo okarakterizirali klasu obogaćenu BGC-om ne samo brojanjem maksimalnog broja BGC-ova koje su kodirali njegovi članovi, već i procjenom raznolikosti tih BGC-ova, što objašnjava učestalost različitih vrsta prirodnih proizvoda kandidata (Slika 2c i metode )..Otkrili smo da su biosintetski najrazličitije vrste predstavljene posebno proizvedenim bakterijskim MAG-ovima u ovoj studiji.Ove bakterije pripadaju nekultiviranom tipu Candidatus Eremiobacterota, koji ostaje uglavnom neistražen osim nekoliko genomskih studija37,38.Važno je napomenuti da je “ca.Rod Eremiobacterota analiziran je samo u kopnenom okruženju39 i nije poznato da uključuje članove obogaćene BGC-om.Ovdje smo rekonstruirali osam MAG-ova iste vrste (identitet nukleotida > 99%) 23. Stoga predlažemo naziv vrste "Candidatus Eudoremicrobium malaspinii", nazvan po nereidi (morskoj nimfi), prekrasnom daru u grčkoj mitologiji i ekspedicijama.'Ka.Prema filogenetskoj napomeni 13, E. malaspinii nema prethodno poznatih rođaka ispod razine sekvence i stoga pripada novoj bakterijskoj obitelji koju predlažemo “Ca.E. malaspinii” kao tipsku vrstu i “Ca.Eudormicrobiaceae” kao službeni naziv (dodatne informacije).Kratka metagenomska rekonstrukcija 'Ca.Projekt genoma E. malaspinii potvrđen je vrlo malim unosom, dugo očitanim metagenomskim sekvenciranjem i ciljanim sastavljanjem jednog uzorka (metode) kao jednog linearnog kromosoma od 9,63 Mb s duplikacijom od 75 kb.kao jedinu preostalu nejasnoću.
Kako bismo utvrdili filogenetski kontekst ove vrste, tražili smo 40 blisko povezanih vrsta u dodatnim metagenomskim uzorcima obogaćenim eukariotima iz ekspedicije na ocean Tara kroz ciljanu rekonstrukciju genoma.Ukratko, povezali smo metagenomska čitanja s genomskim fragmentima povezanim s “Ca.E. malaspinii” i pretpostavili da povećana stopa regrutiranja u ovom uzorku ukazuje na prisutnost drugih srodnika (metoda).Kao rezultat, pronašli smo 10 MAG-ova, kombinaciju 19 MAG-ova koji predstavljaju pet vrsta u tri roda unutar novo definirane obitelji (tj. "Ca. Eudormicrobiaceae").Nakon ručnog pregleda i kontrole kvalitete (prošireni podaci, slika 6 i dodatne informacije), ustanovili smo da je “Ca.Vrste Eudormicrobiaceae imaju veće genome (8 Mb) i bogatiji biosintetski potencijal (14 do 22 BGC po vrsti) od ostalih članova "Ca".Clade Eremiobacterota (do 7 BGC) (sl. 3a–c).
a, Filogenetski položaji pet 'Ca.Vrste Eudormicrobiaceae pokazale su bogatstvo BGC specifično za morske linije identificirane u ovoj studiji.Filogenetsko stablo uključuje sve 'Ca.MAG Eremiobacterota i članovi drugih vrsta (brojevi genoma u zagradama) navedeni u GTDB (verzija 89) korišteni su za evolucijsku pozadinu (metode).Najudaljeniji slojevi predstavljaju klasifikacije na razini porodice ("Ca. Eudormicrobiaceae" i "Ca. Xenobiaceae") i na razini klase ("Ca. Eremiobacteria").Pet vrsta opisanih u ovoj studiji predstavljeno je alfanumeričkim kodovima i predloženim binomnim imenima (dodatne informacije).b, u redu.Vrste Eudormicrobiaceae dijele sedam zajedničkih BGC jezgri.Odsutnost BGC u klasu A2 nastala je zbog nepotpunosti reprezentativnog MAG-a (dodatna tablica 3).BGC su specifični za “Ca.Amphithomicrobium” i “Ca.Amphithomicrobium” (klade A i B) nisu prikazane.c, Svi BGC kodirani kao “Ca.Utvrđeno je da je Eudoremicrobium taraoceanii izražen u 623 metatranskriptoma uzetih iz oceana Tare.Puni krugovi označavaju aktivnu transkripciju.Narančasti krugovi označavaju log2-transformirane promjene nabora ispod i iznad stope ekspresije gena za domaćinstvo (metode).d, krivulje relativne abundancije (metode) koje pokazuju 'Ca.Vrste Eudormicrobiaceae rasprostranjene su u većini oceanskih bazena i u cijelom vodenom stupcu (od površine do dubine od najmanje 4000 m).Na temelju ovih procjena, otkrili smo da 'Ca.E. malaspinii' čini do 6% prokariotskih stanica u dubokomorskim zajednicama pelagičnih žitarica.Smatrali smo da je vrsta prisutna na lokaciji ako je pronađena u bilo kojem dijelu veličine određenog dubinskog sloja.IO – Indijski ocean, NAO – Sjeverni Atlantik, NPO – Sjeverni Pacifik, RS – Crveno more, SAO – Južni Atlantik, SO – Južni Ocean, SPO – Južni Pacifik.
Proučavajući brojnost i distribuciju Ca.Eudormicrobiaceae, koji, kako smo utvrdili, prevladava u većini oceanskih bazena, kao iu cijelom vodenom stupcu (Sl. 3d).Lokalno čine 6% zajednice morskih mikroba, što ih čini važnim dijelom globalnog morskog mikrobioma.Osim toga, pronašli smo relativni sadržaj Ca.Vrste Eudormicrobiaceae i njihove razine ekspresije BGC bile su najviše u eukariotskoj obogaćenoj frakciji (Slika 3c i prošireni podaci, Slika 7), što ukazuje na moguću interakciju s česticama, uključujući plankton.Ovo zapažanje ima neke sličnosti s 'Ca.Eudoremicrobium BGC koji proizvode citotoksične prirodne proizvode poznatim putovima mogu pokazivati predatorsko ponašanje (Dodatne informacije i prošireni podaci, slika 8), slično drugim predatorima koji specifično proizvode metabolite kao što je Myxococcus41.Otkriće Ca.Eudormicrobiaceae u manje dostupnim (duboki ocean) ili eukariotskim, a ne prokariotskim uzorcima može objasniti zašto te bakterije i njihova neočekivana BGC raznolikost ostaju nejasni u kontekstu istraživanja prirodne hrane.
Naposljetku, nastojali smo eksperimentalno potvrditi obećanje našeg rada temeljenog na mikrobiomu u otkrivanju novih puteva, enzima i prirodnih proizvoda.Među različitim klasama BGC-a, poznato je da RiPP put kodira bogatu kemijsku i funkcionalnu raznolikost zbog različitih post-translacijskih modifikacija jezgrenog peptida od strane zrelih enzima42.Pa smo odabrali dva 'Ca.Eudoremicrobium' RiPP BGC (slike 3b i 4a-e) temelje se na istom kao i svi poznati BGC (\(\bar{d}\)MIBiG i \(\bar{d}\)RefSeq iznad 0,2).
a–c, In vitro heterologna ekspresija i in vitro enzimatski testovi novog (\(\bar{d}\)RefSeq = 0,29) klastera biosinteze RiPP specifičnog za dubokomorske Ca vrste.E. malaspinii' je dovela do proizvodnje difosforiliranih proizvoda.c, modifikacije identificirane pomoću MS/MS visoke rezolucije (HR) (fragmentacija označena b i y ionima u kemijskoj strukturi) i NMR (prošireni podaci, slika 9).d, ovaj fosforilirani peptid pokazuje nisku mikromolarnu inhibiciju elastaze neutrofila sisavaca, koja se ne nalazi u kontrolnom peptidu i dehidrirajućem peptidu (dehidracija izazvana kemijskim uklanjanjem).Eksperiment je ponovljen tri puta sa sličnim rezultatima.Na primjer, heterologna ekspresija drugog novog \(\bar{d}\)RefSeq = 0,33) klastera biosinteze proteina razjašnjava funkciju četiri zrela enzima koji modificiraju peptid jezgre od 46 aminokiselina.Ostaci se boje prema mjestu modifikacije predviđenom HR-MS/MS, označavanjem izotopa i NMR analizom (dodatne informacije).Crtkana boja označava da se modifikacija događa na bilo kojem od dva ostatka.Slika je kompilacija brojnih heterolognih konstrukata za prikaz aktivnosti svih zrelih enzima na istoj jezgri.h, Ilustracija NMR podataka za N-metilaciju osnovnog amida.Puni rezultati prikazani su na sl.10 s proširenim podacima.i, Filogenetski položaj zrelog enzima klastera proteina FkbM među svim domenama FkbM pronađenim u bazi podataka MIBiG 2.0 otkriva enzim ove obitelji s aktivnošću N-metiltransferaze (dodatne informacije).Prikazani su shematski dijagrami BGC (a, e), prekursorskih peptidnih struktura (b, f) i pretpostavljenih kemijskih struktura prirodnih proizvoda (c, g).
Prvi RiPP put (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) pronađen je samo u dubokomorskim vrstama “Ca.E. malaspinii” i šifre za peptid-prekursor (Sl. 4a, b).U ovom zrelom enzimu identificirali smo jednu funkcionalnu domenu homolognu domeni dehidracije lantipeptidne sintaze koja normalno katalizira fosforilaciju i naknadno uklanjanje 43 (dodatne informacije).Stoga predviđamo da modifikacija peptida prekursora uključuje takvu dehidraciju u dva koraka.Međutim, korištenjem tandemske masene spektrometrije (MS/MS) i spektroskopije nuklearne magnetske rezonancije (NMR), identificirali smo polifosforilirani linearni peptid (slika 4c).Iako neočekivano, pronašli smo nekoliko linija dokaza koji potvrđuju da je to krajnji proizvod: dva različita heterologna domaćina i bez dehidracije u in vitro ispitivanjima, identifikacija ključnih ostataka mutiranih na mjestu katalitičke dehidracije zrelog enzima.sve rekonstruirao “Ca”.Genom E. malaspinii (prošireni podaci, slika 9 i dodatne informacije) i, konačno, biološka aktivnost fosforiliranog produkta, ali ne i kemijski sintetiziranog dehidriranog oblika (slika 4d).U stvari, otkrili smo da pokazuje nisku mikromolarnu inhibitornu aktivnost proteaze protiv neutrofilne elastaze, usporedivu s drugim srodnim prirodnim proizvodima u rasponu koncentracija (IC50 = 14,3 μM) 44, unatoč činjenici da ekološku ulogu tek treba razjasniti.Na temelju ovih rezultata, predlažemo da se put nazove "fosfeptin".
Drugi slučaj je složeni RiPP put specifičan za 'Ca.Predviđeno je da rod Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) kodira prirodne proteinske proizvode (slika 4e).Ti su putovi od posebnog biotehnološkog interesa zbog očekivane gustoće i raznolikosti neobičnih kemijskih modifikacija koje uspostavljaju enzimi kodirani relativno kratkim BGCs45.Otkrili smo da se ovaj protein razlikuje od prethodno karakteriziranih proteina po tome što mu nedostaje i glavni NX5N motiv policeramida i lantioninska petlja landornamida 46 .Kako bismo prevladali ograničenja uobičajenih heterolognih obrazaca ekspresije, upotrijebili smo ih zajedno s prilagođenim sustavom Microvirgula aerodenitrificans za karakterizaciju četiri zrela enzima puta (metode).Koristeći kombinaciju MS/MS, označavanja izotopa i NMR-a, otkrili smo ove zrele enzime u jezgri peptida od 46 aminokiselina (Slika 4f,g, prošireni podaci, Slike 10-12 i dodatne informacije).Među zrelim enzimima, okarakterizirali smo prvo pojavljivanje člana obitelji FkbM O-metiltransferaze 47 u RiPP putu i neočekivano otkrili da ovaj zreli enzim uvodi okosnicu N-metilacije (Slika 4h, i i dodatne informacije).Iako je ova modifikacija poznata u prirodnim proizvodima NRP48, enzimska N-metilacija amidnih veza je složena, ali biotehnološki značajna reakcija49 koja je dosad bila od interesa za RiPP obitelj borozina.Specifičnost 50,51.Identifikacija ove aktivnosti u drugim obiteljima enzima i RiPP-a može otvoriti nove primjene i proširiti funkcionalnu raznolikost proteina 52 i njihovu kemijsku raznolikost.Na temelju identificiranih modifikacija i neobične duljine predložene strukture proizvoda, predlažemo naziv puta "pitonamid".
Otkriće neočekivane enzimologije u funkcionalno karakteriziranoj obitelji enzima ilustrira obećanje ekološke genomike za nova otkrića, a također ilustrira ograničenu sposobnost funkcionalnog zaključivanja samo na temelju homologije sekvence.Stoga, zajedno s izvješćima o nekanonskim bioaktivnim polifosforiliranim RiPP-ovima, naši rezultati pokazuju resursno intenzivnu, ali kritičnu vrijednost za napore sintetske biologije da u potpunosti otkrije funkcionalno bogatstvo, raznolikost i neobične strukture biokemijskih spojeva.
Ovdje demonstriramo raspon biosintetskog potencijala kodiranog mikrobima i njihov genomski kontekst u globalnom morskom mikrobiomu, olakšavajući buduća istraživanja tako što rezultirajući resurs stavljamo na raspolaganje znanstvenoj zajednici (https://microbiomics.io/ocean/).Otkrili smo da se velik dio njegove filogenetske i funkcionalne novosti može postići samo rekonstrukcijom MAG-ova i SAG-ova, osobito u nedovoljno iskorištenim mikrobnim zajednicama koje bi mogle usmjeravati buduće napore bioprospekcije.Iako ćemo se ovdje usredotočiti na 'Ca.Eudormicrobiaceae” kao loza posebno biosintetski “talentirana”, mnogi BGC-ovi predviđeni u neotkrivenoj mikrobioti vjerojatno kodiraju prethodno neopisane enzimologije koje daju spojeve s ekološki i/ili biotehnološki značajnim djelovanjem.
Metagenomski skupovi podataka iz velikih oceanografskih studija i studija vremenskih serija s dovoljnom dubinom sekvenciranja uključeni su kako bi se povećala pokrivenost globalnih morskih mikrobnih zajednica u oceanskim bazenima, dubokim slojevima i tijekom vremena.Ovi skupovi podataka (dodatna tablica 1 i slika 1) uključuju metagenomiju iz uzoraka prikupljenih u oceanima Tare (obogaćeni virusima, n=190; obogaćeni prokariotima, n=180)12,22 i ekspediciju BioGEOTRACES (n=480).Havajski oceanski vremenski niz (HOT, n = 68), Bermudsko-atlantski vremenski niz (BATS, n = 62)21 i ekspedicija Malaspina (n = 58)23.Čitanja sekvenciranja iz svih metagenomskih fragmenata filtrirana su za kvalitetu korištenjem BBMap (v.38.71) uklanjanjem adaptera za sekvenciranje iz čitanja, uklanjanjem čitanja mapiranih na sekvence kontrole kvalitete (PhiX genomi) i korištenjem trimq=14, maq=20 odbacuje lošu kvalitetu čitanja, maxns = 0 i minlength = 45. Naknadne analize su pokrenute ili spojene s QC očitanjima ako je navedeno (bbmerge.sh minoverlap=16).QC očitanja su normalizirana (bbnorm.sh target = 40, minddepth = 0) prije izgradnje pomoću metaSPAdes (v.3.11.1 ili v.3.12 ako je potrebno)53.Rezultirajući kontigi skele (u daljnjem tekstu skele) konačno su filtrirani prema duljini (≥1 kb).
1038 metagenomskih uzoraka podijeljeno je u skupine, a za svaku skupinu uzoraka, metagenomska očitanja kontrole kvalitete svih uzoraka usklađena su sa zagradama svakog uzorka zasebno, što je rezultiralo sljedećim brojem uparenih grupnih očitanja: Tara Marine Virusi – obogaćeni (190×190 ), Prokarioti obogaćeni (180×180), BioGEOTRACES, HOT i BATS (610×610) i Malaspina (58×58).Mapiranje je učinjeno korištenjem Burrows-Wheeler-Alignera (BWA) (v.0.7.17-r1188)54 koji omogućuje uparivanje očitanja sa sekundarnim mjestima (koristeći oznaku -a).Poravnanja su filtrirana tako da budu duga najmanje 45 baza, imaju ≥97% identiteta i raspon ≥80% čitanja.Rezultirajuće BAM datoteke obrađene su pomoću skripte jgi_summarize_bam_contig_depths za MetaBAT2 (v.2.12.1)55 kako bi se osigurala pokrivenost unutar i između uzoraka za svaku skupinu.Konačno, zagrade su grupirane kako bi se povećala osjetljivost pojedinačnim pokretanjem MetaBAT2 na svim uzorcima s –minContig 2000 i –maxEdges 500. Koristimo MetaBAT2 umjesto ansambl boksača jer se u neovisnim testovima pokazalo da je najučinkovitiji pojedinačni boksač.i 10 do 50 puta brži od ostalih uobičajeno korištenih boksača57.Kako bi se testirao učinak korelacije izdašnosti, nasumično odabran poduzorak metagenomije (10 za svaki od dva skupa podataka o oceanu Tara, 10 za BioGEOTRACES, 5 za svaku vremensku seriju i 5 za Malaspinu) dodatno je koristio samo uzorke.Interni uzorci su grupirani kako bi se dobile informacije o pokrivenosti.(Dodatne informacije).
Dodatni (vanjski) genomi uključeni su u kasniju analizu, naime 830 ručno odabranih MAG-ova iz podskupa skupa podataka Tara Oceans26, 5287 SAG-ova iz skupa podataka GORG20 i podaci iz MAR baze podataka (MarDB v. 4) iz 1707 izoliranih REF-ova i 682 SAG) 27. Za skup podataka MarDB, genomi se odabiru na temelju dostupnih metapodataka ako tip uzorka odgovara sljedećem regularnom izrazu: '[S|s]single.?[C|c]ell|[C|c]ulture| [I|i] izoliran'.
Kvaliteta svakog metagenomskog spremnika i vanjskih genoma procijenjena je pomoću CheckM-a (v.1.0.13) i Anvi'o's Lineage Workflow (v.5.5.0)58,59.Ako CheckM ili Anvi'o izvješćuju o ≥50% potpunosti/potpunosti i ≤10% kontaminaciji/redundanciji, tada spremite metagenomske stanice i vanjske genome za kasniju analizu.Ti su rezultati zatim kombinirani u srednju vrijednost potpunosti (mcpl) i srednju kontaminaciju (mctn) kako bi se kvaliteta genoma klasificirala prema kriterijima zajednice60 kako slijedi: visoka kvaliteta: mcpl ≥ 90% i mctn ≤ 5%;dobra kvaliteta: mcpl ≥ 70%, mctn ≤ 10%, srednja kvaliteta: mcpl ≥ 50% i mctn ≤ 10%, zadovoljavajuća kvaliteta: mcpl ≤ 90% ili mctn ≥ 10%.Filtrirani genomi zatim su korelirani s rezultatima kvalitete (Q i Q') kako slijedi: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (varijabilnost soja)/100 + 0,5 x log[N50] .(implementirano u dRep61).
Kako bi se omogućila usporedna analiza između različitih izvora podataka i tipova genoma (MAG, SAG i REF), 34 799 genoma dereferencirano je na temelju prosječnog identiteta nukleotida na cijelom genomu (ANI) pomoću dRep-a (v.2.5.4).Ponavlja)61 s pragovima od 95% ANI28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) i markerski geni s jednom kopijom pomoću SpecI63 koji osigurava grupiranje genoma na razini vrste.Reprezentativni genom odabran je za svaki dRep klaster prema maksimalnom rezultatu kvalitete (Q') definiranom gore, koji se smatra reprezentativnim za vrstu.
Za procjenu brzine mapiranja, BWA (v.0.7.17-r1188, -a) korišten je za mapiranje svih 1038 skupova metagenomskih čitanja s 34.799 genoma sadržanih u OMD-u.Očitavanja kontrolirane kvalitete mapirana su u jednostranom načinu rada, a rezultirajuća poravnanja su filtrirana kako bi se zadržala samo poravnanja duljine ≥45 bp.i identitet ≥95%.Omjer prikaza za svaki uzorak je postotak očitanja preostalih nakon filtracije podijeljen s ukupnim brojem očitanja kontrole kvalitete.Koristeći isti pristup, svaki od 1038 metagenoma smanjen je na 5 milijuna umetaka (prošireni podaci, slika 1c) i uparen s GORG SAG u OMD i u svim GEM16.Količina MAG-ova prikupljenih iz morske vode u katalogu GEM16 određena je upitima ključnih riječi metagenomskih izvora, odabirom uzoraka morske vode (npr. za razliku od morskih sedimenata).Konkretno, odabiremo "vodeno" kao "kategorija_ekosustava", "morsko" kao "tip_ekosustava", a filtriramo "stanište" kao "duboki ocean", "morsko", "morsko oceansko", "pelagično more", "morska voda" , “Ocean”, “Morska voda”, “Površinska morska voda”, “Površinska morska voda”.To je rezultiralo s 5903 MAG-a (734 visoke kvalitete) raspoređenih preko 1823 OTU-a (pogledajte ovdje).
Prokariotski genomi taksonomski su označeni pomoću GTDB-Tk (v.1.0.2)64 sa zadanim parametrima koji ciljaju GTDB r89 verziju 13. Anvi'o je korišten za identifikaciju eukariotskih genoma na temelju predviđanja domene i prisjećanja ≥50% i redundancije ≤ 10%.Taksonomska oznaka vrste definirana je kao jedan od njezinih reprezentativnih genoma.S iznimkom eukariota (148 MAG), svaki genom je prvo funkcionalno označen korištenjem prokka (v.1.14.5)65, imenovanjem kompletnih gena, definiranjem parametara "arheja" ili "bakterija" po potrebi, što je također prijavljeno za ne- kodiranje gena.i CRISPR regije, između ostalih genomskih značajki.Označite predviđene gene identificiranjem univerzalnih marker gena s jednom kopijom (uscMG) pomoću fetchMG (v.1.2)66, dodijelite ortološke grupe i postavite upit pomoću emappera (v.2.0.1)67 na temelju eggNOG (v.5.0)68.Baza podataka KEGG (objavljeno 10. veljače 2020.) 69. Posljednji korak je izveden uparivanjem proteina s bazom podataka KEGG pomoću DIAMOND (v.0.9.30)70 s upitom i pokrivenošću teme od ≥70%.Rezultati su dalje filtrirani prema NCBI Prokaryotic Genome Annotation Pipeline71 na temelju brzine prijenosa ≥ 50% maksimalne očekivane brzine prijenosa (sama veza).Slijedovi gena također su korišteni kao input za identifikaciju BGC-ova u genomu pomoću antiSMASH (v.5.1.0)72 sa zadanim parametrima i različitim eksplozijama klastera.Svi genomi i bilješke kompilirani su u OMD zajedno s kontekstualnim metapodacima dostupnim na webu (https://microbiomics.io/ocean/).
Slično prethodno opisanim metodama12,22 koristili smo CD-HIT (v.4.8.1) za grupiranje >56,6 milijuna gena koji kodiraju proteine iz bakterijskih i arhealnih genoma iz OMD u 95% identične i kraće gene (90% pokrivenost)73 do >17,7 milijuna klastera gena.Najduža sekvenca odabrana je kao reprezentativni gen za svaku skupinu gena.1038 metagenoma je zatim upareno s >17,7 milijuna BWA (-a) članova klastera, a rezultirajuće BAM datoteke su filtrirane da zadrže samo poravnanja s ≥95% postotnim identitetom i ≥45 baznih poravnanja.Obilje gena normalizirano duljinom izračunato je prvo brojanjem umetaka iz najboljeg jedinstvenog poravnanja, a zatim, za nejasno mapirane umetke, dodavanjem frakcijskih brojeva odgovarajućim ciljnim genima proporcionalno njihovom broju jedinstvenih umetaka.
Genomi iz proširenog OMD-a (s dodatnim MAG-ovima iz "Ca. Eudormicrobiaceae", vidi dolje) dodani su u bazu podataka alata za metagenomsku analizu mOTUs74 (v.2.5.1) kako bi se stvorila proširena referentna baza podataka mOTU.Od deset uscMG-ova preživjelo je samo šest genoma s jednom kopijom (23 528 genoma).Proširenje baze podataka rezultiralo je s 4494 dodatna klastera na razini vrste.Analizirano je 1038 metagenoma pomoću zadanih mOTU parametara (v.2).Ukupno 989 genoma sadržanih u 644 mOTU klastera (95% REF, 5% SAG i 99,9% pripada MarDB) nije detektirano mOTU profilom.To odražava razne dodatne izvore morske izolacije MarDB genoma (većina neotkrivenih genoma povezana je s organizmima izoliranima iz sedimenata, morskim domaćinima itd.).Da bismo se u ovoj studiji nastavili fokusirati na okoliš otvorenog oceana, isključili smo ih iz nizvodne analize osim ako nisu otkriveni ili uključeni u proširenu mOTU bazu podataka stvorenu u ovoj studiji.
Svi BGC-ovi iz MAG-a, SAG-a i REF-a u OMD-u (vidi gore) kombinirani su s BGC-ovima identificiranim u svim metagenomskim skelama (antiSMASH v.5.0, zadani parametri) i karakterizirani pomoću BiG-SLICE (v.1.1) (PFAM domena)75.Na temelju ovih značajki, izračunali smo sve kosinusne udaljenosti između BGC-ova i grupirali ih (srednje veze) u GCF i GCC koristeći pragove udaljenosti od 0,2 odnosno 0,8.Ovi su pragovi prilagodba pragova koji su se prethodno koristili korištenjem euklidske udaljenosti75 zajedno s kosinusnom udaljenošću, što ublažava neke pogreške u izvornoj BiG-SLICE strategiji klasteriranja (dodatne informacije).
BGC-ovi su zatim filtrirani da zadrže samo ≥5 kb kodiranih na skelama kako bi se smanjio rizik od fragmentacije kao što je prethodno opisano16 i kako bi se isključili MarDB REF-ovi i SAG-ovi koji nisu pronađeni u 1038 metagenoma (vidi gore).To je rezultiralo s ukupno 39 055 BGC-ova koji su kodirani genomom OMD, s dodatnih 14 106 identificiranih na metagenomskim fragmentima (tj. koji nisu kombinirani u MAG-ove).Ovi "metagenomski" BGC-ovi korišteni su za procjenu udjela potencijala biosinteze morskog mikrobioma koji nije uhvaćen u bazi podataka (dodatne informacije).Svaki BGC je funkcionalno karakteriziran prema prediktivnim tipovima proizvoda definiranim anti-SMASH ili grubljim kategorijama proizvoda definiranim u BiG-SCAPE76.Kako bi se spriječila pristranost uzorkovanja u kvantifikaciji (taksonomski i funkcionalni sastav GCC/GCF, udaljenost GCF i GCC do referentnih baza podataka i metagenomska brojnost GCF), zadržavanjem samo najduljeg BGC po GCF za svaku vrstu, 39 055 BGC je dodatno deduplicirano, što je rezultiralo s ukupno 17 689 BGC.
Novost GCC i GCF procijenjena je na temelju udaljenosti između izračunate baze podataka (RefSeq baza podataka u BiG-FAM)29 i eksperimentalno provjerenog (MIBIG 2.0)30 BGC.Za svaki od 17.689 reprezentativnih BGC-ova odabrali smo najmanju kosinusnu udaljenost do odgovarajuće baze podataka.Ove minimalne udaljenosti se zatim usrednjavaju (srednje) prema GCF ili GCC, prema potrebi.GCF se smatra novim ako je udaljenost do baze podataka veća od 0,2, što odgovara idealnom odvajanju između (prosječnog) GCF-a i reference.Za GCC odabiremo 0,4, što je dvostruko više od praga definiranog GCF-om, kako bismo zaključali dugoročni odnos s vezama.
Metagenomska zastupljenost BGC procijenjena je kao prosječna zastupljenost njegovih biosintetskih gena (kako je određeno pomoću anti-SMASH) dostupnih iz profila na razini gena.Metagenomska brojnost svakog GCF-a ili GCC-a tada je izračunata kao zbroj reprezentativnih BGC-ova (od 17 689).Ove karte obilja naknadno su normalizirane za stanični sastav korištenjem broja mOTU po uzorku, koji je također uračunao napore sekvenciranja (prošireni podaci, slika 1d).Prevalencija GCF ili GCC izračunata je kao postotak uzoraka s abundancijom > 0.
Euklidska udaljenost između uzoraka izračunata je iz normaliziranog GCF profila.Te su udaljenosti smanjene u veličini pomoću UMAP77, a rezultirajuće ugradnje korištene su za nenadzirano klasteriranje temeljeno na gustoći pomoću HDBSCAN78.Optimalan minimalni broj bodova za klaster (a time i broj klastera) koji koristi HDBSCAN određuje se maksimiziranjem kumulativne vjerojatnosti članstva u klasteru.Identificirani klasteri (i nasumični uravnoteženi subuzorak ovih klastera da bi se uzela u obzir pristranost u permutacijskoj multivarijantnoj analizi varijance (PERMANOVA)) testirani su na značaj u odnosu na nereducirane euklidske udaljenosti korištenjem PERMANOVA.Prosječna veličina genoma uzoraka izračunata je na temelju relativne zastupljenosti mOTU i procijenjene veličine genoma članova genoma.Konkretno, prosječna veličina genoma svakog mOTU procijenjena je kao prosjek veličina genoma njegovih članova ispravljenih za cjelovitost (nakon filtriranja) (na primjer, 75% kompletan genom s duljinom od 3 Mb ima prilagođenu veličinu od 4 Mb).za srednje genome s integritetom ≥70%.Prosječna veličina genoma za svaki uzorak zatim je izračunata kao zbroj veličina genoma mOTU ponderiranih relativnom brojnošću.
Filtrirani skup BGC-ova kodiranih genomom u OMD-u prikazan je u bakterijskim i arhealnim GTDB stablima (u okvirima od ≥5 kb, isključujući REF i SAG MarDB koji nisu pronađeni u 1038 metagenoma, vidi gore) i njihovim predviđenim kategorijama proizvoda na temelju filogenetike položaj genoma (vidi gore).Prvo smo smanjili podatke po vrstama, koristeći genom s najviše BGC-ova u toj vrsti kao reprezentativan.Za vizualizaciju, predstavnici su dalje podijeljeni u grupe stabala, i ponovno, za svaki stanični sloj, genom koji sadrži najveći broj BGC-ova odabran je kao predstavnik.Vrste obogaćene BGC-om (najmanje jedan genom s >15 BGC-ova) dodatno su analizirane izračunavanjem Shannonovog indeksa raznolikosti za vrste proizvoda kodirane u tim BGC-ovima.Ako su sve predviđene vrste proizvoda iste, smatra se da kemijski hibridi i drugi složeni BGC (kako predviđa anti-SMAH) pripadaju istoj vrsti proizvoda, bez obzira na njihov redoslijed u klasteru (npr. fuzija protein-bakteriocin i bakteriocin-proteoprotein tijelo).hibrid).
Preostala DNK (procijenjena na 6 ng) iz Malaspina uzorka MP1648, odgovara biološkom uzorku SAMN05421555 i podudara se s metagenomskim čitanjem Illumina SRR3962772 za kratko čitanje, obrađeno prema PacBio protokolu sekvenciranja s ultra-niskim unosom za korištenje PacBio kompleta SMRTbell gDNA amplifikacije uzoraka kit (100-980-000) i komplet za pripremu šablona SMRTbell Express 2.0 (100-938-900).Ukratko, preostala DNK je izrezana, popravljena i pročišćena (ProNex kuglice) pomoću Covarisa (g-TUBE, 52104).Pročišćena DNK se zatim podvrgava pripremi biblioteke, umnožavanju, pročišćavanju (ProNex kuglice) i odabiru veličine (>6 kb, Blue Pippin) prije konačnog koraka pročišćavanja (ProNex kuglice) i sekvenciranja na platformi Sequel II.
Rekonstrukcija prva dva ca.Za MAG Eremiobacterota identificirali smo šest dodatnih ANI >99% (oni su uključeni u sliku 3), koji su u početku bili filtrirani na temelju rezultata kontaminacije (kasnije identificirani kao duplikacije gena, vidi dolje).Pronašli smo i pladanj s natpisom "Ca".Eremiobacterota” iz raznih studija23 i upotrijebio ih zajedno s osam MAG-ova iz naše studije kao referencu za metagenomska očitavanja iz 633 eukariotskih obogaćenih (>0,8 µm) uzoraka koristeći BWA (v.0.7.17) Ref -r1188, – oznaka) za smanjeno uzorkovanje mapiranje (5 milijuna čitanja).Na temelju karata specifičnih za obogaćivanje (filtriranih prema 95% identiteta poravnanja i 80% pokrivenosti čitanja), 10 metagenoma (očekivana pokrivenost ≥5×) odabrano je za sklapanje i dodatnih 49 metagenoma (očekivana pokrivenost ≥1×) za korelaciju sadržaja.Koristeći iste parametre kao gore, ovi uzorci su grupirani i dodano je 10 dodatnih 'Ca'.MAG Eremiobacterota je obnovljen.Ovih 16 MAG-ova (ne računajući dva koja su već u bazi podataka) dovode ukupni broj genoma u proširenom OMD-u na 34.815.MAG-ovima se dodjeljuju taksonomski rangovi na temelju njihove genomske sličnosti i položaja u GTDB-u.18 MAG-ova dereplicirano je pomoću dRep-a u 5 vrsta (intraspecifični ANI >99%) i 3 roda (intragenerički ANI 85% do 94%) unutar iste obitelji79.Predstavnici vrsta ručno su odabrani na temelju integriteta, kontaminacije i N50.Predložena nomenklatura navedena je u Dodatnim informacijama.
Ocijenite cjelovitost i kontaminaciju 'Ca.MAG Eremiobacterota, procijenili smo prisutnost uscMG-a, kao i setove markera s jednom kopijom specifične za lozu i domenu koje koriste CheckM i Anvi'o.Identifikacija 2 duplikata od 40 uscMG-ova potvrđena je filogenetskom rekonstrukcijom (vidi dolje) kako bi se isključila bilo kakva potencijalna kontaminacija (to odgovara 5% na temelju ovih 40 marker gena).Dodatna studija pet reprezentativnih MAG-ova 'Ca.Niska razina kontaminanata u ovim rekonstruiranim genomima potvrđena je za vrste Eremiobacterota korištenjem interaktivnog Anvi'o sučelja temeljenog na korelacijama obilja i sastava sekvenci (Dodatne informacije)59.
Za filogenomsku analizu odabrali smo pet reprezentativnih MAG "Ca".Eudormicrobiaceae”, sve vrste “Ca.Genom Eremiobacterota i članova drugih rodova (uključujući UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria i Planctomycetota) dostupan je iz GTDB (r89)13.Svi ovi genomi označeni su kao što je prethodno opisano za ekstrakciju gena markera u jednoj kopiji i BGC bilješku.GTDB genomi su konzervirani prema gore navedenim kriterijima integriteta i kontaminacije.Filogenetska analiza provedena je korištenjem tijeka rada Anvi'o Phylogenetics59.Stablo je konstruirano korištenjem IQTREE (v.2.0.3) (zadane opcije i -bb 1000)80 na poravnanju 39 tandemskih ribosomskih proteina koje je identificirao Anvi'o (MUSCLE, v.3.8.1551)81.Njegove pozicije su smanjene.da pokrije najmanje 50% genoma82, a Planctomycecota je korištena kao vanjska grupa na temelju topologije stabla GTDB.Jedno stablo od 40 uscMG-ova izgrađeno je korištenjem istih alata i parametara.
Koristili smo Traitar (v.1.1.2) sa zadanim parametrima (fenotip, iz nukleotida)83 za predviđanje uobičajenih svojstava mikroba.Istražili smo potencijalni predatorski način života na temelju prethodno razvijenog predatorskog indeksa84 koji ovisi o sadržaju gena koji kodira proteine u genomu.Konkretno, koristimo DIAMOND za usporedbu proteina u genomu s bazom podataka OrthoMCL (v.4)85 koristeći opcije –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 I prebrojavanje gena koji odgovaraju geni markeri za predatore i ne-predatore.Indeks je razlika između broja grabežljivih i negrabežljivih oznaka.Kao dodatnu kontrolu analizirali smo i “Ca” genom.Faktor Entotheonella TSY118 temelji se na njegovoj povezanosti s Ca.Eudremikrobij (velika veličina genoma i biosintetski potencijal).Zatim smo testirali potencijalne veze između predatorskih i ne-predatorskih marker gena i biosintetski potencijal Ca.Eudormicrobiaceae” i otkrili da se ne više od jednog gena (iz bilo koje vrste markerskog gena, tj. predatorskog/nepredatorskog gena) preklapa s BGC, što sugerira da BGC ne zbunjuje predatorske signale.Dodatna genomska oznaka kodiranih replikona provedena je pomoću TXSSCAN (v.1.0.2) kako bi se specifično ispitao sustav izlučivanja, pili i flagela86.
Pet reprezentativnih 'Ca' je mapirano mapiranjem 623 metatranskriptoma iz prokariotskih i eukariotskih frakcija obogaćenja oceana Tare22,40,87 (koristeći BWA, v.0.7.17-r1188, -a zastavu).Genom Eudormicrobiaceae.BAM datoteke obrađene su s FeatureCounts (v.2.0.1)88 nakon 80% pokrivenosti čitanja i 95% filtriranja identiteta (s opcijama featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Broji broj umetaka po genu.Generirane karte normalizirane su za duljinu gena i obilje gena markera mOTU (prosječni broj umetanja normaliziran na duljinu za gene s brojem umetanja >0) i logaritamski transformirane na 22,74 kako bi se dobila relativna ekspresija po stanici svake razine gena, što također objašnjava varijabilnost od uzorka do uzorka tijekom sekvenciranja.Takvi omjeri omogućuju komparativnu analizu, ublažavajući probleme sa sastavom pri korištenju podataka o relativnoj zastupljenosti.Samo uzorci s >5 od 10 mOTU marker gena uzeti su u obzir za daljnju analizu kako bi se omogućilo otkrivanje dovoljno velikog dijela genoma.
Normalizirani profil transkriptoma 'Ca.E. taraoceanii podvrgnut je smanjenju dimenzionalnosti korištenjem UMAP-a, a rezultirajući prikaz korišten je za nenadzirano grupiranje pomoću HDBSCAN-a (vidi gore) za određivanje statusa ekspresije.PERMANOVA testira značajnost razlika između identificiranih klastera u izvornom (ne smanjenom) prostoru udaljenosti.Diferencijalna ekspresija između ovih stanja testirana je u genomu (vidi gore) i identificiran je 201 KEGG put u 6 funkcionalnih skupina, naime: BGC, sustav izlučivanja i flagelarni geni iz TXSSCAN-a, degradacijski enzimi (proteaze i peptidaze), te grabežljivi i ne- predatorski geni.markeri predatorskog indeksa.Za svaki uzorak izračunali smo srednju normaliziranu ekspresiju za svaku klasu (imajte na umu da se sama BGC ekspresija izračunava kao srednja ekspresija biosintetskih gena za taj BGC) i ispitali smo značajnost među državama (Kruskal-Wallisov test prilagođen za FDR).
Sintetski geni kupljeni su od GenScripta, a PCR početnice kupljene su od Microsyntha.Za umnožavanje DNA korištena je Phusion polimeraza tvrtke Thermo Fisher Scientific.Za pročišćavanje DNA korišteni su NucleoSpin plazmidi, NucleoSpin gel i PCR kit za pročišćavanje tvrtke Macherey-Nagel.Restrikcijski enzimi i T4 DNA ligaza kupljeni su od New England Biolabs.Kemikalije osim izopropil-β-d-1-tiogalaktopiranozida (IPTG) (Biosynth) i 1,4-ditiotreitola (DTT, AppliChem) kupljene su od Sigma-Aldrich i korištene bez daljnjeg pročišćavanja.Antibiotici kloramfenikol (Cm), spektinomicin dihidroklorid (Sm), ampicilin (Amp), gentamicin (Gt) i karbenicilin (Cbn) nabavljeni su od AppliChema.Komponente medija Bacto Tripton i Bacto kvasac kupljene su od BD Biosciences.Tripsin za sekvenciranje je kupljen od Promege.
Sekvence gena ekstrahirane su iz anti-SMASH predviđenog BGC 75.1.E. malaspinii (Dodatne informacije).
Geni embA (lokus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (lokus, MALA_SAMN05422137_METAG-framework_127-gene_4) i embAM (uključujući međugene regije) sekvencionirani su kao sintetski konstrukti u pUC57(AmpR) sa i bez optimizacije kodona ed za izražavanje u E kada.Gen embA subkloniran je u prvo mjesto višestrukog kloniranja (MCS1) pACYCDuet-1(CmR) i pCDFDuet-1(SmR) s mjestima cijepanja BamHI i HindIII.Geni embM i embMopt (kodonski optimizirani) subklonirani su u MCS1 pCDFDuet-1(SmR) s BamHI i HindIII i postavljeni na drugo mjesto višestrukog kloniranja pCDFDuet-1(SmR) i pRSFDuet-1(KanR) (MCS2) s NdeI/ChoI.EmbAM kazeta je subklonirana u pCDFDuetl(SmR) s BamHI i HindIII mjestima cijepanja.Gen orf3/embI (lokus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) konstruiran je PCR-om ekstenzije preklapanja upotrebom početnica EmbI_OE_F_NdeI i EmbI_OE_R_XhoI, digestiran s NdeI/XhoI i povezan u pCDFDuet-1-EmbM (MCS1) upotrebom istog re strikcioni enzimi (Dodatak stol).6).Digestija i ligacija restrikcijskim enzimom provedena je prema protokolu proizvođača (New England Biolabs).
Vrijeme objave: 14. ožujka 2023