Hírek - Mikrobiális metaproteomika : a mintafeldolgozástól az adatgyűjtésen át az adatelemzésig

Wu Enhui, Qiao Liang*

Kémiai Tanszék, Fudan Egyetem, Sanghaj 200433, Kína

A mikroorganizmusok szorosan összefüggenek az emberi betegségekkel és egészséggel. A mikrobiális közösségek összetételének és funkcióinak megértése olyan fontos kérdés, amelyet sürgősen tanulmányozni kell. Az elmúlt években a metaproteomika a mikroorganizmusok összetételének és működésének tanulmányozásának fontos technikai eszközévé vált. A mikrobiális közösségek mintáinak összetettsége és nagy heterogenitása miatt azonban a mintafeldolgozás, a tömegspektrometriás adatgyűjtés és az adatelemzés vált a metaproteomika három fő kihívásává. A metaproteomikai elemzés során gyakran szükséges optimalizálni a különböző típusú minták előkezelését, és különböző mikrobiális elválasztási, dúsítási, extrakciós és lízissémákat kell alkalmazni. Egyetlen faj proteomjához hasonlóan a metaproteomikában a tömegspektrometriás adatgyűjtési módok közé tartozik az adatfüggő adatgyűjtés (DDA) és az adatfüggetlen adatgyűjtés (DIA) mód. A DIA adatgyűjtési mód teljes mértékben képes összegyűjteni a minta peptidinformációit, és nagy fejlesztési potenciállal rendelkezik. A metaproteom minták összetettsége miatt azonban a DIA adatelemzése komoly problémává vált, amely akadályozza a metaproteomika mélyreható lefedettségét. Az adatelemzés szempontjából a legfontosabb lépés a fehérjeszekvencia adatbázis felépítése. Az adatbázis mérete és teljessége nemcsak az azonosítások számát befolyásolja nagyban, hanem faji és funkcionális szinten is befolyásolja az elemzést. Jelenleg a metaproteom adatbázis felépítésének arany standardja a metagenomon alapuló fehérjeszekvencia adatbázis. Ugyanakkor az iteratív keresésen alapuló nyilvános adatbázis-szűrési módszer is erős gyakorlati értékűnek bizonyult. A specifikus adatelemzési stratégiák szempontjából a peptidközpontú DIA adatelemzési módszerek abszolút fősodort foglalnak el. A mély tanulás és a mesterséges intelligencia fejlesztésével nagyban elősegíti a makroproteomikai adatelemzés pontosságát, lefedettségét és elemzési sebességét. A downstream bioinformatikai elemzés szempontjából az elmúlt években egy sor annotációs eszközt fejlesztettek ki, amelyek fehérje-, peptid- és génszintű faj-annotációt is végezhetnek a mikrobaközösségek összetételének meghatározására. Más omikai módszerekkel összehasonlítva a mikrobiális közösségek funkcionális elemzése a makroproteomika egyedülálló jellemzője. A makroproteomika a mikrobiális közösségek multi-omikai elemzésének fontos részévé vált, és még mindig nagy fejlődési potenciállal rendelkezik a lefedettség mélysége, az észlelési érzékenység és az adatelemzés teljessége tekintetében.

01Minta előkezelés

Jelenleg a metaproteomikai technológiát széles körben használják az emberi mikrobiom, a talaj, az élelmiszerek, az óceánok, az aktív iszap és más területek kutatásában. Egyetlen faj proteomanalíziséhez képest az összetett minták metaproteómáinak minta-előkezelése több kihívással néz szembe. A tényleges mintákban a mikrobiális összetétel összetett, a dinamikus abundancia tartománya nagy, a különböző típusú mikroorganizmusok sejtfalszerkezete nagyon eltérő, a minták gyakran nagy mennyiségű gazdafehérjét és egyéb szennyeződéseket tartalmaznak. Ezért a metaproteom elemzése során gyakran szükséges a különböző típusú minták optimalizálása, és különböző mikrobiális elválasztási, dúsítási, extrakciós és lízissémák alkalmazása.

A mikrobiális metaproteómák kinyerése különböző mintákból bizonyos hasonlóságokat és különbségeket is mutat, de jelenleg hiányzik az egységes előfeldolgozási folyamat a különböző típusú metaproteom mintákhoz.

02Tömegspektrometriás adatgyűjtés

A sörétes proteomanalízis során az előkezelést követő peptidkeveréket először a kromatográfiás oszlopban választják el, majd az ionizációt követően a tömegspektrométerbe kerül az adatgyűjtéshez. Az egyes fajok proteomanalíziséhez hasonlóan a makroproteomanalízis tömegspektrometriás adatgyűjtési módjai közé tartozik a DDA mód és a DIA mód.

A tömegspektrometriás műszerek folyamatos iterációjával és frissítésével nagyobb érzékenységű és felbontású tömegspektrometriás műszereket alkalmaznak a metaproteómára, és a metaproteomanalízis lefedettségi mélysége is folyamatosan javul. Hosszú ideig az Orbitrap által vezetett nagy felbontású tömegspektrometriás műszerek sorozatát széles körben használják a metaproteomában.

Az eredeti szöveg 1. táblázata néhány reprezentatív metaproteomikai tanulmányt mutat be 2011-től napjainkig a mintatípus, az elemzési stratégia, a tömegspektrometriás műszer, a felvételi módszer, az elemző szoftver és az azonosítások száma tekintetében.

03Tömegspektrometriás adatok elemzése

3.1 DDA adatelemzési stratégia

3.1.1 Keresés az adatbázisban

3.1.2de novoszekvenálási stratégia

3.2 DIA adatelemzési stratégia

04 Fajok osztályozása és funkcionális megjegyzés

A különböző taxonómiai szinteken lévő mikrobiális közösségek összetétele a mikrobiomkutatás egyik kulcsfontosságú kutatási területe. Az elmúlt években egy sor annotációs eszközt fejlesztettek ki a fajok fehérjeszintű, peptidszintű és génszintű annotálására a mikrobaközösségek összetételének meghatározására.

A funkcionális annotáció lényege a célfehérje szekvencia összehasonlítása a funkcionális fehérjeszekvencia adatbázissal. Génfunkciós adatbázisok, például GO, COG, KEGG, eggNOG stb. segítségével különböző funkcionális annotációs elemzések végezhetők a makroproteómák által azonosított fehérjéken. Az annotációs eszközök közé tartozik a Blast2GO, DAVID, KOBAS stb.

05 Összegzés és kilátások

A mikroorganizmusok fontos szerepet játszanak az emberi egészségben és a betegségekben. Az elmúlt években a metaproteomika fontos technikai eszközzé vált a mikrobiális közösségek működésének tanulmányozásában. A metaproteomika elemzési folyamata hasonló az egyfajú proteomikáéhoz, de a metaproteomika kutatási tárgyának összetettsége miatt az egyes elemzési lépésekben sajátos kutatási stratégiákat kell elfogadni, a minta előkezelésétől az adatgyűjtésen át az adatelemzésig. Jelenleg az előkezelési módszerek fejlődésének, a tömegspektrometriás technológia folyamatos innovációjának és a bioinformatika rohamos fejlődésének köszönhetően a metaproteomika nagy előrelépést tett az azonosítás mélységében és alkalmazási körében.

A makroproteom minták előkezelése során először a minta jellegét kell figyelembe venni. A mikroorganizmusok elkülönítése a környezeti sejtektől és fehérjéktől az egyik legfontosabb kihívás, amellyel a makroproteómák szembesülnek, és az elválasztás hatékonysága és a mikrobiális veszteség közötti egyensúly sürgős megoldásra váró probléma. Másodszor, a mikroorganizmusok fehérjekivonásánál figyelembe kell venni a különböző baktériumok szerkezeti heterogenitásából adódó különbségeket. A nyomtartományban lévő makroproteóma minták szintén speciális előkezelési módszereket igényelnek.

Ami a tömegspektrometriás műszereket illeti, a főbb tömegspektrometriás műszerek áttértek az Orbitrap tömeganalizátorokon, például LTQ-Orbitrap és Q Exactive tömegspektrométerekről az ionmobilitás-csatolt repülési idő tömegelemzőkre, például a timsTOF Pro-ra. . Az ionmobilitási dimenzióinformációkkal rendelkező timsTOF műszerek sorozata nagy detektálási pontossággal, alacsony kimutatási határral és jó ismételhetőséggel rendelkezik. Fokozatosan fontos eszközökké váltak számos olyan kutatási területen, amelyek tömegspektrometriás kimutatást igényelnek, mint például egyetlen faj proteomja, metaproteómája és metabolomja. Érdemes megjegyezni, hogy a tömegspektrometriás műszerek dinamikus tartománya hosszú ideig korlátozta a metaproteom kutatás fehérjelefedettségi mélységét. A jövőben a nagyobb dinamikatartománnyal rendelkező tömegspektrometriás műszerek javíthatják a fehérjeazonosítás érzékenységét és pontosságát a metaproteomákban.

A tömegspektrometriás adatgyűjtéshez, bár a DIA adatgyűjtési módot széles körben alkalmazták egyetlen faj proteomjában, a legtöbb jelenlegi makroproteom elemzés még mindig a DDA adatgyűjtési módot használja. A DIA adatgyűjtési mód teljes mértékben képes megszerezni a minta fragmens ioninformációit, és a DDA adatgyűjtési móddal összehasonlítva képes a makroproteom minta peptidinformációinak teljes megszerzésére. A DIA adatok nagy összetettsége miatt azonban a DIA makroproteom adatainak elemzése még mindig nagy nehézségekbe ütközik. A mesterséges intelligencia és a mély tanulás fejlesztése várhatóan javítja a DIA adatelemzés pontosságát és teljességét.

A metaproteomika adatelemzésének egyik kulcsfontosságú lépése a fehérjeszekvencia adatbázis felépítése. Az olyan népszerű kutatási területeken, mint a bélflóra, használhatók a bélmikrobiális adatbázisok, mint például az IGC és a HMP, és jó azonosítási eredményeket értek el. A legtöbb metaproteomikai elemzés esetében a leghatékonyabb adatbázis-építési stratégia továbbra is egy mintaspecifikus fehérjeszekvencia adatbázis létrehozása metagenomikus szekvenálási adatokon. A nagy komplexitású és nagy dinamikatartománnyal rendelkező mikrobiális közösségminták esetében a szekvenálási mélység növelése szükséges az alacsony abundanciájú fajok azonosításának növelése érdekében, ezáltal javítva a fehérjeszekvencia adatbázis lefedettségét. Ha hiányoznak a szekvenálási adatok, iteratív keresési módszerrel optimalizálható a nyilvános adatbázis. Az iteratív keresés azonban hatással lehet az FDR minőségellenőrzésére, ezért a keresési eredményeket gondosan ellenőrizni kell. Emellett érdemes még megvizsgálni a hagyományos FDR minőségellenőrzési modellek metaproteomikai elemzésben való alkalmazhatóságát. A keresési stratégia szempontjából a hibrid spektrális könyvtár stratégia javíthatja a DIA metaproteomika lefedettségi mélységét. Az elmúlt években a mély tanuláson alapuló előrejelzett spektrális könyvtár kiváló teljesítményt mutatott a DIA proteomikában. A metaproteom adatbázisok azonban gyakran több millió fehérjebejegyzést tartalmaznak, ami nagyszámú előrejelzett spektrális könyvtárat eredményez, sok számítási erőforrást fogyaszt, és nagy keresési teret eredményez. Emellett a metaproteómák fehérjeszekvenciái közötti hasonlóság nagyon változó, ami megnehezíti a spektrális könyvtár előrejelzési modell pontosságának biztosítását, ezért a predikciós spektrális könyvtárakat nem alkalmazták széles körben a metaproteomikában. Ezenkívül új fehérje-következtetési és osztályozási annotációs stratégiákat kell kidolgozni a nagyon szekvenciahasonló fehérjék metaproteomikai elemzésére.

Összefoglalva, a metaproteomikai technológia, mint feltörekvő mikrobiomkutatási technológia jelentős kutatási eredményeket ért el, és hatalmas fejlesztési potenciállal is rendelkezik.

Feladás időpontja: 2024. augusztus 30

Mikrobiális metaproteomika: a mintafeldolgozástól az adatgyűjtésen át az adatelemzésig