Vätske-vätskefasseparationssekvensbaserade prediktorer

LLPS involverar ofta sekvensregioner som har unika funktionella egenskaper, såväl som närvaron av prionliknande och RNA-bindande domäner. Nuförtiden finns det bara ett fåtal metoder för att förutsäga ett proteins benägenhet att driva LLPS. Utbudet av biologiska mekanismer involverade i LLPS, den begränsade kunskapen om dessa mekanismer och den viktiga kontextberoende komponenten i LLPS gör detta problem utmanande. Under de senaste åren, trots framstegen inom detta område, har bara ett fåtal prediktorer, specifika för LLPS, utvecklats för att försöka förstå sambandet mellan proteinsekvensegenskaper och förmågan att driva LLPS. Här kommer vi att revidera de senaste LLPS-sekvensbaserade prediktorerna, kort introducera dem och förklara vilka individuella proteinegenskaper som de identifierar i samband med LLPS.

Tabell 2
Prediktor Publicerad Beskrivning - Typ av data
PSPer 2019 PSPer är en metod tränad för att identifiera prionliknande RNA-bindande fasseparationsproteiner (PSP). Denna metod är fokuserad på en speciell egenskap hos LLPS-proteiner och ger en övergripande poäng för ett givet protein beroende på närvaron av denna egenskap. Metoden tränas på ett experimentellt dataset av FUS-liknande PSP:er och de biofysiska egenskaperna (PLD- och RNA-bindande domän, RNA-igenkänningsmotiv, oordnade och ytterligare domäner) som tillhör varje region, implementerade i en probabilistisk modell. Denna metod tränades också inklusive en negativ datauppsättning av ordnade proteiner, så det förväntas att dess prestanda ökar på de störda proteiner som drivs av LLPS.
PLAAC 2014 PLAAC förutspår prionliknande aminosyrasammansättning, vanligtvis berikad med polära rester med hjälp av Hidden Markov Model (HMM). Denna metod utvecklades ursprungligen innan man insåg implikationen av PLDs i LLPS, och följaktligen är den inte tränad för att identifiera majoriteten av fasseparerande regioner.
PScore 2017 PScore är en statistisk poängalgoritm som förutsäger pi-pi-interaktioner. Den jämför pi-pi-interaktioner som förutspås i målproteinerna med alla proteiner som finns i PDB för att tilldela en poäng av fasseparationsbenägenhet.
catGRANULE 2016 catGRANULE är en metod som ursprungligen tränades mot jästprotein men den har visat sig vara användbar för att förutsäga mänskliga fasseparerande proteiner. Algoritmen är baserad på sekvenssammansättningsstatistik för att skilja proteiner som är lokaliserade i jästgranulat från resten av jästproteomet. De egenskaper som anses väga resterna är störningar och nukleinsyrabindningsbenägenhet, såväl som egenskaper hos vissa aminosyror.
PSpredictor 2019 PSPredictor är en maskininlärningsmetod för att förutsäga proteiner som fassepareras, tränade på en uppsättning experimentellt validerade proteinsekvenser i LLPSDB-databasen.
PSAP 2021 PSAP är en slumpmässig skogsklassificerare för att förutsäga sannolikheten för proteiner att förmedla fasseparation. Denna klassificerare är utbildad på en uppsättning av 90 högsäkra HUMAN-proteiner som driver LLPS.
FuzDrop 2020 FuzDrop är en metod för att förutsäga droppdrivande regioner och proteiner. Algoritmen tränades på en datauppsättning av förare som samlats in från olika offentliga databaser, och resultatet är en sannolikhet per rest för droppbildning.

LLPS-simuleringar

En annan viktig beräkningsresurs inom LLPS-området är de teoretiska simuleringarna av proteiner, särskilt intrinsically disordered proteiner (IDPs), som driver LLPS. Dessa simuleringar är komplementära till experimenten och ger viktiga insikter om de molekylära mekanismerna hos enskilda proteiner som driver LLPS. En recension från Dignon et al. diskuterade hur dessa simuleringar kan tillämpas för att tolka de experimentella resultaten, för att förklara fasbeteendet och för att tillhandahålla prediktiva ramverk för att designa proteiner med avstämbara fasövergångsegenskaper. Utmaningen är kompromissen mellan modellens upplösning och beräkningseffektiviteten, eftersom allatomsimuleringar av stora system som involverar internflyktingar fortfarande är svåra att utföra. Dessutom är de molekylära interaktionerna mellan IDPs i dropptillståndet fortfarande dåligt förstådda, och kombinationen av experimentella data och simuleringar är oumbärliga för att belysa dem. Förbättringar av provtagnings- och simuleringsmetoder kan komma att ske under de närmaste åren, för att belysa dessa mekanismer.

Se även

  1. ^ a b    Orlando, Gabriele; Raimondi, Daniele; Tabaro, Francesco; Codicè, Francesco; Moreau, Yves; Vranken, Wim F (2019-04-17). "Beräkningsidentifiering av prionliknande RNA-bindande proteiner som bildar vätskefasseparerade kondensat" . Bioinformatik . 35 (22): 4617–4623. doi : 10.1093/bioinformatics/btz274 . ISSN 1367-4803 . PMID 30994888 .
  2. ^ a b     Lancaster, AK; Nutter-Upham, A.; Lindquist, S.; King, OD (2014-05-13). "PLAAC: en webb- och kommandoradsapplikation för att identifiera proteiner med prionliknande aminosyrasammansättning" . Bioinformatik . 30 (17): 2501–2502. doi : 10.1093/bioinformatics/btu310 . ISSN 1367-4803 . PMC 4147883 . PMID 24825614 .
  3. ^ a b     Vernon, Robert McCoy; Chong, Paul Andrew; Tsang, Brian; Kim, Tae Hun; Bah, Alaji; Farber, Patrick; Lin, Hong; Forman-Kay, Julie Deborah (2018-02-09). Shan, Yibing (red.). "Pi-Pi-kontakter är en förbisedd proteinfunktion som är relevant för fasseparation" . eLife . 7 : e31486. doi : 10.7554/eLife.31486 . ISSN 2050-084X . PMC 5847340 . PMID 29424691 .
  4. ^ a b     Bolognesi, Benedetta; Gotor, Nieves Lorenzo; Dhar, Riddhiman; Cirillo, Davide; Baldrighi, Marta; Tartaglia, Gian Gaetano; Lehner, Ben (2016-06-28). "En koncentrationsberoende vätskefasseparation kan orsaka toxicitet vid ökat proteinuttryck" . Cellrapporter . 16 (1): 222–231. doi : 10.1016/j.celrep.2016.05.076 . ISSN 2211-1247 . PMC 4929146 . PMID 27320918 .
  5. ^     Ambadipudi, Susmitha; Biernat, Jacek; Riedel, Dietmar; Mandelkow, Eckhard; Zweckstetter, Markus (2017-08-17). "Vätske-vätskefasseparation av de mikrotubulibindande upprepningarna av det Alzheimer-relaterade proteinet Tau" . Naturkommunikation . 8 (1): 275. Bibcode : 2017NatCo...8..275A . doi : 10.1038/s41467-017-00480-0 . ISSN 2041-1723 . PMC 5561136 . PMID 28819146 .
  6. ^ a b   Sun, Tanlin; Li, Qian; Xu, Youjun; Zhang, Zhuqing; Lai, Luhua; Pei, Jianfeng (2019-11-15). "Förutsägelse av vätske-vätskefasseparationsproteiner med hjälp av maskininlärning" : 842336. doi : 10.1101/842336 . S2CID 209574590 . {{ citera journal }} : Citera journal kräver |journal= ( hjälp )
  7. ^ a b     Mierlo, Guido van; Jansen, Jurriaan RG; Wang, Jie; Poser, Ina; Heeringen, Simon J. van; Vermeulen, Michiel (2021-02-02). "Förutsäga bildning av proteinkondensat med hjälp av maskininlärning" . Cellrapporter . 34 (5): 108705. doi : 10.1016/j.celrep.2021.108705 . ISSN 2211-1247 . PMID 33535034 . S2CID 231804701 .
  8. ^ a b     Hardenberg, Maarten; Horvath, Attila; Ambrus, Viktor; Fuxreiter, Monika; Vendruscolo, Michele (2020-12-29). "Utbredd förekomst av dropptillståndet av proteiner i det mänskliga proteomet" . Proceedings of the National Academy of Sciences . 117 (52): 33254–33262. doi : 10.1073/pnas.2007670117 . ISSN 0027-8424 . PMC 7777240 . PMID 33318217 .
  9. ^     Dignon, Gregory L; Zheng, Wenwei; Mittal, Jeetain (2019-03-01). "Simuleringsmetoder för vätske-vätskefasseparation av oordnade proteiner" . Aktuellt yttrande inom kemiteknik . Frontiers of Chemical Engineering: Molecular Modeling. 23 : 92–98. doi : 10.1016/j.coche.2019.03.004 . ISSN 2211-3398 . PMC 7426017 . PMID 32802734 .
  10. ^     Shea, Joan-Emma; Bästa, Robert B; Mittal, Jeetain (2021-04-01). "Fysikbaserade beräkningsmässiga och teoretiska tillvägagångssätt för i sig störda proteiner" . Aktuell åsikt i strukturbiologi . Teori och simulering/beräkningsmetoder ● Makromolekylära sammanställningar. 67 : 219-225. doi : 10.1016/j.sbi.2020.12.012 . ISSN 0959-440X . PMC 8150118 . PMID 33545530 .