Phyre

Phyre2
Utvecklare
  • Lawrence Kelley
  • Bob Maccallum
  • Benjamin Jefferys
  • Alex Herbert
  • Riccardo Bennett-Lovsey
  • Michael Sternberg
Stabil frisättning
2.0 / 23 februari 2011 ; för 12 år sedan ( 2011-02-23 )
Skrivet i
Tillgänglig i engelsk
Typ Bioinformatikverktyg för förutsägelse av proteinstruktur
Licens Creative Commons Attribution-2.0
Hemsida www .sbg .bio .ic .ac .uk /phyre2

Phyre och Phyre2 ( P rotein H omology/Analog Y R ecognition E ngine; uttalas som "eld") är gratis webbaserade tjänster för förutsägelse av proteinstruktur . Phyre är bland de mest populära metoderna för att förutsäga proteinstruktur som har citerats över 1500 gånger. Liksom andra tekniker för fjärrhomologiigenkänning (se proteintrådning ) kan den regelbundet generera tillförlitliga proteinmodeller när andra allmänt använda metoder som PSI-BLAST inte kan. Phyre2 har utformats för att säkerställa ett användarvänligt gränssnitt för användare som inte är experter på metoder för att förutsäga proteinstruktur. Dess utveckling finansieras av Biotechnology and Biological Sciences Research Council .

Beskrivning

Phyre- och Phyre2-servrarna förutsäger den tredimensionella strukturen av en proteinsekvens med hjälp av principerna och teknikerna för homologimodellering . Eftersom strukturen hos ett protein är mer bevarad i evolutionen än dess aminosyrasekvens, kan en proteinsekvens av intresse (målet) modelleras med rimlig noggrannhet på en mycket avlägsen besläktad sekvens med känd struktur (mallen), förutsatt att förhållandet mellan mål och mall kan urskiljas genom sekvensanpassning . För närvarande är de mest kraftfulla och exakta metoderna för att upptäcka och anpassa fjärrrelaterade sekvenser beroende på profiler eller dolda Markov-modeller ( HMM). Dessa profiler/HMM fångar mutationsbenägenheten för varje position i en aminosyrasekvens baserat på observerade mutationer i relaterade sekvenser och kan ses som ett "evolutionärt fingeravtryck" av ett visst protein.

Vanligtvis sammanställs aminosyrasekvenserna för en representativ uppsättning av alla kända tredimensionella proteinstrukturer, och dessa sekvenser bearbetas genom att skanna mot en stor proteinsekvensdatabas. Resultatet är en databas med profiler eller HMM, en för varje känd 3D-struktur. En användarsekvens av intresse bearbetas på liknande sätt för att bilda en profil/HMM. Denna användarprofil skannas sedan mot databasen med profiler med hjälp av profilprofil- eller HMM-HMM-inriktningstekniker. Dessa anpassningar kan också ta hänsyn till mönster av förutsagda eller kända sekundära strukturelement och kan poängsättas med hjälp av olika statistiska modeller. Se förutsägelse av proteinstruktur för mer information.

Den första Phyre-servern släpptes i juni 2005 och använder en profil-profilanpassningsalgoritm baserad på varje proteins positionsspecifika poängmatris . Phyre2-servern släpptes offentligt i februari 2011 som en ersättning för den ursprungliga Phyre-servern och ger extra funktionalitet över Phyre, ett mer avancerat gränssnitt, fullt uppdaterat vikbibliotek och använder HHpred / HHsearch- paketet för homologidetektering bland andra förbättringar.

Standardanvändning

Efter att ha klistrat in en proteinaminosyrasekvens i Phyre- eller Phyre2-inlämningsformuläret väntar en användare vanligtvis mellan 30 minuter och flera timmar (beroende på faktorer som sekvenslängd, antal homologa sekvenser och frekvens och längd på infogning och radering) för en förutsägelse att slutföra. Ett e-postmeddelande som innehåller sammanfattande information och den förutspådda strukturen i PDB-format skickas till användaren tillsammans med en länk till en webbsida med resultat. Phyre2 resultatskärmen är uppdelad i tre huvudsektioner, som beskrivs nedan.

Sekundär struktur och störningsprediktion

Exempel Phyre2-utgång för sekundär struktur och störningsprediktion

Den användarinlämnade proteinsekvensen skannas först mot en stor sekvensdatabas med PSI-BLAST . Profilen som genereras av PSI-BLAST bearbetas sedan av det neurala nätverkets sekundära strukturförutsägelseprogram PsiPred och proteinstörningsprediktorn Disopred. Den förutsagda närvaron av alfa-helixar, beta-strängar och oordnade regioner visas grafiskt tillsammans med en färgkodad konfidensstapel.

Domänanalys

Exempel Phyre2-utdata som visar flera domäner och popup-modellvisare

Många proteiner innehåller flera proteindomäner . Phyre2 tillhandahåller en tabell med mallmatchningar färgkodade av konfidens och indikerar regionen för den matchade användarsekvensen. Detta kan hjälpa till vid bestämning av domänsammansättningen av ett protein.

Detaljerad mallinformation

Exempel Phyre2 detaljerad mallinformationstabell

Huvudresultattabellen i Phyre2 ger konfidensuppskattningar, bilder och länkar till de tredimensionella predikterade modellerna och information som härrör från antingen Structural Classification of Proteins-databasen (SCOP) eller Protein Data Bank (PDB) beroende på källan till den detekterade mallen. För varje matchning tar en länk användaren till en detaljerad vy av anpassningen mellan användarsekvensen och sekvensen av känd tredimensionell struktur.

Justeringsvy

Exempel Phyre2 detaljerad vy av anpassningen mellan en användarsekvens och en känd proteinstruktur.

Den detaljerade inriktningsvyn tillåter en användare att undersöka individuella inriktade rester, matchningar mellan förutsagda och kända sekundära strukturelement och förmågan att växla information angående mönster för sekvensbevarande och sekundär strukturkonfidens. Dessutom Jmol för att möjliggöra interaktiv 3D-visning av proteinmodellen.

Förbättringar i Phyre2

Phyre2 använder ett vikbibliotek som uppdateras varje vecka när nya strukturer löses. Den använder ett mer uppdaterat gränssnitt och erbjuder ytterligare funktionalitet över Phyre-servern enligt beskrivningen nedan.

Ytterligare funktionalitet

Satsvis bearbetning

Batchbearbetningsfunktionen tillåter användare att skicka in mer än en sekvens till Phyre2 genom att ladda upp en fil med sekvenser i FASTA-format . Som standard har användare en gräns på 100 sekvenser i en batch. Denna gräns kan höjas genom att kontakta administratören. Batch-jobb bearbetas i bakgrunden på fri datorkraft när den blir tillgänglig. Sålunda tar batchjobb ofta längre tid än individuellt inskickade jobb, men detta är nödvändigt för att möjliggöra en rättvis fördelning av datorresurser till alla Phyre2-användare.

En till en tråd

En till en trådning låter dig ladda upp både en sekvens du vill modellera OCH mallen som du ska modellera den på. Användare har ibland en proteinsekvens som de vill modellera på en specifik mall som de väljer. Detta kan till exempel vara en nyligen löst struktur som inte finns i Phyre2-databasen eller på grund av ytterligare biologisk information som indikerar att den valda mallen skulle producera en mer exakt modell än den eller de som automatiskt valts av Phyre2.

Backphyre

Istället för att förutsäga 3D-strukturen för en proteinsekvens, har ofta användare en löst struktur och de är intresserade av att avgöra om det finns en relaterad struktur i ett intressant genom. I Phyre2 kan en uppladdad proteinstruktur omvandlas till en dold Markov-modell och sedan skannas mot en uppsättning genom (mer än 20 genom i mars 2011). Denna funktion kallas "BackPhyre" för att indikera hur Phyre2 används omvänt.

Phyrealarm

Ibland kan Phyre2 inte upptäcka några säkra matchningar till kända strukturer. Dock ökar vikbiblioteksdatabasen med cirka 40-100 nya strukturer varje vecka. Så även om det kanske inte finns några anständiga mallar den här veckan, kan det mycket väl bli det under de kommande veckorna. Phyrealarm tillåter användare att skicka in en proteinsekvens för att automatiskt skannas mot nya poster som läggs till foldbiblioteket varje vecka. Om en säker träff upptäcks meddelas användaren automatiskt via e-post tillsammans med resultaten av Phyre2-sökningen. Användare kan också kontrollera nivån på anpassningstäckning och förtroende för matchen som krävs för att utlösa en e-postvarning.

3DligandSite

Phyre2 är kopplad till 3DLigandSite-servern för förutsägelse av proteinbindningsställen. 3DLigandSite har varit en av de bästa servrarna för förutsägelse av bindningsställen vid Critical Assessment of Techniques for Protein Structure Prediction (CASP) i ( CASP 8 och CASP 9). Säkra modeller producerade av Phyre2 (konfidens >90%) skickas automatiskt till 3DLigandSite.

Transmembrantopologi förutsägelse

Programmet memsat_svm används för att förutsäga närvaron och topologin för eventuella transmembranspiraler som finns i användarproteinsekvensen.

Modellering av flera mallar

Phyre2 tillåter användare att välja "Intensiv"-modellering från huvudskärmen för inlämning. Detta läge:

  • Undersöker listan med träffar och tillämpar heuristik för att välja mallar som maximerar sekvenstäckning och tillförlitlighet.
  • Konstruerar modeller för varje vald mall.
  • Använder dessa modeller för att tillhandahålla parvisa avståndsbegränsningar som matas in i ab initio- och multi-mallmodelleringsverktyget Poing.
  • Poing syntetiserar användarproteinet i samband med dessa avståndsbegränsningar, modellerade av fjädrar. Regioner för vilka det inte finns någon mallinformation modelleras av den ab initio förenklade fysikmodellen av Poing.
  • Den kompletta modellen som skapas av Poing kombineras med originalmallarna som input till MODELLER .

Ansökningar

Tillämpningar av Phyre och Phyre2 inkluderar förutsägelse av proteinstruktur, funktionsförutsägelse, domänförutsägelse, förutsägelse av domängräns, evolutionär klassificering av proteiner, vägledande platsriktad mutagenes och lösning av proteinkristallstrukturer genom molekylär ersättning .

Det finns två länkade resurser som använder Phyre-förutsägelser för den strukturbaserade analysen av missense-varianter som vanligtvis härrör från enkelnukleotidpolymorfismer .

  • PhyreRisk är en databas som kartlägger genetiska varianter till experimentella och Phyre-förutspådda proteinstrukturer. Proteinsidan visar de experimentella och förutspådda strukturerna. Användare kan kartlägga varianter från antingen genetiska eller proteinkoordinater.
  • Missense3D är ett verktyg som ger en stereokemisk rapport om effekten av en missense-variant på proteinstrukturen. Användare kan ladda upp sina egna varianter och koordinater, inklusive både PDB-strukturer och Phyre-förutspådda modeller.

Historia

Phyre och Phyre2 är efterföljarna till 3D-PSSM-proteinstrukturförutsägelsesystemet som har över 1400 citeringar hittills. 3D-PSSM designades och utvecklades av Lawrence Kelley och Bob MacCallum i Biomolecular modeling Lab vid Cancer Research UK . Phyre och Phyre2 var Lawrence Kelley i Structural bioinformatics group, Imperial College London . Komponenter i Phyre- och Phyre2-systemen utvecklades av Benjamin Jefferys, Alex Herbert och Riccardo Bennett-Lovsey. Forskning och utveckling av båda servrarna leddes av Michael Sternberg .