Förutsäg protein
Originalförfattare | Burkhard Rost |
---|---|
Utvecklare | Guy Yachdav Laszlo Kajan |
Initial release | 1992 |
Stabil frisättning | 1.0.88 |
Operativ system | UNIX-baserad |
Typ | Bioinformatik |
Licens | GPLv2 |
Hemsida |
|
PredictProtein (PP) är en automatisk tjänst som söker i uppdaterade offentliga sekvensdatabaser, skapar anpassningar och förutsäger aspekter av proteinstruktur och funktion. Användare skickar en proteinsekvens och får en enda fil med resultat från databasjämförelser och prediktionsmetoder. PP gick online 1992 vid European Molecular Biology Laboratory ; sedan 1999 har det verkat från Columbia University och 2009 flyttade det till Technische Universität München . Även om många servrar har implementerat särskilda aspekter, är PP fortfarande den mest använda offentliga servern för strukturförutsägelse: över 1,5 miljoner förfrågningar från användare i 104 länder har hanterats; över 13 000 användare skickade 10 eller fler olika frågor. PP-webbsidor återspeglas i 17 länder på 4 kontinenter. Systemet är optimerat för att möta kraven från experimentister som inte har erfarenhet av bioinformatik. Detta innebar att vi fokuserade på att bara införliva högkvalitativa metoder, och försökte sammanställa resultat med att utelämna mindre tillförlitliga eller mindre viktiga.
Försök att förenkla utdata genom att införliva en hierarki av trösklar
Försöket att "försmälta" så mycket information som möjligt för att förenkla det enkla att tolka resultaten är en unik pelare för PP. Till exempel returnerar PP som standard endast de proteiner som finns i databasen som med stor sannolikhet har en liknande struktur som frågeproteinet. Särskilda förutsägelser, såsom de för membranspiraler, coiled-coil-regioner, signalpeptider och nukleära lokaliseringssignaler, returneras inte om de visar sig ligga under givna sannolikhetströsklar.
Varje begäran utlöser tillämpningen av över 20 olika metoder
Användare får en enda utdatafil med följande resultat. Databassökningar: liknande sekvenser rapporteras och anpassas med en standard, parvis BLAST, en itererad PSI-BLAST-sökning. Även om de parvisa BLAST-sökningarna är identiska med de som kan erhållas från NCBI-platsen, utförs den itererade PSI-BLAST på en noggrant filtrerad databas för att undvika ackumulering av falska positiva resultat under iterationen. En standardsökning efter funktionsmotiv i PROSITE-databasen. PP identifierar nu också förmodade gränser för strukturella domäner genom CHOP-proceduren. Metoder för att förutsäga strukturer: sekundär struktur, lösningsmedelstillgänglighet och membranspiraler som förutspås av PHD- och PROF-programmen, membransträngar som förutspås av PROFtmb, lindade spoleregioner av COILS och interresidualkontakter genom PROFcon, regioner med låg komplexitet är markerade av SEG och långa regioner utan regelbunden sekundär struktur identifieras av NORSp,. PHD/PROF-programmen är endast tillgängliga via PP. Det speciella sättet på vilket PP automatiskt itererar PSI-BLAST-sökningar och det sätt på vilket vi bestämmer vad som ska inkluderas i sekvensfamiljer är också unikt för PP. De särskilda aspekterna av funktion som för närvarande är explicit inbäddade i PP är alla på något sätt relaterade till subcellulär lokalisering: vi upptäcker nukleära lokaliseringssignaler genom PredictNLS, vi förutsäger lokalisering oberoende av målsignaler via LOCnet; och annotationshomologi med proteiner involverade i cellcykelkontroll.
Tillgänglighet
Webb-service
Webbtjänsten PredictProtein är tillgänglig på www.predictprotein.org. Användare kan skicka in en aminosyrasekvens och få i gengäld en uppsättning automatiska kommentarer för den inlämnade sekvensen. Tjänsten stöds av en databas med förberäknade resultat som påskyndar interaktionstiden.
Molnlösning [ modeord ]
Molnlösningen PredictProtein [ buzzword ] bygger på operativsystemet Debian med öppen källkod och tillhandahåller dess funktionalitet som en uppsättning gratis Debianprogramvarupaket. Bio-Linux är ett operativsystem för bioinformatik och beräkningsbiologi . Dess senaste version 7 tillhandahåller mer än 500 bioinformatikprogram på en Ubuntu Linux-bas. Ubuntu är ett Debianderivat, ett operativsystem som är baserat på Debian med egna tillägg. Cloud BioLinux är en omfattande molnlösning [ buzzword ] som kommer från Bio-Linux och Ubuntu. Debianderivat kan enkelt dela paket mellan varandra. Till exempel är Debian-paket automatiskt inkorporerade i Ubuntu och är även användbara i Cloud BioLinux (proceduren beskrivs i ).