Strukturell inriktning
Strukturell inriktning försöker etablera homologi mellan två eller flera polymerstrukturer baserat på deras form och tredimensionella konformation . Denna process tillämpas vanligtvis på proteintertiära strukturer men kan också användas för stora RNA- molekyler. I motsats till enkel strukturell överlagring, där åtminstone några ekvivalenta rester av de två strukturerna är kända, kräver strukturell inriktning ingen a priori kunskap om ekvivalenta positioner. Strukturell anpassning är ett värdefullt verktyg för jämförelse av proteiner med låg sekvenslikhet, där evolutionära relationer mellan proteiner inte enkelt kan detekteras med standardtekniker för sekvensanpassning . Strukturell anpassning kan därför användas för att antyda evolutionära relationer mellan proteiner som delar mycket lite gemensam sekvens. Försiktighet bör dock iakttas när resultaten används som bevis för delad evolutionär härkomst på grund av de möjliga förvirrande effekterna av konvergent evolution genom vilken flera orelaterade aminosyrasekvenser konvergerar till en gemensam tertiär struktur .
Strukturella anpassningar kan jämföra två sekvenser eller flera sekvenser . Eftersom dessa anpassningar är beroende av information om alla frågesekvensernas tredimensionella konformationer, kan metoden endast användas på sekvenser där dessa strukturer är kända. Dessa hittas vanligtvis genom röntgenkristallografi eller NMR-spektroskopi . Det är möjligt att utföra en strukturell inriktning på strukturer producerade med strukturförutsägelsemetoder . Att utvärdera sådana förutsägelser kräver faktiskt ofta en strukturell anpassning mellan modellen och den verkligt kända strukturen för att bedöma modellens kvalitet. Strukturella anpassningar är särskilt användbara för att analysera data från strukturell genomik och proteomikinsatser , och de kan användas som jämförelsepunkter för att utvärdera anpassningar producerade av rent sekvensbaserade bioinformatiska metoder.
Utdata från en strukturell inriktning är en överlagring av de atomära koordinatuppsättningarna och en minimal rotmedelkvadratavvikelse ( RMSD ) mellan strukturerna. RMSD för två inriktade strukturer indikerar deras divergens från varandra. Strukturell anpassning kan kompliceras av förekomsten av flera proteindomäner inom en eller flera av ingångsstrukturerna, eftersom förändringar i relativ orientering av domänerna mellan två strukturer som ska orienteras kan artificiellt blåsa upp RMSD.
Data producerad genom strukturell anpassning
Den minsta information som produceras från en framgångsrik strukturell anpassning är en uppsättning rester som anses vara likvärdiga mellan strukturerna. Denna uppsättning ekvivalenser används sedan typiskt för att överlagra de tredimensionella koordinaterna för varje ingångsstruktur. (Observera att ett ingångselement kan vara fixerat som en referens och därför ändras inte dess överlagrade koordinater.) De monterade strukturerna kan användas för att beräkna ömsesidiga RMSD-värden, såväl som andra mer sofistikerade mått på strukturell likhet, såsom det globala avståndstestet (GDT, måtten som används i CASP ). Den strukturella anpassningen innebär också en motsvarande endimensionell sekvensanpassning från vilken en sekvensidentitet, eller procentandelen av rester som är identiska mellan ingångsstrukturerna, kan beräknas som ett mått på hur nära de två sekvenserna är relaterade.
Typer av jämförelser
Eftersom proteinstrukturer är sammansatta av aminosyror vars sidokedjor är länkade av en gemensam proteinryggrad, kan ett antal olika möjliga undergrupper av atomerna som utgör en proteinmakromolekyl användas för att producera en strukturell anpassning och beräkna motsvarande RMSD-värden. När strukturer i linje med mycket olika sekvenser, tas sidokedjeatomerna i allmänhet inte i beräkning eftersom deras identiteter skiljer sig åt mellan många inriktade rester. Av denna anledning är det vanligt att strukturella anpassningsmetoder som standard endast använder de ryggradsatomer som ingår i peptidbindningen . För enkelhetens skull och effektiviteten beaktas ofta endast alfa-kolpositionerna , eftersom peptidbindningen har en minimalt variant plan konformation. Endast när strukturerna som ska anpassas är mycket lika eller till och med identiska är det meningsfullt att justera sidokedjeatompositioner, i vilket fall RMSD återspeglar inte bara konformationen av proteinryggraden utan också de rotameriska tillstånden hos sidokedjorna . Andra jämförelsekriterier som reducerar brus och stärker positiva matchningar inkluderar sekundär strukturtilldelning , naturliga kontaktkartor eller restinteraktionsmönster, mått på sidokedjepackning och mått på retention av vätebindningar .
Strukturell överlagring
Den mest grundläggande möjliga jämförelsen mellan proteinstrukturer gör inga försök att ställa in ingångsstrukturerna och kräver en förberäknad anpassning som indata för att bestämma vilka av resterna i sekvensen som är avsedda att beaktas i RMSD-beräkningen. Strukturell superposition används vanligtvis för att jämföra flera konformationer av samma protein (i vilket fall ingen anpassning är nödvändig, eftersom sekvenserna är desamma) och för att utvärdera kvaliteten på anpassningar som produceras med enbart sekvensinformation mellan två eller flera sekvenser vars strukturer är kända . Denna metod använder traditionellt en enkel minsta kvadraters anpassningsalgoritm, där de optimala rotationerna och translationerna hittas genom att minimera summan av de kvadratiska avstånden mellan alla strukturer i superpositionen. På senare tid har maximal sannolikhet och Bayesianska metoder avsevärt ökat noggrannheten för de uppskattade rotationerna, translationerna och kovariansmatriserna för superpositionen.
Algoritmer baserade på multidimensionella rotationer och modifierade kvaternioner har utvecklats för att identifiera topologiska samband mellan proteinstrukturer utan behov av en förutbestämd anpassning. Sådana algoritmer har framgångsrikt identifierat kanoniska veck som fyra-helixbunten . SuperPose - metoden är tillräckligt töjbar för att korrigera för relativa domänrotationer och andra strukturella fallgropar.
Utvärdera likhet
Ofta är syftet med att söka en strukturell överlagring inte så mycket själva superpositionen, utan en utvärdering av likheten mellan två strukturer eller ett förtroende för en avlägsen anpassning. En subtil men viktig skillnad från maximal strukturell överlagring är omvandlingen av en anpassning till en meningsfull likhetspoäng. De flesta metoder ger någon sorts "poäng" som indikerar kvaliteten på överlagringen. Men vad man faktiskt vill ha är inte bara ett uppskattat "Z-värde" eller ett uppskattat E-värde för att se den observerade superpositionen av en slump utan man önskar istället att det uppskattade E-värdet är nära korrelation till det sanna E-värdet. Kritiskt är att även om en metods uppskattade E-värde är exakt korrekt i genomsnitt , om den saknar en låg standardavvikelse på dess uppskattade värdegenereringsprocess, kommer rangordningen av de relativa likheterna mellan ett frågeprotein och en jämförelseuppsättning sällan att överensstämma med den "sanna" ordningen.
Olika metoder kommer att lägga olika antal rester över varandra eftersom de använder olika kvalitetssäkringar och olika definitioner av "överlappning"; vissa innehåller bara rester som uppfyller flera lokala och globala superpositionskriterier och andra är mer giriga, flexibla och promiskuösa. Ett större antal överlagrade atomer kan betyda mer likhet, men det kanske inte alltid ger det bästa E-värdet som kvantifierar osannolikheten av överlagringen och därför inte lika användbart för att bedöma likhet, särskilt i avlägsna homologer.
Algoritmisk komplexitet
Optimal lösning
Den optimala " träningen " av en proteinsekvens på en känd struktur och produktionen av en optimal multipelsekvensinriktning har visats vara NP-komplett . Detta innebär dock inte att det strukturella anpassningsproblemet är NP-komplett. Strängt taget är en optimal lösning på problemet med proteinstrukturanpassning endast känd för vissa proteinstrukturlikhetsmått, såsom de mått som används i proteinstrukturförutsägelseexperiment, GDT_TS och MaxSub. Dessa åtgärder kan rigoröst optimeras med hjälp av en algoritm som kan maximera antalet atomer i två proteiner som kan överlagras under en fördefinierad avståndsgräns. Tyvärr är algoritmen för optimal lösning inte praktisk, eftersom dess körtid inte bara beror på längderna utan också på den inneboende geometrin hos ingående proteiner.
Ungefärlig lösning
Ungefärliga polynom-tidsalgoritmer för strukturell inriktning som producerar en familj av "optimala" lösningar inom en approximationsparameter för en given poängfunktion har utvecklats. Även om dessa algoritmer teoretiskt klassificerar det ungefärliga problemet med proteinstrukturanpassning som "löst", är de fortfarande beräkningsmässigt för dyra för storskalig proteinstrukturanalys. Som en konsekvens existerar inte praktiska algoritmer som konvergerar till de globala lösningarna för anpassningen, givet en poängfunktion. De flesta algoritmer är därför heuristiska, men algoritmer som garanterar konvergens till åtminstone lokala maximisatorer av poängfunktionerna och är praktiska har utvecklats.
Representation av strukturer
Proteinstrukturer måste representeras i något koordinatoberoende utrymme för att göra dem jämförbara. Detta uppnås typiskt genom att konstruera en sekvens-till-sekvens-matris eller serie av matriser som omfattar jämförande metriker: snarare än absoluta avstånd i förhållande till ett fast koordinatutrymme. En intuitiv representation är distansmatrisen , som är en tvådimensionell matris som innehåller alla parvisa avstånd mellan någon delmängd av atomerna i varje struktur (som alfakolen ) . Matrisen ökar i dimensionalitet när antalet strukturer som ska justeras samtidigt ökar. Att reducera proteinet till ett grovt mått såsom sekundära strukturelement (SSE) eller strukturella fragment kan också producera förnuftiga anpassningar, trots förlusten av information från kasseringsavstånd, eftersom brus också kasseras. Att välja en representation för att underlätta beräkningen är avgörande för att utveckla en effektiv inriktningsmekanism.
Metoder
Strukturella inriktningstekniker har använts för att jämföra individuella strukturer eller uppsättningar av strukturer såväl som i produktionen av "allt-till-alla" jämförelsedatabaser som mäter divergensen mellan varje par av strukturer som finns i Protein Data Bank (PDB ) . Sådana databaser används för att klassificera proteiner efter deras veck .
DALI
En vanlig och populär strukturell inriktningsmetod är DALI, eller Distance-matrix ALIgnment-metoden, som bryter indatastrukturerna i hexapeptidfragment och beräknar en avståndsmatris genom att utvärdera kontaktmönstren mellan på varandra följande fragment. Sekundära strukturegenskaper som involverar rester som är angränsande i sekvens visas på matrisens huvuddiagonal ; andra diagonaler i matrisen reflekterar rumsliga kontakter mellan rester som inte är nära varandra i sekvensen. När dessa diagonaler är parallella med huvuddiagonalen, är de egenskaper de representerar parallella; när de är vinkelräta är deras egenskaper antiparallella. Denna representation är minneskrävande eftersom funktionerna i den kvadratiska matrisen är symmetriska (och därmed redundanta) kring huvuddiagonalen.
När två proteiners distansmatriser delar samma eller liknande egenskaper i ungefär samma positioner, kan de sägas ha liknande veck med liknande längdslingor som förbinder deras sekundära strukturelement. DALIs faktiska anpassningsprocess kräver en likhetssökning efter att de två proteinernas avståndsmatriser har byggts; detta utförs normalt via en serie överlappande submatriser av storleken 6x6. Submatrismatchningar sätts sedan samman till en slutlig justering via en standardpoängmaximeringsalgoritm - den ursprungliga versionen av DALI använde en Monte Carlo- simulering för att maximera en strukturell likhetspoäng som är en funktion av avstånden mellan förmodade motsvarande atomer. I synnerhet är mer avlägsna atomer inom motsvarande egenskaper exponentiellt nedviktade för att minska effekterna av brus som introduceras av slingmobilitet, spiraltorsioner och andra mindre strukturella variationer. Eftersom DALI förlitar sig på en allt-till-alla-avståndsmatris, kan den förklara möjligheten att strukturellt anpassade funktioner kan visas i olika ordningsföljder inom de två sekvenserna som jämförs.
DALI-metoden har också använts för att konstruera en databas känd som FSSP (Fold classification based on Structure-Structure alignment of Proteins, or Families of Structurally Similar Proteins) där alla kända proteinstrukturer är inriktade med varandra för att bestämma deras strukturella grannar och veckklassificering. Det finns en sökbar databas baserad på DALI samt ett nedladdningsbart program och webbsökning baserad på en fristående version känd som DaliLite.
Kombinatorisk förlängning
Den kombinatoriska förlängningsmetoden (CE) liknar DALI genom att den också bryter upp varje struktur i frågeuppsättningen i en serie fragment som den sedan försöker återmontera till en fullständig justering. En serie av parvisa kombinationer av fragment som kallas aligned fragment pairs, eller AFP, används för att definiera en likhetsmatris genom vilken en optimal väg genereras för att identifiera den slutliga inriktningen. Endast AFP som uppfyller givna kriterier för lokal likhet ingår i matrisen som ett sätt att minska det nödvändiga sökutrymmet och därigenom öka effektiviteten. Ett antal likhetsmått är möjliga; den ursprungliga definitionen av CE-metoden inkluderade endast strukturella överlagringar och avstånd mellan rester men har sedan utökats till att omfatta lokala miljöegenskaper som sekundär struktur, exponering för lösningsmedel, vätebindningsmönster och dihedriska vinklar .
En anpassningsbana beräknas som den optimala vägen genom likhetsmatrisen genom att linjärt fortskrida genom sekvenserna och utöka anpassningen med nästa möjliga högpoängande AFP-par. Det initiala AFP-paret som nukleerar anpassningen kan förekomma vid vilken punkt som helst i sekvensmatrisen. Förlängningar fortsätter sedan med nästa AFP som uppfyller givna avståndskriterier, vilket begränsar inriktningen till låga gapstorlekar. Storleken på varje AFP och den maximala gapstorleken är nödvändiga inmatningsparametrar men är vanligtvis inställda på empiriskt bestämda värden på 8 respektive 30. Liksom DALI och SSAP har CE använts för att konstruera en klassificeringsdatabas för allt-till-alla, arkiverad 1998-12-03 på Wayback Machine från de kända proteinstrukturerna i PDB.
RCSB PDB har nyligen släppt en uppdaterad version av CE, Mammoth och FATCAT som en del av RCSB PDB Protein Comparison Tool . Det ger en ny variant av CE som kan detektera cirkulära permutationer i proteinstrukturer.
Mammut
MAMMOTH närmar sig anpassningsproblemet från ett annat mål än nästan alla andra metoder. Istället för att försöka hitta en anpassning som maximalt överlagrar det största antalet rester, söker den den delmängd av den strukturella anpassningen som minst sannolikt inträffar av en slump. För att göra detta markerar den en lokal motivanpassning med flaggor för att indikera vilka rester som samtidigt uppfyller strängare kriterier: 1) Lokal strukturöverlappning 2) vanlig sekundär struktur 3) 3D-superposition 4) samma ordning i primär sekvens. Den konverterar statistiken över antalet rester med högsäkerhetsmatchningar och storleken på proteinet för att beräkna ett förväntansvärde för resultatet av en slump. Den utmärker sig i att matcha avlägsna homologer, särskilt strukturer som genereras av ab initio-strukturförutsägelse till strukturfamiljer som SCOP, eftersom den betonar att extrahera en statistiskt tillförlitlig underanpassning och inte för att uppnå maximal sekvensanpassning eller maximal 3D-superposition.
För varje överlappande fönster med 7 på varandra följande rester beräknar den uppsättningen av enhetsvektorer för förskjutningsriktning mellan intilliggande C-alfa-rester. Alla-mot-alla lokala motiv jämförs utifrån URMS-poängen. Dessa värden blir parjusteringspoängposterna för dynamisk programmering som ger en fröparvis restinriktning. Den andra fasen använder en modifierad MaxSub-algoritm: ett enstaka 7-resid aligned par i varje protein används för att orientera de två fullängdsproteinstrukturerna för att maximalt överlagra dessa bara dessa 7 C-alfa, sedan i den här orienteringen skannar den efter eventuella ytterligare justerade par som är nära i 3D. Den omorienterar strukturerna för att överlagra denna utökade uppsättning och itererar tills inga fler par sammanfaller i 3D. Denna process startas om för varje 7:e restfönster i fröjusteringen. Utgången är det maximala antalet atomer som finns från något av dessa initiala frön. Denna statistik omvandlas till ett kalibrerat E-värde för likheten mellan proteinerna.
Mammoth gör inga försök att upprepa den initiala justeringen eller utöka den högkvalitativa delmängden. Därför kan fröjusteringen den visar inte jämföras rättvist med DALI eller TM align eftersom den skapades helt enkelt som en heuristik för att beskära sökutrymmet. (Den kan användas om man vill ha en anpassning baserad enbart på lokal struktur-motiv-likhet som är agnostisk för långdistans styv kropps atominriktning.) På grund av samma sparsamhet är den långt över tio gånger snabbare än DALI, CE och TM-align. Det används ofta i kombination med dessa långsammare verktyg för att förhandsgranska stora databaser för att extrahera de bästa E-värderelaterade strukturerna för mer uttömmande överlagring eller dyra beräkningar.
Det har varit särskilt framgångsrikt med att analysera "lock"-strukturer från ab initio-strukturförutsägelse. Dessa lockbeten är ökända för att få lokal fragment-motivstruktur korrekt och att bilda några kärnor med korrekt 3D-tertiärstruktur men att få den fullängds tertiära strukturen fel. I denna skymningsfjärrhomologiregim har Mammoths e-värden för utvärdering av CASP-proteinstrukturförutsägelse visat sig vara betydligt mer korrelerade med mänsklig rankning än SSAP eller DALI. Mammoths förmåga att extrahera multikriteriernas partiella överlappningar med proteiner med känd struktur och rangordna dessa med korrekta E-värden, kombinerat med dess hastighet underlättar genomsökning av ett stort antal lockbetsmodeller mot PDB-databasen för att identifiera de mest sannolika korrekta lockbetena baserat på deras fjärrhomologi med kända proteiner.
SSAP
SSAP-metoden (Sequential Structure Alignment Program) använder dubbel dynamisk programmering för att producera en strukturell inriktning baserad på atom-till-atom- vektorer i strukturrymden. Istället för de alfa-kol som vanligtvis används i strukturell anpassning, konstruerar SSAP sina vektorer från beta-kolen för alla rester utom glycin, en metod som alltså tar hänsyn till det rotameriska tillståndet för varje rest såväl som dess placering längs ryggraden. SSAP fungerar genom att först konstruera en serie av avståndsvektorer mellan rester mellan varje rest och dess närmaste icke-angränsande grannar på varje protein. En serie matriser konstrueras sedan innehållande vektorskillnaderna mellan grannar för varje par av rester för vilka vektorer konstruerades. Dynamisk programmering applicerad på varje resulterande matris bestämmer en serie av optimala lokala inriktningar som sedan summeras till en "sammanfattningsmatris" till vilken dynamisk programmering appliceras igen för att bestämma den övergripande strukturella inriktningen.
SSAP producerade ursprungligen endast parvisa anpassningar men har sedan dess utökats till flera anpassningar också. Det har använts på ett allt-till-alla-sätt för att producera ett hierarkiskt veckklassificeringsschema känt som CATH (Class, Architecture, Topology, Homology), som har använts för att konstruera CATH Protein Structure Classification- databasen.
Senaste utvecklingen
Förbättringar av strukturella anpassningsmetoder utgör ett aktivt forskningsområde, och nya eller modifierade metoder föreslås ofta som påstås ge fördelar jämfört med de äldre och mer spridda teknikerna. Ett färskt exempel, TM-align, använder en ny metod för att vikta dess avståndsmatris, på vilken standard dynamisk programmering sedan tillämpas. Viktningen föreslås för att påskynda konvergensen av dynamisk programmering och korrigera för effekter som härrör från inriktningslängder. I en benchmarkingstudie har TM-align rapporterats förbättra både hastighet och noggrannhet jämfört med DALI och CE.
Andra lovande metoder för strukturell anpassning är lokala strukturella anpassningsmetoder. Dessa ger jämförelse av förutvalda delar av proteiner (t.ex. bindningsställen, användardefinierade strukturella motiv) mot bindningsställen eller strukturella databaser för hela proteiner. MultiBind- och MAPPIS-servrarna tillåter identifiering av vanliga rumsliga arrangemang av fysikalisk-kemiska egenskaper såsom H-bindningsdonator, acceptor, alifatisk, aromatisk eller hydrofob i en uppsättning av användarförsedda proteinbindningsställen definierade av interaktioner med små molekyler (MultiBind) eller i en uppsättning av användartillhandahållna protein-protein-gränssnitt (MAPPIS). Andra tillhandahåller jämförelse av hela proteinstrukturer mot ett antal användarinlämnade strukturer eller mot en stor databas med proteinstrukturer inom rimlig tid ( ProBiS ). Till skillnad från globala anpassningsmetoder är lokala strukturella anpassningsmetoder lämpade för detektion av lokalt konserverade mönster av funktionella grupper, som ofta uppträder i bindningsställen och har betydande inblandning i ligandbindning. Som ett exempel kan man jämföra G-Losa, ett verktyg för lokal strukturanpassning, med TM-align, en global strukturanpassningsbaserad metod. Medan G-Losa förutsäger läkemedelsliknande liganders positioner i enkelkedjiga proteinmål mer exakt än TM-align, är den totala framgångsfrekvensen för TM-align bättre.
Men eftersom algoritmiska förbättringar och datorprestanda har raderat rent tekniska brister i äldre tillvägagångssätt, har det blivit tydligt att det inte finns något universellt kriterium för den "optimala" strukturella anpassningen. TM-align, till exempel, är särskilt robust för att kvantifiera jämförelser mellan uppsättningar av proteiner med stora skillnader i sekvenslängder, men den fångar bara indirekt vätebindning eller sekundär strukturordningsbevarande som kan vara bättre mätvärden för anpassning av evolutionärt relaterade proteiner. Sålunda har den senaste utvecklingen fokuserat på att optimera särskilda attribut som hastighet, kvantifiering av poäng, korrelation till alternativa guldstandarder eller tolerans för ofullkomlighet i strukturella data eller ab initio strukturella modeller. En alternativ metod som vinner popularitet är att använda konsensus mellan olika metoder för att fastställa proteiners strukturella likheter.
RNA strukturell anpassning
Strukturella anpassningstekniker har traditionellt tillämpats uteslutande på proteiner, som de primära biologiska makromolekylerna som antar karakteristiska tredimensionella strukturer. Men stora RNA- molekyler bildar också karakteristiska tertiära strukturer , som huvudsakligen förmedlas av vätebindningar som bildas mellan baspar såväl som basstapling . Funktionellt liknande icke-kodande RNA- molekyler kan vara särskilt svåra att extrahera från genomikdata eftersom strukturen är starkare konserverad än sekvensen i RNA såväl som i proteiner, och det mer begränsade alfabetet av RNA minskar informationsinnehållet i en given nukleotid vid en given position.
På grund av det ökande intresset för RNA-strukturer och på grund av ökningen av antalet experimentellt bestämda 3D-RNA-strukturer har dock få metoder för likhet med RNA-strukturer utvecklats nyligen. En av dessa metoder är t.ex. SETTER som bryter ner varje RNA-struktur i mindre delar som kallas allmänna sekundära strukturenheter (GSSU). GSSUs anpassas därefter och dessa partiella anpassningar slås samman till den slutliga RNA-strukturanpassningen och poängsätts. Metoden har implementerats i SETTER webbserver .
En ny metod för parvis strukturell anpassning av RNA-sekvenser med låg sekvensidentitet har publicerats och implementerats i programmet FOLDALIGN . Denna metod är dock inte riktigt analog med proteinstrukturell anpassningsteknik eftersom den beräkningsmässigt förutsäger strukturerna för RNA-inmatningssekvenserna snarare än att kräva experimentellt bestämda strukturer som indata. Även om beräkningsförutsägelse av proteinveckningsprocessen inte har varit särskilt framgångsrik hittills, kan RNA-strukturer utan pseudoknoter ofta förutsägas förnuftigt med hjälp av gratis energibaserade poängmetoder som står för basparning och stapling.
programvara
Att välja ett mjukvaruverktyg för strukturell anpassning kan vara en utmaning på grund av det stora utbudet av tillgängliga paket som skiljer sig markant i metodik och tillförlitlighet. En dellösning på detta problem presenterades i och gjordes allmänt tillgänglig via ProCKSI webbserver. En mer komplett lista över för närvarande tillgängliga och fritt distribuerade mjukvara för strukturell uppriktning finns i programvara för strukturell uppriktning .
Egenskaper för vissa strukturella anpassningsservrar och mjukvarupaket sammanfattas och testas med exempel på Structural Alignment Tools i Proteopedia.Org .
Se även
Vidare läsning
- Bourne PE, Shindyalov IN. (2003): Strukturjämförelse och anpassning . I: Bourne, PE, Weissig, H. (Eds): Structural Bioinformatics . Hoboken NJ: Wiley-Liss. ISBN 0-471-20200-2
- Yuan X, Bystroff C. (2004) "Icke-sekventiella strukturbaserade anpassningar avslöjar topologioberoende kärnpackningsarrangemang i proteiner", Bioinformatik . 5 november 2004
- Jung J, Lee B (2000). "Justering av proteinstrukturer med hjälp av miljöprofiler" . Protein Eng . 13 (8): 535–543. doi : 10.1093/protein/13.8.535 . PMID 10964982 .
- Ye Y, Godzik A (2005). "Flera flexibel strukturjustering med hjälp av partiella ordningsdiagram" . Bioinformatik . 21 (10): 2362–2369. doi : 10.1093/bioinformatics/bti353 . PMID 15746292 .
- Sippl M, Wiederstein M (2008). "En anteckning om svåra strukturanpassningsproblem" . Bioinformatik . 24 (3): 426–427. doi : 10.1093/bioinformatics/btm622 . PMID 18174182 .