Protein tandem upprepas

Vanliga exempel på proteintandemupprepningsstrukturer: WD40-repetitionsdomänen för beta-TrCP (grön), leucinrik upprepningsdomän för TLR2 (röd), bältdjursrepetitionsdomän för beta-catenin (blå), ankyrinrepetitionsdomän för ANKRA2 (orange) , kelch-repeteringsdomän för Keap1 (gul) och HEAT-repeteringsdomän för en PP2A -regulatorisk subenhet R1a (magenta).

En uppsättning proteintandemupprepningar definieras som flera (minst två) intilliggande kopior som har samma eller liknande sekvensmotiv . Dessa periodiska sekvenser genereras av interna duplikationer i både kodande och icke-kodande genomiska sekvenser. Repetitiva enheter av proteintandemupprepningar är avsevärt olika, allt från upprepning av en enda aminosyra till domäner med 100 eller fler rester.

Schematisk representation av tandemupprepningssekvens.

"Upprepar" i proteiner

Exempel på multipelsekvensinriktning av en pentapeptidupprepning som leder till en tandemupprepningsstruktur

I proteiner är en "upprepning" vilket sekvensblock som helst som återkommer mer än en gång i sekvensen, antingen i en identisk eller en mycket liknande form. Graden av likhet kan vara mycket varierande, med vissa upprepningar som endast bibehåller ett fåtal bevarade aminosyrapositioner och en karakteristisk längd. Mycket degenererade upprepningar kan vara mycket svåra att upptäcka från enbart sekvens. Strukturell likhet kan hjälpa till att identifiera repetitiva mönster i följd.

Strukturera

Repetitivitet indikerar inte i sig något om proteinets struktur. Som en "tumregel" kan korta repetitiva sekvenser (t.ex. de under längden av 10 aminosyror) vara i sig störda och inte en del av några vikta proteindomäner . Upprepningar som är minst 30 till 40 aminosyror långa är mycket mer benägna att vikas som en del av en domän. Sådana långa upprepningar är ofta indikativa på närvaron av en solenoiddomän i proteinet.

Ungefär hälften av tandemupprepningsregionerna har inneboende oordnade konformation som naturligt vecklas ut. Exempel på oordnade repetitiva sekvenser inkluderar 7-mer peptidupprepningar som finns i RPB1-subenheten av RNA-polymeras II , eller tandem beta-catenin eller axinbindande linjära motiv i APC (adenomatös polypos coli). Den andra hälften av regionerna med den stabila 3D-strukturen har en uppsjö av former och funktioner. Exempel på korta upprepningar som uppvisar ordnade strukturer inkluderar kollagenupprepningen med tre rester eller pentapeptidupprepningen med fem rester som bildar en beta-helixstruktur .

Klassificering

Beroende på längden på de repetitiva enheterna kan deras proteinstrukturer delas in i fem klasser:

  1. kristallina aggregat bildade av regioner med 1 eller 2 rester långa upprepningar, arketypiska lågkomplexitetsregioner
  2. fibrösa strukturer stabiliserade genom interkedjeinteraktioner med 3-7 restupprepningar
  3. långsträckta strukturer med upprepningar av 5–40 rester dominerade av solenoidproteiner
  4. slutna (ej långsträckta) strukturer med upprepningar på 30-60 rester som toroidupprepningar
  5. pärlor på en sträng strukturer med typisk storlek på upprepningar över 50 rester, som redan är tillräckligt stora för att vika sig självständigt till stabila domäner.

Fungera

Några välkända exempel på proteiner med tandemupprepningar är kollagen , som spelar en nyckelroll i arrangemanget av den extracellulära matrisen; alfa-spiralformade spolar med strukturella och oligomeriseringsfunktioner; leucinrika repeterande proteiner, som specifikt binder ett antal globulära proteiner genom sina konkava ytor; och zinkfingerproteiner , som reglerar uttrycket av gener genom att binda DNA .

Tandemupprepningsproteiner fungerar ofta som protein-proteininteraktionsmoduler. WD40 -upprepningen är ett utmärkt exempel på denna funktion.

Fördelning i proteomer

Tandemupprepningar är allestädes närvarande i proteomer och förekommer i minst 14 % av alla proteiner. Till exempel finns de i nästan vart tredje mänskligt protein och till och med i vartannat protein från Plasmodium falciparum eller Dictyostelium discoideum . Tandemupprepningar med korta repetitiva enheter (särskilt homorepeats) är vanligare än andra.

Anteckningsmetoder

Protein tandem upprepningar kan antingen detekteras från sekvens eller kommenteras från struktur. Specialiserade metoder byggdes för identifiering av repeterande proteiner.

Sekvensbaserade strategier, baserade på homologisökning eller domäntilldelning, underskattar oftast TRs på grund av närvaron av mycket degenererade upprepade enheter. En nyligen genomförd studie för att förstå och förbättra Pfam-täckningen av det mänskliga proteomet visade att fem av de tio största sekvensklustren som inte har annoterats med Pfam är upprepade regioner. Alternativt kan metoder som inte kräver några förkunskaper för detektering av upprepade delsträngar baseras på självjämförelse, klustring eller dolda Markov-modeller. Vissa andra förlitar sig på komplexitetsmätningar eller drar fördel av metasökningar för att kombinera utdata från olika källor.

Strukturbaserade metoder drar istället fördel av modulariteten hos tillgängliga PDB-strukturer för att känna igen repetitiva element.

externa länkar