Proteindomän

Pyruvate kinas , ett protein med tre domäner (​).

Inom molekylärbiologi är en proteindomän en region av ett proteins polypeptidkedja som är självstabiliserande och som viker sig oberoende av resten. Varje domän bildar en kompakt vikt tredimensionell struktur . Många proteiner består av flera domäner, och en domän kan förekomma i en mängd olika proteiner. Molekylär evolution använder domäner som byggstenar och dessa kan kombineras i olika arrangemang för att skapa proteiner med olika funktioner. I allmänhet varierar domäner i längd från mellan cirka 50 aminosyror upp till 250 aminosyror långa. De kortaste domänerna, såsom zinkfingrar , stabiliseras av metalljoner eller disulfidbryggor . Domäner bildar ofta funktionella enheter, såsom den kalciumbindande EF-handdomänen av calmodulin . Eftersom de är oberoende stabila, kan domäner "bytas" genom genteknik mellan ett protein och ett annat för att göra chimära proteiner .

Bakgrund

Konceptet för domänen föreslogs först 1973 av Wetlaufer efter röntgenkristallografiska studier av hönslysozym och papain och av begränsade proteolysstudier av immunglobuliner . Wetlaufer definierade domäner som stabila enheter av proteinstruktur som kunde vika sig autonomt. Tidigare har domäner beskrivits som enheter av:

  • kompakt struktur
  • funktion och evolution
  • hopfällbar.

Varje definition är giltig och kommer ofta att överlappa varandra, dvs en kompakt strukturell domän som finns bland olika proteiner kommer sannolikt att vikas oberoende inom sin strukturella miljö. Naturen sammanför ofta flera domäner för att bilda multidomän och multifunktionella proteiner med ett stort antal möjligheter. I ett multidomänprotein kan varje domän fylla sin egen funktion oberoende eller på ett samordnat sätt med sina grannar. Domäner kan antingen fungera som moduler för att bygga upp stora sammansättningar såsom viruspartiklar eller muskelfibrer, eller kan tillhandahålla specifika katalytiska eller bindningsställen som finns i enzymer eller regulatoriska proteiner.

Exempel: Pyruvatkinas

Ett lämpligt exempel är pyruvatkinas (se första figuren), ett glykolytiskt enzym som spelar en viktig roll för att reglera flödet från fruktos-1,6-bifosfat till pyruvat. Den innehåller en all-β-nukleotidbindande domän (i blått), en α/β-substratbindande domän (i grått) och en α/β-regulatorisk domän (i olivgrönt), sammankopplade med flera polypeptidlänkar. Varje domän i detta protein förekommer i olika uppsättningar av proteinfamiljer .

Den centrala α/β-fatsubstratbindande domänen är en av de vanligaste enzymvecken . Det ses i många olika enzymfamiljer som katalyserar helt orelaterade reaktioner. α/β-cylindern kallas vanligtvis för TIM-cylindern uppkallad efter triosfosfatisomeras, vilket var den första sådan struktur som löstes. Det är för närvarande klassificerat i 26 homologa familjer i CATH-domändatabasen. TIM-cylindern bildas av en sekvens av β-α-β-motiv som stängs av att den första och sista strängen binds samman av väte och bildar en åttasträngad cylinder. Det finns debatt om det evolutionära ursprunget för denna domän. En studie har föreslagit att ett enda förfäders enzym kunde ha divergerat i flera familjer, medan en annan tyder på att en stabil TIM-fatstruktur har utvecklats genom konvergent evolution.

TIM-cylindern i pyruvatkinas är "diskontinuerlig", vilket betyder att mer än ett segment av polypeptiden krävs för att bilda domänen. Detta är sannolikt resultatet av införandet av en domän i en annan under proteinets utveckling. Det har visats från kända strukturer att ungefär en fjärdedel av strukturella domäner är diskontinuerliga. Den insatta regulatoriska domänen av β-fat är "kontinuerlig", uppbyggd av en enda sträcka av polypeptid.

Enheter av proteinstruktur

Den primära strukturen (strängen av aminosyror) av ett protein kodar slutligen för dess unikt vikta tredimensionella (3D) konformation. Den viktigaste faktorn som styr veckningen av ett protein till 3D-struktur är fördelningen av polära och icke-polära sidokedjor. Vikning drivs av att hydrofoba sidokedjor begravs i det inre av molekylen för att undvika kontakt med den vattenhaltiga miljön. Generellt har proteiner en kärna av hydrofoba rester omgivna av ett skal av hydrofila rester. Eftersom själva peptidbindningarna är polära neutraliseras de av vätebindningar med varandra när de befinner sig i den hydrofoba miljön. Detta ger upphov till regioner av polypeptiden som bildar regelbundna 3D-strukturmönster som kallas sekundär struktur . Det finns två huvudtyper av sekundär struktur: α-helixar och β-sheets .

Vissa enkla kombinationer av sekundära strukturelement har visat sig ofta förekomma i proteinstruktur och kallas supersekundära strukturer eller motiv . Till exempel består β-hårnålsmotivet av två intilliggande antiparallella β-strängar förenade av en liten slinga. Det finns i de flesta antiparallella β-strukturer både som ett isolerat band och som en del av mer komplexa β-ark. En annan vanlig supersekundär struktur är β-α-β-motivet, som ofta används för att koppla ihop två parallella β-strängar. Den centrala a-helixen förbinder C-ändarna av den första strängen med N-ändarna på den andra strängen, packar dess sidokedjor mot β-arket och skyddar därför de hydrofoba resterna av β-strängarna från ytan.

Kovalent association av två domäner representerar en funktionell och strukturell fördel eftersom det finns en ökning i stabilitet jämfört med samma strukturer som inte är kovalent associerade. Andra fördelar är skyddet av intermediärer inom enzymatiska klyftor mellan domäner som annars kan vara instabila i vattenhaltiga miljöer, och ett fixerat stökiometriskt förhållande av den enzymatiska aktiviteten som är nödvändig för en sekventiell uppsättning reaktioner.

Strukturell anpassning är ett viktigt verktyg för att bestämma domäner.

Tertiär struktur

Flera motiv packas ihop för att bilda kompakta, lokala, halvoberoende enheter som kallas domäner. Den övergripande 3D-strukturen av polypeptidkedjan kallas proteinets tertiära struktur . Domäner är de grundläggande enheterna av tertiär struktur, varje domän innehåller en individuell hydrofob kärna byggd av sekundära strukturella enheter sammankopplade med slingregioner. Packningen av polypeptiden är vanligtvis mycket tätare i det inre än utsidan av domänen och producerar en fast-liknande kärna och en vätskeliknande yta. Kärnrester är ofta konserverade i en proteinfamilj , medan resterna i slingor är mindre konserverade, om de inte är involverade i proteinets funktion. Protein tertiär struktur kan delas in i fyra huvudklasser baserat på det sekundära strukturella innehållet i domänen.

  • All-α-domäner har en domänkärna byggd uteslutande från α-helixar. Denna klass domineras av små veck, av vilka många bildar en enkel bunt med spiraler som löper upp och ner.
  • All-β-domäner har en kärna som består av antiparallella β-ark, vanligtvis två ark packade mot varandra. Olika mönster kan identifieras i strängarnas arrangemang, vilket ofta ger upphov till identifiering av återkommande motiv, till exempel det grekiska nyckelmotivet.
  • α+β-domäner är en blandning av all-α- och all-β-motiv. Klassificering av proteiner i denna klass är svår på grund av överlappningar till de andra tre klasserna och används därför inte i CATH -domändatabasen.
  • α/β-domäner är gjorda av en kombination av β-α-β-motiv som övervägande bildar ett parallellt β-ark omgivet av amfipatiska α-helixar. De sekundära strukturerna är arrangerade i lager eller fat.

Begränsningar för storlek

Domäner har begränsningar för storlek. Storleken på individuella strukturella domäner varierar från 36 rester i E-selektin till 692 rester i lipoxygenas-1, men majoriteten, 90 %, har färre än 200 rester med ett genomsnitt på cirka 100 rester. Mycket korta domäner, mindre än 40 rester, stabiliseras ofta av metalljoner eller disulfidbindningar. Större domäner, mer än 300 rester, kommer sannolikt att bestå av flera hydrofoba kärnor.

Kvartär struktur

Många proteiner har en kvartär struktur , som består av flera polypeptidkedjor som associeras till en oligomer molekyl. Varje polypeptidkedja i ett sådant protein kallas en subenhet. Hemoglobin, till exempel, består av två α- och två β-subenheter. Var och en av de fyra kedjorna har ett all-α globinveck med en hemficka.

Domänbyte

Domänbyte är en mekanism för att bilda oligomera sammansättningar. Vid domänbyte ersätts ett sekundärt eller tertiärt element i ett monomert protein med samma element i ett annat protein. Domänbyte kan sträcka sig från sekundära strukturelement till hela strukturella domäner. Den representerar också en modell för evolution för funktionell anpassning genom oligomerisering, t.ex. oligomera enzymer som har sitt aktiva ställe vid subenhetsgränssnitt.

Domäner som evolutionära moduler

Naturen är en pysslare och inte en uppfinnare , nya sekvenser är anpassade från redan existerande sekvenser snarare än uppfunna. Domäner är det vanliga materialet som naturen använder för att generera nya sekvenser; de kan ses som genetiskt mobila enheter, kallade "moduler". Ofta är C- och N-terminalerna av domäner nära varandra i rymden, vilket gör att de lätt kan "sluckas in i" överordnade strukturer under evolutionsprocessen. Många domänfamiljer finns i alla tre livsformer, Archaea , Bacteria och Eukarya . Proteinmoduler är en undergrupp av proteindomäner som finns över en rad olika proteiner med en särskilt mångsidig struktur. Exempel kan hittas bland extracellulära proteiner associerade med koagulering, fibrinolys, komplement, den extracellulära matrisen, cellyteadhesionsmolekyler och cytokinreceptorer. Fyra konkreta exempel på utbredda proteinmoduler är följande domäner: SH2 , immunglobulin , fibronektin typ 3 och kringle .

Molekylär evolution ger upphov till familjer av besläktade proteiner med liknande sekvens och struktur. Sekvenslikheterna kan dock vara extremt låga mellan proteiner som delar samma struktur. Proteinstrukturer kan vara liknande eftersom proteiner har avvikit från en gemensam förfader. Alternativt kan vissa veck vara mer gynnade än andra eftersom de representerar stabila arrangemang av sekundära strukturer och vissa proteiner kan konvergera mot dessa veck under evolutionens gång. Det finns för närvarande cirka 110 000 experimentellt bestämda protein 3D-strukturer deponerade i Protein Data Bank ( PDB). Men denna uppsättning innehåller många identiska eller mycket liknande strukturer. Alla proteiner bör klassificeras till strukturella familjer för att förstå deras evolutionära relationer. Strukturella jämförelser uppnås bäst på domännivå. Av denna anledning har många algoritmer utvecklats för att automatiskt tilldela domäner i proteiner med känd 3D-struktur; se ' Domändefinition från strukturella koordinater '.

CATH-domändatabasen klassificerar domäner i ungefär 800-faldiga familjer; tio av dessa veck är mycket befolkade och kallas "superveck". Superveck definieras som veck för vilka det finns minst tre strukturer utan signifikant sekvenslikhet. Den mest befolkade är α/β-fat-supervecket, som beskrivits tidigare.

Multidomänproteiner

Majoriteten av proteinerna, två tredjedelar i encelliga organismer och mer än 80 % i metazoer, är multidomänproteiner. Andra studier drog dock slutsatsen att 40% av prokaryota proteiner består av flera domäner medan eukaryoter har cirka 65% multidomänproteiner.

Många domäner i eukaryota multidomänproteiner kan hittas som oberoende proteiner i prokaryoter, vilket tyder på att domäner i multidomänproteiner en gång har funnits som oberoende proteiner. Till exempel har ryggradsdjur en multienzympolypeptid som innehåller GAR-syntetas- , AIR-syntetas- och GAR-transformylasdomänerna (GARs-AIRs-GARt; GAR: glycinamidribonukleotidsyntetas/transferas; AIR: aminoimidazolribonukleotidsyntetas). Hos insekter uppträder polypeptiden som GARs-(AIRs)2-GARt, i jäst kodas GARs-AIRs separat från GARt, och i bakterier kodas varje domän separat.

(rullningsbar bild) Attractin-liknande protein 1 (ATRNL1) är ett multidomänprotein som finns i djur, inklusive människor. Varje enhet är en domän, t.ex. EGF- eller Kelch-domänerna .

Ursprung

Multidomänproteiner kommer sannolikt att ha uppstått från selektivt tryck under evolutionen för att skapa nya funktioner. Olika proteiner har avvikit från gemensamma förfäder genom olika kombinationer och associationer av domäner. Modulära enheter rör sig ofta omkring, inom och mellan biologiska system genom mekanismer för genetisk blandning:

  • införlivande av mobila element inklusive horisontella överföringar (mellan arter);
  • grova omarrangemang såsom inversioner, translokationer, strykningar och duplikationer;
  • homolog rekombination ;
  • glidning av DNA-polymeras under replikation.

Typer av organisation

Insättningar av liknande PH-domänmoduler (rödbrun) i två olika proteiner.

Den enklaste multidomänorganisationen som ses i proteiner är den för en enda domän som upprepas i tandem. Domänerna kan interagera med varandra ( domän-domäninteraktion ) eller förbli isolerade, som pärlor på en sträng. Det gigantiska muskelproteinet titin med 30 000 rester omfattar cirka 120 domäner av fibronektin-III-typ och Ig-typ. I serinproteaserna har en gendupliceringshändelse lett till bildandet av ett enzym med två β-fatsdomäner. Upprepningarna har avvikit så vitt att det inte finns någon uppenbar sekvenslikhet mellan dem. Det aktiva stället är beläget vid en klyfta mellan de två β-fatdomänerna, i vilken funktionellt viktiga rester tillförs från varje domän. Genmanipulerade mutanter av kymotrypsinserinproteaset visades ha viss proteinasaktivitet även om deras rester av det aktiva stället hade avskaffats och det har därför postulerats att dupliceringshändelsen förstärkte enzymets aktivitet .

Moduler visar ofta olika anslutningsförhållanden, vilket illustreras av kinesinerna och ABC-transportörerna . Kinesinmotordomänen kan vara i vardera änden av en polypeptidkedja som inkluderar en spiralformad region och en lastdomän. ABC-transportörer är byggda med upp till fyra domäner bestående av två orelaterade moduler, ATP-bindande kassett och en integrerad membranmodul, arrangerade i olika kombinationer.

Inte bara omkombinerar domäner, utan det finns många exempel på att en domän har infogats i en annan. Sekvens- eller strukturella likheter med andra domäner visar att homologer av insatta och moderdomäner kan existera oberoende. Ett exempel är "fingrarna" som infogas i "palm"-domänen inom polymeraserna i Pol I-familjen. Eftersom en domän kan infogas i en annan bör det alltid finnas minst en kontinuerlig domän i ett multidomänprotein. Detta är huvudskillnaden mellan definitioner av strukturella domäner och evolutionära/funktionella domäner. En evolutionär domän kommer att vara begränsad till en eller två kopplingar mellan domäner, medan strukturella domäner kan ha obegränsade kopplingar, inom ett givet kriterium för att det finns en gemensam kärna. Flera strukturella domäner skulle kunna tilldelas en evolutionär domän.

En superdomän består av två eller flera konserverade domäner av nominellt oberoende ursprung, men som sedan ärvs som en enda strukturell/funktionell enhet. Denna kombinerade superdomän kan förekomma i olika proteiner som inte är relaterade till enbart genduplicering. Ett exempel på en superdomän är proteinet tyrosinfosfatas C2-domänpar i PTEN , tensin , auxilin och membranproteinet TPTE2. Denna superdomän finns i proteiner hos djur, växter och svampar. En nyckelfunktion hos PTP-C2-superdomänen är bevarande av aminosyrarester i domängränssnittet.

Domäner är autonoma vikningsenheter

Hopfällbar

Proteinveckning - det olösta problemet : Sedan Anfinsens verksamma verk i början av 1960-talet är målet att helt förstå mekanismen genom vilken en polypeptid snabbt viker sig till sin stabila naturliga konformation fortfarande svårfångad. Många experimentella vikningsstudier har bidragit mycket till vår förståelse, men principerna som styr proteinveckning är fortfarande baserade på de som upptäcktes i de allra första studierna av vikning. Anfinsen visade att det naturliga tillståndet för ett protein är termodynamiskt stabilt, konformationen är på ett globalt minimum av dess fria energi.

Vikning är en riktad sökning av konformationellt utrymme som tillåter proteinet att vikas på en biologiskt genomförbar tidsskala. Levinthal- paradoxen säger att om ett protein av medelstor storlek skulle prova alla möjliga konformationer innan man hittar den med lägst energi, skulle hela processen ta miljarder år. Proteiner viker sig vanligtvis inom 0,1 och 1000 sekunder. Därför måste proteinveckningsprocessen styras någon väg genom en specifik veckningsväg. De krafter som styr detta sökande är sannolikt en kombination av lokala och globala influenser vars effekter märks i olika skeden av reaktionen.

Framsteg i experimentella och teoretiska studier har visat att vikning kan ses i termer av energilandskap, där vikningskinetik betraktas som en progressiv organisation av en ensemble av delvis vikta strukturer genom vilka ett protein passerar på väg till den vikta strukturen. Detta har beskrivits i termer av en viktratt , i vilken ett ovikt protein har ett stort antal tillgängliga konformationstillstånd och det finns färre tillstånd tillgängliga för det veckade proteinet. En tratt innebär att för proteinveckning sker en minskning av energi och förlust av entropi med ökande tertiär strukturbildning. Trattens lokala grovhet återspeglar kinetiska fällor, motsvarande ackumuleringen av felvikta mellanprodukter. En vikkedja går mot lägre fria energier inom kedjan genom att öka dess kompakthet. Kedjans konformationsalternativ blir alltmer begränsade i slutändan mot en inbyggd struktur.

Fördel med domäner vid proteinveckning

Organisationen av stora proteiner genom strukturella domäner representerar en fördel för proteinveckning, där varje domän kan vika individuellt, vilket påskyndar veckningsprocessen och minskar en potentiellt stor kombination av restinteraktioner. Dessutom, givet den observerade slumpmässiga fördelningen av hydrofoba rester i proteiner, verkar domänbildning vara den optimala lösningen för ett stort protein att begrava sina hydrofoba rester samtidigt som de hydrofila resterna hålls på ytan.

Emellertid skiljer sig rollen av inter-domäninteraktioner i proteinveckning och i energistabilisering av den nativa strukturen förmodligen för varje protein. I T4-lysozym är inverkan av en domän på den andra så stark att hela molekylen är resistent mot proteolytisk klyvning. I detta fall är vikning en sekventiell process där den C-terminala domänen måste vikas oberoende i ett tidigt steg, och den andra domänen kräver närvaron av den vikta C-terminala domänen för vikning och stabilisering.

Det har visat sig att veckningen av en isolerad domän kan ske i samma takt eller ibland snabbare än den för den integrerade domänen, vilket tyder på att ogynnsamma interaktioner med resten av proteinet kan inträffa under veckningen. Flera argument tyder på att det långsammaste steget i veckningen av stora proteiner är parningen av de vikta domänerna. Detta beror antingen på att domänerna inte är vikta helt korrekt eller på att de små justeringar som krävs för deras interaktion är energimässigt ogynnsamma, som att ta bort vatten från domängränssnittet.

Domäner och proteinflexibilitet

Proteindomänens dynamik spelar en nyckelroll i en mängd molekylärt igenkännings- och signaleringsprocesser. Proteindomäner, sammankopplade av i sig oordnade flexibla länkdomäner , inducerar långdistansallosteri via proteindomändynamik . De resulterande dynamiska moderna kan inte generellt förutsägas från statiska strukturer av varken hela proteinet eller individuella domäner. De kan dock härledas genom att jämföra olika strukturer av ett protein (som i Database of Molecular Motions) . De kan också föreslås genom provtagning i omfattande molekylära dynamikbanor och huvudkomponentanalys, eller så kan de observeras direkt med hjälp av spektra som mäts med neutronspin- ekospektroskopi.

Domändefinition från strukturella koordinater

Betydelsen av domäner som strukturella byggstenar och element i evolutionen har lett till många automatiserade metoder för deras identifiering och klassificering i proteiner med känd struktur. Automatiska procedurer för tillförlitlig domäntilldelning är avgörande för genereringen av domändatabaserna, särskilt som antalet kända proteinstrukturer ökar. Även om gränserna för en domän kan bestämmas genom visuell inspektion, är konstruktionen av en automatiserad metod inte enkel. Problem uppstår när man ställs inför domäner som är diskontinuerliga eller mycket associerade. Att det inte finns någon standarddefinition av vad en domän egentligen är har gjort att domäntilldelningarna har varierat enormt, där varje forskare har använt en unik uppsättning kriterier.

En strukturell domän är en kompakt, globulär substruktur med fler interaktioner inom sig än med resten av proteinet. Därför kan en strukturell domän bestämmas av två visuella egenskaper: dess kompakthet och dess omfattning av isolering. Mått på lokal kompakthet i proteiner har använts i många av de tidiga metoderna för domäntilldelning och i flera av de nyare metoderna.

Metoder

En av de första algoritmerna använde en Cα-Cα-avståndskarta tillsammans med en hierarkisk klustringsrutin som betraktade proteiner som flera små segment, 10 rester i längd. De initiala segmenten grupperades efter varandra baserat på avstånd mellan segmenten; segment med de kortaste avstånden grupperades och betraktades som enstaka segment därefter. Den stegvisa klustringen inkluderade slutligen hela proteinet. Go utnyttjade också det faktum att avstånden mellan domänerna normalt är större än avstånden inom domänen; alla möjliga Cα-Cα-avstånd representerades som diagonala plots där det fanns distinkta mönster för spiraler, förlängda strängar och kombinationer av sekundära strukturer.

Metoden av Sowdhamini och Blundell kluster sekundära strukturer i ett protein baserat på deras Cα-Cα-avstånd och identifierar domäner från mönstret i deras dendrogram . Eftersom proceduren inte betraktar proteinet som en kontinuerlig kedja av aminosyror finns det inga problem med att behandla diskontinuerliga domäner. Specifika noder i dessa dendrogram identifieras som tertiära strukturella kluster av proteinet, dessa inkluderar både supersekundära strukturer och domäner. DOMAK-algoritmen används för att skapa 3Dee-domändatabasen. Den beräknar ett "delat värde" från antalet av varje typ av kontakt när proteinet delas godtyckligt i två delar. Detta delade värde är stort när de två delarna av strukturen är distinkta.

Metoden enligt Wodak och Janin baserades på de beräknade gränsytor mellan två kedjesegment som upprepade gånger kluvits vid olika restpositioner. Gränssnittsareor beräknades genom att jämföra ytareor för de kluvna segmenten med de för den naturliga strukturen. Potentiella domängränser kan identifieras på en plats där gränssnittsområdet var som ett minimum. Andra metoder har använt mått på lösningsmedelstillgänglighet för att beräkna kompaktheten.

PUU-algoritmen innehåller en harmonisk modell som används för att approximera dynamik mellan domäner. Det underliggande fysiska konceptet är att många stela interaktioner kommer att inträffa inom varje domän och lösa interaktioner kommer att inträffa mellan domäner. Denna algoritm används för att definiera domäner i FSSP- domändatabasen.

Swindells (1995) utvecklade en metod, DETECTIVE, för identifiering av domäner i proteinstrukturer utifrån idén att domäner har ett hydrofobt inre. Brister visade sig uppstå när hydrofoba kärnor från olika domäner fortsätter genom gränssnittsregionen.

RigidFinder är en ny metod för identifiering av proteinstyva block (domäner och loopar) från två olika konformationer. Stela block definieras som block där alla avstånd mellan rester bevaras över konformationer.

Metoden RIBFIND utvecklad av Pandurangan och Topf identifierar stela kroppar i proteinstrukturer genom att utföra rumslig klustring av sekundära strukturella element i proteiner. De stela RIBFIND-kropparna har använts för att flexibelt passa in proteinstrukturer i kryoelektronmikroskopi densitetskartor.

En allmän metod för att identifiera dynamiska domäner , det vill säga proteinregioner som beter sig ungefär som stela enheter under loppet av strukturella fluktuationer, har introducerats av Potestio et al. och bland andra applikationer användes också för att jämföra konsistensen av de dynamikbaserade domänunderavdelningarna med standardstrukturbaserade. Metoden, kallad PiSQRD , är allmänt tillgänglig i form av en webbserver. Det senare tillåter användare att optimalt dela upp enkelkedjiga eller multimera proteiner i kvasi-rigida domäner baserat på systemets kollektiva fluktuationssätt. Som standard beräknas de senare genom en elastisk nätverksmodell; alternativt förberäknade väsentliga dynamiska utrymmen kan laddas upp av användaren.

Exempel på domäner

Domäner med okänd funktion

En stor del av domänerna har okänd funktion. En domän med okänd funktion (DUF) är en proteindomän som inte har någon karakteriserad funktion. Dessa familjer har samlats i Pfam-databasen med prefixet DUF följt av ett nummer, med exempel DUF2992 och DUF1220. Det finns nu över 3 000 DUF-familjer i Pfam-databasen som representerar över 20 % av kända familjer. Överraskande nog har antalet DUFs i Pfam ökat från 20% (2010) till 22% (2019), mest på grund av ett ökande antal nya genomsekvenser . Pfam release 32.0 (2019) innehöll 3 961 DUFs.

Se även

Den här artikeln innehåller text och figurer från George, RA (2002) "Predicting Structural Domains in Proteins" avhandling, University College London, som bidragit med dess författare.

Nyckelpapper

externa länkar

Strukturella domändatabaser

Sekvensdomändatabaser

Funktionella domändatabaser

  • dcGO En omfattande databas med domäncentrerade ontologier om funktioner, fenotyper och sjukdomar.