Interaktion mellan protein och protein

Den hästskoformade ribonukleasinhibitorn (visad som trådram) bildar en protein-protein-interaktion med ribonukleasproteinet. Kontakterna mellan de två proteinerna visas som färgade fläckar.

Protein-protein-interaktioner ( PPI ) är fysiska kontakter med hög specificitet etablerade mellan två eller flera proteinmolekyler som ett resultat av biokemiska händelser som styrs av interaktioner som inkluderar elektrostatiska krafter , vätebindning och den hydrofoba effekten . Många är fysiska kontakter med molekylära associationer mellan kedjor som förekommer i en cell eller i en levande organism i ett specifikt biomolekylärt sammanhang.

Proteiner agerar sällan ensamma eftersom deras funktioner tenderar att regleras. Många molekylära processer i en cell utförs av molekylära maskiner som är byggda av många proteinkomponenter organiserade av deras PPI. Dessa fysiologiska interaktioner utgör organismens så kallade interaktomik , medan avvikande PPI är grunden för flera aggregationsrelaterade sjukdomar, såsom Creutzfeldt-Jakob och Alzheimers sjukdomar .

PPI har studerats med många metoder och ur olika perspektiv: biokemi , kvantkemi , molekylär dynamik , signaltransduktion , bland annat. All denna information möjliggör skapandet av stora proteininteraktionsnätverk - liknande metaboliska eller genetiska/epigenetiska nätverk - som ger den nuvarande kunskapen om biokemiska kaskader och molekylär etiologi för sjukdomar, såväl som upptäckten av förmodade proteinmål av terapeutiskt intresse.

Exempel

Elektronöverföringsproteiner

I många metabola reaktioner binder ett protein som fungerar som en elektronbärare till ett enzym som verkar för dess reduktas . Efter att den tagit emot en elektron dissocierar den och binder sedan till nästa enzym som verkar dess oxidas (dvs. en acceptor för elektronen). Dessa interaktioner mellan proteiner är beroende av mycket specifik bindning mellan proteiner för att säkerställa effektiv elektronöverföring. Exempel: mitokondriell oxidativ fosforylering kedjesystemkomponenter cytokrom c-reduktas / cytokrom c / cytokrom c oxidas; mikrosomala och mitokondriella P450-system.

identifierades de specifika resterna som var involverade i bindningen av elektronöverföringsproteinet adrenodoxin till dess reduktas som två grundläggande Arg-rester på ytan av reduktaset och två sura Asp-rester på adrenodoxinet. Nyare arbete på reduktasets fylogeni har visat att dessa rester involverade i protein-proteininteraktioner har bevarats under hela utvecklingen av detta enzym.

Signaltransduktion

Cellens aktivitet regleras av extracellulära signaler. Signalutbredning inuti och/eller längs det inre av celler beror på PPI mellan de olika signalmolekylerna. Rekryteringen av signalvägar genom PPI kallas signaltransduktion och spelar en grundläggande roll i många biologiska processer och i många sjukdomar inklusive Parkinsons sjukdom och cancer.

Membrantransport

Ett protein kan bära ett annat protein (till exempel från cytoplasma till kärna eller vice versa i fallet med kärnporsimportiner ). [ citat behövs ]

Cellmetabolism

I många biosyntetiska processer interagerar enzymer med varandra för att producera små föreningar eller andra makromolekyler. [ citat behövs ]

Muskelsammandragning

Fysiologi av muskelkontraktion involverar flera interaktioner. Myosinfilament fungerar som molekylära motorer och genom att binda till aktin möjliggör filamentglidning. Vidare associerar medlemmar av lipiddroppar associerade proteiner i skelettmuskeln med andra proteiner, som aktivator av fetttriglyceridlipas och dess samaktivator jämförande genidentifikation-58, för att reglera lipolys i skelettmuskulaturen.

Typer

För att beskriva typerna av protein-protein-interaktioner (PPI) är det viktigt att tänka på att proteiner kan interagera på ett "övergående" sätt (för att ge någon specifik effekt på kort tid, som en signaltransduktion) eller att interagera med andra proteiner i ett "stabilt" sätt att bilda komplex som blir molekylära maskiner inom de levande systemen. En sammansättning av proteinkomplex kan resultera i bildningen av homo-oligomera eller hetero-oligomera komplex . Förutom de konventionella komplexen, som enzym-inhibitor och antikropp-antigen, kan interaktioner också etableras mellan domän-domän och domän-peptid. En annan viktig skillnad för att identifiera protein-protein-interaktioner är hur de har bestämts, eftersom det finns tekniker som mäter direkta fysiska interaktioner mellan proteinpar, kallade "binära" metoder, medan det finns andra tekniker som mäter fysiska interaktioner mellan grupper av proteiner, utan parvis bestämning av proteinpartners, kallade "co-complex" metoder.

Homo-oligomerer vs. hetero-oligomerer

Homo-oligomerer är makromolekylära komplex som består av endast en typ av proteinsubenhet . Sammansättning av proteinsubenheter styrs av etableringen av icke-kovalenta interaktioner i proteinets kvartära struktur . Avbrytning av homo-oligomerer för att återgå till de initiala individuella monomererna kräver ofta denaturering av komplexet. Flera enzymer , bärarproteiner , byggnadsställningsproteiner och transkriptionsreglerande faktorer utför sina funktioner som homo-oligomerer. Distinkta proteinsubenheter interagerar i hetero-oligomerer, som är väsentliga för att kontrollera flera cellulära funktioner. Vikten av kommunikationen mellan heterologa proteiner är ännu mer uppenbar under cellsignaleringshändelser och sådana interaktioner är endast möjliga på grund av strukturella domäner inom proteinerna (som beskrivs nedan).

Stabila interaktioner kontra övergående interaktioner

Stabila interaktioner involverar proteiner som interagerar under lång tid och tar del av permanenta komplex som subenheter för att utföra funktionella roller. Dessa är vanligtvis fallet med homo-oligomerer (t.ex. cytokrom c ), och vissa hetero-oligomera proteiner, som subenheter av ATPas . Å andra sidan kan ett protein interagera kortvarigt och på ett reversibelt sätt med andra proteiner endast i vissa cellulära sammanhang – celltyp , cellcykelstadium , externa faktorer, närvaro av andra bindande proteiner etc. – som det händer med de flesta av de proteiner involverade i biokemiska kaskader . Dessa kallas transienta interaktioner. Till exempel binder vissa G-proteinkopplade receptorer endast tillfälligt till G i/o -proteiner när de aktiveras av extracellulära ligander, medan vissa Gq - kopplade receptorer, såsom muskarinreceptor M3, förkopplar med Gq- proteiner före receptor-ligandbindning. Interaktioner mellan i sig störda proteinregioner till globulära proteindomäner (dvs. MoRFs ) är övergående interaktioner.

Kovalent vs. icke-kovalent

Kovalenta interaktioner är de med starkast association och bildas av disulfidbindningar eller elektrondelning . Även om de är sällsynta är dessa interaktioner avgörande för vissa posttranslationella modifieringar , som ubiquitination och SUMOylation . Icke-kovalenta bindningar etableras vanligtvis under övergående interaktioner genom kombinationen av svagare bindningar, såsom vätebindningar , joninteraktioner, Van der Waals-krafter eller hydrofoba bindningar.

Vattnets roll

Vattenmolekyler spelar en betydande roll i interaktionen mellan proteiner. Kristallstrukturerna av komplex, erhållna med hög upplösning från olika men homologa proteiner, har visat att vissa gränssnittsvattenmolekyler är konserverade mellan homologa komplex. Majoriteten av gränssnittsvattenmolekylerna gör vätebindningar med båda parterna i varje komplex. Vissa gränssnittsaminosyrarester eller atomgrupper hos en proteinpartner deltar i både direkta och vattenmedierade interaktioner med den andra proteinpartnern. Dubbelt indirekta interaktioner, medierade av två vattenmolekyler, är fler i de homologa komplexen med låg affinitet. Noggrant utförda mutagenesexperiment, t.ex. att ändra en tyrosinrest till en fenylalanin, har visat att vattenmedierade interaktioner kan bidra till interaktionsenergin. Sålunda kan vattenmolekyler underlätta interaktionerna och korsigenkänningarna mellan proteiner.

Strukturera

Kristallstruktur av modifierad Gramicidin S bestämd genom röntgenkristallografi
NMR-struktur av cytokrom C som illustrerar dess dynamik i lösning

De molekylära strukturerna i många proteinkomplex har låsts upp med tekniken för röntgenkristallografi . Den första strukturen som löstes med denna metod var den av kaskelotmyoglobin av Sir John Cowdery Kendrew . I denna teknik detekteras vinklarna och intensiteterna hos en stråle av röntgenstrålar som diffrakteras av kristallina atomer i en film, vilket ger en tredimensionell bild av tätheten av elektroner i kristallen.

Senare började även kärnmagnetisk resonans tillämpas i syfte att reda ut proteinkomplexens molekylära struktur. Ett av de första exemplen var strukturen av kalmodulinbindande domäner bundna till kalmodulin . Denna teknik är baserad på studiet av magnetiska egenskaper hos atomkärnor, vilket bestämmer fysikaliska och kemiska egenskaper hos motsvarande atomer eller molekyler. Kärnmagnetisk resonans är fördelaktig för att karakterisera svaga PPI.

Domäner

Proteiner har strukturella domäner som tillåter deras interaktion med och binder till specifika sekvenser på andra proteiner:

SH2-domäner är strukturellt sammansatta av tresträngade tvinnade beta-ark inklämda flankerade av två alfa-helixar. Förekomsten av en djup bindningsficka med hög affinitet för fosfotyrosin , men inte för fosfoserin eller fosfotreonin , är väsentlig för igenkänningen av tyrosinfosforylerade proteiner, främst autofosforylerade tillväxtfaktorreceptorer . Tillväxtfaktorreceptorbindande proteiner och fosfolipas C y är exempel på proteiner som har SH2-domäner.
Strukturellt utgörs SH3-domäner av en beta-cylinder bildad av två ortogonala beta-ark och tre antiparallella beta-strängar. Dessa domäner känner igen prolinberikade sekvenser, som polyprolin typ II spiralstruktur (PXXP-motiv) [ verifiering behövs ] i cellsignaleringsproteiner som proteintyrosinkinaser och tillväxtfaktorreceptorbundet protein 2 ( Grb2 ).
  • Fosfotyrosinbindande (PTB) domän
PTB-domäner interagerar med sekvenser som innehåller en fosfotyrosingrupp. Dessa domäner kan hittas i insulinreceptorsubstratet .
LIM-domäner identifierades initialt i tre homeodomäntranskriptionsfaktorer (lin11, is11 och mec3). Utöver dessa homeodomänproteiner och andra proteiner som är involverade i utvecklingen har LIM-domäner också identifierats i icke-homeodomänproteiner med relevanta roller i cellulär differentiering , association med cytoskelett och senescens . Dessa domäner innehåller ett tandem-cysteinrikt Zn2 + -fingermotiv och omfattar konsensussekvensen CX2CX16-23HX2CX2CX2CX16-21CX2C/H/D. LIM-domäner binder till PDZ-domäner, bHLH-transkriptionsfaktorer och andra LIM-domäner.
SAM - domäner består av fem helixar som bildar ett kompakt paket med en konserverad hydrofob kärna . Dessa domäner, som till exempel kan hittas i Eph-receptorn och den stromala interaktionsmolekylen ( STIM ), binder till icke-SAM-domäninnehållande proteiner och de verkar också ha förmågan att binda RNA .
PDZ-domäner identifierades först i tre guanylatkinaser: PSD-95, DlgA och ZO-1. Dessa domäner känner igen karboxiterminala tripeptidmotiv (S/TXV), andra PDZ-domäner eller LIM-domäner och binder dem genom en kort peptidsekvens som har en C-terminal hydrofob rest. Några av de proteiner som identifierats ha PDZ-domäner är byggnadsställningsproteiner eller verkar vara involverade i jonreceptorsammansättning och receptorenzymkomplexbildning.
FERM-domäner innehåller basiska rester som kan binda PtdIns(4,5) P2 . Talin och focal adhesion kinas (FAK) är två av proteinerna som presenterar FERM-domäner.
CH-domäner finns huvudsakligen i cytoskelettproteiner som parvin .
Pleckstrin-homologidomäner binder till fosfoinositider och syradomäner i signalproteiner.
WW-domäner binder till prolinberikade sekvenser.
  • WSxWS-motiv
Finns i cytokinreceptorer

Egenskaper för gränssnittet

Studiet av molekylstrukturen kan ge fina detaljer om gränssnittet som möjliggör interaktionen mellan proteiner. När man karakteriserar PPI-gränssnitt är det viktigt att ta hänsyn till typen av komplex.

Parametrar som utvärderas inkluderar storlek (mätt i absoluta dimensioner Å 2 eller i lösningsmedelstillgänglig ytarea (SASA) ), form, komplementaritet mellan ytor, restgränssnittsbenägenhet, hydrofobicitet, segmentering och sekundär struktur och konformationsförändringar vid komplexbildning.

Den stora majoriteten av PPI-gränssnitt återspeglar sammansättningen av proteinytor, snarare än proteinkärnorna, trots att de ofta är berikade på hydrofoba rester, särskilt i aromatiska rester. PPI-gränssnitt är dynamiska och ofta plana, även om de också kan vara klotformade och utskjutande. Baserat på tre strukturer – insulindimer , trypsin -pankreatiskt trypsinhämmarekomplex och oxyhemoglobin – fann Cyrus Chothia och Joel Janin att mellan 1 130 och 1 720 Å 2 ytarea avlägsnades från kontakt med vatten, vilket indikerar att hydrofobicitet är en viktig faktor för stabilisering av PPI. Senare studier förfinade den nedgrävda ytan av majoriteten av interaktionerna till 1 600±350 Å 2 . Men mycket större interaktionsgränssnitt observerades också och var associerade med betydande förändringar i konformationen hos en av interaktionspartnerna. PPIs gränssnitt uppvisar både form och elektrostatisk komplementaritet.

förordning

  • Proteinkoncentration, som i sin tur påverkas av uttrycksnivåer och nedbrytningshastigheter;
  • Proteinaffinitet för proteiner eller andra bindningsligander;
  • Liganderkoncentrationer ( substrat , joner , etc.);
  • Närvaro av andra proteiner , nukleinsyror och joner ;
  • Elektriska fält runt proteiner.
  • Förekomst av kovalenta modifieringar;

Experimentella metoder

Det finns en mängd olika metoder för att upptäcka dem. Var och en av tillvägagångssätten har sina egna styrkor och svagheter, särskilt när det gäller metodens känslighet och specificitet . De mest konventionella och allmänt använda metoderna med hög genomströmning är tvåhybridscreening av jäst och affinitetsrening kopplad till masspektrometri .

Principer för tvåhybridsystem från jäst och däggdjur

Jäst två-hybrid screening

Detta system beskrevs först 1989 av Fields and Song med Saccharomyces cerevisiae som biologisk modell. Jäst två hybrid möjliggör identifiering av parvisa PPI (binär metod) in vivo , där de två proteinerna testas för biofysiskt direkt interaktion. Y2H är baserad på den funktionella rekonstitutionen av jästtranskriptionsfaktorn Gal4 och efterföljande aktivering av en selektiv reporter såsom His3. För att testa två proteiner för interaktion görs två proteinuttryckskonstruktioner: ett protein (X) fusioneras till den Gal4 DNA-bindande domänen (DB) och ett andra protein (Y) fusioneras till Gal4 aktiveringsdomänen (AD). I analysen transformeras jästceller med dessa konstruktioner. Transkription av reportergener sker inte om inte bete (DB-X) och bytesdjur (AD-Y) interagerar med varandra och bildar en funktionell Gal4-transkriptionsfaktor. Sålunda kan interaktionen mellan proteiner härledas av närvaron av produkterna resulterande av reportergenexpressionen. I fall där reportergenen uttrycker enzymer som tillåter jästen att syntetisera essentiella aminosyror eller nukleotider, indikerar jästtillväxt under selektiva mediabetingelser att de två testade proteinerna interagerar. Nyligen publicerades programvara för att upptäcka och prioritera proteininteraktioner.

Trots dess användbarhet har jäst tvåhybridsystemet begränsningar. Den använder jäst som huvudvärdsystem, vilket kan vara ett problem när man studerar proteiner som innehåller däggdjursspecifika post-translationella modifieringar. Antalet identifierade PPI är vanligtvis lågt på grund av en hög falsk negativ frekvens; och underskattar till exempel membranproteiner .

I initiala studier som använde Y2H gjordes ofta inte korrekta kontroller för falska positiva (t.ex. när DB-X aktiverar reportergenen utan närvaro av AD-Y), vilket ledde till en högre än normalt falsk positiv frekvens. Ett empiriskt ramverk måste implementeras för att kontrollera dessa falska positiva resultat. Begränsningar i lägre täckning av membranproteiner har övervunnits genom uppkomsten av jäst två-hybridvarianter, såsom membranjäst två-hybrid (MYTH) och split-ubiquitin-systemet, som inte är begränsade till interaktioner som förekommer i kärnan; och det bakteriella tvåhybridsystemet, utfört i bakterier;

Principen för tandemaffinitetsrening

Affinitetsrening kopplad till masspektrometri

Affinitetsrening kopplad till masspektrometri detekterar mestadels stabila interaktioner och indikerar således bättre funktionella in vivo PPI: er. Denna metod börjar med rening av det taggade proteinet, som uttrycks i cellen vanligtvis vid in vivo- koncentrationer, och dess interagerande proteiner (affinitetsrening). En av de mest fördelaktiga och mest använda metoderna för att rena proteiner med mycket låg kontaminerande bakgrund är tandemaffinitetsrening, utvecklad av Bertrand Seraphin och Matthias Mann och respektive kollegor. PPI:er kan sedan analyseras kvantitativt och kvalitativt med masspektrometri med olika metoder: kemisk inkorporering, biologisk eller metabolisk inkorporering (SILAC) och etikettfria metoder. Dessutom nätverksteori använts för att studera hela uppsättningen av identifierade protein-protein-interaktioner i celler.

Nukleinsyra programmerbar protein array (NAPPA)

Detta system utvecklades först av LaBaer och kollegor 2004 genom att använda in vitro-transkriptions- och översättningssystem. De använder DNA-mall som kodar genen av intresse sammansmält med GST-protein, och den var immobiliserad i den fasta ytan. Anti-GST-antikropp och biotinylerad plasmid-DNA var bundna i aminopropyltrietoxisilan (APTES)-belagda objektglas. BSA kan förbättra bindningseffektiviteten hos DNA. Biotinylerad plasmid-DNA bands av avidin. Nytt protein syntetiserades genom att använda ett cellfritt uttryckssystem, dvs. kaninretikulocytlysat (RRL), och sedan fångades det nya proteinet genom anti-GST-antikropp bunden på objektglaset. För att testa protein-protein-interaktion immobiliserades målprotein-cDNA:t och frågeprotein-cDNA i samma belagda objektglas. Genom att använda in vitro-transkriptions- och translationssystem syntetiserades mål- och frågeprotein med samma extrakt. Målproteinet bands till arrayen genom antikropp belagd i objektglaset och frågeprotein användes för att sondera arrayen. Frågeproteinet märktes med hemagglutinin (HA) epitop. Således visualiserades interaktionen mellan de två proteinerna med antikroppen mot HA.

Intragent komplement

När flera kopior av en polypeptid som kodas av en gen bildar ett komplex, kallas denna proteinstruktur en multimer. När en multimer bildas från polypeptider producerade av två olika mutanta alleler av en speciell gen, kan den blandade multimeren uppvisa större funktionell aktivitet än de oblandade multimererna som bildas av var och en av mutanterna ensam. I ett sådant fall kallas fenomenet för intragen komplementering (även kallad interallelisk komplementering). Intragen komplementering har påvisats i många olika gener i en mängd olika organismer inklusive svamparna Neurospora crassa , Saccharomyces cerevisiae och Schizosaccharomyces pombe ; bakterien Salmonella typhimurium ; virusbakteriofagen T4 , ett RNA-virus och människor. I sådana studier isolerades ofta många mutationer som var defekta i samma gen och kartlades i linjär ordning på basis av rekombinationsfrekvenser för att bilda en genetisk karta över genen. Separat testades mutanterna i parvisa kombinationer för att mäta komplementering. En analys av resultaten från sådana studier ledde till slutsatsen att intragen komplementering i allmänhet uppstår från interaktionen mellan olika defekta polypeptidmonomerer för att bilda en multimer. Gener som kodar för multimerbildande polypeptider verkar vara vanliga. En tolkning av data är att polypeptidmonomerer ofta är inriktade i multimeren på ett sådant sätt att muterade polypeptider som är defekta på närliggande platser i den genetiska kartan tenderar att bilda en blandad multimer som fungerar dåligt, medan mutanta polypeptider som är defekta på avlägsna platser tenderar att bildas. en blandad multimer som fungerar mer effektivt. Direkt interaktion mellan två begynnande proteiner som kommer från närliggande ribosomer verkar vara en allmän mekanism för homo-oligomer (multimer) bildning. Hundratals proteinoligomerer identifierades som samlas i mänskliga celler genom en sådan interaktion. Den vanligaste formen av interaktion är mellan de N-terminala regionerna av de interagerande proteinerna. Dimerbildning verkar kunna ske oberoende av dedikerade monteringsmaskiner. De intermolekylära krafterna som sannolikt är ansvariga för självigenkänning och multimerbildning diskuterades av Jehle.

Andra möjliga metoder

Olika tekniker för att identifiera PPI har dykt upp tillsammans med teknikutvecklingen. Dessa inkluderar co-immunoprecipitation, proteinmikroarrayer , analytisk ultracentrifugering , ljusspridning , fluorescensspektroskopi , luminescensbaserad däggdjursinteraktomkartläggning (LUMIER), resonans-energiöverföringssystem, interaktionsfälla för däggdjursprotein-protein, elektroomkopplingsbara bioytorkomplementering av proteiner , analys , såväl som etikettfria mätningar i realtid genom ytplasmonresonans och kalorimetri .

Beräkningsmetoder

Text mining protokoll.

Beräkningsförutsägelse av protein-protein-interaktioner

Den experimentella upptäckten och karakteriseringen av PPI är arbetsintensiv och tidskrävande. Men många PPI: er kan också förutsägas beräkningsmässigt, vanligtvis med hjälp av experimentella data som utgångspunkt. Men metoder har också utvecklats som tillåter förutsägelse av PPI de novo, det vill säga utan tidigare bevis för dessa interaktioner.

Genomiska sammanhangsmetoder

Rosetta Stone eller Domain Fusion-metoden är baserad på hypotesen att interagerande proteiner ibland smälts samman till ett enda protein i ett annat genom. Därför kan vi förutsäga om två proteiner kan interagera genom att bestämma om de var och en har icke-överlappande sekvenslikhet med en region av en enda proteinsekvens i ett annat genom.

Conserved Neighborhood-metoden är baserad på hypotesen att om gener som kodar för två proteiner är grannar på en kromosom i många genom, så är de sannolikt funktionellt relaterade (och möjligen fysiskt interagerande) .

Den fylogenetiska profilmetoden är baserad på hypotesen att om två eller flera proteiner är närvarande eller saknas samtidigt över flera genom, så är de sannolikt funktionellt relaterade. Därför kan potentiellt interagerande proteiner identifieras genom att bestämma närvaron eller frånvaron av gener över många genom och välja de gener som alltid är närvarande eller frånvarande tillsammans.

Textutvinningsmetoder

Allmänt tillgänglig information från biomedicinska dokument är lättillgänglig via internet och håller på att bli en kraftfull resurs för att samla in kända protein-proteininteraktioner (PPI), PPI-förutsägelse och proteindockning. Textutvinning är mycket mindre kostsamt och tidskrävande jämfört med andra tekniker med hög genomströmning. För närvarande upptäcker textutvinningsmetoder generellt binära relationer mellan interagerande proteiner från enskilda meningar med hjälp av regel-/mönsterbaserad informationsextraktion och metoder för maskininlärning . Ett brett utbud av textutvinningstillämpningar för PPI-extraktion och/eller förutsägelse är tillgängliga för allmänheten, såväl som arkiv som ofta lagrar manuellt validerade och/eller beräkningsförutspådda PPI:er. Textutvinning kan implementeras i två steg: informationshämtning , där texter som innehåller namn på endera eller båda interagerande proteinerna hämtas och informationsextraktion, där riktad information (interagerande proteiner, implicerade rester, interaktionstyper, etc.) extraheras.

Det finns också studier som använder fylogenetisk profilering , som baserar sina funktioner på teorin att proteiner som är involverade i gemensamma vägar samutvecklas på ett korrelerat sätt mellan arter. Vissa mer komplexa textutvinningsmetoder använder avancerade Natural Language Processing ) och bygger kunskapsnätverk (till exempel betraktar gennamn som noder och verb som kanter). Andra utvecklingar involverar kärnmetoder för att förutsäga proteininteraktioner.

Maskininlärningsmetoder

Klassificeringshierarki för maskinlärande teknik.

Många beräkningsmetoder har föreslagits och granskats för att förutsäga protein-proteininteraktioner. Förutsägelsemetoder kan grupperas i kategorier baserat på prediktiva bevis: proteinsekvens, jämförande genomik , proteindomäner, protein tertiär struktur och interaktionsnätverkstopologi. Konstruktionen av en positiv uppsättning (kända interagerande proteinpar) och en negativ uppsättning (icke-interagerande proteinpar) behövs för utvecklingen av en beräkningsförutsägelsemodell. Förutsägelsemodeller som använder maskininlärningstekniker kan grovt delas in i två huvudgrupper: övervakade och oövervakade, baserat på märkning av indatavariabler enligt det förväntade resultatet.

År 2005 analyserades integrala membranproteiner av Saccharomyces cerevisiae med hjälp av det parningsbaserade ubiquitin-systemet (mbSUS). Systemet detekterar interaktioner mellan membranproteiner och extracellulära signalproteiner. Av de 705 integrerade membranproteinerna spårades 1 985 olika interaktioner som involverade 536 proteiner. För att sortera och klassificera interaktioner användes en stödvektormaskin för att definiera interaktioner med hög medel och låg konfidens. Det delade ubikvitinmembranjäst-tvåhybridsystemet använder transkriptionsreportrar för att identifiera jästtransformanter som kodar för par av interagerande proteiner. År 2006 random forest , ett exempel på en övervakad teknik, vara den mest effektiva maskininlärningsmetoden för förutsägelse av proteininteraktion. Sådana metoder har använts för att upptäcka proteininteraktioner på human interaktom, specifikt interaktomen hos membranproteiner och interaktomen hos schizofreniassocierade proteiner.

Från och med 2020 resulterade en modell som använder restklusterklasser (RCCs), konstruerad från databaserna 3DID och Negatome, i 96-99% korrekt klassificerade fall av protein-protein-interaktioner. RCC är ett beräkningsvektorutrymme som efterliknar proteinveckningsutrymme och inkluderar alla samtidigt kontaktade restuppsättningar, som kan användas för att analysera proteinstruktur-funktionsrelation och evolution.

Databaser

Storskalig identifiering av PPI genererade hundratusentals interaktioner, som samlades ihop i specialiserade biologiska databaser som kontinuerligt uppdateras för att tillhandahålla kompletta interaktomer . Den första av dessa databaser var databasen över interagerande proteiner (DIP) .

Primära databaser samlar in information om publicerade PPI:er som bevisats existera via småskaliga eller storskaliga experimentella metoder. Exempel: DIP , Biomolecular Interaction Network Database (BIND), Biological General Repository for Interaction Dataset ( BioGRID ), Human Protein Reference Database (HPRD), IntAct Molecular Interaction Database, Molecular Interaction Database (MINT), MIPS Protein Interaction Resource on Yeast (MIPS) -MPact), och MIPS Mammalian Protein-Protein Interaction Database (MIPS-MPPI).<

Metadatabaser är normalt ett resultat av integrationen av primär databasinformation, men kan också samla in en del originaldata.

Förutsägelsedatabaser innehåller många PPI:er som förutsägs med hjälp av flera tekniker (huvudartikel). Exempel: Human Protein–Protein Interaction Prediction Database (PIPs), Interlogous Interaction Database (I2D), Kända och förutspådda protein–proteininteraktioner (STRING-db) och Unified Human Interactive (UniHI).

De ovan nämnda beräkningsmetoderna är alla beroende av källdatabaser vars data kan extrapoleras för att förutsäga nya protein-protein-interaktioner . Täckningen skiljer sig mycket mellan databaserna. Generellt sett har primära databaser de minsta totala proteininteraktionerna registrerade eftersom de inte integrerar data från flera andra databaser, medan förutsägelsedatabaser har mest eftersom de inkluderar andra former av bevis utöver experimentella. Till exempel har den primära databasen IntAct 572 063 interaktioner, metadatabasens APID har 678 000 interaktioner och den prediktiva databasen STRING har 25 914 693 interaktioner. Det är dock viktigt att notera att en del av interaktionerna i STRING-databasen endast förutsägs av beräkningsmetoder som genomisk kontext och inte verifieras experimentellt.

Interaktionsnätverk

Schizofreni PPI.

Information som finns i PPI:s databaser stödjer konstruktionen av interaktionsnätverk. Även om PPI-nätverket för ett givet frågeprotein kan representeras i läroböcker, är diagram över helcells-PPI: er uppriktigt sagt komplexa och svåra att generera.

Ett exempel på en manuellt producerad molekylär interaktionskarta är Kurt Kohns karta från 1999 över cellcykelkontroll. Ritning på Kohns karta, Schwikowski et al. 2000 publicerade en artikel om PPI i jäst, som länkade samman 1 548 interagerande proteiner bestämda genom tvåhybridscreening. De använde en metod för att rita grafer i lager för att hitta en initial placering av noderna och förbättrade sedan layouten med en kraftbaserad algoritm.

Bioinformatiska verktyg har utvecklats för att förenkla den svåra uppgiften att visualisera molekylära interaktionsnätverk och komplettera dem med andra typer av data. Till exempel Cytoscape en öppen källkod som används ofta och många plugins är tillgängliga för närvarande. Pajek programvara är fördelaktig för visualisering och analys av mycket stora nätverk.

Identifiering av funktionella moduler i PPI-nätverk är en viktig utmaning inom bioinformatik. Funktionella moduler betyder en uppsättning proteiner som är starkt kopplade till varandra i PPI-nätverk. Det är nästan liknande problem som community upptäckt i sociala nätverk . Det finns några metoder som Jactive-moduler och MoBaS. Jactive-moduler integrerar PPI-nätverk och genuttrycksdata medan MoBaS integrerar PPI-nätverk och Genome Wide association Studies .

Protein-protein-relationer är ofta resultatet av flera typer av interaktioner eller härleds från olika tillvägagångssätt, inklusive samlokalisering, direkt interaktion, suppressiv genetisk interaktion, additiv genetisk interaktion, fysisk association och andra associationer.

Signerade interaktionsnätverk

Proteinproteininteraktionerna visas i ett signerat nätverk som beskriver vilken typ av interaktioner som äger rum

Interaktioner mellan protein och protein leder ofta till att ett av de interagerande proteinerna antingen "aktiveras" eller "undertrycks". Sådana effekter kan indikeras i ett PPI-nätverk med "tecken" (t.ex. "aktivering" eller "inhibering"). Även om sådana attribut har lagts till nätverk under lång tid, har Vinayagam et al. (2014) myntade termen Signed network för dem. Signerade nätverk uttrycks ofta genom att märka interaktionen som antingen positiv eller negativ. En positiv interaktion är en där interaktionen resulterar i att ett av proteinerna aktiveras. Omvänt indikerar en negativ interaktion att ett av proteinerna inaktiveras.

Protein-protein-interaktionsnätverk konstrueras ofta som ett resultat av laboratorieexperiment som tvåhybridskärmar av jäst eller 'affinitetsrening och efterföljande masspektrometritekniker. Dessa metoder tillhandahåller dock inte det lager av information som behövs för att avgöra vilken typ av interaktion som finns för att kunna tillskriva tecken till nätverksdiagrammen.

RNA-interferensskärmar

RNA-interferens (RNAi)-skärmar (undertryckande av enskilda proteiner mellan transkription och translation) är en metod som kan användas i processen att ge tecken till protein-protein-interaktioner. Enskilda proteiner undertrycks och de resulterande fenotyperna analyseras. Ett korrelerande fenotypiskt förhållande (dvs. där hämningen av endera av två proteiner resulterar i samma fenotyp) indikerar ett positivt eller aktiverande förhållande. Fenotyper som inte korrelerar (dvs där hämningen av endera av två proteiner resulterar i två olika fenotyper) indikerar ett negativt eller inaktiverande samband. Om protein A är beroende av protein B för aktivering kommer hämningen av antingen protein A eller B att resultera i att en cell förlorar den tjänst som tillhandahålls av protein A och fenotyperna kommer att vara desamma för hämning av antingen A eller B. men protein A inaktiveras av protein B då kommer fenotyperna att skilja sig beroende på vilket protein som hämmas (hämma protein B och det kan inte längre inaktivera protein A vilket lämnar A aktivt men inaktiverar A och det finns inget för B att aktivera eftersom A är inaktiv och fenotypen ändras). Flera RNAi- skärmar måste utföras för att tillförlitligt kunna utse ett tecken på en given protein-protein-interaktion. Vinayagam et al. som utarbetade den här tekniken uppger att minst nio RNAi- skärmar krävs med självförtroende som ökar när man utför fler skärmar.

Som terapeutiska mål

Modulering av PPI är utmanande och får allt större uppmärksamhet av det vetenskapliga samfundet. Flera egenskaper hos PPI, såsom allosteriska platser och hotspots, har införlivats i läkemedelsdesignstrategier. Relevansen av PPI som förmodade terapeutiska mål för utvecklingen av nya behandlingar är särskilt tydlig vid cancer, med flera pågående kliniska prövningar inom detta område. Samförståndet mellan dessa lovande mål finns inte desto mindre betecknat i de redan tillgängliga läkemedel på marknaden för att behandla en mängd sjukdomar. Exempel är Tirobifan, hämmare av glykoproteinet IIb/IIIa, som används som ett kardiovaskulärt läkemedel, och Maraviroc , hämmare av CCR5-gp120-interaktionen, som används som anti-HIV-läkemedel. Nyligen, [ när? ] Amit Jaiswal och andra kunde utveckla 30 peptider med hjälp av protein-proteininteraktionsstudier för att hämma telomerasrekrytering mot telomerer.

Se även

Vidare läsning

externa länkar