Urgammalt protein

En tidslinje för viktiga antika proteinanalyser sedan 1950-talet.

Proteiner är makromolekyler byggda av en eller flera kedjor av aminosyror . De är dynamiska enheter som utför ett brett spektrum av biologiska funktioner och är väsentliga för levande organismer . Begreppet protein myntades första gången av Jöns Jacob Berzelius 1838, härstammar från det grekiska ordet proteios (som betyder: av första rang). Samlingar av proteiner eller proteomer är kompletta uppsättningar av proteinblandningar associerade med en cell , en vävnad eller en organism . Studiet av moderna proteiner har drivits av framsteg inom molekylärbiologi , analytisk kemi och bioinformatik . Ordet proteomics skapades av Marc Wilkins 1995 för att beteckna den storskaliga analysen av proteomer .

På liknande sätt är uråldriga proteiner komplexa blandningar och termen paleoproteomics används för att karakterisera studien av proteomer i det förflutna. Forntida proteiner har återvunnits från ett brett spektrum av arkeologiska material, inklusive ben , tänder , äggskal , läder , pergament , keramik , målningsbindemedel och välbevarade mjuka vävnader som tarmarna . Dessa bevarade proteiner har tidigare gett värdefull information om taxonomisk identifiering , evolutionshistoria ( fylogeni ), kost, hälsa, sjukdomar, teknologi och social dynamik.

Liksom modern proteomik har studiet av forntida proteiner också möjliggjorts av tekniska framsteg. Olika analytiska tekniker, till exempel aminosyraprofilering, racemiseringsdatering , immunodetektion, Edman-sekvensering , peptidmassfingeravtryck och tandemmasspektrometri har använts för att analysera uråldriga proteiner. Införandet av högpresterande masspektrometri (till exempel Orbitrap ) år 2000 har revolutionerat området, eftersom hela de bevarade sekvenserna av komplexa proteomer kan karakteriseras.

Under det senaste decenniet har studiet av antika proteiner utvecklats till ett väletablerat område inom arkeologisk vetenskap. Men liksom forskningen om aDNA (gammalt DNA bevarat i arkeologiska lämningar), har det begränsats av flera utmaningar såsom täckningen av referensdatabaser, identifiering, kontaminering och autentisering. Forskare har arbetat med att standardisera provtagning, extraktion, dataanalys och rapportering för gamla proteiner. Nya beräkningsverktyg som de novo-sekvensering och öppen forskning kan också förbättra identifieringen av antika proteomer.

Historia: pionjärerna inom antika proteinstudier

Philip Abelson, Edgar Hare och Thomas Hoering

Abelson , Hare och Hoering ledde studierna av antika proteiner mellan 1950-talet och början av 1970-talet. Abelson ledde det geofysiska laboratoriet vid Carnegie Institute (Washington, DC) mellan 1953 och 1971, och han var den första som upptäckte aminosyror i fossiler. Hare gick med i laget och specialiserade sig på racemisering av aminosyror (omvandling av L- till D-aminosyror efter organismers död). D/L-förhållanden användes för att datera olika gamla vävnader som ben, skal och marina sediment. Hoering var en annan framstående medlem, som bidrog till framstegen för isotoper och masspektrometri. Denna gyllene trio drog många begåvade biologer, geologer, kemister och fysiker till fältet, inklusive Marilyn Fogel , John Hedges och Noreen Tuross.

Ralph Wyckoff

Wyckoff var en pionjär inom röntgenkristallografi och elektronmikroskopi . Med hjälp av mikroskopiska bilder visade han variationen och skadorna hos kollagenfibrer i gamla ben och skal. Hans forskning bidrog till förståelsen av proteindiagenes ( nedbrytning) i slutet av 1960-talet och visade att uråldriga aminosyraprofiler ensamma kanske inte är tillräckliga för proteinidentifiering.

Margaret Jope och Peter Wesbroek

Jope och Wesbroek var ledande experter på skalproteiner och kristallisation . Wesbroek etablerade senare Geobiokemi-laboratorium vid universitetet i Leiden, med fokus på biomineralisering och hur denna process underlättade proteinöverlevnad. Han var också banbrytande för användningen av antikroppar för studier av antika proteiner på 1970- och 1980-talen, med användning av olika immunologiska tekniker som Ouchterlony dubbel immundiffusion (interaktioner mellan antikroppar och antigener i en gel).

Peggy Oström

Ostrom har kämpat för användningen av masspektrometri sedan 1990-talet. Hon var den första att förbättra sekvenstäckningen av uråldriga proteiner genom att kombinera olika tekniker som peptidmassfingeravtryck och vätskekromatografi-tandem masspektrometri ( LC-MS/MS).

Forntida proteiners biokemi

Bildande & inkorporering

Att förstå hur forntida proteiner bildas och införlivas i arkeologiska material är väsentligt vid provtagning, utvärdering av föroreningar och planering av analyser. I allmänhet, för gamla proteiner i proteinhaltiga vävnader, särskilt kollagener i ben, keratiner i ull , amelogeniner i tandemaljen och intrakristallina proteiner i skal, kan de inkorporeras under tiden för vävnadsbildning. Men bildningen av proteinhaltiga vävnader är ofta komplex, dynamisk och påverkas av olika faktorer såsom pH, metaller, jonkoncentration, kost plus andra biologiska, kemiska och fysikaliska parametrar. Ett av de mest karakteriserade fenomenen är benmineralisering , en process genom vilken hydroxiapatitkristaller deponeras i kollagenfibrer och bildar en matris. Trots omfattande forskning är benställning fortfarande en utmaning, och rollen av icke-kollagena proteiner (ett brett utbud av proteoglykaner och andra proteiner) är fortfarande dåligt förstådd.

En annan kategori är komplexa och potentiellt mineraliserade vävnader, såsom forntida mänskliga tandstenar och keramiska kärl. Tandstenar definieras som förkalkade biofilmer , skapade och förmedlade av interaktioner mellan kalciumfosfatjoner och ett brett spektrum av orala mikrobiella , mänskliga och livsmedelsproteiner under episodisk biomineralisering . På liknande sätt kan mineralerna i en keramisk matris interagera med matproteiner under livsmedelsbearbetning och tillagning. Detta förklaras bäst av kalcitavlagringar som fäster på insidan av arkeologiska keramiska kärl. Dessa proteinrika mineraliserade avlagringar kan bildas vid upprepad tillagning med hårt vatten och efterföljande skalning.

Bevarande

Organiska (innehållande kol) biomolekyler som proteiner är benägna att nedbrytas. Experimentella studier visar till exempel att robusta, fibrösa och hydrofoba keratiner som fjädrar och ylletyger sönderfaller snabbt vid rumstemperatur. Forntida proteiner är faktiskt exceptionella, och de återvinns ofta från extrema begravningssammanhang, särskilt torra och kalla miljöer. Detta beror på att bristen på vatten och låg temperatur kan bromsa hydrolys, mikrobiell attack och enzymatiska aktiviteter.

Det finns också proteiner vars kemiska och fysikaliska egenskaper kan möjliggöra att de bevaras på lång sikt. Det bästa exemplet är typ 1 kollagen ; det är ett av de vanligaste proteinerna i hud (80-85%) och ben (80-90%) extracellulära matriser . Det är också mineraliserat, organiserat i en trippelspiral och stabiliserat genom vätebindning . Typ 1 kollagen har rutinmässigt extraherats från gamla ben, läder och pergament; dessa egenskaper kan bidra till dess stabilitet över tid. Ett annat vanligt protein i det arkeologiska dokumentet är mjölkbeta -laktoglobulin , ofta utvunnet från forntida tandsten. Beta-laktoglobulin är ett litet vassleprotein med en molekylmassa på cirka 18400 Da ( dalton ). Det är resistent mot uppvärmning och enzymatisk nedbrytning; strukturellt har den en beta-fat associerad med bindning till små hydrofoba molekyler som fettsyror , vilket bildar stabila polymerer .

Med tanke på att proteiner varierar i överflöd, storlek, hydrofobicitet (vattenolöslighet), struktur, konformation (form), funktion och stabilitet, är det svårt att förstå proteinkonservering. Även om det finns vanliga bestämningsfaktorer för proteinöverlevnad, inklusive termisk historia (temperatur/tid), begravningsförhållanden (pH/ jordkemi / grundvatten ) och proteinegenskaper ( angränsande aminosyror / sekundär struktur / tertiär vikning / proteominnehåll ), finns det ingen tydligt svar och proteindiagenes är fortfarande ett aktivt forskningsfält.

Struktur & skademönster

Generellt sett har proteiner fyra nivåer av strukturell komplexitet: kvartär (flera polypeptider eller subenheter ), tertiär (3D-veckningen av en polypeptid), sekundär ( alfa-helixar / beta-ark /slumpmässiga spolar) och primär struktur (linjära aminosyrasekvenser länkade av peptidbindningar ). Forntida proteiner förväntas förlora sin strukturella integritet med tiden, på grund av denaturering (proteinutveckling) eller andra diagenetiska processer.

Forntida proteiner tenderar också att vara fragmenterade, skadade och förändrade. Proteiner kan klyvas till små fragment med tiden, eftersom hydrolys (tillsats av vatten) bryter peptidbindningar ( kovalenta bindningar mellan två angränsande alfa-aminosyror ). När det gäller posttranslationella modifieringar (förändringar sker efter RNA-translation ), kännetecknas uråldriga proteiner ofta av omfattande skador såsom oxidation ( metionin ), hydroxylering ( prolin ), deamidering ( glutamin / asparagin ), citrullinering ( arginin ), fosforylering ( serin) . / treonin / tyrosin ), N-terminalt glutamat till pyroglutamat och tillägg av avancerade glykeringsprodukter till lysin eller arginin . Bland dessa modifieringar glutamindeamidering en av de mest tidsberoende processerna. Glutamindeamidering - enzymatisk process, genom vilken glutamin omvandlas till glutaminsyra (+0,98406 Da) via sidokedjehydrolys eller bildandet av en glutarimidring . Det är en långsam omvandling med lång halveringstid , beroende på intilliggande aminosyror , sekundära strukturer , 3D-vikning, pH , temperatur och andra faktorer. Bioinformatiska verktyg är tillgängliga för att beräkna bulk- och platsspecifika deamideringshastigheter av gamla proteiner.

Paleoproteomik

Översikt

Palaeoproteomics är ett snabbt växande område som kombinerar arkeologi , biologi , kemi och kulturarvsstudier . Jämfört med dess högprofilerade systerfält aDNA- analys, extraktion, identifiering och autentisering av forntida proteiner utmanande, eftersom både forntida DNA och proteiner tenderar att vara ultrakorta, mycket fragmenterade, omfattande skadade och kemiskt modifierade.

Men forntida proteiner är fortfarande en av de mest informativa biomolekylerna. Proteiner tenderar att brytas ned långsammare än DNA, särskilt biomineraliserade proteiner. Medan forntida lipider kan användas för att skilja mellan marina, växt- och animaliska fetter, är gamla proteindata högupplösta med taxon- och vävnadsspecifikationer.

Hittills har uråldriga peptidsekvenser framgångsrikt extraherats och säkert karakteriserats från olika arkeologiska lämningar, inklusive ett 3,8 Ma (miljoner år) strutsäggskal, 1,77 Ma Homo erectus -tänder, ett 0,16 Ma Denisovan -käkben och flera neolitiska (6000-5600 cal BC) krukor. Därför har paleoproteomik gett värdefull insikt i tidigare evolutionära relationer, utdöda arter och samhällen.

Extraktion

Generellt finns det två tillvägagångssätt: en matsmältningsfri, top-down- metod och bottom-up- proteomik. Top-down proteomik används sällan för att analysera uråldriga proteiner på grund av analytiska och beräkningssvårigheter. För bottom-up, eller hagelgevärsproteomik , smälts uråldriga proteiner till peptider med hjälp av enzymer, till exempel trypsin . Mineraliserade arkeologiska lämningar som ben, tänder, skal, tandsten och keramik kräver ett extra demineraliseringssteg för att frigöra proteiner från mineralmatriser. Detta uppnås ofta genom att använda en svag syra ( etylendiamintetraättiksyra , EDTA) eller kall (4 °C) saltsyra (HCl) för att minimera kemiska modifieringar som kan införas under extraktion.

För att göra gamla proteiner lösliga kan värme, sonikering , kaotropa medel ( urea / guanidinhydroklorid , GnHCl), tvättmedel eller andra buffertar användas. Alkylering och reduktion ingår ofta för cystein för att störa disulfidbindningar och undvika tvärbindning .

Efter demineralisering, proteinsolubilisering, alkylering och reduktion behövs buffertbyte för att säkerställa att extrakten är kompatibla med nedströmsanalys. För närvarande finns det tre allmänt använda protokoll för antika proteiner och geler (GASP), filter (FASP) och magnetiska pärlor (SP3) kan användas för detta ändamål. När buffertutbytet är avslutat inkuberas extrakten med nedbrytningsenzymer, koncentreras, renas och avsaltas sedan.

För icke-mineraliserat arkeologiskt material som pergament, läder och målningar är avmineralisering inte nödvändigt, och protokollen kan ändras beroende på provkonservering och provtagningsstorlek.

Instrumentering och dataanalys

Nuförtiden domineras paleoproteomik av två masspektrometribaserade tekniker: MALDI-ToF (matrisassisterad laserdesorption/jonisering-tid-av-flight) och LC-MS/MS . MALDI-ToF används för att bestämma massa-till-laddning (m/z) förhållandet mellan joner och deras toppmönster. Digererade peptider fläckas på en MALDI-platta, samkristalliseras med en matris (huvudsakligen a-cyano-4-hydroxikanelsyra, CHCA); en laser exciterar och joniserar matrisen, sedan mäts dess tid att resa ett vakuumrör och omvandlas till ett spektrum av m/z-förhållanden och intensiteter.

Eftersom endast toppmönster, inte hela aminosyrasekvenser av digererade peptider karakteriseras, behövs peptidmarkörer för mönstermatchning och uråldrig proteinidentifiering. I arkeologiska sammanhang har MALDI-ToF rutinmässigt använts för ben och kollagener inom ett område som kallas ZooMS (zooarchaeolgy by mass spectrometri).

LC-MS/MS är ett annat allmänt använt tillvägagångssätt. Det är en kraftfull analytisk teknik för att separera, sekvensera och kvantifiera komplexa proteinblandningar. Det första steget i LC-MS/MS är vätskekromatografi. Proteinblandningar separeras i en flytande mobil fas med användning av en stationär kolonn. Hur flytande analyter interagerar med en stationär fas beror på deras storlek, laddning, hydrofobicitet och affinitet. Dessa skillnader leder till distinkt eluering och retentionstid (när en komponent av en blandning lämnar en kolonn). Efter kromatografisk separation joniseras proteinkomponenter och införs i masspektrometrar. Under en första massskanning (MS1) mäts m/z-förhållandena av prekursorjoner. Utvalda prekursorer fragmenteras ytterligare och m/z-förhållandena för fragmentjoner bestäms i en andra massskanning (MS2). Det finns olika fragmenteringsmetoder, till exempel högenergi C-trap-dissociation (HCD) och kollisionsinducerad dissociation (CID), men b- och y-joner är ofta riktade.

Sökmotorer och mjukvaruverktyg används ofta för att bearbeta gamla MS/MS-data, inklusive MaxQuant, Mascot och PEAKS. Proteinsekvensdata kan laddas ner från offentliga genbanker ( UniProt / NCBI ) och exporteras som FASTA-filer för sekvenseringsalgoritmer. På senare tid har öppna sökmotorer som MetaMorpheus, pFind och Fragpipe uppmärksammats, eftersom de gör det möjligt att identifiera alla modifieringar som är förknippade med peptidspektrala matchningar (PSMs).

De novo-sekvensering är också möjlig för analys av gamla MS/MS-spektra. Det är en sekvenseringsteknik som sätter ihop aminosyrasekvenser direkt från spektra utan referensdatabaser. Framsteg inom djupinlärning leder också till utvecklingen av flera pipelines som DeNovoGUI, DeepNovo2 och Casanovo. Det kan dock vara utmanande att utvärdera utdata från de novo-sekvenser och optimering kan krävas för antika proteiner för att minimera falska positiva och överanpassade.

Ansökningar

Palaeoproteomer

  • Ben. Forntida ben är ett av de mest välkarakteriserade och ikoniska paleoproteomerna. Forntida benproteomer har sekvenserats från homininer , människor, mammutar , moas och nu utdöd noshörning . Fibrillära kollagener är de vanligaste proteinerna i moderna ben; på liknande sätt är kollagener av typ 1 och III också vanliga i det arkeologiska arkivet. Medan moderna ben innehåller cirka 10% av icke-kollagena proteiner (NCP), har olika NCPs registrerats, inklusive osteokalcin , biglykan och lumican . I allmänhet är NCP:er utmärkta mål för att studera evolutionshistoria, eftersom de har högre omsättningshastigheter än ben. Med tanke på överflödet av uråldriga benproteomer är ett proteomiskt arbetsflöde från nerifrån och upp känt som SPIN (Species by Proteome INvestigation) tillgängligt för analys med hög genomströmning av 150 miljoner däggdjursben.
  • Tänder. Tandemaljen är en av de hårdaste och mest mineraliserade vävnaderna i människokroppen, eftersom den huvudsakligen består av hydroxiapatitkristaller. Medan ett emaljproteom är litet, är gamla amelogeniner och andra ameloblastrelevanta proteiner ofta välbevarade i ett mineraliserat, slutet system. Gamla emaljproteiner är användbara när aDNA eller andra proteiner inte överlever, och de har analyserats för att förstå utdöda arter och evolution.
  • Skal. Arkeologiska skal innehåller också rika palaoproteomer. Liksom tandemalj, De är mer eller mindre nära system som isolerar proteiner från vatten eller andra nedbrytningskrafter. Strathiocalcin-1 och -2 identifieras säkert i 3,8 Ma strutsäggskalsprover på platsen för Laetoli i Tazania. lektiner av C-typ är förknippade med biomineralisering, och de finns också i utdöda stora fågelskal som samlats in från Australien. Med tanke på strutsäggskalets ålder, verifierades det med en kombination av sex metoder: analytisk replikation (samma prover analyserade i olika laboratorier), aminosyraracemisering (D/L-förhållanden), överföringsanalys (för- och efterinjektion). tvättar för att utvärdera omfattningen av överföring i masspektrometrar), skademönster (deamidering/oxidation/fosforylering/amidering/sönderdelning) och aDNA-studier. Dessa oberoende procedurer säkerställer äktheten av de äldsta peptidsekvenserna.

Andra komplexa blandningar

  • Keramik & matskorpor. Olika forntida dietproteiner har karakteriserats från keramik och tillhörande matskorpor (förkolnade och kalcitavlagringar på keramiska kärl). Beta-laktoglobulinproteiner från ko, får och getmjölk är dominerande i detta sammanhang, men det finns också mjölkkasein ( alfa-, beta- och kappa-kasein), hemoglobiner från djurblod och en lång rad växtproteiner (veteglutiner , kornhordeiner ) . baljväxter och andra frölagringsproteiner) . Identifieringen av dessa uråldriga livsmedel kan användas för att förstå hur mat tillagades, tillagades och konsumerades förr i tiden. Det är också tydligt att arkeologisk keramik och matskorpor är komplexa blandningar som innehåller metaproteomer (flera proteomer).

Analytiska utmaningar

Medan paleoproteomics är ett användbart verktyg för ett brett spektrum av forskningsfrågor, finns det några analytiska utmaningar som hindrar området från att nå sin potential. Den första frågan är bevarande. Mineralbindning verkar stabilisera proteiner, men detta är en komplex, dynamisk process som inte systematiskt har undersökts i olika arkeologiska och begravningssammanhang.

Destruktiv provtagning är ett annat problem som kan orsaka irreparabel skada på arkeologiskt material. Även om minimalt destruktiva eller oförstörande provtagningsmetoder utvecklas för pergament, ben, mumifierade vävnader och läder, är det oklart om de är lämpliga för andra typer av lämningar såsom tandsten, keramik och matskorpor.

Det är lika svårt att extrahera mineralbundna proteiner på grund av deras låga förekomst, omfattande nedbrytning och ofta starka intermolekylära interaktioner (vätebindning, dispersion, jon-dipol och dipol-dipol-interaktioner) med mineralmatris. Forntida proteiner varierar också i konserveringstillstånd, hydrofobicitet, löslighet och optimala pH-värden; metodutveckling krävs fortfarande för att maximera proteinåtervinningen.

Forntida proteinidentifiering är fortfarande en utmaning, eftersom databassökningsalgoritmer inte är optimerade för lågintensiva och skadade antika proteiner, vilket ökar sannolikheten för falska positiva och falska negativa. Det finns också frågan om mörka proteomer (okända proteinregioner som inte kan sekvenseras); cirka 44-54% av proteinerna i eukaryoter såsom djur och växter är mörka. Referensdatabaser är också partiska mot modellorganismer som jäst och möss , och aktuella sekvensdata kanske inte täcker allt arkeologiskt material.

Slutligen, även om cytosindeaminering (cytosin som omvandlas till uracil med tiden som orsakar felläsningar) har använts i stor utsträckning vid autentisering av aDNA, finns det inga standardiserade procedurer för att autentisera gamla proteiner . Denna autentiseringsfråga framhävs av anspråksidentifieringen av 78 Ma Brachylophosaurus canadensis ( hadrosaur ) och 68 Ma Tyrannosaurus rex kollagenpeptider. Bristen på post-translationella modifieringar och efterföljande experimentella studier visar att dessa sekvenser kan härledas från bakteriella biofilmer , korskontaminering av kontrollprover eller moderna laboratorieprocedurer.

Framtida inriktningar

Trots betydande analytiska utmaningar utvecklas paleoproteomics ständigt och antar ny teknik. Senaste högpresterande masspektrometri, till exempel TimsToF (fångad jonmobilitet-tid-av-flight) i ett DIA-läge (dataoberoende insamling) kan hjälpa till med separation, urval och upplösning av gamla MS/MS-data. Nya extraktionsprotokoll som DES ( Deep Eutectic Solvent )-assisterade procedurer kan öka antalet och typerna av extraherade paleoproteomer. Identifieringsverktygen förbättras också tack vare framstegen inom bioinformatik, maskininlärning och artificiell intelligens.

Användbara verktyg

Offentliga depåer för rådata

Referensdatabaser

Databassökning

Öppna sökning

De novo-program

Se även

Vidare läsning

Wikipedia-sidor