Periannan Senapati

Dr Periannan Senapathy
Född
Alma mater

Loyola College Madras University Indian Institute of Science
Känd för


Genomics Clinical Genomics RNA Splicing Delade gener
Vetenskaplig karriär
institutioner
National Institutes of Health University of Wisconsin, Madison
Hemsida Genome International Corporation

Periannan Senapathy är en molekylärbiolog , genetiker , författare och entreprenör. Han är grundare, president och chief scientific officer på Genome International Corporation, ett bioteknik- , bioinformatik- och informationsteknologiföretag baserat i Madison, Wisconsin , som utvecklar beräkningsgenomiska tillämpningar av nästa generations DNA-sekvensering (NGS) och kliniska beslutsstödsystem för analysera patientgenomdata som hjälper till vid diagnos och behandling av sjukdomar.

Dr. Senapathy är känd för sina bidrag inom genetik, genomik och klinisk genomik, särskilt inom biologin av RNA-skarvning och den delade strukturen av eukaryota gener. Han utvecklade Shapiro & Senapathy-algoritmen (S&S) för att förutsäga splitsningsställen, exoner och gener hos eukaryoter, som har blivit den primära metoden för att upptäcka sjukdomsorsakande mutationer i splitsningsövergångar. S &S har implementerats i många gensöknings- och mutationsdetekteringsverktyg som används flitigt i stora kliniska och forskningsinstitutioner runt om i världen för att upptäcka mutationer hos tusentals patienter med många sjukdomar, inklusive cancer och ärftliga sjukdomar. Det används allt mer i nästa generations sekvenseringsera, eftersom det är allmänt insett att >50 % av alla sjukdomar och biverkningar av läkemedel hos människor och andra djur möjligen inträffar inom splitsningsregionerna av gener. S&S-algoritmen har citerats i ~4 000 publikationer om att hitta splitsningsmutationer i tusentals cancer och ärftliga sjukdomar.

Dr. Senapathy erbjöd en ny hypotes om ursprunget till introner , splitgener och splitsningsövergångar i eukaryota gener. Eftersom den delade strukturen av gener är central för eukaryot biologi, har deras ursprung varit en stor fråga inom biologin. Dr Senapathy föreslog " delad genteorin ", som säger att den splittrade strukturen uppstod på grund av ursprunget till splittrade gener från slumpmässiga DNA-sekvenser, och gav påtagliga bevis från genomsekvenser från flera organismer. Han visade också att splitsningsförbindelserna av eukaryota gener kunde ha sitt ursprung från stoppkodonändarna av Open Reading Frames (ORF) i slumpmässiga DNA-sekvenser baserade på analys av eukaryota genomiska DNA-sekvenser. Dr Marshall Nirenberg , Nobelpristagaren som hade dechiffrerat kodoner, kommunicerade papper till PNAS. Senapathy har publicerat sina andra vetenskapliga rön i tidskrifter inklusive Science , Nucleic Acids Research , PNAS , Journal of Biological Chemistry och Journal of Molecular Biology , och är författare till flera patent inom genomikområdet.

Biografi

Senapathy har en Ph.D. i molekylärbiologi från Indian Institute of Science , Bangalore , Indien. Han tillbringade tolv år i genomforskning för National Institutes of Health 's Laboratory of Molecular and Cell Biology (NIADDK) och Laboratory of Statistical and Mathematical Methodology vid Division of Computer Research and Technology (DCRT) i Bethesda, Maryland (1980–1980) 87), och Biotechnology Center och Institutionen för genetik vid University of Wisconsin, Madison (1987–91). Dr. Senapathy grundade Genome International 1992 för att utveckla beräkningsbiologisk forskning, produkter och tjänster

Anmärkningsvärda forskningsbidrag

Dr. Senapathy har gett viktiga bidrag inom RNA-skarvningsbiologin, vilket har påverkat förståelsen av strukturen, funktionen och ursprunget för de eukaryota exonerna, intronerna, splitsningsövergångarna och delade generna, och tillämpningarna av dessa fynd inom humanmedicin som har påverkat positivt. tusentals patienter med hundratals sjukdomar inklusive cancer och ärftliga sjukdomar. Hans forskning är ett exempel på tillämpningen av grundläggande molekylärbiologiska forskningsrön på humanmedicin med djupgående inverkan, och en mängd olika grundläggande vetenskaper och andra praktiska tillämpningar på djur och växter.

Ursprunget för delade gener från slumpmässiga DNA-sekvenser

Den delade genteorin svarar på stora frågor om varför och hur de delade generna från eukaryoter uppstod. Den anger att om kodande sekvenser för biologiska proteiner härrörde från slumpmässiga primordiala genetiska sekvenser, skulle den slumpmässiga förekomsten av de 3 stoppkodonen av 64 kodon begränsa de öppna läsramarna (ORF) till en mycket kort längd på ~60 baser. Således kan kodande sekvenser för biologiska proteiner med medellängder på ~1 200 baser och långa kodande sekvenser på 6 000 baser praktiskt taget aldrig förekomma i slumpmässiga sekvenser. Generna var alltså tvungna att förekomma i bitar i delad form, med korta kodande sekvenser (ORF) som blev exoner, avbrutna av mycket långa slumpmässiga sekvenser som blev introner. När det eukaryota DNA:t testades för ORF-längdfördelning matchade det exakt det från slumpmässigt DNA, med mycket korta ORF:er som matchade längden på exoner, och mycket långa introner som förutspått, vilket stöder teorin om delad gen. Sålunda är introner kvarlevor från deras slumpmässiga sekvensursprung och är därför öronmärkta för att avlägsnas vid det primära RNA-stadiet, även om de för övrigt kan ha få genetiska element som är användbara för cellen. Nobelpristagaren Dr. Marshall Nirenberg , som dechiffrerade kodonen, kommunicerade uppsatsen till PNAS . New Scientist täckte denna publikation med titeln "En lång förklaring till introner".

Den kända molekylärbiologen och biofysikern Dr. Colin Blake från Laboratory of Molecular Biophysics och Oxford Center for Molecular Sciences, University of Oxford, kommenterade Dr. Senapathys teori att: "Senaste arbete av Dr. Senapathy, när det tillämpas på RNA, förklarar uttömmande ursprunget för den segregerade formen av RNA i kodande och icke-kodande regioner. Det antyder också varför en splitsningsmekanism utvecklades i början av primordial evolution. Närvaron av slumpmässig sekvens var därför tillräcklig för att skapa den segregerade formen av RNA i den primordiala förfadern observeras i den eukaryota genstrukturen."

Ursprunget för RNA-splitsningsövergångssignaler från stoppkodon för ORF

Dr. Senapathys forskning belyser också ursprunget till skarvförbindelserna av eukaryota gener, återigen de stora frågorna om varför och hur skarvövergångssignalerna uppstod. Dr. Senapathy förutspådde att, om teorin om delad gen var sann, skulle ändarna av dessa ORF som hade ett stoppkodon ha blivit ändarna av exoner som skulle förekomma inom introner, och det skulle definiera splitsningsövergångarna. Senapathy fann att nästan alla splitsningsövergångar i eukaryota gener innehöll stoppkodon exakt i ändarna av introner, som gränsar till exonerna som förutspått. I själva verket befanns dessa stoppkodon bilda den "kanoniska" AG:GT-splitsningssekvensen, där de tre stoppkodonen uppträdde som en del av de starka konsensussignalerna. Senapathy hade observerat att mutationer i dessa stoppkodonbaser inom splitsningsövergångar var orsaken till majoriteten av sjukdomar orsakade av splitsningsmutationer, vilket betonade vikten av stoppkodon i splitsningsövergångarna. Sålunda ledde den grundläggande splitgenteorin till hypotesen att splitsningsförbindelserna härrörde från stoppkodonen. Dr. Marshall Nirenberg stödde publiceringen av denna artikel i PNAS . New Scientist täckte denna publikation med titeln "Exons, Introns and Evolution".

Varför exoner är korta och introner är långa

Forskning baserad på teorin om split gen kastar ljus över andra grundläggande frågor om exoner och introner. Eukaryoternas exoner är i allmänhet korta (mänskliga exoner i genomsnitt ~120 baser och kan vara så korta som 10 baser) och introner är vanligtvis mycket långa (i genomsnitt ~3 000 baser och kan vara flera hundra tusen baser långa), till exempel gener RBFOX1, CNTNAP2, PTPRD och DLG2. Dr Senapathy har gett ett rimligt svar på dessa frågor, vilket har varit den enda förklaringen hittills. Baserat på teorin om delad gen måste exoner av eukaryota gener, om de härstammar från slumpmässiga DNA-sekvenser, matcha längden av ORF från slumpmässig sekvens, och bör möjligen vara runt 100 baser (nära medianlängden för ORF i slumpmässig sekvens) . Genomsekvenserna för levande organismer, till exempel människan, uppvisar exakt samma genomsnittliga längder på 120 baser för exoner, och de längsta exonerna på 600 baser (med få undantag), vilket är samma längd som de längsta slumpmässiga ORF:erna. Dessutom kan intronerna vara mycket långa, baserat på teorin om delad gen, vilket har visat sig vara sant i eukaryota organismer.

Varför genomerna är stora

Detta arbete förklarar också varför genomen är mycket stora, till exempel det mänskliga genomet med tre miljarder baser, och varför endast en mycket liten del av det mänskliga genomet (~2%) kodar för proteinerna och andra regulatoriska element. Om delade gener härrörde från slumpmässiga primordiala DNA-sekvenser, skulle den innehålla en betydande mängd DNA som skulle representeras av introner. Vidare skulle ett genom sammansatt från slumpmässigt DNA innehållande delade gener också innefatta intergeniskt slumpmässigt DNA. De begynnande genomen som härrörde från slumpmässiga DNA-sekvenser måste alltså vara stora, oavsett organismens komplexitet. Observationen att genomet för flera organismer som löken (~16 miljarder baser) och salamander (~32 miljarder baser) är mycket större än människans (~3 miljarder baser) men organismerna är inte mer komplexa än människan ger trovärdighet åt denna delade genteorin. Vidare upptäcktes att arvsmassan hos flera organismer är mindre, även om de innehåller i stort sett samma antal gener som människans, såsom de från C. elegans (genomstorlek ~100 miljoner baser, ~19 000 gener) och Arabidopsis (genomstorlek ~125 miljoner baser, ~25 000 gener), ger stöd till denna teori. Den delade genteorin förutspår att intronerna i de delade generna i dessa genom kan vara den "reducerade" (eller raderade) formen jämfört med de större generna med långa introner, vilket leder till reducerade genom. Faktum är att forskare nyligen föreslagit att dessa mindre genom faktiskt är reducerade genom, vilket ger stöd till teorin om delad gen.

Ursprunget till det spliceosomala maskineriet och den eukaryota cellkärnan

Dr Senapathys forskning tar också upp ursprunget till det spliceosomala maskineriet som redigerar ut intronerna från RNA-transkripten av gener. Om de splittrade generna hade sitt ursprung från slumpmässigt DNA, skulle intronerna ha blivit en onödig men integrerad del av de eukaryota generna tillsammans med splitsningsövergångarna i deras ändar. Det spliceosomala maskineriet skulle krävas för att ta bort dem och göra det möjligt för de korta exonerna att linjärt splitsas samman som ett kontinuerligt kodande mRNA som kan översättas till ett komplett protein. Sålunda visar den splittrade genteorin att hela spliceosomala maskineriet har sitt ursprung på grund av ursprunget till delade gener från slumpmässiga DNA-sekvenser, och för att ta bort de onödiga intronerna.

Dr Senapathy hade också föreslagit ett rimligt mekanistiskt och funktionellt skäl till varför den eukaryota kärnan uppstod, en stor obesvarad fråga inom biologin. Om transkripten av de splittrade generna och de splitsade mRNA:erna fanns i en cell utan kärna, skulle ribosomerna försöka binda till både det icke-splitsade primära RNA-transkriptet och det splitsade mRNA:t, vilket skulle resultera i ett molekylärt kaos. Om en gräns hade uppstått för att separera RNA-skarvningsprocessen från mRNA-translationen, kan det undvika detta problem med molekylärt kaos. Detta är exakt vad som finns i eukaryota celler, där splitsningen av det primära RNA-transkriptet sker inom kärnan, och det splitsade mRNA:t transporteras till cytoplasman, där ribosomerna översätter dem till proteiner. Den nukleära gränsen ger en tydlig separation av den primära RNA-skarvningen och mRNA-translationen.

Ursprunget för den eukaryota cellen

Dessa undersökningar ledde således till möjligheten att ur-DNA med väsentligen slumpmässig sekvens gav upphov till den komplexa strukturen av de splittrade generna med exoner, introner och splitsningsövergångar. De förutspår också att cellerna som hyste dessa splittrade gener måste vara komplexa med en nukleär cytoplasmatisk gräns och måste ha haft ett spliceosomalt maskineri. Således var det möjligt att den tidigaste cellen var komplex och eukaryot. Överraskande nog visar fynd från omfattande jämförande genomikforskning från flera organismer under de senaste 15 åren överväldigande att de tidigaste organismerna kunde ha varit mycket komplexa och eukaryota och kunde ha innehållit komplexa proteiner, exakt som förutspått av Senapathys teori.

Spliceosomen är ett mycket komplext maskineri inom den eukaryota cellen, som innehåller ~200 proteiner och flera SnRNPs. I sin artikel " Complex spliceosomal organisation ancestral to extant eukaryotes ", säger molekylärbiologerna Dr. Lesley Collins och Dr. David Penny "Vi börjar med hypotesen att ... spliceosomen har ökat i komplexitet under hela den eukaryota evolutionen. Undersökning av fördelningen av spliceosomala komponenter indikerar att inte bara en spliceosom fanns i den eukaryota förfadern utan den innehöll också de flesta av nyckelkomponenterna som finns i dagens eukaryoter. ... den sista gemensamma förfadern till bevarade eukaryoter verkar visa mycket av den molekylära komplexitet som ses idag ." Detta tyder på att de tidigaste eukaryota organismerna var mycket komplexa och innehöll sofistikerade gener och proteiner, som teorin om delad gen förutspår.

Shapiro-Senapathy-algoritmen

Den delade genteorin kulminerade i Shapiro-Senapathy-algoritmen , som hjälper till att identifiera splitsningsmutationer som orsakar många sjukdomar och negativa läkemedelsreaktioner. Denna algoritm används i allt större utsträckning i klinisk praxis och forskning, inte bara för att hitta mutationer i kända sjukdomsframkallande gener hos patienter, utan också för att upptäcka nya gener som orsakar olika sjukdomar. Dessutom används den för att hitta mekanismen för avvikande splitsning hos individuella patienter såväl som i grupper av patienter med en viss sjukdom. Dessutom används det för att definiera de kryptiska splitsningsställena och härleda de mekanismer genom vilka mutationer i dem kan påverka normal splitsning och leda till olika sjukdomar. Den används också för att ta upp olika frågor inom grundforskning på människor, djur och växter.

Dessa bidrag har påverkat viktiga frågor inom eukaryot biologi och deras tillämpningar inom humanmedicin. Dessa applikationer kan expandera när områdena klinisk genomik och farmakogenomik förstorar sin forskning med megasekvenseringsprojekt som All of Us-projektet som kommer att sekvensera en miljon individer, och med sekvensering av miljontals patienter i klinisk praxis och forskning i framtiden.

Utvalda publikationer