Shapiro Senapathy algoritm
Shapiro Senapathy-algoritmen (S&S) är en algoritm för att förutsäga skarvövergångar i gener från djur och växter. Denna algoritm har använts för att upptäcka sjukdomsorsakande skarvställen mutationer och kryptiska skarvställen.
Algoritmen
Ett splitsningsställe är gränsen mellan en exon och intron i en gen. Dessa platser innehåller ett speciellt sekvensmotiv , vilket är nödvändigt för igenkänning och bearbetning av RNA-skarvningsmaskineriet.
S&S-algoritmen använder glidfönster på åtta nukleotider, motsvarande längden på splitsningsställets sekvensmotiv, för att identifiera dessa konserverade sekvenser och därmed potentiella splitsningsställen. Med hjälp av en viktad tabell över nukleotidfrekvenser matar S&S-algoritmen ut en konsensusbaserad procentandel för möjligheten att fönstret innehåller en splitsningsplats.
S&S-algoritmen fungerar som basen för andra mjukvaruverktyg, såsom Human Splicing Finder, Splice-site Analyzer Tool, dbass (Ensembl), Alamut och SROOGLE.
Cancergenupptäckt med hjälp av S&S
Genom att använda S&S-algoritmen har man upptäckt mutationer och gener som orsakar många olika former av cancer. Till exempel gener som orsakar vanliga cancerformer inklusive bröstcancer , äggstockscancer , kolorektal cancer , leukemi , huvud- och halscancer , prostatacancer , retinoblastom , skivepitelcancer , mag- tarmcancer , melanom , levercancer , Lynch syndrom , och neurofibromatos , hudcancer . har hittats. Dessutom har splitsningsmutationer i gener som orsakar mindre kända cancerformer, inklusive magcancer, gangliogliom , Li-Fraumeni syndrom , Loeys-Dietz syndrom , osteokondrom (bentumör), Nevoid basalcellscancersyndrom och feokromocytom identifierats.
Specifika mutationer i olika skarvställen i olika gener som orsakar bröstcancer (t.ex. BRCA1, PALB2), äggstockscancer (t.ex. SLC9A3R1, COL7A1, HSD17B7), tjocktarmscancer (t.ex. APC, MLH1, DPYD), kolorektal cancer (t.ex. COL3A1) , APC, HLA-A), hudcancer (t.ex. COL17A1, XPA, POLH) och Fanconi-anemi (t.ex. FANC, FANA) har upptäckts. Mutationerna i donator- och acceptorsplitsningsställena i olika gener som orsakar en mängd olika cancerformer som har identifierats av S&S visas i tabell 1 .
Sjukdomstyp | Gen symbol | Mutationsplats | Ursprunglig sekvens | Muterad sekvens | Skarvning av aberration |
---|---|---|---|---|---|
Bröstcancer | BRCA1 | Exon 11 | AAGGTGTGT | AA A GTGTGT | Hoppa över exon 12 |
PALB2 | Exon 12 | CAGGCAAGT | CA A GCAAGT | Potentiellt försvagar den kanoniska donatorns skarvningsplats | |
Äggstockscancer | SLC9A3R1 | Exon2 | GAGGTGATG | GAGG C GATG | Betydande effekt vid "skarvning" |
Kolorektal cancer | MLH1 | Exon 9 | TCGGTATGT | TC A GTATGT | Hoppa över exon 8 och proteintrunkering |
MSH2 | Intron 8 | CAGGTATGC | CAGG C ATGC | Mellanliggande sekvens, RNA-bearbetning, Ingen aminosyraförändring | |
MSH6 | Intron 9 | TTTTTAATTTTAAGG | TTTTTAATTTT G AGG | Mellanliggande sekvens, RNA-bearbetning, Ingen aminosyraförändring | |
Hudcancer | TGFBR1 | Exon 5 | TTTTGATTCTTTAGG | TTTTGATTCTTT C GG | Exon 5 hoppar över |
ITGA6 | Intron 19 | TTATTTTCTAACAGG | TTATTTTCTAACA C G | Hoppa över exon 20 och resulterade i radering i ram | |
Birt-Hogg-Dubé (BHD) syndrom | FLCN | Exon 9 | GAAGTAGC | GAAG G AAGC | Hoppa över exon 9 och svag retention av 131 bp av intron 9 |
Nevoid basalcellscancer | PTCH1 | Intron 4 | CAGGTATAT | CAGGT G TAT | Exon 4 Hoppa över |
Mesoteliom | BAP1 | Exon 16 | AAGGTGAGG | T AGGTGAGG | Skapar ett nytt 5'-splitsställe som resulterar i en 4-nukleotiders deletion av 3'-änden av exon 16 |
Upptäckt av gener som orsakar ärftliga sjukdomar med hjälp av S&S
Specifika mutationer i olika skarvställen i olika gener som orsakar ärftliga sjukdomar, inklusive till exempel typ 1-diabetes (t.ex. PTPN22, TCF1 (HCF-1A)), hypertoni (t.ex. LDL, LDLR, LPL), Marfans syndrom (t.ex. , FBN1, TGFBR2, FBN2), hjärtsjukdomar (t.ex. COL1A2, MYBPC3, ACTC1), ögonsjukdomar (t.ex. EVC, VSX1) har upptäckts. Några exempel på mutationer i donator- och acceptorsplitsningsställena i olika gener som orsakar en mängd ärftliga störningar identifierade med hjälp av S&S visas i tabell 2 .
Sjukdomstyp | Gen symbol | Mutationsplats | Ursprunglig sekvens | Muterad sekvens | Skarvning av aberration |
---|---|---|---|---|---|
Diabetes | PTPN22 | Exon 18 | AAGGTAAAG | AA C GTAAAG | Hoppa över exon 18 |
TCF1 | Intron 4 | TTTGTGCCCCTCCAGG | TTTGTGCCCCTC G GG | Hoppa över exon 5 | |
Hypertoni | LDL | Intron 10 | TGGGTGCGT | TGGGTGC A T | Normolipidemisk till klassisk heterozygot FH |
LDLR | Intron 2 | GCTGTGAGT | GCTGTG T GT | Kan orsaka skarvningsavvikelser genom en silikoanalys | |
LPL | Intron 2 | ACGGTAAGG | ACG A TAAGG | Kryptiska skarvställen aktiveras in vivo på ställena | |
Marfans syndrom | FBN1 | Intron 46 | CAAGTAAGA | CAAGTAA A A | Exon hoppar/kryptisk skarvplats |
TGFBR2 | Intron 1 | ATCCTGTTTTACAGA | ATCCTGTTTTAC G GA | Onormal skarvning | |
FBN2 | Intron45 | TGGGTAAGT | TGGG G AAGT | Förändringar av skarvställen som leder till ramskiftningsmutationer, orsakar ett trunkerat protein |
|
Hjärtsjukdom | COL1A2 | Intron 46 | GCTGTAAGT | GCTG C AAGT | Tillåten nästan exklusiv användning av en kryptisk givare plats 17 nt uppströms i exonet |
MYBPC3 | Intron 5 | CTCCATGCACACAGG | CTCCATGCACAC C GG | Onormalt mRNA-transkript med en prematur stoppkodon kommer att producera ett trunkerat protein som saknar bindningsställena för myosin och titin |
|
ACTC1 | Intron 1 | TTTTCTTCTCATAGG | TTTTCTTCT T ATAGG | Ingen effekt | |
Ögonstörning | ABCR | Intron 30 | CAGGTACCT | CAG T TACCT | Autosomal recessiv RP och CRD |
VSX1 | Intron 5 | TTTTTTTTTACAAGG | T A TTTTTTTACAAGG | Avvikande skarvning |
Gener som orsakar störningar i immunsystemet
Mer än 100 störningar i immunsystemet påverkar människor, inklusive inflammatoriska tarmsjukdomar , multipel skleros , systemisk lupus erythematosus , bloomsyndrom , familjärt kallt autoinflammatoriskt syndrom och dyseratosis congenita . Shapiro-Senapathy-algoritmen har använts för att upptäcka gener och mutationer som är involverade i många immunsjukdomar, inklusive Ataxia telangiectasia , B-cellsdefekter, epidermolysis bullosa och X-länkad agammaglobulinemi .
Xeroderma pigmentosum , en autosomal recessiv störning orsakas av felaktiga proteiner som bildas på grund av ett nytt föredraget splitsningsdonatorställe identifierat med hjälp av S&S-algoritm och resulterat i defekt reparation av nukleotidexcision.
Typ I Bartters syndrom (BS) orsakas av mutationer i genen SLC12A1. S&S-algoritmen hjälpte till att avslöja närvaron av två nya heterozygota mutationer c.724 + 4A > G i intron 5 och c.2095delG i intron 16, vilket ledde till fullständig exon 5-hoppning.
Mutationer i MYH-genen, som är ansvarig för att ta bort den oxidativt skadade DNA-lesionen är cancerkänsliga hos individerna. IVS1+5C spelar en kausativ roll i aktiveringen av ett kryptiskt splitsningsdonatorställe och den alternativa splitsningen i intron 1, visar S&S-algoritmen, guanin (G) vid positionen för IVS+5 är välbevarad (vid frekvensen 84 % ) bland primater. Detta stödde också det faktum att G/C SNP i den konserverade splitsningsövergången av MYH-genen orsakar den alternativa splitsningen av intron 1 av β-typ-transkriptet.
Splitsplatspoäng beräknades enligt S&S för att hitta EBV-infektion i X-länkad lymfoproliferativ sjukdom. Identifiering av familjär tumörkalcinos (FTC) är en autosomal recessiv störning som kännetecknas av ektopiska förkalkningar och förhöjda serumfosfatnivåer och det beror på avvikande splitsning.
Tillämpning av S&S på sjukhus för klinisk praxis och forskning
Att tillämpa S&S-teknologiplattformen i modern klinisk genomikforskning har framskridit diagnos och behandling av mänskliga sjukdomar.
I den moderna eran av Next Generation Sequencing (NGS)-teknologi, tillämpas S&S i stor utsträckning i klinisk praxis. Kliniker och molekylärdiagnostiska laboratorier tillämpar S&S med hjälp av olika beräkningsverktyg inklusive HSF, SSF och Alamut. Det hjälper till att upptäcka gener och mutationer hos patienter vars sjukdom är stratifierad eller när sjukdomen hos en patient är okänd baserat på kliniska undersökningar.
I detta sammanhang har S&S tillämpats på kohorter av patienter i olika etniska grupper med olika cancerformer och ärftliga sjukdomar. Nedan ges några exempel.
Cancer
Cancer typ | Publikationstitel | År | Etnicitet | Antal patienter | |
---|---|---|---|---|---|
1 | Bröstcancer | Könslinjemutationslandskapet för BRCA1 och BRCA2 i Brasilien | 2018 | Brasilien | 649 patienter |
2 | Ärftlig icke-polypos kolorektal cancer | Prevalens och egenskaper hos ärftligt icke-polypos kolorektal cancer (HNPCC) syndrom hos invandrade asiatiska kolorektal cancerpatienter | 2017 | Asiatisk invandrare | 143 patienter |
3 | Nevoid basalcellscancersyndrom | Nevoid basalcellscancersyndrom orsakat av splitsningsmutationer i PTCH1-genen | 2016 | japanska | 10 patienter |
4 | Prostatacancer | Identifiering av två nya HOXB13 könslinjemutationer hos portugisiska prostatacancerpatienter | 2015 | portugisiska | 462 patienter, 132 kontroller |
5 | Kolorektal adenomatös polypos | Identifiering av nya orsaksgener för kolorektal adenomatös polypos | 2015 | tysk | 181 patienter, 531 kontroller |
6 | Njurcellscancer | Genetisk screening av FLCN-genen identifierar sex nya varianter och en dansk grundarmutation | 2016 | danska | 143 individer |
Ärftliga störningar
Sjukdomens namn | Publikationstitel | År | Etnicitet | Antal patienter | |
---|---|---|---|---|---|
1 | Bardet-Biedls syndrom | Den första rikstäckande undersökningen och genetiska analyserna av Bardet-Biedls syndrom i Japan | 2015 | Japan | 38 patienter (sjukdom identifierad hos 9 patienter) |
2 | Odontogenes sjukdomar | Genetiska bevis som stöder rollen av kalciumkanalen, CACNA1S, i tandknuten och rotmönster | 2018 | thailändska familjer | 11 patienter, 18 kontroller |
3 | Beta-ketotiolasbrist | Kliniska och mutationella karaktäriseringar av tio indiska patienter med beta-ketothiolasbrist | 2016 | indiska | 10 patienter |
4 | Otydlig talutvecklingsfördröjning | Progressiv SCAR14 med oklart tal, utvecklingsfördröjning, tremor och beteendeproblem orsakade av en homozygot deletion av SPTBN2 pleckstrin homologidomänen | 2017 | pakistansk familj | 9 patienter, 12 kontroller |
5 | Dents sjukdom | Dents sjukdom hos barn: diagnostiskt och terapeutiskt övervägande | 2015 | Polen | 10 patienter |
6 | Atypiskt hemolytiskt uremiskt syndrom | Genetik Atypiskt hemolytiskt-uremiskt syndrom | 2015 | Newcastle-kohort | 28 familjer, 7 sporadiska patienter |
7 | Åldersrelaterad makuladegeneration och Stargardts sjukdom | Genetik av åldersrelaterad makuladegeneration och Stargardts sjukdom i sydafrikanska populationer | 2015 | Afrikanska befolkningar | 32 patienter |
S&S - den första algoritmen för att identifiera splitsningsställen, exoner och delade gener
Dr. Senapathys ursprungliga mål med att utveckla en metod för att identifiera splitsningsställen var att hitta kompletta gener i obearbetad okarakteriserad genomsekvens som kunde användas i det mänskliga genomprojektet. I landmärkepapperet med detta mål beskrev han den grundläggande metoden för att identifiera splitsningsställena inom en given sekvens baserat på Position Weight Matrix (PWM) för splitsningssekvenserna i olika eukaryota organismgrupper för första gången. Han skapade också den första exondetekteringsmetoden genom att definiera de grundläggande egenskaperna hos ett exon som sekvensen som begränsas av en acceptor och en donatorsplitsningsställen som hade S&S-poäng över ett tröskelvärde, och av en ORF som var obligatorisk för en exon. En algoritm för att hitta kompletta gener baserade på de identifierade exonerna beskrevs också av Dr Senapathy för första gången.
Dr Senapathy visade att endast skadliga mutationer i donator- eller acceptorsplitsställena som drastiskt skulle göra proteinet defekt skulle minska poängen för splitsningsstället (senare känd som Shapiro-Senapathy-poängen), och andra icke-skadliga variationer skulle inte minska poängen . S&S-metoden var anpassad för att undersöka de kryptiska skarvställena orsakade av mutationer som leder till sjukdomar. Denna metod för att detektera skadliga splitsningsmutationer i eukaryota gener har använts i stor utsträckning i sjukdomsforskning hos människor, djur och växter under de senaste tre decennierna, som beskrivits ovan.
Den grundläggande metoden för identifiering av splitsningsställen och för att definiera exoner och gener användes därefter av forskare för att hitta splitsningsställen, exoner och eukaryota gener i en mängd olika organismer. Dessa metoder utgjorde också grunden för all efterföljande verktygsutveckling för att upptäcka gener i okarakteriserade genomiska sekvenser. Det användes också i olika beräkningsmetoder inklusive maskininlärning och neurala nätverk, och i alternativ splitsningsforskning.
Upptäcka mekanismerna för avvikande splitsning i sjukdomar
Shapiro-Senapathy-algoritmen har använts för att bestämma de olika avvikande splitsningsmekanismerna i gener på grund av skadliga mutationer i splitsningsställena, som orsakar många sjukdomar. Skadliga mutationer i splitsningsstället försämrar den normala splitsningen av gentranskripten och gör därigenom det kodade proteinet defekt. Ett mutant skarvställe kan bli "svagt" jämfört med det ursprungliga stället, på grund av vilket den muterade skarvningsövergången blir oigenkännlig av det spliceosomala maskineriet. Detta kan leda till att exonet hoppar över i splitsningsreaktionen, vilket resulterar i förlust av det exonet i det splitsade mRNA:t (exon-hoppning). Å andra sidan kan ett partiellt eller fullständigt intron inkluderas i mRNA på grund av en splitsningsställemutation som gör det oigenkännligt (introninklusion). En partiell exon-hoppning eller introninkludering kan leda till för tidig avslutning av proteinet från mRNA, vilket kommer att bli defekt vilket leder till sjukdomar. S&S har därmed banat väg för att fastställa de mekanismer genom vilka en skadlig mutation kan leda till ett defekt protein, vilket resulterar i olika sjukdomar beroende på vilken gen som påverkas.
Exempel på splitsningsaberrationer
Sjukdomstyp | Gen symbol | Mutationsplats | Ursprunglig donator/acceptator | Muterad givare/acceptor | Aberrationseffekt |
---|---|---|---|---|---|
Koloncancer | APC | Intron 2 | AAGGTAGAT | AAGG A AGAT | Hoppa över Exon 3 |
Kolorektal cancer | MSH2 | Exon 15 | GAGGTTTGT | GAGGTTT C T | Hoppa över Exon 15 |
Retinoblastom | RB1 | Intron 23 | TCTTAACTTGACAGA | TCTTAAC G TGACAGA | Ny skarvacceptor, introninkludering |
Trofisk benign epidermolysis bullosa | COL17A1 | Intron 51 | AGCGTAAGT | AGC A TAAGT | leda till exonhoppning, introninklusion eller användning av ett kryptiskt splitsningsställe, vilket resulterar i antingen ett trunkerat protein eller ett protein som saknar en liten region av den kodande sekvensen |
Choroideremi | CHM | Intron 3 | CAGGTAAAG | CAG A TAAAG | Kodon för tidig avslutning |
Cowdens syndrom | PTEN | Intron 4 | GAGGTAGGT | GAG EN TAGGT | Kodon för tidig terminering inom exon 5 |
Ett exempel på splitsningsaberration (exonhoppning) orsakad av en mutation i donatorns splitsningsställe i exon 8 av MLH1-genen som ledde till kolorektal cancer ges nedan. Detta exempel visar att en mutation i ett splitsningsställe i en gen kan leda till en djupgående effekt i sekvensen och strukturen av mRNA:t och sekvensen, strukturen och funktionen hos det kodade proteinet, vilket leder till sjukdom.
S&S i kryptiska skarvplatser, forskning och medicinska tillämpningar
Den korrekta identifieringen av splitsningsställen måste vara mycket exakt eftersom konsensussplitsningssekvenserna är mycket korta och det finns många andra sekvenser som liknar de autentiska splitsningsställena inom gensekvenser, som är kända som kryptiska, icke-kanoniska eller pseudosplitsningsställen. När ett autentiskt eller verkligt splitsningsställe är muterat, kan alla kryptiska splitsningsställen som finns nära det ursprungliga verkliga splitsningsstället felaktigt användas som autentiska platser, vilket resulterar i ett avvikande mRNA. Det felaktiga mRNA:t kan inkludera en partiell sekvens från det angränsande intronet eller förlora ett partiellt exon, vilket kan resultera i ett för tidigt stoppkodon. Resultatet kan bli ett trunkerat protein som skulle ha förlorat sin funktion helt.
Shapiro-Senapathy-algoritmen kan identifiera de kryptiska skarvplatserna, förutom de autentiska skarvplatserna. Kryptiska sajter kan ofta vara starkare än de autentiska sajterna, med högre S&S-poäng. På grund av avsaknaden av ett medföljande komplementärt donator- eller acceptorställe kommer detta kryptiska ställe inte att vara aktivt eller användas i en splitsningsreaktion. När en angränsande verklig plats muteras för att bli svagare än den kryptiska sidan, kan den kryptiska sidan användas istället för den verkliga sidan, vilket resulterar i en kryptisk exon och ett avvikande transkript.
Många sjukdomar har orsakats av mutationer i kryptiska splitsningsställen eller användning av kryptiska splitsningsställen på grund av mutationerna i autentiska splitsningsställen.
S&S inom djur- och växtgenomikforskning
S&S har också använts i RNA-splitsningsforskning i många djur och växter.
mRNA-skarvningen spelar en grundläggande roll i genfunktionell reglering. Mycket nyligen har det visats att A till G-omvandlingar vid splitsningsställen kan leda till felsplitsning av mRNA i Arabidopsis. Splitsnings- och exon-intronövergångsförutsägelsen sammanföll med GT/AG-regeln (S&S) i molekylär karakterisering och utveckling av köttätande soldagg (Drosera rotundifolia L.) klass V b-1,3-glukanas. Oskarvade (LSDH) och splitsade (SSDH) transkript av NAD+-beroende sorbitoldehydrogenas (NADSDH) av jordgubbar (Fragaria ananassa Duch., cv. Nyoho) undersöktes för fytohormonella behandlingar.
Ambra1 är en positiv regulator av autofagi, en lysosom-medierad nedbrytningsprocess involverad både i fysiologiska och patologiska tillstånd. Nuförtiden har denna funktion hos Ambra1 endast karaktäriserats hos däggdjur och zebrafiskar. Minskning av rbm24a eller rbm24b genprodukter genom morpholino knockdown resulterade i betydande störningar av somitbildning hos mus och zebrafisk. Dr.Senapathy-algoritmen används i stor utsträckning för att studera intron-exon-organisation av fut8- gener. Intron-exon-gränserna för Sf 9 fut8 överensstämde med konsensussekvensen för splitsningsdonator- och acceptorställena som avslutades med S&S.
Split-genteorin, introner och skarvövergångar
Motivationen för Dr Senapathy att utveckla en metod för att detektera skarvövergångar kom från hans teori om split-gen. Om primordiala DNA-sekvenser hade en slumpmässig nukleotidorganisation, skulle den slumpmässiga fördelningen av stoppkodon endast tillåta mycket korta öppna läsramar (ORF), eftersom tre stoppkodon av 64 kodon skulle resultera i en genomsnittlig ORF på ~60 baser. När Senapathy testade detta i slumpmässiga DNA-sekvenser, visade sig inte bara detta vara sant, utan de längsta ORF:erna även i mycket långa DNA-sekvenser visade sig vara ~600 baser över vilka inga ORF:er existerade. Om så är fallet kommer en lång kodande sekvens på till och med 1 200 baser (den genomsnittliga kodande sekvenslängden för gener från levande organismer) och längre kodande sekvenser på 6 000 baser (varav många förekommer i levande organismer) inte att förekomma i en primordial slumpmässig sekvens. Generna var alltså tvungna att förekomma i bitar i delad form, med korta kodande sekvenser (ORF) som blev exoner, avbrutna av mycket långa slumpmässiga sekvenser som blev introner. När det eukaryota DNA:t testades för ORF-längdfördelning matchade det exakt det från slumpmässigt DNA, med mycket korta ORF:er som matchade längden på exoner och mycket långa introner som förutspått, vilket stöder teorin om delad gen .
Om denna delade genteorin var sann, skulle ändarna av dessa ORF som hade ett stoppkodon av naturen ha blivit ändarna av exoner som skulle förekomma inom introner, och det skulle definiera splitsningsförbindelserna. När denna hypotes testades visade sig nästan alla splitsningsövergångar i eukaryota gener innehålla stoppkodon exakt i ändarna av introner, som gränsar till exonerna. Faktum är att dessa stoppkodoner bildade den "kanoniska" AG:GT-skarvningssekvensen, där de tre stoppkodonen uppträdde som en del av de starka konsensussignalerna. Nobelpristagaren Dr. Marshall Nirenberg , som dechiffrerade kodonen, konstaterade att dessa fynd starkt visade att teorin om delad gen för ursprunget till introner och den delade strukturen av gener måste vara giltig, och kommunicerade artikeln till PNAS. New Scientist täckte denna publikation i "A long explanation for introns".
Denna grundläggande delade genteori ledde till hypotesen att splitsningsförbindelserna härrörde från stoppkodonen. Förutom kodonet CAG hittades endast TAG, som är ett stoppkodon, i ändarna av introner. Överraskande nog hittades alla tre stoppkodonen (TGA, TAA och TAG) efter en bas (G) i början av introner. Dessa stoppkodon visas i den konsensus kanoniska donatorsplitsningsövergången som AG:GT(A/G)GGT, varvid TAA och TGA är stoppkodonen, och det ytterligare TAG är också närvarande vid denna position. Den kanoniska acceptorsplitsningsövergången visas som (C/T)AG:GT, där TAG är stoppkodonet. Dessa konsensussekvenser visar tydligt närvaron av stoppkodonerna vid ändarna av introner som gränsar till exonerna i alla eukaryota gener. Dr. Marshall Nirenberg uppgav återigen att dessa observationer fullt ut stödde teorin om delad gen för ursprunget till splitsningsövergångssekvenser från stoppkodon, som var referent för denna artikel. New Scientist täckte denna publikation i "Exons, Introns and Evolution".
Dr Senapathy ville detektera splitsningsförbindelserna i slumpmässigt DNA baserat på konsensussplitssignalsekvenserna, eftersom han fann att det fanns många sekvenser som liknade splitsningsställen som inte var de riktiga splitsningsställena i gener. Denna Position Weight Matrix-metod visade sig vara en mycket noggrann algoritm för att detektera de verkliga skarvställena och de kryptiska platserna i gener. Han formulerade också den första exondetekteringsmetoden, baserad på kravet på skarvövergångar i ändarna av exoner, och kravet på en öppen läsram som skulle innehålla exonen. Denna exondetekteringsmetod visade sig också vara mycket exakt och detekterade de flesta av exonerna med få falska positiva och falska negativa. Han utökade detta tillvägagångssätt för att definiera en fullständig delad gen i en eukaryot genomisk sekvens. Således visade sig den PWM-baserade algoritmen vara mycket känslig för att inte bara detektera de verkliga splitsningsställena och kryptiska platserna, utan också för att detektera muterade splitsningsställen som är skadliga i motsats till icke-skadliga splitsningsmutationer.
Stoppkodonen i splitsningsövergångar visade sig vara de starkaste baserna i splitsningsövergångar av eukaryota gener, när de testades med PWM:erna för konsensussekvenserna. Faktum är att det visades att mutationer i dessa baser var orsaken till sjukdomar jämfört med andra baser, eftersom dessa tre av de fyra baserna (bas 1, 3 och 4) i det kanoniska AG:GT var en del av stoppkodonen. Senapati visade att, när dessa kanoniska baser muterades, blev splitsningsställets poäng svag, vilket orsakade splitsningsaberrationer i splitsningsprocessen och translation av mRNA (som beskrivs under sjukdomsavsnittet ovan). Även om värdet av metoden för att upptäcka splitsningsställen för att upptäcka gener med splitsningsmutationer som orsakade sjukdom har insetts under åren, har dess betydelse inom klinisk medicin insett alltmer i Next Generation Sequencing-eran under de senaste fem åren, med dess inkorporering i flera verktyg baserade på S&S-algoritmen.
Dr. Senapathy är för närvarande VD och CSO för Genome International Corporation (GIC), ett FoU-företag inom genomik baserat i Madison, WI. Hans team har utvecklat flera databaser och verktyg för analys av skarvkorsningar, inklusive EuSplice, AspAlt, ExDom och RoBust. AspAlt fick beröm av Biotechniques, som uppgav att det löste ett svårt problem för forskare i den jämförande analysen och visualiseringen av alternativ splitsning över olika genom. GIC har senast utvecklat analysplattformen för klinisk genomik Genome Explorer ® .
Utvalda publikationer
- Shapiro, Marvin B.; Senapathy, Periannan (1987). "RNA-splitsningsförbindelser av olika klasser av eukaryoter: sekvensstatistik och funktionella implikationer i genuttryck" . Nukleinsyraforskning . 15 (17): 7155–7174. doi : 10.1093/nar/15.17.7155 . PMC 306199 . PMID 3658675 .
- Senapathy, P. (1988). "Möjlig utveckling av splice-junction-signaler i eukaryota gener från stoppkodon" . Proc Natl Acad Sci USA . 85 (4): 1129–33. Bibcode : 1988PNAS...85.1129S . doi : 10.1073/pnas.85.4.1129 . PMC 279719 . PMID 3422483 .
- Senapathy, P; Shapiro, MB; Harris, NL (1990). "Splice-korsningar, förgreningspunkter och exoner: sekvensstatistik, identifiering och tillämpningar till genomprojekt". Metoder inom enzymologi . 183 : 252–78. doi : 10.1016/0076-6879(90)83018-5 . PMID 2314278 .
- Harris, NL; Senapathy, P. (1990). "Fördelning och konsensus av grenpunktssignaler i eukaryota gener: en datoriserad statistisk analys" . Nucleic Acids Res . 18 (10): 3015–9. doi : 10.1093/nar/18.10.3015 . PMC 330832 . PMID 2349097 .
- Senapathy, P. (1986). "Ursprunget till eukaryota introner: en hypotes, baserad på kodonfördelningsstatistik i gener, och dess implikationer" . Proc Natl Acad Sci USA . 83 (7): 2133–7. Bibcode : 1986PNAS...83.2133S . doi : 10.1073/pnas.83.7.2133 . PMC 323245 . PMID 3457379 .
- Regulapati, R.; Bhasi, A.; Singh, CK; Senapathy, P. (2008). "Ursprunget till den delade strukturen av spliceosomala gener från slumpmässiga genetiska sekvenser" . PLOS ETT . 3 (10): 10. Bibcode : 2008PLoSO...3.3456R . doi : 10.1371/journal.pone.0003456 . PMC 2565106 . PMID 18941625 .
- Senapathy, P. (1995). "Introner och ursprunget till proteinkodande gener" . Vetenskap . 268 (5215): 1366–7. Bibcode : 1995Sci...268.1366S . doi : 10.1126/science.7761858 . PMID 7761858 .