Shapiro Senapathy algoritm

De olika typerna av splitsningsmutationer i gener. Mutationer inom splitsningsregionerna av gener kan leda till ett defekt transkript och protein. Beroende på var exakt mutationen inträffar och vilket "kryptiskt" splitsningsställe nära det ursprungliga stället som väljs för splitsning, kommer den specifika defekten i transkriptet och proteinet att variera. Ofta kommer splitsningsmutationer att leda till exonhoppning, introninklusion, exonförlängning/trunkering och för tidig avslutning i det resulterande transkriptet. De olika defekterna i transkriptet kommer i sin tur att resultera i olika typer av störningar i proteinets aminosyrasekvens.

Shapiro Senapathy-algoritmen (S&S) är en algoritm för att förutsäga skarvövergångar i gener från djur och växter. Denna algoritm har använts för att upptäcka sjukdomsorsakande skarvställen mutationer och kryptiska skarvställen.

Algoritmen

Ett splitsningsställe är gränsen mellan en exon och intron i en gen. Dessa platser innehåller ett speciellt sekvensmotiv , vilket är nödvändigt för igenkänning och bearbetning av RNA-skarvningsmaskineriet.

S&S-algoritmen använder glidfönster på åtta nukleotider, motsvarande längden på splitsningsställets sekvensmotiv, för att identifiera dessa konserverade sekvenser och därmed potentiella splitsningsställen. Med hjälp av en viktad tabell över nukleotidfrekvenser matar S&S-algoritmen ut en konsensusbaserad procentandel för möjligheten att fönstret innehåller en splitsningsplats.

S&S-algoritmen fungerar som basen för andra mjukvaruverktyg, såsom Human Splicing Finder, Splice-site Analyzer Tool, dbass (Ensembl), Alamut och SROOGLE.

Cancergenupptäckt med hjälp av S&S

Genom att använda S&S-algoritmen har man upptäckt mutationer och gener som orsakar många olika former av cancer. Till exempel gener som orsakar vanliga cancerformer inklusive bröstcancer , äggstockscancer , kolorektal cancer , leukemi , huvud- och halscancer , prostatacancer , retinoblastom , skivepitelcancer , mag- tarmcancer , melanom , levercancer , Lynch syndrom , och neurofibromatos , hudcancer . har hittats. Dessutom har splitsningsmutationer i gener som orsakar mindre kända cancerformer, inklusive magcancer, gangliogliom , Li-Fraumeni syndrom , Loeys-Dietz syndrom , osteokondrom (bentumör), Nevoid basalcellscancersyndrom och feokromocytom identifierats.

Specifika mutationer i olika skarvställen i olika gener som orsakar bröstcancer (t.ex. BRCA1, PALB2), äggstockscancer (t.ex. SLC9A3R1, COL7A1, HSD17B7), tjocktarmscancer (t.ex. APC, MLH1, DPYD), kolorektal cancer (t.ex. COL3A1) , APC, HLA-A), hudcancer (t.ex. COL17A1, XPA, POLH) och Fanconi-anemi (t.ex. FANC, FANA) har upptäckts. Mutationerna i donator- och acceptorsplitsningsställena i olika gener som orsakar en mängd olika cancerformer som har identifierats av S&S visas i tabell 1 .

Sjukdomstyp Gen symbol Mutationsplats Ursprunglig sekvens Muterad sekvens Skarvning av aberration
Bröstcancer BRCA1 Exon 11 AAGGTGTGT AA A GTGTGT Hoppa över exon 12
PALB2 Exon 12 CAGGCAAGT CA A GCAAGT Potentiellt försvagar den kanoniska donatorns skarvningsplats
Äggstockscancer SLC9A3R1 Exon2 GAGGTGATG GAGG C GATG Betydande effekt vid "skarvning"
Kolorektal cancer MLH1 Exon 9 TCGGTATGT TC A GTATGT Hoppa över exon 8 och proteintrunkering
MSH2 Intron 8 CAGGTATGC CAGG C ATGC Mellanliggande sekvens, RNA-bearbetning, Ingen aminosyraförändring
MSH6 Intron 9 TTTTTAATTTTAAGG TTTTTAATTTT G AGG Mellanliggande sekvens, RNA-bearbetning, Ingen aminosyraförändring
Hudcancer TGFBR1 Exon 5 TTTTGATTCTTTAGG TTTTGATTCTTT C GG Exon 5 hoppar över
ITGA6 Intron 19 TTATTTTCTAACAGG TTATTTTCTAACA C G Hoppa över exon 20 och resulterade i radering i ram
Birt-Hogg-Dubé (BHD) syndrom FLCN Exon 9 GAAGTAGC GAAG G AAGC Hoppa över exon 9 och svag retention av 131 bp av intron 9
Nevoid basalcellscancer PTCH1 Intron 4 CAGGTATAT CAGGT G TAT Exon 4 Hoppa över
Mesoteliom BAP1 Exon 16 AAGGTGAGG T AGGTGAGG Skapar ett nytt 5'-splitsställe som resulterar i en 4-nukleotiders deletion av 3'-änden av exon 16
Tabell 1. Mutationer i donator- och acceptorsplitsningsställena i olika gener

Upptäckt av gener som orsakar ärftliga sjukdomar med hjälp av S&S

Specifika mutationer i olika skarvställen i olika gener som orsakar ärftliga sjukdomar, inklusive till exempel typ 1-diabetes (t.ex. PTPN22, TCF1 (HCF-1A)), hypertoni (t.ex. LDL, LDLR, LPL), Marfans syndrom (t.ex. , FBN1, TGFBR2, FBN2), hjärtsjukdomar (t.ex. COL1A2, MYBPC3, ACTC1), ögonsjukdomar (t.ex. EVC, VSX1) har upptäckts. Några exempel på mutationer i donator- och acceptorsplitsningsställena i olika gener som orsakar en mängd ärftliga störningar identifierade med hjälp av S&S visas i tabell 2 .

Sjukdomstyp Gen symbol Mutationsplats Ursprunglig sekvens Muterad sekvens Skarvning av aberration
Diabetes PTPN22 Exon 18 AAGGTAAAG AA C GTAAAG Hoppa över exon 18
TCF1 Intron 4 TTTGTGCCCCTCCAGG TTTGTGCCCCTC G GG Hoppa över exon 5
Hypertoni LDL Intron 10 TGGGTGCGT TGGGTGC A T Normolipidemisk till klassisk heterozygot FH
LDLR Intron 2 GCTGTGAGT GCTGTG T GT Kan orsaka skarvningsavvikelser genom en silikoanalys
LPL Intron 2 ACGGTAAGG ACG A TAAGG Kryptiska skarvställen aktiveras in vivo på ställena
Marfans syndrom FBN1 Intron 46 CAAGTAAGA CAAGTAA A A Exon hoppar/kryptisk skarvplats
TGFBR2 Intron 1 ATCCTGTTTTACAGA ATCCTGTTTTAC G GA Onormal skarvning
FBN2 Intron45 TGGGTAAGT TGGG G AAGT Förändringar av skarvställen som leder till ramskiftningsmutationer,

orsakar ett trunkerat protein

Hjärtsjukdom COL1A2 Intron 46 GCTGTAAGT GCTG C ​​AAGT Tillåten nästan exklusiv användning av en kryptisk givare

plats 17 nt uppströms i exonet

MYBPC3 Intron 5 CTCCATGCACACAGG CTCCATGCACAC C GG Onormalt mRNA-transkript med en prematur

stoppkodon kommer att producera ett trunkerat protein som saknar bindningsställena för myosin och titin

ACTC1 Intron 1 TTTTCTTCTCATAGG TTTTCTTCT T ATAGG Ingen effekt
Ögonstörning ABCR Intron 30 CAGGTACCT CAG T TACCT Autosomal recessiv RP och CRD
VSX1 Intron 5 TTTTTTTTTACAAGG T A TTTTTTTACAAGG Avvikande skarvning
Tabell 2. Mutationer i donator- och acceptorsplitsningsställena i olika gener som orsakar ärftliga sjukdomar

Gener som orsakar störningar i immunsystemet

Mer än 100 störningar i immunsystemet påverkar människor, inklusive inflammatoriska tarmsjukdomar , multipel skleros , systemisk lupus erythematosus , bloomsyndrom , familjärt kallt autoinflammatoriskt syndrom och dyseratosis congenita . Shapiro-Senapathy-algoritmen har använts för att upptäcka gener och mutationer som är involverade i många immunsjukdomar, inklusive Ataxia telangiectasia , B-cellsdefekter, epidermolysis bullosa och X-länkad agammaglobulinemi .

Xeroderma pigmentosum , en autosomal recessiv störning orsakas av felaktiga proteiner som bildas på grund av ett nytt föredraget splitsningsdonatorställe identifierat med hjälp av S&S-algoritm och resulterat i defekt reparation av nukleotidexcision.

Typ I Bartters syndrom (BS) orsakas av mutationer i genen SLC12A1. S&S-algoritmen hjälpte till att avslöja närvaron av två nya heterozygota mutationer c.724 + 4A > G i intron 5 och c.2095delG i intron 16, vilket ledde till fullständig exon 5-hoppning.

Mutationer i MYH-genen, som är ansvarig för att ta bort den oxidativt skadade DNA-lesionen är cancerkänsliga hos individerna. IVS1+5C spelar en kausativ roll i aktiveringen av ett kryptiskt splitsningsdonatorställe och den alternativa splitsningen i intron 1, visar S&S-algoritmen, guanin (G) vid positionen för IVS+5 är välbevarad (vid frekvensen 84 % ) bland primater. Detta stödde också det faktum att G/C SNP i den konserverade splitsningsövergången av MYH-genen orsakar den alternativa splitsningen av intron 1 av β-typ-transkriptet.

Splitsplatspoäng beräknades enligt S&S för att hitta EBV-infektion i X-länkad lymfoproliferativ sjukdom. Identifiering av familjär tumörkalcinos (FTC) är en autosomal recessiv störning som kännetecknas av ektopiska förkalkningar och förhöjda serumfosfatnivåer och det beror på avvikande splitsning.

Tillämpning av S&S på sjukhus för klinisk praxis och forskning

Att tillämpa S&S-teknologiplattformen i modern klinisk genomikforskning har framskridit diagnos och behandling av mänskliga sjukdomar.

I den moderna eran av Next Generation Sequencing (NGS)-teknologi, tillämpas S&S i stor utsträckning i klinisk praxis. Kliniker och molekylärdiagnostiska laboratorier tillämpar S&S med hjälp av olika beräkningsverktyg inklusive HSF, SSF och Alamut. Det hjälper till att upptäcka gener och mutationer hos patienter vars sjukdom är stratifierad eller när sjukdomen hos en patient är okänd baserat på kliniska undersökningar.

I detta sammanhang har S&S tillämpats på kohorter av patienter i olika etniska grupper med olika cancerformer och ärftliga sjukdomar. Nedan ges några exempel.

Cancer

Cancer typ Publikationstitel År Etnicitet Antal patienter
1 Bröstcancer Könslinjemutationslandskapet för BRCA1 och BRCA2 i Brasilien 2018 Brasilien 649 patienter
2 Ärftlig icke-polypos kolorektal cancer Prevalens och egenskaper hos ärftligt icke-polypos kolorektal cancer (HNPCC) syndrom hos invandrade asiatiska kolorektal cancerpatienter 2017 Asiatisk invandrare 143 patienter
3 Nevoid basalcellscancersyndrom Nevoid basalcellscancersyndrom orsakat av splitsningsmutationer i PTCH1-genen 2016 japanska 10 patienter
4 Prostatacancer Identifiering av två nya HOXB13 könslinjemutationer hos portugisiska prostatacancerpatienter 2015 portugisiska 462 patienter, 132 kontroller
5 Kolorektal adenomatös polypos Identifiering av nya orsaksgener för kolorektal adenomatös polypos 2015 tysk 181 patienter, 531 kontroller
6 Njurcellscancer Genetisk screening av FLCN-genen identifierar sex nya varianter och en dansk grundarmutation 2016 danska 143 individer

Ärftliga störningar

Sjukdomens namn Publikationstitel År Etnicitet Antal patienter
1 Bardet-Biedls syndrom Den första rikstäckande undersökningen och genetiska analyserna av Bardet-Biedls syndrom i Japan 2015 Japan 38 patienter (sjukdom identifierad hos 9 patienter)
2 Odontogenes sjukdomar Genetiska bevis som stöder rollen av kalciumkanalen, CACNA1S, i tandknuten och rotmönster 2018 thailändska familjer 11 patienter, 18 kontroller
3 Beta-ketotiolasbrist Kliniska och mutationella karaktäriseringar av tio indiska patienter med beta-ketothiolasbrist 2016 indiska 10 patienter
4 Otydlig talutvecklingsfördröjning Progressiv SCAR14 med oklart tal, utvecklingsfördröjning, tremor och beteendeproblem orsakade av en homozygot deletion av SPTBN2 pleckstrin homologidomänen 2017 pakistansk familj 9 patienter, 12 kontroller
5 Dents sjukdom Dents sjukdom hos barn: diagnostiskt och terapeutiskt övervägande 2015 Polen 10 patienter
6 Atypiskt hemolytiskt uremiskt syndrom Genetik Atypiskt hemolytiskt-uremiskt syndrom 2015 Newcastle-kohort 28 familjer, 7 sporadiska patienter
7 Åldersrelaterad makuladegeneration och Stargardts sjukdom Genetik av åldersrelaterad makuladegeneration och Stargardts sjukdom i sydafrikanska populationer 2015 Afrikanska befolkningar 32 patienter

S&S - den första algoritmen för att identifiera splitsningsställen, exoner och delade gener

Dr. Senapathys ursprungliga mål med att utveckla en metod för att identifiera splitsningsställen var att hitta kompletta gener i obearbetad okarakteriserad genomsekvens som kunde användas i det mänskliga genomprojektet. I landmärkepapperet med detta mål beskrev han den grundläggande metoden för att identifiera splitsningsställena inom en given sekvens baserat på Position Weight Matrix (PWM) för splitsningssekvenserna i olika eukaryota organismgrupper för första gången. Han skapade också den första exondetekteringsmetoden genom att definiera de grundläggande egenskaperna hos ett exon som sekvensen som begränsas av en acceptor och en donatorsplitsningsställen som hade S&S-poäng över ett tröskelvärde, och av en ORF som var obligatorisk för en exon. En algoritm för att hitta kompletta gener baserade på de identifierade exonerna beskrevs också av Dr Senapathy för första gången.

Dr Senapathy visade att endast skadliga mutationer i donator- eller acceptorsplitsställena som drastiskt skulle göra proteinet defekt skulle minska poängen för splitsningsstället (senare känd som Shapiro-Senapathy-poängen), och andra icke-skadliga variationer skulle inte minska poängen . S&S-metoden var anpassad för att undersöka de kryptiska skarvställena orsakade av mutationer som leder till sjukdomar. Denna metod för att detektera skadliga splitsningsmutationer i eukaryota gener har använts i stor utsträckning i sjukdomsforskning hos människor, djur och växter under de senaste tre decennierna, som beskrivits ovan.

Den grundläggande metoden för identifiering av splitsningsställen och för att definiera exoner och gener användes därefter av forskare för att hitta splitsningsställen, exoner och eukaryota gener i en mängd olika organismer. Dessa metoder utgjorde också grunden för all efterföljande verktygsutveckling för att upptäcka gener i okarakteriserade genomiska sekvenser. Det användes också i olika beräkningsmetoder inklusive maskininlärning och neurala nätverk, och i alternativ splitsningsforskning.

Upptäcka mekanismerna för avvikande splitsning i sjukdomar

Shapiro-Senapathy-algoritmen har använts för att bestämma de olika avvikande splitsningsmekanismerna i gener på grund av skadliga mutationer i splitsningsställena, som orsakar många sjukdomar. Skadliga mutationer i splitsningsstället försämrar den normala splitsningen av gentranskripten och gör därigenom det kodade proteinet defekt. Ett mutant skarvställe kan bli "svagt" jämfört med det ursprungliga stället, på grund av vilket den muterade skarvningsövergången blir oigenkännlig av det spliceosomala maskineriet. Detta kan leda till att exonet hoppar över i splitsningsreaktionen, vilket resulterar i förlust av det exonet i det splitsade mRNA:t (exon-hoppning). Å andra sidan kan ett partiellt eller fullständigt intron inkluderas i mRNA på grund av en splitsningsställemutation som gör det oigenkännligt (introninklusion). En partiell exon-hoppning eller introninkludering kan leda till för tidig avslutning av proteinet från mRNA, vilket kommer att bli defekt vilket leder till sjukdomar. S&S har därmed banat väg för att fastställa de mekanismer genom vilka en skadlig mutation kan leda till ett defekt protein, vilket resulterar i olika sjukdomar beroende på vilken gen som påverkas.

Exempel på splitsningsaberrationer

Sjukdomstyp Gen symbol Mutationsplats Ursprunglig donator/acceptator Muterad givare/acceptor Aberrationseffekt
Koloncancer APC Intron 2 AAGGTAGAT AAGG A AGAT Hoppa över Exon 3
Kolorektal cancer MSH2 Exon 15 GAGGTTTGT GAGGTTT C T Hoppa över Exon 15
Retinoblastom RB1 Intron 23 TCTTAACTTGACAGA TCTTAAC G TGACAGA Ny skarvacceptor, introninkludering
Trofisk benign epidermolysis bullosa COL17A1 Intron 51 AGCGTAAGT AGC A TAAGT leda till exonhoppning, introninklusion eller användning av ett kryptiskt splitsningsställe, vilket resulterar i antingen ett trunkerat protein eller ett protein som saknar en liten region av den kodande sekvensen
Choroideremi CHM Intron 3 CAGGTAAAG CAG A TAAAG Kodon för tidig avslutning
Cowdens syndrom PTEN Intron 4 GAGGTAGGT GAG EN TAGGT Kodon för tidig terminering inom exon 5

Ett exempel på splitsningsaberration (exonhoppning) orsakad av en mutation i donatorns splitsningsställe i exon 8 av MLH1-genen som ledde till kolorektal cancer ges nedan. Detta exempel visar att en mutation i ett splitsningsställe i en gen kan leda till en djupgående effekt i sekvensen och strukturen av mRNA:t och sekvensen, strukturen och funktionen hos det kodade proteinet, vilket leder till sjukdom.

ExampleofColorectalCancer
Exon Skipping orsakad av en donatormutation i genen MLH1 som leder till kolorektal cancer . Genereringen av ett mRNA från en delad gen involverar transkription av genen till det primära RNA-transkriptet och det exakta avlägsnandet av intronerna och sammanfogningen av exonerna från det primära RNA-transkriptet. En skadlig mutation i splitsningssignalerna (donator- eller acceptorsplitsningsställen) kan påverka igenkänningen av den korrekta splitsningsövergången och leda till en aberration i sammanfogningen av de autentiska exonerna. Beroende på om mutationen inträffar inom donatorn eller acceptorstället, och den speciella basen som är muterad inom splitsningssekvensen, kan aberrationen leda till att ett fullständigt eller partiellt exon hoppar över, eller att ett partiellt intron eller ett kryptiskt inkluderas. exon i det mRNA som produceras genom splitsningsprocessen. Båda dessa situationer leder vanligtvis till ett för tidigt stoppkodon i mRNA:t och resulterar i ett helt defekt protein. S&S-algoritmen hjälper till att bestämma vilket splitsningsställe och exon i en gen som är muterade, och S&S-poängen för det muterade splitsningsstället hjälper till att bestämma typen av splitsningsaberration och den resulterande mRNA-strukturen och sekvensen. Exempelgenen MLH1 som påverkas vid kolorektal cancer visas i figuren. Man fann med hjälp av S&S-algoritmen att en mutation i donatorsplitsningsstället i exon 8 ledde till att exon 8 hoppades över. mRNA:t saknar alltså den sekvens som motsvarar exon 8 (sekvenspositioner visas i figuren). Detta orsakar ett ramskifte i den mRNA-kodande sekvensen vid aminosyraposition 226, vilket leder till för tidig proteinstympning vid aminosyraposition 233. Detta muterade protein är helt defekt, vilket har lett till kolorektal cancer hos patienten.

S&S i kryptiska skarvplatser, forskning och medicinska tillämpningar

Den korrekta identifieringen av splitsningsställen måste vara mycket exakt eftersom konsensussplitsningssekvenserna är mycket korta och det finns många andra sekvenser som liknar de autentiska splitsningsställena inom gensekvenser, som är kända som kryptiska, icke-kanoniska eller pseudosplitsningsställen. När ett autentiskt eller verkligt splitsningsställe är muterat, kan alla kryptiska splitsningsställen som finns nära det ursprungliga verkliga splitsningsstället felaktigt användas som autentiska platser, vilket resulterar i ett avvikande mRNA. Det felaktiga mRNA:t kan inkludera en partiell sekvens från det angränsande intronet eller förlora ett partiellt exon, vilket kan resultera i ett för tidigt stoppkodon. Resultatet kan bli ett trunkerat protein som skulle ha förlorat sin funktion helt.

Shapiro-Senapathy-algoritmen kan identifiera de kryptiska skarvplatserna, förutom de autentiska skarvplatserna. Kryptiska sajter kan ofta vara starkare än de autentiska sajterna, med högre S&S-poäng. På grund av avsaknaden av ett medföljande komplementärt donator- eller acceptorställe kommer detta kryptiska ställe inte att vara aktivt eller användas i en splitsningsreaktion. När en angränsande verklig plats muteras för att bli svagare än den kryptiska sidan, kan den kryptiska sidan användas istället för den verkliga sidan, vilket resulterar i en kryptisk exon och ett avvikande transkript.

Många sjukdomar har orsakats av mutationer i kryptiska splitsningsställen eller användning av kryptiska splitsningsställen på grund av mutationerna i autentiska splitsningsställen.

S&S inom djur- och växtgenomikforskning

S&S har också använts i RNA-splitsningsforskning i många djur och växter.

mRNA-skarvningen spelar en grundläggande roll i genfunktionell reglering. Mycket nyligen har det visats att A till G-omvandlingar vid splitsningsställen kan leda till felsplitsning av mRNA i Arabidopsis. Splitsnings- och exon-intronövergångsförutsägelsen sammanföll med GT/AG-regeln (S&S) i molekylär karakterisering och utveckling av köttätande soldagg (Drosera rotundifolia L.) klass V b-1,3-glukanas. Oskarvade (LSDH) och splitsade (SSDH) transkript av NAD+-beroende sorbitoldehydrogenas (NADSDH) av jordgubbar (Fragaria ananassa Duch., cv. Nyoho) undersöktes för fytohormonella behandlingar.

Ambra1 är en positiv regulator av autofagi, en lysosom-medierad nedbrytningsprocess involverad både i fysiologiska och patologiska tillstånd. Nuförtiden har denna funktion hos Ambra1 endast karaktäriserats hos däggdjur och zebrafiskar. Minskning av rbm24a eller rbm24b genprodukter genom morpholino knockdown resulterade i betydande störningar av somitbildning hos mus och zebrafisk. Dr.Senapathy-algoritmen används i stor utsträckning för att studera intron-exon-organisation av fut8- gener. Intron-exon-gränserna för Sf 9 fut8 överensstämde med konsensussekvensen för splitsningsdonator- och acceptorställena som avslutades med S&S.

Split-genteorin, introner och skarvövergångar

Motivationen för Dr Senapathy att utveckla en metod för att detektera skarvövergångar kom från hans teori om split-gen. Om primordiala DNA-sekvenser hade en slumpmässig nukleotidorganisation, skulle den slumpmässiga fördelningen av stoppkodon endast tillåta mycket korta öppna läsramar (ORF), eftersom tre stoppkodon av 64 kodon skulle resultera i en genomsnittlig ORF på ~60 baser. När Senapathy testade detta i slumpmässiga DNA-sekvenser, visade sig inte bara detta vara sant, utan de längsta ORF:erna även i mycket långa DNA-sekvenser visade sig vara ~600 baser över vilka inga ORF:er existerade. Om så är fallet kommer en lång kodande sekvens på till och med 1 200 baser (den genomsnittliga kodande sekvenslängden för gener från levande organismer) och längre kodande sekvenser på 6 000 baser (varav många förekommer i levande organismer) inte att förekomma i en primordial slumpmässig sekvens. Generna var alltså tvungna att förekomma i bitar i delad form, med korta kodande sekvenser (ORF) som blev exoner, avbrutna av mycket långa slumpmässiga sekvenser som blev introner. När det eukaryota DNA:t testades för ORF-längdfördelning matchade det exakt det från slumpmässigt DNA, med mycket korta ORF:er som matchade längden på exoner och mycket långa introner som förutspått, vilket stöder teorin om delad gen .

Om denna delade genteorin var sann, skulle ändarna av dessa ORF som hade ett stoppkodon av naturen ha blivit ändarna av exoner som skulle förekomma inom introner, och det skulle definiera splitsningsförbindelserna. När denna hypotes testades visade sig nästan alla splitsningsövergångar i eukaryota gener innehålla stoppkodon exakt i ändarna av introner, som gränsar till exonerna. Faktum är att dessa stoppkodoner bildade den "kanoniska" AG:GT-skarvningssekvensen, där de tre stoppkodonen uppträdde som en del av de starka konsensussignalerna. Nobelpristagaren Dr. Marshall Nirenberg , som dechiffrerade kodonen, konstaterade att dessa fynd starkt visade att teorin om delad gen för ursprunget till introner och den delade strukturen av gener måste vara giltig, och kommunicerade artikeln till PNAS. New Scientist täckte denna publikation i "A long explanation for introns".

Denna grundläggande delade genteori ledde till hypotesen att splitsningsförbindelserna härrörde från stoppkodonen. Förutom kodonet CAG hittades endast TAG, som är ett stoppkodon, i ändarna av introner. Överraskande nog hittades alla tre stoppkodonen (TGA, TAA och TAG) efter en bas (G) i början av introner. Dessa stoppkodon visas i den konsensus kanoniska donatorsplitsningsövergången som AG:GT(A/G)GGT, varvid TAA och TGA är stoppkodonen, och det ytterligare TAG är också närvarande vid denna position. Den kanoniska acceptorsplitsningsövergången visas som (C/T)AG:GT, där TAG är stoppkodonet. Dessa konsensussekvenser visar tydligt närvaron av stoppkodonerna vid ändarna av introner som gränsar till exonerna i alla eukaryota gener. Dr. Marshall Nirenberg uppgav återigen att dessa observationer fullt ut stödde teorin om delad gen för ursprunget till splitsningsövergångssekvenser från stoppkodon, som var referent för denna artikel. New Scientist täckte denna publikation i "Exons, Introns and Evolution".

Dr Senapathy ville detektera splitsningsförbindelserna i slumpmässigt DNA baserat på konsensussplitssignalsekvenserna, eftersom han fann att det fanns många sekvenser som liknade splitsningsställen som inte var de riktiga splitsningsställena i gener. Denna Position Weight Matrix-metod visade sig vara en mycket noggrann algoritm för att detektera de verkliga skarvställena och de kryptiska platserna i gener. Han formulerade också den första exondetekteringsmetoden, baserad på kravet på skarvövergångar i ändarna av exoner, och kravet på en öppen läsram som skulle innehålla exonen. Denna exondetekteringsmetod visade sig också vara mycket exakt och detekterade de flesta av exonerna med få falska positiva och falska negativa. Han utökade detta tillvägagångssätt för att definiera en fullständig delad gen i en eukaryot genomisk sekvens. Således visade sig den PWM-baserade algoritmen vara mycket känslig för att inte bara detektera de verkliga splitsningsställena och kryptiska platserna, utan också för att detektera muterade splitsningsställen som är skadliga i motsats till icke-skadliga splitsningsmutationer.

Stoppkodonen i splitsningsövergångar visade sig vara de starkaste baserna i splitsningsövergångar av eukaryota gener, när de testades med PWM:erna för konsensussekvenserna. Faktum är att det visades att mutationer i dessa baser var orsaken till sjukdomar jämfört med andra baser, eftersom dessa tre av de fyra baserna (bas 1, 3 och 4) i det kanoniska AG:GT var en del av stoppkodonen. Senapati visade att, när dessa kanoniska baser muterades, blev splitsningsställets poäng svag, vilket orsakade splitsningsaberrationer i splitsningsprocessen och translation av mRNA (som beskrivs under sjukdomsavsnittet ovan). Även om värdet av metoden för att upptäcka splitsningsställen för att upptäcka gener med splitsningsmutationer som orsakade sjukdom har insetts under åren, har dess betydelse inom klinisk medicin insett alltmer i Next Generation Sequencing-eran under de senaste fem åren, med dess inkorporering i flera verktyg baserade på S&S-algoritmen.

Dr. Senapathy är för närvarande VD och CSO för Genome International Corporation (GIC), ett FoU-företag inom genomik baserat i Madison, WI. Hans team har utvecklat flera databaser och verktyg för analys av skarvkorsningar, inklusive EuSplice, AspAlt, ExDom och RoBust. AspAlt fick beröm av Biotechniques, som uppgav att det löste ett svårt problem för forskare i den jämförande analysen och visualiseringen av alternativ splitsning över olika genom. GIC har senast utvecklat analysplattformen för klinisk genomik Genome Explorer ® .

Utvalda publikationer