DNA-anteckning

DNA-annotering eller genomannotering är processen att identifiera placeringen av gener och alla kodande regioner i ett genom och bestämma vad dessa gener gör. En anteckning (oavsett sammanhang) är en anteckning som läggs till som förklaring eller kommentar. När ett genom väl är sekvenserat måste det annoteras för att förstå det. Gener i ett eukaryot genom kan annoteras med hjälp av olika annoteringsverktyg som FINDER. En modern annoteringspipeline kan stödja ett användarvänligt webbgränssnitt och mjukvarucontainerisering som MOSGA. Moderna annoteringspipelines för prokaryota genom är Bakta, Prokka och PGAP.

För DNA-annotering berikas en tidigare okänd sekvensrepresentation av genetiskt material med information som relaterar genomisk position till intron - exongränser , regulatoriska sekvenser , upprepningar , gennamn och proteinprodukter . Denna anteckning lagras i genomiska databaser som Mouse Genome Informatics , FlyBase och WormBase . Utbildningsmaterial om vissa aspekter av biologisk anteckning från för Gene Ontology 2006 och liknande evenemang finns tillgängligt på Gene Ontologys webbplats.

National Center for Biomedical Ontology (www.bioontology.org) utvecklar verktyg för automatisk anteckning av databasposter baserat på textbeskrivningarna av dessa poster.

Som en allmän metod har dcGO en automatiserad procedur för att statistiskt härleda associationer mellan ontologitermer och proteindomäner eller kombinationer av domäner från de befintliga annoteringarna på gen/proteinnivå.

Bearbeta

Genomannotering består av tre huvudsteg:.

  1. identifiera delar av genomet som inte kodar för proteiner
  2. identifiera element på genomet , en process som kallas genprediktion
  3. bifoga biologisk information till dessa element

Automatiska anteckningsverktyg försöker utföra dessa steg via datoranalys, i motsats till manuell annotering (aka curation) som involverar mänsklig expertis. Idealt sett existerar dessa tillvägagångssätt samtidigt och kompletterar varandra i samma annoteringspipeline .

En enkel metod för genkommentarer bygger på homologibaserade sökverktyg, som BLAST , för att söka efter homologa gener i specifika databaser, den resulterande informationen används sedan för att kommentera gener och genom. Men när information läggs till annoteringsplattformen, blir manuella annotatorer kapabla att dekonvolutera avvikelser mellan gener som ges samma annotering. Vissa databaser använder genomkontextinformation, likhetspoäng, experimentella data och integrationer av andra resurser för att tillhandahålla genomannoteringar genom deras Subsystems-metod. Andra databaser (t.ex. Ensembl ) förlitar sig på kurerade datakällor såväl som en rad olika mjukvaruverktyg i deras automatiserade genomannoteringspipeline.

Strukturell annotering består av identifiering av genomiska element.

  • ORF och deras lokalisering
  • genstruktur
  • kodningsregioner
  • lokalisering av regleringsmotiv

Funktionell annotering består av att bifoga biologisk information till genomiska element.

  • biokemisk funktion
  • biologisk funktion
  • involverade reglering och interaktioner
  • uttryck

Dessa steg kan involvera både biologiska experiment och i silicoanalys . Proteogenomikbaserade tillvägagångssätt använder information från uttryckta proteiner, ofta härledda från masspektrometri , för att förbättra genomikkommentarer.

En mängd olika mjukvaruverktyg har utvecklats för att tillåta forskare att se och dela genomannoteringar; till exempel MAKER .

Genomannotering är fortfarande en stor utmaning för forskare som undersöker det mänskliga genomet , nu när genomsekvenserna för mer än tusen mänskliga individer (The 100 000 Genomes Project, Storbritannien) och flera modellorganismer är i stort sett kompletta. Att identifiera lokaliseringen av gener och andra genetiska kontrollelement beskrivs ofta som att definiera den biologiska "delslistan" för montering och normal drift av en organism. Forskare är fortfarande på ett tidigt stadium i processen att avgränsa denna dellista och förstå hur alla delar "passar ihop".

Genomannotering är ett aktivt undersökningsområde och involverar ett antal olika organisationer inom life science-gemenskapen som publicerar resultaten av sina insatser i allmänt tillgängliga biologiska databaser tillgängliga via webben och andra elektroniska medel. Här är en alfabetisk lista över pågående projekt som är relevanta för genomkommentarer:

På Wikipedia har genomannotering börjat bli automatiserad under regi av Gene Wiki-portalen som driver en bot som skördar gendata från forskningsdatabaser och skapar genstubbar på grundval av det.