Genontologi Term Anrikning

Gene Ontology ( GO ) term anrikning är en teknik för att tolka uppsättningar av gener som använder sig av Gene Ontologys klassificeringssystem, där gener tilldelas en uppsättning fördefinierade fack beroende på deras funktionella egenskaper. Till exempel är genen FasR kategoriserad som en receptor , involverad i apoptos och lokaliserad på plasmamembranet .

Forskare som utför experiment med hög genomströmning som ger uppsättningar av gener (till exempel gener som uttrycks differentiellt under olika förhållanden) vill ofta hämta en funktionell profil av den genuppsättningen, för att bättre förstå de underliggande biologiska processerna . Detta kan göras genom att jämföra ingångsgenuppsättningen med var och en av bins (termer) i GO – ett statistiskt test kan utföras för varje bin för att se om den är berikad för ingående gener.

Resultatet av analysen är vanligtvis en rankad lista med GO-termer, var och en associerad med ett p-värde .

Bakgrund

Genontologin

Gene Ontology (GO) tillhandahåller ett system för hierarkiskt klassificering av gener eller genprodukter i termer organiserade i en grafstruktur (eller en ontologi ). Termerna är grupper i tre kategorier: molekylär funktion (som beskriver en gens molekylära aktivitet), biologisk process (som beskriver den större cellulära eller fysiologiska rollen som utförs av genen, koordinerad med andra gener) och cellulär komponent (som beskriver platsen i cell där genprodukten utför sin funktion). Varje gen kan beskrivas (kommenteras) med flera termer. GO används aktivt för att klassificera gener från människor, modellorganismer och en mängd andra arter.

Med hjälp av GO är det möjligt att hämta uppsättningen termer som används för att beskriva vilken gen som helst, eller omvänt, givet en term, returnera uppsättningen gener som är kommenterade till den termen. För den senare frågan används det hierarkiska systemet för GO för att ge fullständiga resultat. Till exempel bör en fråga för GO-termen för kärna returnera gener som är kommenterade till termen "kärnmembran".

Tolka data med hög genomströmning

Vissa typer av experiment med hög genomströmning (t.ex. RNA-seq ) returnerar uppsättningar av gener som är över- eller underuttryckta. GO kan användas för att funktionellt profilera denna uppsättning gener, för att bestämma vilka GO-termer som förekommer oftare än vad som skulle förväntas av en slump när man undersöker uppsättningen termer som är annoterade till ingående gener. Till exempel kan ett experiment jämföra genuttryck i friska celler mot cancerceller . Funktionell profilering kan användas för att belysa de underliggande cellulära mekanismerna som är associerade med cancertillståndet. Detta kallas också termberikning eller termöverrepresentation, eftersom vi testar om en GO-term är statistiskt berikad för den givna uppsättningen gener.

Metoder

Det finns en mängd olika metoder för att utföra en termberikning med GO. Metoderna kan variera beroende på vilken typ av statistiskt test som används, det vanligaste är Fishers exakta test / hypergeometriska test . Vissa metoder använder sig av Bayesiansk statistik. Det finns också variationer i typen av korrigering som tillämpas för flera jämförelser , den vanligaste är Bonferroni-korrigering .

Metoder varierar också i sin inmatning – vissa tar orankade genuppsättningar, andra rankade genuppsättningar, med mer sofistikerade metoder som gör att varje gen kan associeras med en storlek (t.ex. uttrycksnivå), vilket undviker godtyckliga cutoffs.

Verktyg