Translationell bioinformatik

Translationell bioinformatik ( TBI ) är ett framväxande område inom studiet av hälsoinformatik , fokuserat på konvergensen av molekylär bioinformatik , biostatistik , statistisk genetik och klinisk informatik . Dess fokus ligger på att tillämpa informatikmetodik på den ökande mängden biomedicinsk och genomisk data för att formulera kunskap och medicinska verktyg, som kan användas av forskare, kliniker och patienter. Dessutom innebär det att tillämpa biomedicinsk forskning för att förbättra människors hälsa genom användning av datorbaserade informationssystem. TBI använder datautvinning och analyserar biomedicinsk informatik för att generera klinisk kunskap för tillämpning. Klinisk kunskap inkluderar att hitta likheter i patientpopulationer, tolka biologisk information för att föreslå terapibehandlingar och förutsäga hälsoresultat.

Historia

Translationell bioinformatik är ett relativt ungt område inom translationell forskning. Googles trender indikerar att användningen av " bioinformatik " har minskat sedan mitten av 1990-talet när det föreslogs som en transformativ metod för biomedicinsk forskning. Den myntades dock nästan tio år tidigare. TBI presenterades sedan som ett medel för att underlätta dataorganisation, tillgänglighet och förbättrad tolkning av tillgänglig biomedicinsk forskning. Det ansågs vara ett beslutsstödsverktyg som kunde integrera biomedicinsk information i beslutsprocesser som annars skulle ha utelämnats på grund av det mänskliga minnets natur och tankemönster.

Inledningsvis låg fokus för TBI på ontologi och vokabulärdesign för att söka i massdatalagren. Detta försök var dock i stort sett misslyckat eftersom preliminära försök till automatisering resulterade i felaktig information. TBI behövde utveckla en baslinje för korsreferenser av data med högre ordningsalgoritmer för att länka data, strukturer och funktioner i nätverk. Detta gick hand i hand med ett fokus på att utveckla läroplanen för program på forskarnivå och kapitalisering för finansiering på det växande offentliga erkännandet av den potentiella möjligheten i TBI.

När det första utkastet av det mänskliga genomet färdigställdes i början av 2000-talet fortsatte TBI att växa och visa sig framträdande som ett sätt att överbrygga biologiska fynd med klinisk informatik, vilket påverkade möjligheterna för både biologi- och hälsovårdsindustrin. Uttrycksprofilering, textutvinning för trendanalys, befolkningsbaserad datautvinning som ger biomedicinska insikter och ontologiutveckling har utforskats, definierats och etablerats som viktiga bidrag till TBI. Framsteg inom området som har använts för kunskapsupptäckt inkluderar länkning av kliniska journaler till genomikdata, länkning av läkemedel med härkomst, helgenomsekvensering för en grupp med en vanlig sjukdom och semantik inom litteraturbrytning. Det har diskuterats om samarbetsinsatser för att skapa strategier över jurisdiktioner för TBI, särskilt i Europa. Det senaste decenniet har också sett utvecklingen av personlig medicin och datadelning inom farmakogenomik . Dessa prestationer har befäst allmänhetens intresse, genererat medel för investeringar i utbildning och vidareutveckling av läroplanen, ökat efterfrågan på kunnig personal inom området och drivit pågående TBI-forskning och utveckling.

Fördelar och möjligheter

För närvarande spänner TBI-forskningen över flera discipliner; tillämpningen av TBI i kliniska miljöer är dock fortfarande begränsad. För närvarande används det delvis inom läkemedelsutveckling , regulatorisk granskning och klinisk medicin . Möjligheten för tillämpning av TBI är mycket bredare då medicinska tidskrifter i allt högre grad nämner termen "informatik" och diskuterar bioinformatikrelaterade ämnen. TBI-forskning bygger på fyra huvudområden av diskurs: klinisk genomik, genomisk medicin, farmakogenomik och genetisk epidemiologi . Det finns ett ökande antal konferenser och forum fokuserade på TBI för att skapa möjligheter för kunskapsdelning och fältutveckling. Allmänna ämnen som förekommer på de senaste konferenserna inkluderar: (1) personlig genomik och genomisk infrastruktur, (2) läkemedels- och genforskning för biverkningar, interaktioner och återanvändning av läkemedel, (3) biomarkörer och fenotyprepresentation, (4) sekvensering, vetenskap och systemmedicin, (5) beräknings- och analytiska metoder för TBI, och (6) tillämpning av överbryggande genetisk forskning och klinisk praxis.

Med hjälp av bioinformatiker kan biologer analysera komplexa data, skapa webbplatser för experimentella mätningar, underlätta delning av mätningarna och koppla resultat till kliniska resultat. Translationella bioinformatiker som studerar en viss sjukdom skulle ha mer provdata om en given sjukdom än en enskild biolog som studerar sjukdomen ensam.

Sedan fullbordandet av det mänskliga genomet försöker nya projekt att systematiskt analysera alla genförändringar i en sjukdom som cancer snarare än att fokusera på ett fåtal gener åt gången. I framtiden kommer storskalig data att integreras från olika källor för att utvinna funktionell information. Tillgängligheten av ett stort antal mänskliga genom kommer att möjliggöra statistisk utvinning av deras relation till livsstilar, läkemedelsinteraktioner och andra faktorer. Translationell bioinformatik förändrar därför sökandet efter sjukdomsgener och håller på att bli en avgörande del av andra medicinska forskningsområden inklusive farmakogenomik .

I en studie som utvärderade de beräkningsmässiga och ekonomiska egenskaperna hos cloud computing vid utförande av storskalig dataintegration och analys av genomisk medicin, hade molnbaserad analys liknande kostnader och prestanda jämfört med ett lokalt beräkningskluster. Detta tyder på att molnberäkningsteknik kan vara en värdefull och ekonomisk teknik för att underlätta storskalig translationell forskning inom genomisk medicin.

Metoder

Lagring

Stora mängder bioinformatisk data är för närvarande tillgänglig och fortsätter att öka. Till exempel innehåller GenBank-databasen, finansierad av National Institute of Health (NIH), för närvarande 82 miljarder nukleotider i 78 miljoner sekvenser som kodar för 270 000 arter. Motsvarigheten till GenBank för genuttrycksmikroarrayer , känd som Gene Expression Omnibus (GEO), har över 183 000 prover från 7 200 experiment och detta antal fördubblas eller tredubblas varje år. European Bioinformatics Institute ( EBI) har en liknande databas som heter ArrayExpress som har över 100 000 prover från över 3 000 experiment. Sammantaget har TBI tillgång till mer än en kvarts miljon mikroarrayprover för närvarande.

För att extrahera relevant data från stora datamängder använder TBI olika metoder som datakonsolidering, datafederation och datalagring . I datakonsolideringsmetoden extraheras data från olika källor och centraliseras i en enda databas. Detta tillvägagångssätt möjliggör standardisering av heterogena data och hjälper till att lösa problem med interoperabilitet och kompatibilitet mellan datamängder. Men förespråkare för denna metod stöter ofta på svårigheter med att uppdatera sina databaser eftersom den är baserad på en enda datamodell. Däremot länkar datafederationsmetoden samman databaser och extraherar data regelbundet och kombinerar sedan data för frågor. Fördelen med detta tillvägagångssätt är att det gör det möjligt för användaren att komma åt realtidsdata på en enda portal. Begränsningen med detta är dock att insamlad data inte alltid synkroniseras eftersom den härrör från flera källor. Datalager tillhandahåller en enda enhetlig plattform för datakurering. Data warehousing integrerar data från flera källor i ett gemensamt format och används vanligtvis inom biovetenskap uteslutande för beslutsstöd.

Analytics

Analytiska tekniker tjänar till att översätta biologiska data med hjälp av tekniker med hög genomströmning till kliniskt relevant information. För närvarande finns det många programvaror och metoder för att söka efter data, och detta antal fortsätter att växa i takt med att fler studier genomförs och publiceras i bioinformatiktidskrifter som Genome Biology , BMC Bioinformatics , BMC Genomics och Bioinformatics . För att fastställa den bästa analytiska tekniken, har verktyg som Weka skapats för att chiffra igenom mängden mjukvaror och välja den mest lämpliga tekniken som abstraherar bort behovet av att känna till en specifik metod.

Integration

Dataintegration innebär att utveckla metoder som använder biologisk information för den kliniska miljön. Att integrera data ger kliniker verktyg för dataåtkomst, kunskapsupptäckt och beslutsstöd. Dataintegration tjänar till att utnyttja den mängd information som finns tillgänglig inom bioinformatik för att förbättra patienternas hälsa och säkerhet. Ett exempel på dataintegration är användningen av beslutsstödssystem (DSS) baserade på translationell bioinformatik. DSS som används i detta avseende identifierar korrelationer i patientens elektroniska journaler (EMR) och andra kliniska informationssystem för att hjälpa kliniker i deras diagnoser.

Kosta

Företag kan nu tillhandahålla sekvensering och analys av hela mänskligt genom som en enkel utlokaliserad tjänst. Andra och tredje generationens versioner av sekvenseringssystem är planerade för att öka mängden genom per dag, per instrument, till 80. Enligt VD:n för Complete Genomics Cliff Reid har den totala marknaden för hela mänskliga genomsekvensering runt om i världen ökat femfaldigt under 2009 och 2010, och uppskattades till 15 000 genom för 2011. Om priset skulle falla till 1 000 dollar per genom, vidhöll han dessutom att företaget fortfarande skulle kunna göra vinst. Företaget arbetar också med processförbättringar för att få ner den interna kostnaden till cirka 100 USD per genom, exklusive provförberedande och arbetskostnader.

Enligt National Human Genome Research Institute (NHGRI) har kostnaderna för att sekvensera hela genomet minskat avsevärt från över 95 miljoner dollar 2001 till 7 666 dollar i januari 2012. På samma sätt har kostnaderna för att bestämma en megabas (en miljon baser) också minskat från över 5 000 USD 2001 till 0,09 USD 2012. Under 2008 övergick sekvenseringscentra från Sanger-baserad (dideoxikedjetermineringssekvensering) till 'andra generationens' (eller 'nästa generationens') DNA- sekvenseringsteknik . Detta orsakade en betydande minskning av sekvenseringskostnaderna.

Framtida inriktningar

TBI har potential att spela en betydande roll inom medicin; men många utmaningar återstår fortfarande. Det övergripande målet för TBI är att "utveckla informatikmetoder för att länka över traditionellt olika data- och kunskapskällor som möjliggör både generering och testning av nya hypoteser". Nuvarande tillämpningar av TBI står inför utmaningar på grund av brist på standarder vilket resulterar i olika metoder för datainsamling. Dessutom hindras analys- och lagringsmöjligheter på grund av stora mängder data som finns i aktuell forskning. Detta problem förväntas öka med personlig genomik eftersom det kommer att skapa en ännu större ackumulering av data.

Utmaningar finns också i forskningen om läkemedel och biomarkörer, genomisk medicin, proteindesignmetagenomik, upptäckt av infektionssjukdomar, datakurering , litteraturutvinning och arbetsflödesutveckling. Fortsatt tro på möjligheterna och fördelarna med TBI motiverar ytterligare finansiering för infrastruktur, skydd av immateriella rättigheter och tillgänglighetspolicyer.

Tillgänglig finansiering för TBI under det senaste decenniet har ökat. Efterfrågan på translationell bioinformatikforskning beror delvis på tillväxten inom många områden inom bioinformatik och hälsoinformatik och delvis på det populära stödet från projekt som Human Genome Project . Denna tillväxt och tillströmning av finansiering har gjort det möjligt för industrin att producera tillgångar som ett förråd av genuttrycksdata och genomisk skala, samtidigt som det har gjort framsteg mot konceptet att skapa ett genom för $1000 och slutföra Human Genome Project . Vissa tror att TBI kommer att orsaka en kulturell förändring i hur vetenskaplig och klinisk information bearbetas inom läkemedelsindustrin, tillsynsmyndigheter och klinisk praxis. Det ses också som ett sätt att flytta kliniska prövningsdesigner bort från fallstudier och mot EMR-analys.

Ledare inom området har presenterat många förutsägelser om riktningen TBI är och bör ta. En samling förutsägelser är följande:

  1. Lesko (2012) menar att det måste finnas en strategi inom EU för att överbrygga klyftan mellan akademi och industri på följande sätt – direkt citerat:
    1. Validera och publicera informatikdata och teknologimodeller enligt accepterade standarder för att underlätta antagandet,
    2. Förvandla elektroniska journaler för att göra dem mer tillgängliga och interoperabla,
    3. Uppmuntra informationsdelning, engagera tillsynsmyndigheter och
    4. Uppmuntra ökat ekonomiskt stöd för att växa och utveckla TBI
  2. Altman (2011), vid AMIA-toppmötet 2011 om TBI, förutspår att:
    1. Cloud computing kommer att bidra till stora biomedicinska upptäckter.
    2. Informatiktillämpningar till stamcellsvetenskap kommer att öka
    3. Immungenomik kommer att dyka upp som kraftfulla data
    4. Flödescytometriinformatik kommer att växa
    5. Molekylär- och uttrycksdata kommer att kombineras för att återanvända läkemedel
    6. Exomsekvensering kommer att pågå längre än förväntat. Framsteg i tolkningen av icke-kodande DNA-variationer
  3. Sarkar, Butte , Lussier , Tarczy-Hornoch & Ohno-Machado (2011) säger att framtiden för TBI måste etablera ett sätt att hantera den stora mängden tillgänglig data och se till att integrera resultat från projekt som eMERGE (Electronic Medical Records och Genomics) projekt finansierat av NIH, Personal Genome Project, Exome Project, Million Veteran Program och 1000 Genomes Project.

"I en informationsrik värld betyder rikedomen av information en brist på något annat - en brist på vad det än är som informationen konsumerar. Vad informationen konsumerar är ganska uppenbart: den tär på mottagarnas uppmärksamhet. Därför skapar en rikedom av information en brist på uppmärksamhet och ett behov av att fördela den uppmärksamheten effektivt bland det överflöd av informationskällor som det kan konsumera." (Herbert Simon, 1971).

Föreningar, konferenser och tidskrifter

Nedan finns en lista över befintliga föreningar, konferenser och tidskrifter som är specifika för TBI. Detta är på intet sätt en allomfattande lista och bör utvecklas när andra upptäcks.

Associations
Konferenser *webbplatser ändras årligen
  • AMIA årliga symposium [Chicago, 2012]
  • AMIA Joint Summits on Translational Science [San Francisco, 2013]
  • AMIA Summit on Translational Bioinformatics (TBI) [San Francisco, 2013]
  • AMIA Summit Clinical Research Informatics (CRI) [San Francisco, 2013]
  • TBC 2011 , Translationell bioinformatikkonferens [Seoul, Korea, 2011]
  • TBC 2012 , Translationell bioinformatikkonferens [Jeju Island, Korea, 2012]
  • TBC/ISCB-Asien 2013 , Translationell bioinformatikkonferens [Seoul, Korea, 2013]
  • TBC/ISB 2014 , Translationell bioinformatikkonferens [Qingdao, Kina, 2014]
  • TBC2015 , Translationell bioinformatikkonferens [Tokyo, Japan, 2015]
  • IFP/IMIA Working Conference, Interfacing bio- och medicinsk informatik [Amsterdam, 2012]
Tidskrifter
Special Journal Issues on Translational Bioinformatics

Utbildning och certifiering

En icke uttömmande lista över utbildnings- och certifieringsprogram som är specifika för TBI listas nedan.