Renaissance Computing Institute

Renaissance Computing Institute (RENCI)
RENCI Europa.jpg
RENCI:s huvudcampus vid Europa Drive, Chapel Hill, NC
Etablerade 2004
Forskningsområde
datavetenskap och cyberinfrastruktur; miljövetenskap; biomedicin och hälsovetenskap
Direktör Stanley C. Ahalt, PhD
Plats Chapel Hill, NC
Tillhörigheter University of North Carolina vid Chapel Hill
Hemsida renci.org

Renaissance Computing Institute (RENCI) lanserades 2004 som ett samarbete mellan delstaten North Carolina , University of North Carolina vid Chapel Hill (UNC-CH), Duke University och North Carolina State University . RENCI är organisatoriskt uppbyggt som ett forskningsinstitut inom UNC-CH, och dess huvudcampus ligger i Chapel Hill, NC , några miles från UNC-CH campus. RENCI har engagemangscentra vid UNC-CH, Duke University (Durham) och North Carolina State University (Raleigh).

RENCI:s grundare var Daniel A. Reed; Stanley C. Ahalt är den nuvarande regissören. RENCI har över 80 anställda.

Uppdragsbeskrivning

RENCIs nuvarande uppdrag är: "att utveckla och distribuera avancerad teknologi för att möjliggöra forskningsupptäckter och praktiska innovationer." RENCI uppnår sitt uppdrag genom att samarbeta med akademiska forskare, politiska beslutsfattare och industriledare för att engagera sig i forskning och utveckling som syftar till att lösa kritiska utmaningar inom flera fokusområden: datavetenskap och cyberinfrastruktur; miljövetenskap; och biomedicin och hälsovetenskap.

Historia

RENCI grundades i januari 2004 av Daniel A. Reed, PhD, med finansiering från staten North Carolina, UNC-CH, North Carolina State University och Duke University. Dr. Reed var tidigare chef för National Center for Supercomputing Applications (NCSA), chefsarkitekt för National Science Foundation (NSF) TeraGrid -initiativet och medlem av presidentens rådgivande kommitté för informationsteknologi. I maj 2004 gick Alan Blatecky till RENCI som biträdande direktör. Mr. Blatecky var tidigare verkställande direktör för San Diego Supercomputer Center och chef för NSF Middleware-initiativet.

RENCI:s ursprungliga uppdragsbeskrivning var:

att fungera som ett multidisciplinärt institut som överbryggar akademi, handel och samhälle för att berika och stärka mänsklig potential, skapa multiinstitutionella partnerskap och utveckla och distribuera världsledande beräkningsinfrastruktur.

I december 2005 fick RENCI $5,9 miljoner i finansiering från delstaten North Carolina för räkenskapsåret 2005-2006 och $11,8 miljoner i återkommande medel för "personalstöd, datordrift och utrustning." Denna finansiering var avgörande för RENCI eftersom den utvecklade en statlig infrastruktur för att skapa en virtuell organisation och dra nytta av den infrastrukturen och RENCI-personalens expertis för att engagera sig i federalt finansierade projekt av intresse för staten. RENCI:s initiala fokus låg på att tillämpa cyberteknik och avancerad analys för planering, begränsning och reaktion vid kustkatastrofer. RENCI har sedan dess engagerat sig i olika partnerskap i hela North Carolina och över hela landet. Dessa partnerskap har gett många federala bidragsutmärkelser, vilket ger organisationen en extra intäktsström.

RENCI genomgick ett ledarskapsbyte 2007, med Dr. Reeds avgång och Mr. Blatecky utsågs till interimsdirektör. RENCI implementerade sin första strategiska planeringsprocess någonsin under denna tid. Processen ledde till en reviderad uppdragsbeskrivning:

Renaissance Computing Institute, en multiinstitutionell organisation, samlar multidisciplinära experter och avancerad teknisk kapacitet för att ta itu med pressande forskningsfrågor och för att hitta lösningar på komplexa problem som påverkar livskvaliteten i North Carolina, vår nation och världen.

2009 utsågs Stanley C. Ahalt, PhD, till posten som direktör. Dr. Ahalt har tidigare varit verkställande direktör för Ohio Supercomputer Center (OSC) och var professor vid avdelningen för el- och datorteknik vid Ohio State University (OSU). Vid ankomsten till RENCI fick Dr. Ahalt en gemensam utnämning som professor vid avdelningen för datavetenskap vid UNC-CH.

Ashok Krishnamurthy, PhD, utsågs till biträdande direktör i februari 2013. Dr. Krishnamurthy var tidigare chef för forskning och vetenskaplig utveckling vid OSC och docent vid institutionen för data- och elektroteknik vid OSU.

Under ledning av Drs. Ahalt och Krishnamurthy, RENCI utökade sitt antal anställda, externa partners och bredden av aktiviteter. Flera viktiga partnerskap och initiativ har lanserats. Den första är ett partnerskap med School of Medicine vid UNC-CH om ett National Institutes of Health (NIH) Center for Translational and Clinical Science-pris, vilket ledde till inrättandet av North Carolina Translational and Clinical Sciences Institute 2008 (NC TraCS ). Drs. Ahalt och Krishnamurthy fungerar som direktör respektive meddirektör för Biomedical Informatics Service inom NC TraCS. En andra nyckelaktivitet var grundandet av Water Science Software Institute (WSSI), som samgrundades av RENCI och National Socio-Environmental Synthesis Center (SESYNC) i september 2012. En tredje nyckelaktivitet var skapandet av National Consortium för Data Science (NCDS) i februari 2013. NCDS har sitt huvudkontor på RENCI och inkluderar medlemmar från akademiker, industri och myndigheter. Slutligen var en fjärde nyckelaktivitet inrättandet av iRODS-konsortiet i mars 2013. iRODS-konsortiet har också sitt huvudkontor på RENCI och inkluderar ett mångsidigt internationellt medlemskap.

Nuvarande ledarskap

  • Stanley C. Ahalt, regissör
  • Ashok Krishnamurthy, biträdande direktör
  • Jay Aikat, operativ chef
  • Ilya Baldin, chef för nätverksforskning och infrastruktur
  • Brian Blanton, chef för geodatavetenskap
  • Terrell Russell, chef för datahantering och verkställande direktör för iRODS Consortium
  • Rob Fowler, chef för högpresterande datorer
  • Ray Idaszak, chef för DevOps
  • Rick Luettich, chefsdomänforskare inom kustmodeller
  • Lea Shanley, co-executive director för South Big Data Hub
  • Kirk C. Wilhelmsen, chefsdomänforskare inom genomik och chef för biomedicinska forskningsinitiativ

Viktiga fokusområden och teknologier inom forskning och utveckling

Datavetenskap och cyberinfrastruktur

RENCI har ett antal aktiva forskningsprogram som syftar till att utveckla och distribuera avancerade dator- och nätverksmöjligheter. Många av de resulterande teknologierna är öppen källkod. ExoGENI (Exo-Global Environment for Network Innovation) med öppen källkod utvecklas till exempel som en del av det NSF-finansierade GENI-initiativet. ExoGENI fungerar som en federerad, molnbaserad NIaaS-plattform (Networked Infrastructure-as-a-Service) för dynamisk tillhandahållande av nätverks-, lagrings- och beräkningsresurser. ADAMANT (Adaptive Data-Aware Multi-domain Application Network Topologies), som också finansieras av NSF, bygger på ExoGENI. ADAMANT integrerar Pegasus (arbetsflödeshantering) och HT Condors vetenskapliga arbetsflödessystem med ExoGENI NIaaS-plattformen för att orkestrera genomförandet av storskaliga vetenskapliga arbetsflöden över distribuerade moln eller traditionella högpresterande datorresurser. iRODS (integrated Rule-Oriented Data System) utvecklades av Data Intensive Cyber ​​Environments (DICE) Centers vid UNC-CH och University of California, San Diego och underhålls för närvarande av RENCI. iRODS är en mellanprogramsteknologi med öppen källkod designad för att ge policybaserad kontroll över dataåtkomst, rörelse, användning och arkivering över geografiska platser, olika lagringstekniker och flera användargrupper, var och en med olika policyer för dataåtkomst och användning. RADII (Resource Aware Data-centric collaborative Infrastructure; webbcitation) integrerar GENIs ORCA (Open Resource Control Architecture) med iRODS för att dynamiskt tillhandahålla en distribuerad molnbaserad infrastruktur för multiinstitutionella, datadrivna forskningssamarbeten. RADII åstadkommer detta genom mjukvara utformad för att modellera forskningsdata och kartlägga dataelement, beräkningar och lagring på den underliggande fysiska infrastrukturen av iRODS. DataBridge syftar till att tillhandahålla ett multidimensionellt sociometriskt nätverkssystem för att dela datasamlingar med lång svans. DataBridge är ett samarbetsverktyg med öppen källkod som låter forskare utforska tillgängliga datamängder och deras relevanta algoritmer och definiera semantiska bryggor för att länka till och komma åt olika datamängder inom det sociometriska nätverket.

Miljövetenskap

Många av RENCIs projekt inom miljövetenskaperna fokuserar på hydrologi , kuststormvågor och avancerad modellering för att hjälpa till vid katastrofberedskap. ADCIRC är en mjukvarumodell med öppen källkod som tillämpar avancerad analys på flera datakällor och typer (t.ex. hydrologidatauppsättningar, atmosfäriska datauppsättningar, prognosdata för tropiska stormar, data från geografiska informationssystem, etc.) för att möjliggöra högupplöst realtid förutsägelse av effekterna av kuststormvågor och översvämningar efter orkaner och relaterade händelser. I samarbete med forskare vid UNC Coastal Resilience Center och National Hurricane Center utvecklas ADCIRC som ett kustprognossystem för att hjälpa till med statlig och federal katastrofplanering och beslutsstöd. EarthCube är ett NSF-finansierat initiativ som syftar till "att utveckla ett ramverk under det kommande decenniet för att hjälpa forskare att förstå och förutsäga jordsystemet från solen till jordens mitt." EarthCube designas som en öppen dynamisk cyberinfrastruktur för att möjliggöra gemenskapsstyrd datadelning över geovetenskaperna, inklusive havsvetenskap , polarstudier, atmosfärisk vetenskap, georymd, datavetenskap och andra områden. HydroShare stöds av det NSF-finansierade CUAHSI (Consortium of Universities for the Advancement of Hydrologic Science Inc.) och är under utveckling som en öppen cyberinfrastruktur för hydrologi. HydroShare tillåter vattenforskare att identifiera och hämta vattenrelaterade datamängder och tillhörande algoritmer och modeller och sedan analysera och beräkna data med hjälp av en distribuerad datormiljö som inkluderar nätbaserade moln och högpresterande dator- och lagringskapacitet

Biomedicin och hälsovetenskap

Ett stort fokus för RENCI:s arbete inom biomedicin och hälsovetenskap är klinisk genomik. RENCI samarbetar med NC TraCS, Lineberger Comprehensive Cancer Center vid UNC-CH och UNC:s Information Technology Services Research Computing Division för att utveckla och implementera teknologier för att stödja nästa generations genomisk sekvenseringsteknik, såsom Whole Genome Sequencing (WGS) och Whole Exome Sequencing (WES). Dessa teknologier inkluderar GMW (Genetic Medical Workflow) Engine, som delvis finansierades av NIH och tillhandahåller komplett infångning, analys, validering och rapportering av WGS- och WES-data. GMW Engine är designad som öppen källkodsarkitektur som koordinerar arbetsflöden, underarbetsflöden, prover, data och människor för att stödja alla aspekter av genomikforskning och klinisk tillämpning, från det första patientbesöket till läkarvägledd rapportering av genomiska fynd. MapSeq (Masively Parallel Sequencing) är en open source plugin-baserad Service-Oriented Architecture (SOA) som ger säker hantering och exekvering av de komplexa nedströms beräknings- och analytiska steg som är involverade i genomisk sekvensering med hög genomströmning och andra dataintensiva applikationer. MaPSeq och dess hemmagjorda systerteknologi, GATE (Grid Access Triage Engine), är byggda ovanpå Apache Karaf och ger tillsammans utbyggbara funktioner för nedströmsanalys av genomisk data och andra stora datamängder, inklusive exekvering och hantering av arbetsflödespipeline, meta-schemaläggning av arbetsflödesjobb, opportunistisk användning av beräkningsresurser, säker dataöverföring och webbaserad klientåtkomst. CANVAS (CAroliNa Variant Annotation Store) och AnnoBot (Annotation Bot) arbetar tillsammans för att tillhandahålla versionskontrollerad annotering och metadata för genomisk variantdata för att stödja uppdaterad klinisk tolkning av genomiska varianter och därigenom vägleda kliniskt beslutsfattande. CANVAS är designad som en öppen källkod, relationell PostgreSQL relationsdatabas som lagrar genomisk variantdata med tillhörande annotering och metadata. AnnoBot består av Python-moduler och mjukvarudrivrutinskod som är konfigurerade för att ge automatisk övervakning och hämtning av externa datakällor för anteckningsuppdateringar. CHAT (Convergent Haplotype Association Tagging) är en mjukvarualgoritm som möjliggör identifiering av måttligt penetrerande genomiska varianter med hjälp av genetiska strukturer över populationer. CHAT åberopar en grafteoribaserad algoritm för att bestämma haplotypfasen för en population av obesläktade individer genom att: identifiera delmängder av individer som delar en region av genomet genom härkomst; och sedan generera en konsensushaplotyp för den delade regionen. SMW (Secure Medical Workspace) tillhandahåller en säker miljö för åtkomst till känslig patientdata för klinisk vård eller institutionell granskningsnämnd – godkänd klinisk forskning. SMW-arkitekturen med öppen källkod använder virtualiseringsteknik (dvs. VMWare ) och dataläckageskyddsteknik (DLP) (dvs. WebSense ) för att skapa en säker virtuell arbetsyta i kombination med möjligheten att förhindra (eller tillåta med en utmaning och revision av IT-personalen) ) fysiskt avlägsnande av data från en central, säker lagringsmiljö.

Institut och konsortium

RENCI var en pionjär i upprättandet av ett nationellt institut, WSSI, och två stora konsortium, iRODS Consortium och NCDS.

WSSI

Det NSF-finansierade WSSI etablerades i september 2012 som ett samarbete mellan RENCI och SESYNC. WSSI:s uppdrag är att "möjliggöra och accelerera ny transformativ vattenvetenskap genom att samtidigt omvandla både mjukvarukulturen och forskningskulturen inom vattenvetenskapssamhället." När det är fullt operativt strävar WSSI efter att verka under Open Community Engagement Model, som kommer att integrera flera NSF-finansierade initiativ (Synthesis Centers, Environmental Observatories, Software Sustainability Institutes, etc.) för att destillera data, idéer, teorier och metoder och därigenom tillhandahålla syntetisk information för att hantera vattenvetenskapliga utmaningar som inte kan hanteras med traditionella disciplinära metoder. WSSI:s aktiviteter fokuserar på utvecklingen av en öppen gemenskap och främjandet av öppen källkod och agil mjukvaruutveckling för att påskynda transformativ vattenvetenskaplig forskning. Förutom RENCI och SESYNC inkluderar nuvarande medlemmar Institute for the Environment vid UNC-CH, University of Illinois Urbana-Champaign , University of Michigan , University of Maryland , NCSA, RedHat , National Oceanic and Atmospheric Administration och IBM .

NCDS

NCDS etablerades av RENCI i februari 2013 som ett offentligt/privat partnerskap mellan ledande universitet, statliga och ideella myndigheter och företag som ägnas åt att främja datavetenskap, vilket NCDS definierar som "den systematiska studien av organisationen och användningen av digitala data för att påskynda upptäckten, förbättra kritiska beslutsprocesser och möjliggöra en datadriven ekonomi." NCDS:s uppdrag är "att tillhandahålla den grund som behövs för att främja datavetenskaplig forskning, utbildning och ekonomiska möjligheter." NCDS arbetar mot detta uppdrag genom att tillhandahålla intellektuellt ledarskap och vara värd för många workshops, ett fakultetsstipendium för akademiska industrin, en Data Matters Summer Short Course-serie, studentkarriärevenemang, inbjudna föredrag och toppmöten. Dessutom sponsrar NCDS ett dataobservatorium, som tillhandahåller en delad federerad infrastruktur för datadelning och datoranvändning. NCDS samarbetar också med många regionala insatser inom datavetenskap, inklusive Datapalooza, Triangle Open Data Day, Pearl Hacks, Data4Decisions, Analytics Forward UnConference och andra. Från och med juni 2015 består NCDS av 15 medlemsorganisationer, varav 8 är baserade i North Carolina och 4 multinationella företag med en stark närvaro i Research Triangle Park, NC-området.

iRODS konsortium

iRODS-konsortiet grundades av RENCI i mars 2013 och har sitt huvudkontor på RENCI, liksom det huvudsakliga iRODS-utvecklingsteamet. Konsortiets uppdrag är "att säkerställa hållbarheten för det integrerade regelorienterade datasystemet (iRODS) och att främja dess antagande och fortsatta utveckling." För att uppnå sitt uppdrag arbetar konsortiet med att utveckla standarder för iRODS-teknologin med öppen källkod och dess framtida utveckling, främja framsteg för tekniken och utöka användarbasen. Konsortiet stöder också utvecklingen av en affärskritisk version av iRODS på produktionsnivå (för närvarande v4.1). iRODS-konsortiet inkluderar ett mångsidigt medlemskap av iRODS-användarorganisationer från hela världen. Nuvarande konsortiummedlemmar inkluderar RENCI, DICE Centers vid UNC-CH och University of California, San Diego, DataDirect Networks , Seagate Technology , Wellcome Trust Sanger Institute , Cleversafe , EMC Corporation (EMC2), IBM och NASAs Atmospheric Science Data Center.

externa länkar

Koordinater :