TeraGrid

TeraGrid
TeraGrid-logo.gif
Typ av webbplats
Vetenskapligt stöd
Tillgänglig i engelsk
URL www .teragrid .org
Kommersiell Nej
Lanserades 2004

TeraGrid var en e-Science- nätbaserad datorinfrastruktur som kombinerar resurser på elva partnerplatser. Projektet startade 2001 och pågick från 2004 till 2011.

TeraGrid integrerade högpresterande datorer, dataresurser och verktyg samt experimentella faciliteter. Resurser inkluderade mer än en petaflops datorkapacitet och mer än 30 petabyte online- och arkivdatalagring, med snabb åtkomst och hämtning över högpresterande datornätverksanslutningar . Forskare kunde också komma åt mer än 100 disciplinspecifika databaser.

TeraGrid samordnades genom Grid Infrastructure Group (GIG) vid University of Chicago , i samarbete med resursleverantörernas webbplatser i USA.

Historia

US National Science Foundation (NSF) utfärdade en uppmaning och bad om en "distribuerad terascale-anläggning" från programchefen Richard L. Hilderbrandt. TeraGrid-projektet lanserades i augusti 2001 med 53 miljoner dollar i finansiering till fyra platser: National Center for Supercomputing Applications (NCSA) vid University of Illinois i Urbana-Champaign, San Diego Supercomputer Center (SDSC) vid University of California, San Diego , University of Chicago Argonne National Laboratory och Center for Advanced Computing Research (CACR) vid California Institute of Technology i Pasadena, Kalifornien .

Designen var tänkt att vara ett utbyggbart distribuerat öppet system från början. I oktober 2002 Pittsburgh Supercomputing Center (PSC) vid Carnegie Mellon University och University of Pittsburgh till TeraGrid som nya stora partners när NSF tillkännagav 35 miljoner dollar i tilläggsfinansiering. TeraGrid-nätverket förvandlades genom ETF-projektet från ett mesh med 4 platser till ett stamnät med dubbla nav med anslutningspunkter i Los Angeles och vid Starlight-anläggningarna i Chicago .

I oktober 2003 tilldelade NSF 10 miljoner dollar för att lägga till fyra platser till TeraGrid samt för att etablera en tredje nätverkshubb, i Atlanta . Dessa nya platser var Oak Ridge National Laboratory (ORNL), Purdue University , Indiana University och Texas Advanced Computing Center (TAC) vid University of Texas i Austin .

TeraGrid-konstruktion möjliggjordes också genom företagspartnerskap med Sun Microsystems , IBM , Intel Corporation , Qwest Communications , Juniper Networks , Myricom , Hewlett-Packard Company och Oracle Corporation .

TeraGrid-konstruktionen slutfördes i oktober 2004, då TeraGrid-anläggningen startade full produktion.

Drift

I augusti 2005 utökade NSF:s nyskapade kontor för cyberinfrastruktur stödet med ytterligare fem år med en uppsättning utmärkelser på 150 miljoner USD. Det inkluderade 48 miljoner dollar för samordning och användarstöd till Grid Infrastructure Group vid University of Chicago ledd av Charlie Catlett . Med hjälp av högpresterande nätverksanslutningar innehöll TeraGrid högpresterande datorer, dataresurser och verktyg och avancerade experimentanläggningar runt om i USA. Arbetet som stöds av projektet kallas ibland e-Science . 2006 University of Michigans School of Information en studie av TeraGrid.

I maj 2007 inkluderade TeraGrids integrerade resurser mer än 250 teraflops datorkapacitet och mer än 30 petabyte (kvadrillioner byte) online- och arkivdatalagring med snabb åtkomst och hämtning över högpresterande nätverk. Forskare kunde få tillgång till mer än 100 disciplinspecifika databaser. I slutet av 2009 hade TeraGrid-resurserna vuxit till 2 petaflops datorkapacitet och mer än 60 petabyte lagring. I mitten av 2009 förlängde NSF driften av TeraGrid till 2011.

Övergång till XSEDE

Ett uppföljningsprojekt godkändes i maj 2011. I juli 2011 tillkännagav ett partnerskap av 17 institutioner Extreme Science and Engineering Discovery Environment (XSEDE). NSF tillkännagav finansiering av XSEDE-projektet i fem år, till 121 miljoner dollar. XSEDE leds av John Towns vid University of Illinois 's National Center for Supercomputing Applications .

Arkitektur

TeraGrid-utrustning vid UCSD 2007

TeraGrid-resurser är integrerade genom en tjänsteorienterad arkitektur genom att varje resurs tillhandahåller en "tjänst" som är definierad i termer av gränssnitt och drift. Beräkningsresurser kör en uppsättning programvarupaket som kallas "Coordinated TeraGrid Software and Services" (CTSS). CTSS tillhandahåller en välbekant användarmiljö på alla TeraGrid-system, vilket gör att forskare lättare kan porta kod från ett system till ett annat. CTSS tillhandahåller även integrerande funktioner som enkelsignering, inlämning av jobb på distans, stöd för arbetsflöden, verktyg för dataöverföring, etc. CTSS inkluderar Globus Toolkit , Condor, distribuerad redovisnings- och kontohanteringsprogramvara, verifierings- och valideringsmjukvara och en uppsättning kompilatorer, programmeringsverktyg och miljövariabler .

TeraGrid använder ett 10 Gigabit per sekund dedikerat fiberoptiskt stamnät, med hubbar i Chicago, Denver och Los Angeles. Alla resursleverantörers webbplatser ansluter till en stamnod med 10 Gigabit per sekund. Användare fick tillgång till anläggningen genom nationella forskningsnätverk som Internet2 Abilene-stamnätet och National LambdaRail .

Användande

TeraGrid-användare kom främst från amerikanska universitet. Det finns ungefär 4 000 användare vid över 200 universitet. Akademiska forskare i USA kan erhålla undersökande eller utvecklingstilldelningar (ungefär i "CPU-timmar") baserat på ett sammandrag som beskriver det arbete som ska utföras. Mer omfattande tilldelningar innebär ett förslag som granskas under en kvartalsvis peer-review-process. Alla tilldelningsförslag hanteras via TeraGrids webbplats. Förslagsställare väljer en vetenskaplig disciplin som närmast beskriver deras arbete, och detta möjliggör rapportering om tilldelning av och användning av TeraGrid per vetenskaplig disciplin. Från och med juli 2006 var den vetenskapliga profilen för TeraGrid-tilldelningar och användning:

Tilldelad (%) Begagnade (%) Vetenskaplig disciplin
19 23 Molekylär biovetenskap
17 23 Fysik
14 10 Astronomiska vetenskaper
12 21 Kemi
10 4 Materialforskning
8 6 Kemiska, termiska system
7 7 Atmosfärsvetenskaper
3 2 Avancerad vetenskaplig beräkning
2 0,5 Geovetenskap
2 0,5 Biologiska och kritiska system
1 0,5 Ocean Sciences
1 0,5 Tvärvetenskapliga aktiviteter
1 0,5 Dator- och beräkningsforskning
0,5 0,25 Integrativ biologi och neurovetenskap
0,5 0,25 Mekaniska och strukturella system
0,5 0,25 Matematiska vetenskaper
0,5 0,25 El- och kommunikationssystem
0,5 0,25 Design och tillverkningssystem
0,5 0,25 Miljöbiologi

Var och en av dessa disciplinkategorier motsvarar ett specifikt programområde för National Science Foundation .

Från och med 2006 tillhandahöll TeraGrid applikationsspecifika tjänster till Science Gateway- partners, som betjänar (vanligtvis via en webbportal) disciplinspecifika vetenskaps- och utbildningsgemenskaper. Genom programmet Science Gateways syftar TeraGrid till att bredda åtkomsten med minst en storleksordning i termer av antalet forskare, studenter och pedagoger som kan använda TeraGrid.

Resursleverantörer

Liknande projekt

externa länkar