BASys

BASys
Innehåll
Beskrivning För automatiserad bakteriegenomnotering och generering av kromosomkarta

Datatyper infångade
Datainmatning : rå genomsekvens (FASTA-format), märkt genomsekvens (FAST-format) eller förutspådd/märkt proteomsekvens (FASTA); Datautgång : Fullständigt kommenterat genom tillsammans med en interaktiv, kommenterad genomkarta
Kontakt
Forskningscenter University of Alberta
Laboratorium David S. Wishart
Primärt citat
Access
Hemsida https://www.basys.ca/
Ladda ner URL https://www.basys.ca/
Diverse
Frekvens för datautgivning
Senaste uppdatering 2012
Kurationspolicy Manuellt kurerad

BASys (Bacterial Annotation System) är en fritt tillgänglig webbserver som kan användas för att utföra automatiserad, omfattande annotering av bakteriegenom . Med tillkomsten av nästa generations DNA-sekvensering är det nu möjligt att sekvensera hela genomet av en bakterie (vanligtvis ~4 miljoner baser) inom en enda dag. Detta har lett till en explosion av antalet fullt sekvenserade mikrober . Faktum är att från och med 2013 fanns det mer än 2700 fullt sekvenserade bakteriegenom deponerade hos GenBank . En fortsatt utmaning med mikrobiell genomik är dock att hitta resurserna eller verktygen för att kommentera det stora antalet nysekvenserade genom . BASys utvecklades 2005 i väntan på dessa behov. Faktum är att BASys var världens första allmänt tillgängliga webbserver för mikrobiella genomanteckningar . På grund av dess utbredda popularitet uppdaterades BASys-servern 2011 genom tillägget av flera servernoder för att hantera det stora antalet frågor som den fick.

BASys-servern är utformad för att acceptera antingen sammansatt genomdata (rå DNA-sekvensdata ) eller kompletta proteomtilldelningar som indata. Om rå DNA-sekvens tillhandahålls använder BASys Glimmer (version 2.1.3) för att identifiera generna. Resultatet från BASys är en omfattande genomomfattande annotering (med ~60 annoteringsunderfält för varje gen) och en zoombar, hyperlänkad genomkarta över frågegenomet. BASys använder nästan 30 olika program för att bestämma och kommentera gen-/proteinnamn, GO-funktioner, COG-funktioner, möjliga paraloger och ortologer, molekylvikt, isoelektrisk punkt, operonstruktur, subcellulär lokalisering , signalpeptider , transmembranregioner , sekundärstruktur , 3D-struktur, reaktioner och vägar. Den fullständiga listan över program som används av BASys ges nedan:

namn Metod
Glimmer 2.1.3 Glimmer är ett populärt och mycket noggrant ab initio gensökningsprogram för mikrobiellt DNA. På en studie av för 31 kompletta bakteriella och arkeala genom, Glimmer en genomsnittlig genförutsägelsenoggrannhet på 99,36%. Glimmer använder interpolerade Markov-modeller för att skilja kodande regioner från icke-kodande DNA. Glimmers prestanda minskar med ökande GC-innehåll. För genom med högt GC-innehåll (>60%) Glimmer generera ett stort antal falskt positiva förutsägelser och bör därför användas med försiktighet.
HMMER 2.3.2 Används för lokala Pfam-sökningar
Homodeller 2.0 Lokalt utvecklat homologimodelleringsprogram .
SignalP 3.0 Signalpeptidförutsägelse.
TMHMM 2.0 Förutsägelse av transmembranspiraler i protein .
PSIPRED 2.45 Förutsägelse av sekundär struktur. PSIPRED uppnår ett genomsnittligt Q3-poäng på 80,6 % för förutsägelse av sekundär struktur .
PS_scan Verktyg för lokala PROSITE-skanningar.
VADAR 1.4 Lokalt utvecklat verktyg för analys av proteinstruktur. BASys använder VADAR för att analysera proteinstrukturer för sekundär strukturell information
PSORT-B 2.0.4 Används för att förutsäga subcellulär plats. PSORT-B uppnår en precision på 96 % för grampositiva och gramnegativa bakterier
ProteinNameExtractor 1.0 BASys funktionsprediktionsmodul. Denna modul validerades mot en uppsättning expertkommenterade proteiner från C.trachomatis .
FindParalogs 1.0 BASys-modul för paralogidentifiering. Paralogdatabasen skapas från de konceptuella översättningarna för de identifierade kodningsregionerna som tillhandahålls till BASys av Glimmer eller av insändaren.
FindHomologs 1.0 BASys-modul för homologidentifiering. Söker i modellorganismdatabaser efter möjliga homologer .
GOSearch 1.0 BASys-modul för att extrahera Gene Ontology -information från olika källor.
OperanFinder 1.0 BASys-modul för att identifiera operoner .
StructureManager 1.0 BASys-modul för att manipulera proteinstrukturfiler .
StructureClassifier 1.0 BASys-modul för att bestämma strukturklass från sekundär strukturinformation.
Structure Finder 1.0 BASys-modul för att generera proteinstrukturer från olika källor.
COG_Finder 1.0 BASys-modul för identifiering av COG funktionella kategorier och accessioner
Secondary Structure Manager 1.0 BASys-modul för generering av sekundär strukturinformation från olika källor.
ECNumber_Finder BASys-modul för att mappa EC_number till och från olika källor.
SwissProt Annotation Manager 1.0 BASys-modul för att jämföra och transitivt tillämpa kommentarer från SwissProt- poster.
CCDB Annotation Manager 1.0 BASys-modul för att jämföra och transitivt tillämpa kommentarer från CCDB-poster.
Genidentifierare 1.0 BASys-modul för att koordinera genidentifieringsinformation från glimmer eller användarbidrag
BASys Annotation Manager 1.0 BASys pipeline manager.
KEGG sökhanterare BASys modul för att söka och extrahera metabolisk information från KEGG .
SubCellLocalization Manager 1.0 BASys-modul för att generera subcellulär platsanteckning från olika källor.

Förutom sin omfattande annotering för varje gen/protein i frågegenomet, genererar BASys också färgglada, klickbara och helt zoombara cirkulära kartor över varje ingångskromosom . Dessa bakteriella genomkartor genereras med hjälp av ett program som kallas CGView (Circular Genome Viewer) som utvecklades 2004. Genomkartorna är designade för att möjliggöra snabb navigering och detaljerad visualisering av alla BASys-genererade genanteckningar. En komplett BASys-körning tar cirka 16 timmar för en genomsnittlig bakteriell kromosom (ungefär 4 megabaser). BASys kommentarer kan ses och laddas ner anonymt eller genom ett lösenordsskyddat åtkomstsystem. BASys kommer att lagra sina bakteriegenomnoteringar på servern i maximalt 180 dagar. BASys hanterar cirka 1000 inlämningar per år. BASys är tillgänglig på https://www.basys.ca/

Omfattning och tillgång

All data i BacMap är icke-proprietär eller härledd från en icke-proprietär källa. Den är fritt tillgänglig och tillgänglig för alla. Dessutom är nästan varje datapost helt spårbar och hänvisas uttryckligen till den ursprungliga källan. BacMap-data är tillgänglig via ett offentligt webbgränssnitt och nedladdningar.

Se även