Nacionalni centar za biotehnološke informacije
Nacionalni centar za biotehnološke informacije (NCBI)[1][2] je dio Nacionalne medicinske biblioteke Sjedinjenih Država (NLM), ogranka Nacionalnog instituta za zdravstvo (NIH). Djelatnost mu odobrava i finansira vlada Sjedinjenih Država. Osnovan je 1988., na osnovu zakona koji je sponzorirao senatora Claude Pepper. NCBI se nalazi u gradu Bethseda, Maryland.
NACIONALNI CENTAR ZA BIOTEHNOLOŠKE INFORMACIJE | |
---|---|
Skraćenica | NCBI |
Datum osnivanja | 1988 . |
Vrsta | Domaćin i uređivač niza baza podataka, relevantnih za biotehnologiju i biomedicinu i važan je resurs za alate i usluge iz oblasti bioinformatike. |
Status | Aktivan |
Glavno sjedište | Bethesda, Maryland, SAD 38°59′45″N 77°05′56″W / 38.9959°N 77.0989°W |
Jezik | Engleski |
Br. volontera | Po potrebi |
Veb-sajt | www |
NCBI je domaćin niza baza podataka, relevantnih za biotehnologiju i biomedicinu i važan je resurs za alate i usluge iz oblasti bioinformatike. Glavne baze podataka uključuju GenBank za sekvence DNK i PubMed, bibliografsku bazu podataka o biomedicinskoj literaturi. Ostale baze podataka uključuju bazu podataka NCBI Epigenomics. Sve ove baze dostupne su na mreži putem pretraživača Entrez. NCBI je režirao David Lipman,[2] jedan od originalnih autora programa poravnavanja sekvence BLAST [3] i široko cijenjena ličnost u bioinformatici. Vodio je također intramuralni istraživački program, uključujući grupe koje su vodili Stephen Altschul (još jedan koautor BLAST-a), David Landsman, Eugene Koonin, John Wilbur, Teresa Przytycka i Zhiyong Lu. David Lipman odstupio je sa svoje funkcije u maju 2017.[4]
GenBank
urediNCBI bio je odgovoran za stavljanje na raspolaganje GenBank DNK baza podataka o sekvencama od 1992.[5] GenBank se koordinira sa pojedinačnim laboratorijama i drugim bazama podataka o sekvencama, poput onih iz Evropske molekulske biološke laboratorije (EMBL) i DNK banke podataka Japana (DDBJ).[5]
Od 1992., NCBI je narastao tako da pruža i druge baze podataka pored GenBank-a. NCBI pruža gensku, bazu podataka molekulskog modeliranja (3D proteinske strukture) *OMIM,
- dbSNP (baza podataka polimofizama jednog nukleotida),
- Zbirku referentnih sekvenci,
- Mapau ljudskog genoma i
- Taksonomski pretraživač. Koordinira s Nacionalnim institutom za rak, kako bi osigurao Projekt anatomije genoma raka. NCBI dodjeljuje jedinstveni identifikator (taksonomski ID) svakoj vrsti organizma.[6]
NCBI ima softverske alate koji su dostupni putem internet pretraživača ili putem FTP-a. Naprimjer, BLAST je program pretraživanja sličnosti niza. Može uporediti sekvence sa GenBank DNK bazom podataka za manje od 15 sekundi.
NCBI "polica za knjige" (Bookshelf)
urediNCBI Bookshelf[7] je kolekcija slobodno dostupnih, online verzija odabranih biomedicinskih knjiga koje se mogu preuzeti. Polica s knjigama pokriva širok spektar tema, uključujući molekulsku biologiju, biohemija, ćelijsku biologiju, genetiku, mikrobiologiju, stanja bolesti s molekulske i ćelijske tačke viđenja, metode istraživanja i virusologiju. Neke knjige su mrežne verzije prethodno objavljenih knjiga, dok druge, poput "Pauza za kafu" (Coffee Break), potpisuje i uređuje osoblje NCBI. "Polica za knjige" je nadopuna spremišta Entrez PubMed, sažetaka recenziranih publikacija, a u tom sadržaju Bookshelf pruža utvrđene perspektive o evoluiranim područjima proučavanja.
BLAST
urediOsnovni alat za pretraživanje lokalnog poravnanja (Basic Local Alignment Search Tool – BLAST) je algoritam koji se koristi za izračunavanje sličnosti bioloških sekvenci , kao što su nukleotidne sekvence DNK i aminokiselinske sekvence proteina .[8] BLAST je moćan alat za pronalaženje sekvenci sličnih istraživanoj sekvenci u istom ili u različitim organizmima. Pretražuje datu sekvencu upita u NCBI bazama podataka i serverima i objavljuje rezultate natrag u pregledniku osobe u izabranom formatu. Ulazne sekvence za BLAST uglavnom su u FASTA ili Genbank formatu, dok se izlaz može isporučivati u različitim formatima, kao što su HTML, XML formatiranje i običan tekst. HTML je zadani izlazni format za NCBI-ovu web stranicu. Rezultati za NCBI-BLAST su predstavljeni u grafičkom formatu sa svim pronađenim pogocima, tabelomm sa identifikatorima sekvenci za slaganje koje imaju povezane podatke o bodovanju, zajedno sa poravnanjima za sekvencu od interesa i podudarnostima primljenim sa njihovim analognim BLAST rezultatima.[9]
Entrez
urediEntrez globalni sistem pretraživanja za više baza podataka koristi se u NCBI za sve glavne baze podataka, kao što su nukleotidne i proteinske sekvence, proteinske strukture, PubMed, Taxonomy, Complete Genomes, OMIM i nekoliko drugih.[10] Entrez je sistem za indeksiranje i pronalaženje koji sadrži podatke iz različitih izvora za biomedicinska istraživanja. NCBI je distribuirao prvu verziju Entreza 1991., sastavljenu od nukleotidnih sekvenci iz PDB i GenBank, proteinskih sekvenci iz SWISS-PROT-a, prevedenih u GenBank, PIR, PRF, PDB i povezanih sažetaka i citata iz PubMed-a. Entrez je posebno dizajniran za integriranje podataka iz nekoliko različitih izvora, baza podataka i formata u jedinstveni informativni model i sistem pretraživanja koji mogu efikasno dohvatiti relevantne reference, sekvenci i struktura.[11]
Gene
urediGene je implementiran u NCBI kako bi se okarakterizirale i organizirale informacije o genima. Služi kao glavni čvor za genomske karte, ekspresije, sekvence, funkcije proteina, strukture i podatke o homologiji. Svakom zapisu gena dodjeljuje se jedinstveni GeneID koji se može pratiti kroz cikluse revizije. Geni su ovdje uspostavljeni zapisi za poznate ili predviđene gene, koji su razgraničeni položajima na mapi ili nukleotidnim sekvencama. Gene ima nekoliko prednosti u odnosu na svog prethodnika, LocusLink, uključujući bolju integraciju s drugim bazama podataka u NCBI, širi taksonomski opseg i poboljšane opcije za upite i pronalaženje koje pruža Entrez sistem.[12]
Protein
urediProtein je baza podataka o proteinima koja održava tekstni zapis za pojedinačne proteinske sekvence, izvedene iz mnogih različitih resursa, poput projekta NCBI referentne sekvence (Reference Sequence – RefSeq), GenBank, PDB i UniProtKB/SWISS-Prot. Evidencije proteina prisutne su u različitim formatima, uključujući FASTA i XML i povezane su s drugim resursima NCBI-a. Protein korisnicima pruža relevantne podatke kao što su geni, sekvence DNK/RNK, biološke puteve, podatke o ekspresiji i varijacijama i literaturom. Također pruža unaprijed određene skupove sličnih i identičnih proteina za svaku sekvencu, kako je izračunao u BLAS-u. Baza podataka strukture NCBI sadrži 3D skupove koordinata za eksperimentalno određene strukture u PDB-u koje unosi NCBI.
Baza podataka konzerviranih proteinskih domena (CDD) sadrži profile sekvenci koji karakteriziraju visoko konzervirane domene unutar proteinskih sekvenci. Takođe ima zapise iz vanjskih izvora, kao što su SMART i Pfam. Postoji još jedna baza podataka u bazi proteina, poznata kao baza proteinskih klastera, koja sadrži skupove proteinskih sekvenci koje su grupirane prema maksimalnom poravnanju između pojedinačnih sekvenci, kako je izračunao BLAST.[13]
Baza podatala Pubchem
urediBaza podataka PubChem u NCBI je javni resurs za molekule i njihove aktivnosti protiv bioloških ispitivanja. PubChem je pretraživ i za pronalaženje informacija dostupan mu je Entrez sistem.[14]
Također pogledajte
urediReference
uredi- ^ "The Human Genome Project". The New York Times.
- ^ a b "Research Institute Posts Gene Data on Internet". The New York Times. 26. 6. 1997.
- ^ "Sense from Sequences: Stephen F. Altschul on Bettering BLAST". 2000. Arhivirano s originala, 7. 10. 2007.
- ^ "National Library of Medicine Announces Departure of NCBI Director Dr. David Lipman". www.nlm.nih.gov. Pristupljeno 6. 5. 2017.
- ^ a b Mizrachi, Ilene (22. 8. 2007). GenBank: The Nucleotide Sequence Database. National Center for Biotechnology Information (US) – preko www.ncbi.nlm.nih.gov.
- ^ "Home - Taxonomy - NCBI". www.ncbi.nlm.nih.gov.
- ^ USA (6. 5. 2019). "Home - Books - NCBI". Ncbi.nlm.nih.gov. Pristupljeno 12. 6. 2019.
- ^ Altschul Stephen; Gish Warren; Miller Webb; Myers Eugene; Lipman David (1990). "Basic local alignment search tool". Journal of Molecular Biology. 215 (3): 403–410. doi:10.1016/s0022-2836(05)80360-2. PMID 2231712.
- ^ Madden T. (2002). The NCBI Handbook, 2nd edition, Chapter 16, The BLAST Sequence Analysis Tool
- ^ NCBI Resource Coordinators (2012). "Database resources of theNational Center for Biotechnology Information". Nucleic Acids Research 41 (Database issue): D8–D20.
- ^ Ostell J. (2002). The NCBI Handbook, 2nd edition, Chapter 15, The Entrez Search and Retrieval System
- ^ Maglott D. Pruitt K. & Tatusova T. (2005). The NCBI Handbook, 2nd edition, Chapter 19, Gene: A Directory of Genes
- ^ Sayers E. (2013). The NCBI Handbook, 2nd edition, NCBI Protein Resources
- ^ Wang Y. & Bryant S H. (2014). The NCBI Handbook, 2nd edition, NCBI PubChem BioAssay Database
Vanjski linkovi
uredi