Centro nazionale per l'informazione sulle biotecnologie

Article

June 26, 2022

Il National Center for Biotechnology Information (NCBI) fa parte della US National Medical Library nei locali del National Institutes of Health (NIH) degli Stati Uniti. Il centro è stato fondato nel 1988 e si trova nel campus NIH a Bethlehem, nel Maryland. In passato, il direttore dell'NCBI era David Lipman, noto per le sue ricerche sulla tecnologia BLAST utilizzata per il sequenziamento del DNA. Attualmente, l'istituto è guidato da Stephen Sherry, che in passato ha guidato lo sviluppo dei database genetici dell'NCBI.Il ruolo dell'NCBI è quello di archiviare, elaborare e annotare i dati scientifici, in particolare nei campi della biologia molecolare, della medicina, della biochimica e della genetica. L'istituzione è anche attivamente coinvolta nello sviluppo di strumenti per l'analisi dei dati bioinformatici. I database NCBI raccolgono risultati di sequenziamento del DNA (GenBank), articoli scientifici (PubMed Central, PubMed), informazioni sui geni (RefSeq, Gene), annotazioni di sequenze di macromolecole (Protein, Nucleotide) o dati di mappatura di genomi già sequenziati (Genome). I servizi NCBI sono disponibili gratuitamente, simili agli istituti di bioinformatica come l'Istituto europeo di bioinformatica (EBI), l'Istituto svizzero di bioinformatica (SIB) o la banca dati del DNA del Giappone (DDBJ). Per creare i suoi database, NCBI utilizza i dati archiviati manualmente dalla comunità scientifica direttamente in NCBI o ottenuti in scambio con istituzioni correlate come DDBJ, European Molecular Biology Laboratory (EMBL), Protein Information Resource (PIR) o editori di letteratura scientifica. Anche le attività di gestione mirate dell'NCBI, i dati inseriti attivamente dal personale del centro, rappresentano una minoranza del guadagno di dati. La quantità di dati archiviati presso l'NCBI sta crescendo in modo esponenziale: nel 2020, un totale di oltre 3 miliardi di record sono stati archiviati in tutti i database NCBI, rispetto a circa 680 milioni di record nel 2012 e 90 milioni di record nel 2007. I servizi NCBI sono utilizzati quotidianamente da fino a 4 milioni di utenti La ricerca NCBI è mediata dal sistema Entrez, il cui output è un record complesso ottenuto da più database interconnessi. NCBI consente inoltre di eseguire ricerche nei suoi database per trovare sequenze simili utilizzando l'algoritmo BLAST (Basic Local Alligment Search Tool). Le utility di programmazione Entrez (E-utilities) vengono utilizzate per scaricare tutti i dati rilevanti associati a un determinato record di database.

Strumento di ricerca allineamento locale di base (BLAST)

BLAST è un algoritmo progettato per cercare sequenze simili tra sequenze memorizzate (nucleotidiche o proteiche). Durante la ricerca di NCBI utilizzando BLAST, è possibile utilizzare vari parametri di input (ad es. tabella dei punteggi, database ricercato) in base a criteri prerequisiti. Le sequenze di output sono ordinate in base alla significatività statistica della corrispondenza trovata. BLAST può essere utilizzato anche per determinare relazioni funzionali ed evolutive tra sequenze o per trovare membri omologhi della stessa famiglia genica. Esistono più versioni di BLAST nell'NCBI che consentono la ricerca di sequenze nucleotidiche correlate (BLASTN), sequenze proteiche (BLASTP), sequenze proteiche dalla sequenza nucleotidica tradotta iniziale (BLASTX), sequenze nucleotidiche tradotte dalla sequenza proteica iniziale (TBLASTN), o sequenze nullotidiche tradotte da sequenze nucleotidiche tradotte iniziali (TBLASTX).

Banca Gen

GenBank è un database di sequenze genetiche contenente una raccolta annotata di sequenze di DNA. GenBank, insieme alla DNA Data Bank of Japan e all'European Nuclotide Archive, fa parte della cosiddetta International Nucleotide Sequence Database Collaboration (INSDC), che coopera attivamente nell'archiviazione delle sequenze nucleotidiche. C'è anche uno scambio reciproco di dati archiviati tra queste istituzioni su base giornaliera. La nuova edizione di GenBank viene pubblicata ininterrottamente in due mesi