• Partager
  • Imprimer
  • Abonnez-vous à cette page

Bio-informatique pratique

Entrez Gene (NCBI)

  • La base de données Entrez Gene est la porte d’entrée à utiliser pour débuter une recherche, si on connaît un nom de gène ou sa description. C'est une base à valeur ajoutée, contrairement à Nucleotide (GenBank), qui contient des données brutes.

Partir du bon pied avec RefSeq

Quelle séquence de départ choisir, par exemple pour dessiner des amorces d'amplification ou une sonde moléculaire? Toutes les données n'ont pas la même valeur... si disponible, choisissez la séquence de référence (RefSeq). Vous trouverez l'encadré "Reference Sequence Information" dans les notices des bases de données Nucleotide (qui inclut GenBank) et Protein au NCBI.

Génétique

  • Online Mendelian Inheritance in Man (Johns Hopkins University School of Medicine)
    Base de données sur les gènes humains et les maladies génétiques, contenant des résumés cliniques. Excellent point de départ pour une recherche d'information. Voir aussi : Clinical Utility Gene Cards.
  • GeneReviews (University of Washington at Seattle)
    Description de maladies génétiques avec une emphase sur l'utilisation de tests génétiques dans le diagnostic, le traitement et le counseling. Révision régulière par des pairs et des experts.
  • Medical Genetics Summaries (NCBI)
    Sommaires décrivant l'impact de variations génétiques spécifiques sur la santé.

Mutations

Les sources suivantes répertorient les changements détectables et transmissibles dans la matière génétique.

Séquences de protéines: UNIProt

UNIProt est la ressource la plus complète de séquences et d'information fonctionnelle sur les protéines. Elle regroupe les données contenues dans Swiss-Prot, TrEMBL et PIR. Les données sont annotées manuellement. Voir la vidéo pour une visite du site et les guides d'utilisation.

Protein Data Bank (RCSB)

La base de données PDB est une autre source incontournable d'information spécialisée sur les protéines. L'accès aux données brutes permet de les extraire et de les utiliser pour nos propres besoins, ou de les visualiser en mode tridimensionnel.

Obtenir des séquences d'un organisme

Le tutoriel suivant vous présente comment obtenir une ou plusieurs séquences d'ADN dans les bases de données du NCBI.

Trouver des séquences homologues: alternatives au BLAST par défaut

Des liens pré-calculés par les experts du NCBI vous évitent de faire la recherche vous-même. Conseil : utiliser la séquence fonctionnelle en acides aminés (si applicable) plutôt que la séquence en nucléotides pour identifier des séquences homologues.

Liens pré-calculés au NCBI

§Lien disponible pour toutes les séquences de Nucleotide et Protein.
§Conditions plus stringentes que les paramètres par défaut de l’outil = moins de résultats qu’un BLAST conventionnel, mais souvent plus pertinents.
§Permet de sauver du temps!
§Conseil : utiliser la séquence fonctionnelle en acides aminés (si applicable) plutôt que la séquence en nucléotides pour identifier des séquences homologues.

Trouver des polymorphismes ou SNP

La base de données Single Nucleotide Polymorphisms (NCBI) répertorie les petites variations dans les séquences d’ADN, qui peuvent modifier la fonction d’une protéine (et donc le phénotype). Guide d'utilisation

Outils d'analyse d'ADN et de protéines

  • Galaxy (Center for Comparative Genomics and Bioinformatics)
    Suite d'outils d'analyse qui vous permet d'intégrer des données provenant de diverses sources.
  • FancyGene est un outil convivial et rapide pour représenter graphiquement des gènes. Voir le tutoriel.

Autres outils de recherche

  • DNA Patent Database (Georgetown University's Kennedy Institute of Ethics and the Foundation for Genetic Medicine)
    Base de données offrant un accès gratuit aux versions intégrales des brevets sur l'ADN provenant du United States Patent and Trademark Office (USPTO).
  • The GenomeNet Database Service (Institute for Chemical Research, Kyoto University)
    Système intégré permettant l'interrogation de plusieurs bases de données en biologie moléculaire. Accès à de nombreux outils pour l'interprétation des séquences et à Kyoto Encyclopedia of Genes and Genomes (KEGG).
Dernière mise à jour : 06.07.2017 | Mot(s)-clé(s) : sciences de la santé recherche fondamentale santé bio-informatique Informatique