SIMAP

Aller en bas

SIMAP

Message par louchio le Mer 6 Jan - 14:47

Ce projet est un projet épisodique c'est à dire que habituellement il fourni des unités de calculs seulement au début de chaque mois. L'information est disponible en tout temps sur le site du projet pour connaitre la date de la prochaine livraison.



SIMAP est une base de données de similitude entre protéines. Celle-ci rassemble toutes les séquences de protéines actuellement publiées et est continuellement mise à jour. Les similtudes entre protéines sont calculées à l'aide de l'algorithme FASTA qui fournit la vitesse optimale et la sensibilité nécessaire. SIMAP est à notre sens le seul projet qui combine les vastes connaissances de toutes les protéines actuellement connues et la capacité à en découvrir d'autres progressivement.

En quoi SIMAP est-il utile ?

Du fait de la quantité énorme de séquences de protéines connues dans les bases de données publiques, il est devenu clair que la plupart d'entre-elles ne seront pas expérimentalement traitées dans un avenir proche . Néanmoins, les protéines qui se sont développées à partir d'un ancêtre commun partagent souvent les mêmes fonctions (dites orthologues). Donc, il est possible de déduire la fonction d'une protéine orthologue non-caractérisée avec la fonction connue. Un exemple bien connu sont les investigations sur les gènes et les protéines de souris . Leurs résultats valent aussi pour les gènes et les protéines orthologues humains dans de nombreux cas. Les similitudes entre protéines fournissent des informations sur les relations entre elles et sont nécessaires à la prévision d'orthologues. Il y a de nombreuses méthodes bio-informatiques sur lequelles ont peut s'appuyer concernant la similitude entre protéines. Notre base de données de similitude entre protéines fournit des données de similitude pré-calculées et représente l'espace connu de protéines. Cela ouvre vraiment de nouvelles perspectives comparé à la méthode communément utilisée qui consiste à recalculer de manière répétitive ce type de données. SIMAP est régulièrement mis à jour. La matrice de similitude est simplement étendue de manière incrémentale si de nouvelles séquences arrivent. L'utilisation de SIMAP est complètement gratuite pour l'Éducation et la Recherche Publique.

Pourquoi avons-nous besoin du calcul distribué pour SIMAP ?

Les dépenses informatiques pour calculer les données de similitude dépendent de la taille du nombre de séquences contenues. Donc l'effort de calcul informatique pour tenir la matrice à jour augmente constamment . Nos ressources internes qui exécutent des calculs pour SIMAP depuis des années ne sont plus suffisantes pour traiter toutes les nouvelles séquences. C'est pourquoi nous avons mis en oeuvre un client SIMAP compatible avec la plateforme BOINC (Berkeley Open Infrastructure for Network Computing) qui est basé sur l'algorithme FASTA pour détecter des similitudes de séquences. Nous accomplissons maintenant les derniers essais et sommes sur le point de commencer un projet basé sur BOINC qui contribuera bientôt aux calculs de similitude SIMAP.

Quelles sont les institutions à l'origine de SIMAP ?
SIMAP est un projet commun du Centre de Recherches National GSF pour l'Environnement et la Santé, Neuherberg et l'Université Technique de Munich, le Centre de Vie et Science d'Alimentation Weihenstephan (tous basés en Allemagne).



Ce projet fonctionne sur les plateformes Linux, Windows et Mac




POUR SE JOINDRE AU PROJET

SITE DU PROJET

NOTRE POSITION SUR LE PROJET

Plus d'explication sur le site de l'Alliance Francophone

ETAT DU SERVEUR

louchio

Messages : 145
Points : 209
Date d'inscription : 18/06/2009
Localisation : montérégie

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum