vendredi 10 février 2017

Intelligence artificielle utilise la base de données des maladies

Intelligence artificielle utilise la base de données des maladies
Intelligence artificielle utilise la base de données des maladies les plus gros de lutte contre le cancer 
Nous vivons à une époque passionnante où les nouvelles technologies nous permettent d'amasser d'énormes quantités de données sur le cancer. Et de vastes banques de données contenant les profils génétiques des tumeurs et d'autres informations sont susceptibles de découvrir de nouveaux médicaments potentiels.
Le International Cancer Génome Consortium est profilage jusqu'à 20.000 patients atteints de cancer déjà et la plus grande base de données unique au monde de patients atteints de cancer a vient d’être lancé. Il combinera près des données du cancer en temps réel sur les 350.000 cancers diagnostiqués chaque année en Angleterre, ainsi que des informations cliniques détaillées et plus 11m dossiers de cancer historiques.
Avec toutes ces informations, vous pouvez vous attendre de nouvelles percées dans le traitement du cancer à venir en épaisseur et rapide. Mais plus de ces mines d'or de la matière première que nous avons, plus il devient en fait de donner un sens. Pour ce faire, nous avons besoin de toute une batterie d'autres informations - comme la façon dont différents médicaments peuvent interagir avec les gènes des patients, dont les gènes sont susceptibles d'être adapté pour le développement de médicaments, et ce que les expériences de laboratoire clés vont nous faire sur notre chemin à un nouveau médicament.
Pour rendre cela plus facile, nous avons mis au point un cadre unique base de données canSAR pour relier les goldmines premières de données génétiques pour toute une série de chimie indépendante, biologie, patient et information sur les maladies. Il rassemble des milliards de résultats expérimentaux de partout dans le monde, y compris celles sur la présence de mutations génétiques, les niveaux de gènes et leurs protéines résultantes dans une tumeur, et l'activité mesurée d'un composé ou d'un médicament sur les protéines testées.
Ensuite, le système "traduit" ces données dans un langage commun afin qu'ils puissent être comparés et liés. Il peut même explorer les modes d'interaction entre les protéines dans une cellule en utilisant des systèmes similaires qui sont utilisés pour explorer les interactions humaines dans les réseaux sociaux.
Une fois que ces masses de données sont rassemblées et traduites, canSAR utilise ensuite l'apprentissage machine sophistiquée et l'intelligence artificielle pour tracer des trajets entre eux, prédire les risques et faire des suggestions de médicaments pertinents qui peuvent être testés dans le laboratoire.
Il est un peu comme prédire les gagnants probables d'une course olympique 100 m. Le premier ordinateur "apprend" les facteurs importants de vainqueurs de la course passés tels que la santé cardiovasculaire, la masse musculaire, la performance passée, leur calendrier de formation, puis il utilise cet apprentissage pour classer les nouveaux athlètes basés sur la façon dont ils correspondent au profil des gagnants.
Utilisation de canSAR cibles de cancer potentiel peuvent être repérés en apportant de nombreuses sources de données existantes en un seul endroit et de déchiffrer des propriétés importantes des cibles précédentes de médicaments efficaces. Nous avons besoin de l'état de l'art du calcul haute performance pour être en mesure de croquer les milliards de chiffres pour faire ces prédictions. Nous faisons ensuite les résultats disponibles afin qu'ils puissent être utilisés par les chercheurs.
Bien sûr, une ressource est seulement un succès si elle est largement utilisée. Ainsi, la base de données a été mise à disposition gratuitement à tous et nous nous attendons à devenir un aliment de base dans la boîte à outils du chercheur sur le cancer. Une base de données prototype beaucoup plus petit, a été utilisée par 26.000 utilisateurs uniques dans plus de 70 pays à travers le monde. Le prototype a été utilisé pour identifier les 46 potentiellement protéines "druggable" de cancer qui avaient été négligés. Certains d' entre eux ont depuis acquis un intérêt dans la communauté et sont mieux étudiés. canSAR sera en mesure de faire ce genre de travail à une échelle beaucoup plus grande.
Et l'un des avantages immédiats les plus précieux est qu'il permet de demander "what if" questions et génère des hypothèses que peut être testé dans le laboratoire. Il y a beaucoup de décisions qui doivent être faites sur le chemin de la découverte et le développement d'un médicament. Relier toutes ces informations permettra d'accélérer ces décisions et faire les appels qui sont les plus susceptibles de nous faire plus rapidement vers bénéfice pour le patient.