In a collaborative study led by Sanford Burnham Prebys Medical Discovery Institute (SBP), researchers have combined two publicly available 'omics' databases to create a new catalogue of 'cancer drivers'. Cancer drivers are genes that when altered, are responsible for cancer progression. The researchers used cancer mutation and protein structure databases to identify mutations in patient tumors that alter normal protein-protein interaction (PPI) interfaces. The study, published in PLoS Computational Biology, identified more than 100 novel cancer driver genes and helps explain how tumors driven by the same gene may lead to different patient outcomes.
"This is the first time that three-dimensional protein features, such as PPIs, have been used to identify driver genes across large cancer datasets," said lead author Eduard Porta-Pardo, Ph.D., a postdoctoral fellow at SBP. "We found 71 interfaces in proteins previously unrecognized as cancer drivers, representing potential new cancer predictive markers and/or drug targets. Our analysis also identified several driver interfaces in known cancer genes, such as TP53, HRAS, PI3KCA and EGFR, proving that our method can find relevant cancer driver genes and that alterations in protein interfaces are a common pathogenic mechanism of cancer."
Cancer is caused by the accumulation of mutations to DNA. Until now, scientists have focused on finding alterations in individual genes and cell pathways that can lead to cancer. But the recent push by the National Institutes of Health (NIH) to encourage data sharing has led to an era of unprecedented ability to systematically analyze large scale genomic, clinical, and molecular data to better explain and predict patient outcomes, as well as finding new drug targets to prevent, treat, and potentially cure cancer.
"For this study we used an extended version of e-Driver, our proprietary computational method of identifying protein regions that drive cancer. We integrated tumor data from almost 6,000 patients in The Cancer Genome Atlas (TCGA) with more than 18,000 three-dimensional protein structures from the Protein Data Bank (PDB)," said Adam Godzik, Ph.D, director of the Bioinformatics and Structural Biology Program at SBP. "The algorithm analyzes whether structural alterations of PPI interfaces are enriched in cancer mutations, and can therefore identify candidate driver genes."
"Genes are not monolithic black boxes. They have different regions that code for distinct protein domains that are usually responsible for different functions. It's possible that a given protein only acts as a cancer driver when a specific region of the protein is mutated," Godzik explained. "Our method helps identify novel cancer driver genes and propose molecular hypotheses to explain how tumors apparently driven by the same gene have different behaviors, including patient outcomes."
"Interestingly, we identified some potential cancer drivers that are involved in the immune system. With the growing appreciation of the importance of the immune system in cancer progression, the immunity genes we identified in this study provide new insight regarding which interactions may be most affected," Godzik added.
---
Dans une étude collaborative menée par Sanford Burnham Medical Discovery Institute Prebys (SBP), les chercheurs ont combiné deux bases de données accessibles au public pour créer un nouveau catalogue de «pilotes de cancer». Les pilotes ( ou drivers) de cancer sont des gènes qui lorsqu'ils sont modifiés, sont responsables de la progression du cancer. Les chercheurs ont utilisé des bases de données de mutation et cancer de la structure de protéine pour identifier des mutations dans les tumeurs de patients qui modifient interfaces normales interaction protéine-protéine (PPI). L'étude, publiée dans la revue PLoS Computational Biology, a identifié plus de 100 gènes nouveaux pilote d'un cancer et permet d'expliquer comment les tumeurs entraînés par le même gène peuvent conduire à différents résultats pour les patients.
"Ceci est la première fois que les caractéristiques de protéines en trois dimensions, comme les IPP, ont été utilisées pour identifier les gènes de conduite dans un grand ensembles de données sur le cancer», a déclaré le principal auteur Eduard Porta-Pardo, Ph.D., chercheur postdoctoral à SBP. "Nous avons trouvé 71 interfaces dans les protéines non constatés antérieurement comme conducteurs (drivers) de cancer, ce qui représente de nouveaux marqueurs prédictifs possibles du cancer et / ou des cibles de médicaments. Notre analyse a également identifié plusieurs interfaces de pilote dans les gènes connus du cancer, tels que TP53, HRAS, PI3KCA et EGFR, ce qui prouve que notre méthode peut trouver des gènes du cancer du pilote pertinents et que les modifications dans les interfaces de protéines sont un mécanisme pathogène commun de cancer ".
Le cancer est causé par l'accumulation de mutations de l'ADN. Jusqu'à présent, les scientifiques ont mis l'accent sur la recherche de modifications dans les gènes individuels et les voies cellulaires qui peuvent conduire au cancer. Mais la récente poussée par les National Institutes of Health (NIH) pour encourager le partage des données a conduit à l'ère de la capacité sans précédent pour analyser systématiquement des données génomiques, cliniques et moléculaires à grande échelle afin de mieux expliquer et prédire les résultats des patients, ainsi que de trouver de nouvelles cibles de médicaments pour prévenir, traiter et guérir le cancer potentiellement.
"Pour cette étude, nous avons utilisé une version étendue de conducteurs électronique, notre méthode de calcul exclusif de l'identification des régions de protéines qui entraînent le cancer. Nous avons intégré des données tumorales de près de 6000 patients dans le Cancer Genome Atlas (TCGA) avec plus de 18.000 protéines en structures de trois dimensions de la banque de protéines "Protein Data Bank (PDB)" , a déclaré Adam Godzik, Ph.D, directeur de la bioinformatique et Programme de biologie structurale au SBP. "L'algorithme analyse si des modifications structurelles des interfaces PPI sont enrichies en des mutations d'un cancer, et peuvent donc identifier des gènes pilotes candidats".
"Les gènes sont des boîtes noires pas monolithiques. Ils ont différentes régions qui codent pour des domaines protéiques distincts qui sont généralement responsables de différentes fonctions. Il est possible qu'une protéine donnée agisse uniquement comme un pilote de cancer quand une région spécifique de la protéine est mutée," Godzik explique. "Notre méthode permet d'identifier les gènes du pilote d'un cancer et de proposer de nouvelles hypothèses moléculaires pour expliquer comment les tumeurs apparemment entraînés par le même gène ont des comportements différents, et des résultats différents pour les patients."
«Fait intéressant, nous avons identifié certains pilotes potentiels de cancer qui sont impliqués dans le système immunitaire. Avec la prise de conscience croissante de l'importance du système immunitaire dans la progression du cancer, les gènes de l'immunité que nous avons identifiées dans cette étude fournissent une nouvelle vision concernant les interactions qui peuvent être les plus touchés », a ajouté Godzik.