Trabajo Práctico 1 - Introducción a las bases de datos genómicas

En este Trabajo Práctico conoceremos la base de datos genómica Cbioportal.org la cual proporciona visualización, análisis y descarga de conjuntos de datos de genómica del cáncer a gran escala.

Objetivos:

  • Llevar a cabo un análisis de las alteraciones genómicas en cáncer colorrectal y en cáncer de mama .
  • Analizar cual sería un target terapéutico accionable en cada caso.
  • Evaluar las diferencias en las bases de datos genómicas y transcriptómicas.

Link: http://www.cbioportal.org

Introducción

¿Qué es el cBioPortal para la Genómica del Cáncer?

El cBioPortal para Cancer Genomics es un recurso de acceso abierto y de código abierto para la exploración interactiva de conjuntos de datos genómicos multidimensionales en cáncer. El cBioPortal reduce significativamente las barreras entre los datos genómicos complejos y los investigadores en cáncer que desean acceso rápido, intuitivo y de alta calidad a perfiles moleculares y atributos clínicos de proyectos de genómica del cáncer a gran escala y permite a los investigadores traducir estos conjuntos de datos en conocimientos biológicos y con posibles aplicaciones clínicas.

¿Qué tipos de datos hay en el portal?

Actualmente, el portal almacena datos de números de copias de ADN (valores discretos putativos por gen, p. Ej. “deleted” o “amplificados”), datos de expresión de ARNm y microARN, mutaciones no sinónimas, datos de niveles de proteína y fosfoproteína (RPPA), datos de metilación del ADN y datos clínicos limitados.

¿Cuál es el proceso de curación de datos?

Los conjuntos de datos provisionales TCGA se obtienen directamente del centro de datos TCGA (The Cancer Genome Atlas), en parte a través de Broad Firehose, que se actualizan periódicamente. Además, cBioPortal cura activamente conjuntos de datos de la literatura. Los estudios de la literatura fueron seleccionados a partir de los datos publicados con los documentos. En ocasiones, contactamos a los investigadores con datos adicionales, como los atributos clínicos. Todos los datos de la mutación (VCF o MAF) se procesaron a través de una canalización interna para anotar los efectos de la variante de manera consistente en todos los estudios.

¿En qué se diferencia el cBioPortal para cáncer genómico del portal de datos TCGA?

El portal de cBio es una herramienta de análisis exploratorio para explorar conjuntos de datos genómicos de cáncer a gran escala. Puede ver rápidamente las alteraciones genómicas en un conjunto de pacientes, en un conjunto de tipos de cáncer, realizar análisis de supervivencia y realizar análisis de red. Por el contrario, el Portal de Datos TCGA pretende ser el lugar definitivo para la descarga completa y el acceso a todos los datos generados por TCGA. Si desea explorar un camino de interés en uno o más tipos de cáncer, es probable que el portal cBio sea el lugar donde desea comenzar. Sin embargo, si desea descargar archivos de expresión de mRNA en bruto o archivos completos de número de copias segmentadas, es probable que el TCGA Data Portal sea el lugar donde desea comenzar.

Práctica

Paso 1:

  1. Ingrese a la página web cbioportal.org y explore los tipos de estudio disponibles en el panel “Select Studies”. ¿Cuántos tipos de cáncer se encuentran representados?

  2. Seleccione la opción “Pan Cancer Studies” y de ahí seleccione la opción: MSK-IMPACT Clinical Sequencing Cohort (MSKCC, Nat Med 2017) 10945 samples. Haga click en el icono “Summary” (el icono parece un gráfico de torta). La pantalla le muestra el número de muestras analizadas a partir de un número de pacientes. ¿Cuántas muestras y cuantos pacientes fueron analizados? ¿De donde sale la información utilizada en este dataset? ¿Para qué se hizo?

  3. Observe el recuadro de “mutated genes”. Organice la lista de genes mutados de mayor a menor. ¿Cuál es el gen con mayor número de mutaciones en cáncer? ¿Qué diferencia hay entre la “mutation data” y la “CNA data”?

  4. Haga click sobre el nombre de ese gen y apriete el botón “Query” (arriba a la derecha), luego haga click en la solapa “Cancer Types Summary”. ¿Cuál es la alteración más frecuente encontrada? ¿Cuál es el tipo de cáncer donde se encuentra mayormente alterado este gen?

  5. Haga click sobre la solapa “Mutations”. ¿Que información obtiene?

  6. Haga click sobre la solapa “Survival”. ¿Que información obtiene? ¿Como afecta la sobrevida de los pacientes una alteración genética en P53?

Paso 2:

  1. Vuelva a hacer click en el icono “cBioPortal”. Suponga que Ud. trabaja en una empresa que tiene como objetivo generar “Small molecule inhibitors” contra la proteína KRAS para el tratamiento del cáncer colorrectal. Ud. utiliza la base de datos cBioPortal para explorar las alteraciones genéticas presentes en el gen de KRAS en cáncer colorrectal. En el sector “select studies” haga click en “Bowel”. Luego, haga click en el estudio “Colorectal Adenocarcinoma (TCGA, Girehose Legacy) ”.

  2. Seleccione “Query by gene” y dentro de esa opción “Mutations” y “Putative copy-number alterations from GISTIC” y escriba “KRAS” en el sector “Enter Gene Set”, haga click en “Submit Query”. ¿Qué información obtiene? Utilice una captura de pantalla del OncoPrint, para explicarlo.

  3. ¿Cuál es la mutación en KRAS más frecuente?

  4. Apriete en “modify query” y agregue a la búsqueda “KRAS” y “TP53” en el sector “Enter Gene Set”, haga click en “Submit Query”. ¿Qué información obtiene? ¿Diría que hay una correlación significativa entre las alteraciones entre estos 2 genes? (AYUDA: Haga click en la solapa “Mutual Exclusivity”)

  5. ¿Cree que KRAS es un gen relevante en la progresión en cáncer colorrectal? Repita la búsqueda de KRAS, pero en el set de datos correspondiente a cáncer de próstata (TCGA, Firehose Legacy). ¿Cree que KRAS es igual de relevante en este tipo de cáncer?

  6. Si Ud. fuera a publicar algo que incluya lo hallado en cBioPortal para KRAS ¿Cómo debería citarlo?

Bibliografía:

Previous
Next