DataGenomica

Medicina Traslacional
Proyecto de Tesis Magíster en Informática Médica

La génesis y el desarrollo de enfermedades de alto impacto como el cáncer y otras esta relacionado a la disfunción de los genes. Es por ello que la secuenciación del genoma humano ha impactado la investigación del cáncer a nivel molecular.

Toda la investigación esta orientada a desarrollar la medicina traslacional, entendiendo esta como la transicion de la investigación básica hacia el tratamiento clínico del paciente.

genoma

Propuesta

Diseñar y evaluar un modelo de plataforma de integración de datos clínicos y genómicos para estudios en cáncer de mama.

En esta tesis se desarrollará una plataforma (DataGen) constituida por un modelo de base de datos y un conjunto de herramientas computacionales que permitan asociar la información clínica del paciente con la información genómica.

Datagen permitirá asociar la información clínica de un paciente con sus resultados genómicos y establecer relaciones entre el mutaciones de determinados genes y el fenotipo de la enfermedad en estudio.

Objetivos

• Definir la estructura de almacenamiento estandarizado de datos clínicos en cáncer: elementos comunes y específicos.
• Definir la estructura de almacenamiento de datos genómicos en base a archivos de secuencia Fastq.
• Diseño de la base de datos clínico-genómica: sistemas estructurados y documentales.
• Construir un modelo de sistema de almacenamiento integrado de datos clinicos y genómicos.
• Especificar requisitos de desarrollo de herramientas ETL (extracción, transformación y carga) sobre la base de datos clinico-genómica.

modelo

Modelo de datos

Para adaptarse a la naturaleza disímil de los datos consultados, la información se estudia almacenarla en un nuevo sistema de bases de datos híbrido, permitiendo tanto datos clínicos estructurados como datos genómicos de tipo documental.

• Establecer tipo de datos utilizando modelo json binario (jsonb)
• Flexibilidad para incorporar datos heterogéneos.
• Distribución de datos simple
• Map Reduce para grandes volúmenes de datos (Mongodb)

Se diseñará e implementará un conjunto de herramientas de software para permitir procesos de extracción, transformación y carga (ETL) de información sobre las bases de datos creadas y permitir consultas en línea mediante webservice.

Centros Asociados