Gan-based Data Augmentation for prediction improvement using gene expression data in cancer

Francisco J. Moreno-Barea, José M. Jerez, Leonardo Franco

International Conference on Computational Science, Springer•2022•Vol. : 28-42

Citas

234

Visualizaciones

N/A

Descargas

N/A

Altmetric Score

15/7/2022

Publicado

Autores

Fco. Javier Moreno-Barea
CorrespondenciaCorresp

Departamento de Lenguajes y Ciencias de la Computación, Escuela Técnica Superior de Ingeniería Informática, Universidad de Málaga, Málaga, Spain

José Jerez Aragonés

Departamento de Lenguajes y Ciencias de la Computación, Escuela Técnica Superior de Ingeniería Informática, Universidad de Málaga, Málaga, Spain

Leonardo Franco Ruiz

Departamento de Lenguajes y Ciencias de la Computación, Escuela Técnica Superior de Ingeniería Informática, Universidad de Málaga, Málaga, Spain

Resumen

Within the area of bioinformatics, Deep Learning (DL) models have shown exceptional results in applications in which histological images, scans and tomographies are used. However, when gene expression data are used, the performance often does not reach the expected results. The reason is that these datasets commonly have a high dimensionality and a low number of samples. To improve results in this type of data, Data Augmentation (DA) techniques can be used. DA techniques are methods that can generate synthetic samples from original data to increase the size of the dataset. In this work, three different DA techniques have been developed and tested on six different cancer datasets. Results show that DA techniques can improve classification results with significant improvements in sensitivity, specificity and F1-score when applied to cancer gene expression datasets.

Palabras Clave

Data Augmentation

Gene Expression

Bioinformatics

Deep Learning

CGAN

Acceso a la Publicación

Ver en Revista

Información de Publicación

Páginas

28-42

Publicado

15/7/2022

Métricas de Impacto

Citas14

Factor de Impacto0

Cuartil

TBD

Visualizaciones234

Gan-based Data Augmentation for prediction improvement using gene expression data in cancer

Fco. Javier Moreno-BareaCorrespondenciaCorresp

José Jerez Aragonés

Leonardo Franco Ruiz

Fco. Javier Moreno-Barea
CorrespondenciaCorresp