PRACTICA_FFDD_GIS
PRACTICA_FFDD_GIS copied to clipboard
Repositorio en el que se desarrollará el código de las prácticas de la asignatura "Fuentes de Datos Biomédicos y Web Semántica", del Grado en Ingeniería de la Salud de la UBU.
PRACTICAS "Fuentes de Datos Biomédicos" 
Repositorio en el que se desarrollará el código de las prácticas de la asignatura "Fuentes de Datos Biomédicos y Web Semánticas", del grado de Ingeniería de la Salud, de la Universidad de Burgos.
Más información en la página del curso y a lo largo de las secciones de este README.
Seminarios
La idea detrás de los seminarios busca fortalecer el uso de fuentes biomédicas y su acceso, preprocesamiento y visualización usando herramientas analíticas, como R, para dilucidar el efecto de estresores ambientales sobre la salud humana (Biometereología Humana). Puedes ver más ejemplos en el MCC Collaborative Research Network.
Algunas publicaciones de biometereología humana recientes y/o interesantes, incluyen:
- 2025. Rui et al. Precipitation and diarrhea morbidity.
- 2025. Wu et al. Urban heat-related mortality burden due to greenness.
- 2025. Mercat et al. Green cities and the risk for vector-borne disease.
- 2024. Xu et al. Mortality attributable to air pollution from landscape fires.
A modo de ejemplo, os dejo unos enlaces a algunos seminarios previos que han sido bien (o muy bien) evaluados en la siguiente sección Hall of Fame - Seminarios
Estructura del Seminario
La entrega se basa en dos archivos y un repostorio que se solicitarán como mecanismo de evaluación del tercer control parcial (evaluación contínua). Los archivos que tendréis que entregar son:
- i) Archivo RMarkdown (Cuaderno de R) que contendrá tanto el texto como el código empleado en el seminario. Es de extensión
.Rmd, - ii) Archivo HyperText Markup Language (HTML), de extensión
.htmlque contendrá el seminario renderizado, es decir se unirá tanto el texto como el código y sus resultados (i.e. tablas, figuras, etc.) y - iii) La dirección
urldel repositorio en github donde habéis desarrollado el seminario.
La estructura del seminario contará con los identificadores básicos del seminario como es el título, los autores y curso al que corresponde y con los siguientes apartados específicos:
- Introducción: contextualiza la idea del seminario, entrega una idea general de la temática, de lo que se sabe y sobre todo de lo que no se sabe y queréis abordar en vuestro trabajo.
- Objetivo general: en una frase un objetivo claro y general que muestre muy claramente la relación entre variables que váis a buscar/relacionar.
- Objetivos específicos: tres o cuatro preguntas específicas que permiten responder el objetivo general. Normalmente, se corresponden con la descripción y caracterización (espacial, temporal, etc.) de las variables de interés con las que se trabaja en el seminario y por una o dos preguntas en las que la relación y/o correlación entre estas variables se llevará a cabo (ojo la falta de relación y/o correlación también es un resultado admisible en este seminario).
- Metodología y Resultados: para cada objetivo específico se entregará el código y las representaciones necesarias (tablas, figuras, etc) que permitan responder al objetivo específico en cuestión.
- Conclusiones generales: podréis generar conocimiento nuevo con vuestro seminario y es en este apartado donde váis a detallarlo de manera concisa y reconiendo sus limitaciones.
- Referencias: listado de las referencias utilizadas en el seminario (intentad que sean en formato APA) que os permitirán escribir la introducción y ver lo importante o no de vuestras conclusiones generales.
Baremo de Calificación
Para la entrega, deberéis fijaros en:
- i) como luce el repositorio,
- ii) cómo luce el readme o "landing page",
- iii) cómo luce la estructura de archivos y carpetas dentro del repositorio y
- iv) descargar y abrir (por fuera de github) el documento *.html que han desarrollado para ver bien cómo han resuelto este seminario.
Hall of Fame - Seminarios
Edición 2024-2025
Edición 2023-2024
- Necesidad de Atención Psicológica (NAT) en España
- Análisis estadístico sobre relación entre sedentarismo y uso de audífonos/gafas
Edición 2022-2023
- Suicidios, desigualdad económica e inaccesibilidad a servicios sanitarios
- Relación entre Paro y Suicidio
Edición 2021-2022
- Actividad Fisica, Zonas Verdes y Salud Mental
- Cambio climático y enfermedades cardiovasculares
- Suicidio, clima y desarrollo global
- Inaccesibilidad-sanitaria-y-efectos-en-salud
Recursos para R , Tidyverse y Fuentes de Datos
Repositorios oficiales de R
Programación
- R for Data Science
- R Para Ciencia de Datos
- R4ULPGC: Introducción a R
- Fundamentos de ciencia de datos con R
- Recetas - Posit Recipes
- R Programming for Data Science
- R Avanzado
- Advanced R
- fasteR: Fast Lane to Learning R!
- Big Book of R
- The tidyverse style guide
Datos Semi-estructurados en R
Trabajando con datos JSON en R
- jsonlite: A Simple and Robust JSON Parser and Generator for R
- tidyjson: Tidy Complex 'JSON'
- Working with JSON Data
- Processing JSON data
- Nested data: JSON to tibble
- Pinging an API & Creating JSON in R
- Working with Nested JSON in R
- Converting Nested JSON to DataFrame in R?
- Easily parsing JSON in R with jsonlite and purrr
- Converting nested JSON to a tidy data frame with R
OMOP Common Data Model
Trabajando con OMOP Data en R
- OHDSI - Observational Health Data Sciences and Informatics
- OMOP Common Data Model
- Tidy R programming with the OMOP Common Data Model
- CDMConnector: Connect to an OMOP Common Data Model
- CommonDataModel: OMOP CDM DDL and Documentation Generator
- OmopSketch - OMOP and Common Data Model
- CohortSurvival - survival data using the OMOP common data model
Large Language Models (LLM - Generative AI)
Recursos para R
- Herramientas para usar modelos de lenguaje de gran escala (LLM) en R
- How to create your own RAG applications in R
- Ingeniería de prompt con ChatGPT
- Biblioteca de prompts educativos
- Claude - AI
- Using Claude Code to write R code
Artículos Científicos
- 2024 The use of generative AI for coding in academia
- 2024 Harnessing LLM for coding, teaching and inclusion to empower research
Control de Versiones (R/RStudio and Git/Github)
- Map-of-Github
- Cómo usar Git/GitHub con R
- ¡Se puede aprender cómo funciona Git y GitHub!
- git - la guía sencilla
- Chapter 4 Git, in:Reproducible Analytical Pipelines
- Connect RStudio to Git and GitHub
- Happy Git and GitHub for the useR
- Github actions with R
- Cómo vincular y usar Git con RStudio
- Git y GitHub con R
- Ciencia reproducible: qué, por qué, cómo
Communicación
Gráficos
- The R Graph Gallery
- Colores en R
- ggplot2: Elegant Graphics for Data Analysis
- ggplot2 extensions
- esquisse
- esquisse - APP
- ggplot2 styling
- awesome-r-dataviz
- R Graphics Cookbook
- FlowChart. Tidy Flowchart Generator
- ggdiagram
- accidental aRt
- aRtsy: Generative Art with R and ggplot2
Documentos
- Introducción al uso de RMarkdown
- Informes con R Markdown - Capítulo
- Introducción a RMarkdown - PPT
- R markdown para abogados
- Cómo crear Tablas de información en R Markdown
- R Markdown: The Definitive Guide
- R Markdown Cookbook
- The bookdown package
Aplicaciones (APPs)
- Shiny
bslibR package- Mastering Shiny
- shinydashboard
- shinyMobile: Mobile Ready 'shiny' Apps with Standalone Capabilities
- Shiny app that interacts with a database
- Sistema de Predicción de Calidad del Aire de Madrid
- Sistema de Predicción de Calidad del Aire de Madrid - GITHUB
Despliegue APPs/Dashboards/Docs.
- Despliegue en Posit Cloud
- Despliegue de aplicaciones Shiny
- Deploy a Shiny Application with R
- Publish a Quarto Document with R
- Deploy a LLM-powered Shiny for R
- Create a manifest.json file for Connect Cloud
Estadística y meta-análisis
- An Introduction to Statistical Learning
- Doing Meta-Analysis with R
- Modern Statistics with R
- Little Book of R for Biomedical Statistics!
- Modern Statistics for Modern Biology
Investigación Reproducible Pipelines
- Building reproducible analytical pipelines with R
- Building Reproducible Analytical Pipelines - Course
- Data Pipelines with {targets}
- Genomic reproducibility in the bioinformatics era
Ómicas y Salud
- The Epidemiologist R Handbook
- R for Epidemiology
- Reproducible Medical Research with R
- R for Health Data Science
- Sequence Analysis in R and Bioconductor
- Little Book of R for Bioinformatics
- CRAN Task View: Genomics, Proteomics, Metabolomics, Transcriptomics, and Other Omics
- Introduction to Bioinformatics and Computational Biology
Ontologías & R
- Gene Ontology overview
- autoGO: Auto-GO: Reproducible, Robust and High Quality Ontology Enrichment Visualizations
- DOPE: Drug Ontology Parsing Engine
- FAIRmaterials: Ontology Tools with Data FAIRification in Development
- ontologics: Code-Logics to Handle Ontologies
- ontologyIndex: Reading Ontologies into R
- ontologyPlot: Visualising Sets of Ontological Terms
- ontologySimilarity: Calculating Ontological Similarities
- stoRy: Download, Explore, and Analyze Literary Theme Ontology Data
Machine Learning & R
- The caret Package
- Tidy Modeling with R
- Applied Machine Learning Using mlr3 in R
- Models Demystified
- Sistema de Predicción de Calidad del Aire de Madrid - GITHUB
Formación
Comunidades
- R Consortium
- R Ladies
- R Ladies - GitHub
- R-Ladies Madrid
- R-Ladies Barcelona
- R-Ladies Bilbao (X.com)
- Comunidad R-Hispano
- NHS-R
Noticias
- R-Project
- R-Bloggers
- Revolutions
- II Congreso de R en España-Barcelona, 2023
- III Congreso & XIV Jornadas de Usuarios de R, Sevilla - 2024
Publicaciones científicas sobre este lenguaje
- 2025 Which programming language should I use? A guide for early-career researchers
- 2023 Expansion and evolution of the R programming language
- 2022 Ten simple rules for teaching yourself R
- 2018 R generation
- 2017 Evolution of the R software ecosystem: Metrics, relationships, and their impact on qualities
- 2014 Programming tools: Adventures with R
- 2013 The Evolution of the R Software Ecosystem
Fuentes de Datos Abiertos
- DATOS SINTÉTICOS: ¿QUÉ SON Y PARA QUÉ SE USAN?
- Datos sintéticos y protección de datos
- Datos abiertos Gob. España /
opendataes - Datos abiertos CyL /
opendataes - Redes de calidad del aire autonómicas y locales
- Calidad del Aire - Spain
- Calidad de Aire - JCyL
- Red Calidad Aire - JCyL
- Estaciones de control de la calidad del aire - JCyL
- Calidad del aire (por horas) - JCyL
- Datos espaciales de hospitales
- INE (Instituto Nacional de Estadística) package
- INE - Encuesta de morbilidad hospitalaria
- INE - Lista completa
- rOpenSpain community / GitHub-Repo
- Environmental information systems - Europe
- Air Quality download service - Europe
- European Environment Information and Observation Network
- European city air quality viewer
- Atmosphere Data Store - Copernicus
- GISCO is the Geographic Information System of the Commission
- giscoR package to retrieve data from GISCO
- Global Health Data Exchange /
ihme: an R package - MedDataSets
- medicaldata
- NHS-R Community Datasets
- Eurostat Portal.
- Eurostat R-Package.
- European Health Information Initiative (EHII)
- World Health Organization (WHO)
- World Health Organization - Health Observatory
- rOpenHealth
- European Environment Agency
- European Environment Agency - Datahub
- greenR: An R Package for Quantifying Urban Greenness
- CAMS European air quality reanalyses
- Water Quality ICM
- World Bank Water Data
- Datos Kaggle.
- Google Environmental Insights Explorer.
- European Cancer Information System
- infectiousR
- medicaldata: Data Package for Medical Datasets
- MedDataSets: Comprehensive Medical, Disease, Treatment, and Drug Datasets
- NHS-R Community Datasets
- gigs - Guidance for International Growth Standards project
- OncoDataSets
- crimedatasets
- DigestiveDataSets
- PulmoDataSets
- NeuroDataSets
- CardioDataSets
- DataSetsVerse
- UCI ML Repository
- Awesome Public Datasets
- U.S. Government's Open Data
- Earth Observation Data
- Google Data Search
- Open Data on AWS
- Kaggle
- OpenData CERN
Congresos y Concursos
- IV congreso & XV Jornadas de usuarios de R de Valencia (5-7 noviembre, 2025)
- Concurso de Visualización de Datos con R - 2025
- Data science & AI competitions
- Crowdsourcing AI
- KOPURU - IA de calidad y con propósito
- Kaggle - Competitions