Datos de la vida real

Se define el concepto de Datos de la vida real (Real World Data, RWD) en el ámbito de la salud como los datos derivados de fuentes asociadas con los resultados de una población heterogénea de pacientes en situaciones del mundo real.

El análisis de dichos datos puede generar evidencia en el mundo real (Real World Evidence = RWE) que, a su vez, puede revelar percepciones significativas sobre necesidades insatisfechas, vías de intervención e impacto clínico y económico en los pacientes y en los sistemas de salud.

rwdESP

Una definición alternativa permite unir principio y final: RWD se define como los datos que se recogen fuera de las restricciones controladas de los ensayos clínicos aleatorizados (ECA), con el fin de poder evaluar lo que realmente está sucediendo en la práctica clínica normal.

El ámbito de la Farmaco-economía es el que ha tomado más empuje en el uso de RWD. Para el estudio de los fármacos, en su camino previo a la comercialización, los ensayos clínicos aleatorizados son el método de referencia, pero la generalización de los resultados obtenidos presenta limitaciones relacionadas con:

  • Heterogeneidad en la respuesta al fármaco
  • Variabilidad en la adherencia a los tratamientos
  • Uso del medicamento en poblaciones / pacientes diferentes

Así, los RWD constituyen un complemento muy importante a los resultados de los ensayos clínicos y su análisis, la RWE, puede informar sobre la efectividad y la seguridad de las intervenciones sanitarias en los pacientes e identificar con precisión la relación riesgo-beneficio, demostrar eficazmente el valor del producto para su evaluación económica y maximizar el retorno de la inversión, y por lo tanto, cada vez más es un instrumento deseado por quienes han de tomar decisiones en los distintos niveles sanitarios, desde la clínica hasta el gobierno.

Los beneficios de la utilización del RWD son (García, J.L. et al, 2014):

  • Estimaciones de la efectividad en escenarios clínicos diferentes
  • Comparación con alternativas de investigación o estrategias clínicas para informar de operaciones terapéuticas óptimas, más allá del uso del placebo como comparador
  • Estimación de los riesgos y beneficios de una nueva intervención, incluyendo beneficios y daños a largo plazo.
  • Obtención de resultados clínicos en una población diversa que refleja el rango y la distribución de los pacientes observados en la práctica clínica.
  • Resultados obtenidos desde una perspectiva más amplia que en los ECA tradicionales (resultados informados por los pacientes, calidad de vida y síntomas)
  • Datos utilizables para el cálculo de los costes de los servicios de salud y evaluación económica
  • Información sobre la aplicación y prescripción de los productos en la práctica clínica y sobre la adherencia a los mismos
  • Datos en situaciones en las que no es posible llevar a cabo un ECA
  • Justificación de la recolección de datos en más de una sede

De donde proviene la información

Los Datos de la Vida Real se recogen fundamentalmente a partir de:

  1. Estudios observacionales de registro de enfermedades y tratamientos* (también llamados “estudios naturalistas”)
  2. Datos provenientes de historias clínicas electrónicas
  3. Encuestas de salud
  4. Ensayos clínicos pragmáticos**
  5. Registros de pacientes y datos administrativos de rutina
  6. Medidas de morbilidad y mortalidad y otros resultados clínicos
  7. Guías de prescripción y tratamiento
  8. Historia natural de la progresión de enfermedades
  9. Experiencia del paciente
  10. Estudios de seguridad
  11. Estudios sobre la calidad de vida relacionada con la salud (CVRS)

*     Incluyen Estudios Post-autorización de tipo observacional (EPA)

** Ensayo clínico realizado en un número elevado de pacientes de características más o menos comunes para valorar la eficacia de un tratamiento de forma similar a como se utilizará en la práctica clínica.

Datos que, a su vez, forman parte de un conjunto de Big Data en el que se encuentran datos e información procedente de:

  • Transacciones
  • Datos de registros
  • Eventos
  • e-mails
  • Medios sociales, sitios web, redes sociales, aplicaciones de telefonía móvil
  • Sensores y tecnologías vestibles (wearable technologies)
  • Feeds externos (canales web o fuente web o información web)
  • RFID (Identificación por radiofrecuencia) o datos POS (Punto de venta)
  • Datos geoespaciales
  • Datos (biométricos) de registro digital, audio, imágenes y vídeo

La utilización del Big Data requiere la adquisición de competencias analíticas en diversos campos de conocimiento como la epidemiología, las metodologías de investigación, la informática de la salud, la economía de la salud, la medida de los resultados de los pacientes (Patient Reported Outcome Measures PROMs), etc.

Y en cada una de estas disciplinas, el uso de herramientas de análisis como minería de datos, visualización de datos, modelado predictivo, simulación, análisis de flujo, así como la capacidad de analizar texto en lenguaje natural y trabajar con datos no estructurados.

Las 5 V’s del Big Data

Las 5 características principales del Big Data de conocen como las ‘5 vs’ (volumen, velocidad, variedad, veracidad y valorización).

La característica principal que define Big Data es la gran cantidad de volumen de información que maneja (Ishwarappa, 2015). En la actualidad, cuando se habla de bases de datos masivas se refiere a magnitudes del orden de petabytes (1015 bytes) o exabytes (1018 bytes).

Otra de las características esenciales de Big Data es la enorme velocidad en la generación, recogida y proceso de la información. Por otro lado, la capacidad de análisis de dichos datos ha de ser muy veloz reduciendo los tiempos de procesamiento que presentaban las herramientas tradicionales de análisis.

La tercera de las “v” que explica Big Data es la elevada capacidad de agregar información procedente de una amplia variedad de fuentes de información independientes, como redes sociales, sensores, máquinas o personas individuales. Son tantas que se precisan las nuevas tecnologías para analizar este tipo de datos con el fin de obtener una ventaja competitiva. En este sentido, los sistemas Big Data permiten la integración de datos de origen cuantitativo naturalmente desestructurados, así como gráficos, texto, sonido o imágenes.

El Big Data ha de ser capaz de tratar y analizar inteligentemente el gran volumen de datos con la finalidad de obtener una información verídica y útil que nos permita mejorar nuestra toma de decisiones. El Big Data exige no solo que los datos sean muchos, analizados y aprovechados a gran velocidad, de diversas fuentes, sino que estos sean veraces y, por ello, confiables.

La valorización consiste en la creación de una ventaja competitiva distintiva que presupone una buena comprensión de las expectativas y necesidades del cliente. Para ello se deben identificar y procesar los datos claves, permitiendo así:

  • Monetizar los datos.
  • Obtener nuevos clientes.
  • Generar fidelidad.
  • Reducir costes.
  • Mejorar la imagen de marca.

Ejemplos

Un buen ejemplo de esta aplicación es el programa Mini-sentinel de la Agencia de Medicamentos de Estados Unidos. Este programa ha permitido detectar mediante la aplicación de algoritmos a grandes bases de datos con información, a veces no estructurada y procedente del mundo real, nuevas interacciones, efectos adversos de medicamentos y otros problemas de seguridad que han llevado finalmente a la retirada de fármacos o la modificación de sus indicaciones.

El Instituto de Ingeniería del Conocimiento (IIC) ha participado en XX Congreso Nacional de Informática de la Salud, Inforsalud 2017, con la presentación del innovador proyecto “Visión integrada de traumatología en relación a la lista de espera de sustitución de rodilla”, en el que participan expertos del propio IIC junto con expertos del Servicio de Salud de Castilla-La Mancha (SESCAM). Este proyecto utiliza la información recogida por los sistemas informáticos del SESCAM, tanto de Atención Primaria como Especializada. Se ha utilizado una metodología estándar para proyectos de Big Data y Machine Learning, por medio de cinco pasos:

  1. Especificación de requisitos, datos asociados y criterios a seguir para su validación.
  2. Revisión del estado del arte y de proyectos anteriores relacionados.
  3. Recopilación de información de relevancia aportados por el SESCAM.
  4. Construcción de modelos
  5. Análisis de los resultados para elegir los mejores modelos.

Se han aplicado técnicas de analítica descriptiva y predictiva, así como procesamiento de Lenguaje Natural sobre los textos de la historia clínica informatizada.

El Departamento de Salud de la Generalitat de Cataluña puso en marcha el programa PADRIS, un programa público para hacer más y mejor investigación con la reutilización de los datos.

El PADRIS (Programa públic d’Analítica de Dades per a la Recerca i la Innovació en salut) será gestionado por la Agencia de Calidad y Evaluación Sanitarias de Cataluña (AQuAS) del Departamento de Salud. El nuevo programa quiere contribuir a mejorar el posicionamiento internacional de Cataluña en investigación científica, sumándose al Plan estratégico de innovación e investigación en salud (PERIS) para potenciar la investigación en salud orientada a las personas.

La reutilización y cruce de los datos masivos sanitarios podrá facilitar estudios como, por ejemplo, el seguimiento y la vigilancia de fármacos, dispositivos o implantes médicos de reciente introducción, la detección de interacciones y efectos adversos que los estudios clínicos habituales no hayan puesto de manifiesto, desarrollar estudios de efectividad comparada, seguimiento de cohortes de pacientes o ampliar el conocimiento sobre las enfermedades minoritarias.

 

Si queréis saber más…

 

García López, J.L. et al. (2014) Aportación de los “Real World Data (RWD)” a la mejora de la práctica clínica y del consumo de  recursos de los pacientes. Edición: Fundación Gaspar Casal.

http://fgcasal.org/publicaciones/Libro_RWD.pdf

IBM Global Services (2013) Analítica de datos: El uso en el mundo real de Big Data en sanidad y ciencias de la vida. Cómo las organizaciones más innovadoras en sanidad y ciencias de la salud extraen valor de datos inciertos.

https://www-935.ibm.com/services/multimedia/es_ES_files_AnaDatos.pdf

Del Llano, J.E. et al. (Ed) (2016) Datos de la vida real en el Sistema Sanitario Español. Edición: Fundación Gaspar Casal.

http://www.fgcasal.org/publicaciones/Datos_de_la_vida_real_SSE_2016.pdf

Olshannikova et al. (2017) Conceptualizing Big Social Data. Journal of Big Data 2017, 4:3.

https://journalofbigdata.springeropen.com/articles/10.1186/s40537-017-0063-x

BDV (Big Data Value Association) TF7 Healthcare Group (2016) Big Data Technologies in Healthcare. Needs, opportunities and challenges. 12/21/2016.

http://www.bdva.eu/sites/default/files/Big%20Data%20Technologies%20in%20Healthcare.pdf

Henke, N. et al. (2016) The Age of Analytics: Competing in a Data-driven world. McKinsey Global Institute. December 2016.

http://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/the-age-of-analytics-competing-in-a-data-driven-world

Ishwarappa y Anuradha, J. (2015) A Brief Introduction on Big Data 5Vs Characteristics and Hadoop Technology. International Conference on Intelligent Computing, Communication & Convergence. Procedia Computer Science 48 (2015).

https://ac.els-cdn.com/S1877050915006973/1-s2.0-S1877050915006973-main.pdf?_tid=b51745d0-a29b-11e7-8810-00000aab0f02&acdnat=1506417710_0258a868cd039cdfff1f5b12af046c91

 

Otras páginas web de interés en el tema:

http://www.fgcasal.org/DVRSSE2016/DVRSSE2016_Arraiza.pdf