Dades de la vida real

Es defineix el concepte de Dades de la vida real (Real World Data, RWD) en l’àmbit de la salut com les dades derivades de fonts associades amb els resultats d’una població heterogènia de pacients en situacions del món real.

L’anàlisi d’aquestes dades pot generar evidència en el món real (Real World Evidence = RWE) que, al seu torn, pot revelar percepcions significatives sobre necessitats insatisfetes, vies d’intervenció i impacte clínic i econòmic en els pacients i en els sistemes de salut .

rwdCAT

Una definició alternativa permet unir principi i final: RWD es defineix com les dades que es recullen fora de les restriccions controlades dels assaigs clínics aleatoritzats (ACA), per tal de poder avaluar el que realment està succeint en la pràctica clínica normal.

L’àmbit de la Farmaco-economia és el que ha pres més empenta en l’ús de RWD. Per a l’estudi dels fàrmacs, en el seu camí previ a la comercialització, els assaigs clínics aleatoritzats són el mètode de referència, però la generalització dels resultats obtinguts presenta limitacions relacionades amb:

  • Heterogeneïtat en la resposta al fàrmac
  • Variabilitat en l’adherència als tractaments
  • Ús del medicament en poblacions / pacients diferents

Així, els RWD constitueixen un complement molt important als resultats dels assajos clínics i la seva anàlisi, la RWE, pot informar sobre l’efectivitat i la seguretat de les intervencions sanitàries en els pacients i identificar amb precisió la relació risc-benefici, demostrar eficaçment el valor del producte per a la seva avaluació econòmica i maximitzar el retorn de la inversió, i per tant, cada vegada més és un instrument desitjat pels qui han de prendre decisions en els diferents nivells sanitaris, des de la clínica fins al govern.

Els beneficis de la utilització del RWD són (García, J.L. et al, 2014):

  • Estimacions de l’efectivitat en escenaris clínics diferents
  • Comparació amb alternatives de recerca o estratègies clíniques per informar d’operacions terapèutiques òptimes, més enllà de l’ús del placebo com a comparador
  • Estimació dels riscos i beneficis d’una nova intervenció, incloent beneficis i danys a llarg termini.
  • Obtenció de resultats clínics en una població diversa que reflecteix el rang i la distribució dels pacients observats en la pràctica clínica.
  • Resultats obtinguts des d’una perspectiva més àmplia que en els ACA tradicionals (resultats informats pels pacients, qualitat de vida i símptomes)
  • Dades utilitzables per al càlcul dels costos dels serveis de salut i avaluació econòmica
  • Informació sobre l’aplicació i prescripció dels productes en la pràctica clínica i sobre l’adherència als mateixos
  • Dades en situacions en què no és possible dur a terme un ACA
  • Justificació de la recol·lecció de dades en més d’una seu

D’on prové la informació

Les Dades de la Vida Real es recullen fonamentalment a partir de:

  1. Estudis observacionals de registre de malalties i tractaments * (també anomenats “estudis naturalistes”)
  2. Dades provinents d’històries clíniques electròniques
  3. Enquestes de salut
  4. Assaigs clínics pragmàtics **
  5. Registres de pacients i dades administratives de rutina
  6. Mesures de morbiditat i mortalitat i altres resultats clínics
  7. Guies de prescripció i tractament
  8. Història natural de la progressió de malalties
  9. Experiència del pacient
  10. Estudis de seguretat
  11. Estudis sobre la qualitat de vida relacionada amb la salut (QVRS)

*     Inclouen Estudis Post-autorització de tipus observacional (EPA)
** Assaig clínic realitzat en un nombre elevat de pacients de característiques més o menys comunes per valorar l’eficàcia d’un tractament de forma similar a com es farà servir en la pràctica clínica.

Dades que, al seu torn, formen part d’un conjunt de Big Data en què es troben dades i informació procedent de:

  • Transaccions
  • Dades de registres
  • Esdeveniments
  • e-mails
  • Mitjans socials, llocs web, xarxes socials, aplicacions de telefonia mòbil
  • Sensors i tecnologies vestibles (wearable technologies)
  • Feeds externs (canals web o font web o informació web)
  • RFID (Identificació per radiofreqüència) o dades POS (Punt de venda)
  • Dades geoespacials
  • Dades (biomètrics) de registre digital, àudio, imatges i vídeo

La utilització del Big Data requereix l’adquisició de competències analítiques en diversos camps de coneixement com l’epidemiologia, les metodologies d’investigació, la informàtica de la salut, l’economia de la salut, la mesura dels resultats dels pacients (Patient Reported Outcome Measures PROMs), etc.

I en cadascuna d’aquestes disciplines, l’ús d’eines d’anàlisi com mineria de dades, visualització de dades, modelatge predictiu, simulació, anàlisi de flux, així com la capacitat d’analitzar text en llenguatge natural i treballar amb dades no estructurats.

Les 5 V s del Big Data

Les 5 característiques principals del Big Data de coneixen com les ‘5 vs’ (volum, velocitat, varietat, veracitat i valorització).

La característica principal que defineix Big Data és la gran quantitat de volum d’informació que fa servir (Ishwarappa, 2015). En l’actualitat, quan es parla de bases de dades massives es refereix a magnituds de l’ordre de petabytes (1015 bytes) o exabytes (1018 bytes).

Una altra de les característiques essencials de Big Data és l’enorme velocitat en la generació, recollida i procés de la informació. D’altra banda, la capacitat d’anàlisi d’aquestes dades ha de ser molt veloç reduint els temps de processament que presentaven les eines tradicionals d’anàlisi.

La tercera de les “v” que explica Big Data és l’elevada capacitat d’agregar informació procedent d’una àmplia varietat de fonts d’informació independents, com xarxes socials, sensors, màquines o persones individuals. Són tantes que es precisen les noves tecnologies per analitzar aquest tipus de dades per tal d’obtenir un avantatge competitiu. En aquest sentit, els sistemes Big Data permeten la integració de dades d’origen quantitatiu naturalment desestructurats, així com gràfics, text, so o imatges.

El Big Data ha de ser capaç de tractar i analitzar intel·ligentment el gran volum de dades amb la finalitat d’obtenir una informació verídica i útil que ens permeti millorar la nostra presa de decisions. El Big Data exigeix ​​no només que les dades siguin molts, analitzats i aprofitats a gran velocitat, de diverses fonts, sinó que aquests siguin veraces i, per això, fiables.

La valorització consisteix en la creació d’un avantatge competitiu distintiva que pressuposa una bona comprensió de les expectatives i necessitats del client. Per a això s’han d’identificar i processar les dades claus, permetent així:

  • Monetizar les dades
  • Obtenir nous clients
  • Generar fidelitat
  • Reduir costos
  • Millorar la imatge de marca

Exemples

Un bon exemple d’aquesta aplicació és el programa Mini-sentinel de l’Agència de Medicaments d’Estats Units. Aquest programa ha permès detectar mitjançant l’aplicació d’algoritmes a grans bases de dades amb informació, de vegades no estructurada i procedent del món real, noves interaccions, efectes adversos de medicaments i altres problemes de seguretat que han portat finalment a la retirada de fàrmacs o la modificació de les seves indicacions.

L’Institut d’Enginyeria del Coneixement (IIC) ha participat en XX Congrés Nacional d’Informàtica de la Salut, Inforsalud 2017, amb la presentació de l’innovador projecte “Visió integrada de traumatologia en relació a la llista d’espera de substitució de genoll”, al que participen experts del propi IIC juntament amb experts del Servei de Salut de Castella-la Manxa (SESCAM). Aquest projecte utilitza la informació recollida pels sistemes informàtics del SESCAM, tant d’Atenció Primària com Especialitzada. S’ha utilitzat una metodologia estàndard per a projectes de Big Data i Machine Learning, per mitjà de cinc passos:

  1. Especificació de requisits, dades associades i criteris a seguir per a la seva validació
  2. Revisió de l’estat de l’art i de projectes anteriors relacionats
  3. Recull d’informació de rellevància aportats pel SESCAM
  4. Construcció de models
  5. Anàlisi dels resultats per triar els millors models

S’han aplicat tècniques d’analítica descriptiva i predictiva, així com processament de Llenguatge Natural sobre els textos de la història clínica informatitzada.

El Departament de Salut de la Generalitat de Catalunya  va posar en marxa el programa PADRIS, un programa públic per fer més i millor investigació amb la reutilització de les dades.

El PADRIS (Programa públic d’Analítica de Dades per a la Recerca i la Innovació en salut) serà gestionat per l’Agència de Qualitat i Avaluació Sanitàries de Catalunya (AQuAS) del Departament de Salut. El nou programa vol contribuir a millorar el posicionament internacional de Catalunya en recerca científica, sumant-se al Pla estratègic d’innovació i recerca en salut (PERIS) per potenciar la recerca en salut orientada a les persones.

La reutilització i encreuament de les dades massius sanitaris pot facilitar estudis com, per exemple, el seguiment i la vigilància de fàrmacs, dispositius o implants mèdics de recent introducció, la detecció d’interaccions i efectes adversos que els estudis clínics habituals no hagin posat de manifest , desenvolupar estudis d’efectivitat comparada, seguiment de cohorts de pacients o ampliar el coneixement sobre les malalties minoritàries.

 

Si en voleu saber una mica més …

 

García López, J.L. et al. (2014) Aportación de los “Real World Data (RWD)” a la mejora de la práctica clínica y del consumo de  recursos de los pacientes. Edición: Fundación Gaspar Casal.

http://fgcasal.org/publicaciones/Libro_RWD.pdf

IBM Global Services (2013) Analítica de datos: El uso en el mundo real de Big Data en sanidad y ciencias de la vida. Cómo las organizaciones más innovadoras en sanidad y ciencias de la salud extraen valor de datos inciertos.

https://www-935.ibm.com/services/multimedia/es_ES_files_AnaDatos.pdf

Del Llano, J.E. et al. (Ed) (2016) Datos de la vida real en el Sistema Sanitario Español. Edición: Fundación Gaspar Casal.

http://www.fgcasal.org/publicaciones/Datos_de_la_vida_real_SSE_2016.pdf

Olshannikova et al. (2017) Conceptualizing Big Social Data. Journal of Big Data 2017, 4:3.

https://journalofbigdata.springeropen.com/articles/10.1186/s40537-017-0063-x

BDV (Big Data Value Association) TF7 Healthcare Group (2016) Big Data Technologies in Healthcare. Needs, opportunities and challenges. 12/21/2016.

http://www.bdva.eu/sites/default/files/Big%20Data%20Technologies%20in%20Healthcare.pdf

Henke, N. et al. (2016) The Age of Analytics: Competing in a Data-driven world. McKinsey Global Institute. December 2016.

http://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/the-age-of-analytics-competing-in-a-data-driven-world

Ishwarappa y Anuradha, J. (2015) A Brief Introduction on Big Data 5Vs Characteristics and Hadoop Technology. International Conference on Intelligent Computing, Communication & Convergence. Procedia Computer Science 48 (2015).

https://ac.els-cdn.com/S1877050915006973/1-s2.0-S1877050915006973-main.pdf?_tid=b51745d0-a29b-11e7-8810-00000aab0f02&acdnat=1506417710_0258a868cd039cdfff1f5b12af046c91

 

Altres pàgines web d’interès sobre el tema:

http://www.fgcasal.org/DVRSSE2016/DVRSSE2016_Arraiza.pdf