Fundamentos
Portal de divulgación sobre Psicología Digital Predictiva
Mapa de la página
¿Qué es la Psicología Digital Predictiva?
Es el campo que integra psicología, ciencia de datos y computación para inferir rasgos, estados y conductas a partir de huellas digitales con fines de comprensión, predicción e intervención responsable.
Objetivos
- Describir y explicar fenómenos psicológicos en entornos digitales.
- Predecir resultados relevantes (bienestar, adherencia, aprendizaje).
- Coadyuvar en decisiones humanas (no reemplazarlas).
Principios
RigorÉticaPrivacidadUtilidadTransparencia
Ámbitos
Salud mental, educación, trabajo, marketing, ciudades inteligentes, seguridad digital, políticas públicas.
3+
Modalidades (texto, voz, imagen)
5
Fases del pipeline
8
Principios de gobernanza
Fundamentos teóricos
Pilares que sustentan el análisis psicológico en contextos digitales.
Psicometría moderna
- Validez y fiabilidad (α/ω, test–retest).
- IRT/Rasch y tests adaptativos.
- Equivalencia cultural/plataforma.
Lingüística computacional
- Léxico, sintaxis (POS), semántica (embeddings).
- Pragmática: tono, cortesía, intención, toxicidad.
Economía del comportamiento
- Heurísticos y sesgos.
- Nudges y elección responsable.
Interacción humano–computadora
- Diseño centrado en la persona y accesibilidad.
- Métricas de experiencia: dwell, esfuerzo, flujo.
Neurociencia y afecto
- FC/HRV/EDA y estrés/emoción.
- Carga, atención, fatiga.
Ética aplicada
- Autonomía, beneficencia, no maleficencia, justicia.
- Consentimiento informado significativo.
Datos digitales & señales
Qué datos se usan, cómo se transforman y con qué cautelas.
Fuentes habituales
- Texto: chats, foros, correos (anonimizados).
- Comportamiento: clics, scroll, pausas, rutas.
- Audio: prosodia, ritmo, pausas.
- Imagen/vídeo: expresiones faciales.
- Biometría pasiva: HRV, sueño, actividad.
Ingeniería de features
- Lingüísticos, temporales, de redes.
- Fusión multimodal.
Calidad de datos
- Representatividad y missingness.
- Normalización y balanceo.
- Anonimización y minimización.
Etiquetado y verdad-terreno
Profesionales y acuerdos (κ/α). Evitar proxy labels sin validación.
Métricas de calidad
Cobertura, latencia, frescura, estabilidad, trazabilidad.
Pipeline de análisis
1) Ingesta
APIs, lotes, streaming. Contratos de datos.
2) Preparación
Limpieza, anonimización, enriquecimiento, split estratificado.
3) Modelado
Regresión/logit, árboles, SVM, redes, LLMs.
4) Evaluación
Métricas, CV, análisis de errores, calibración.
5) Despliegue
Monitoreo, drift, versionado, rollback.
Modelado y evaluación
Modelos
- Clásicos: regresión, árboles, bosques, gradiente, SVM.
- Profundos: RNN/Transformers, CNN, multimodal.
- Híbridos: reglas + ML; few-shot con LLMs.
Validación
- k-fold y time series split.
- Externos y stress tests.
Métricas
| Tarea | Métricas clave | Notas |
|---|---|---|
| Clasificación | AUC, F1, sensibilidad, especificidad, MCC | PR en desbalance |
| Regresión | RMSE/MAE, R², MAPE | Residuos y heterocedasticidad |
| Calibración | Brier, ECE | Fiabilidad de probabilidades |
| Despliegue | Latencia, costo, SLO | Monitor de drift |
Interpretabilidad
Coeficientes, importancias, SHAP/ICE.
Robustez
Ruido, contrafácticos, pruebas de invariancia.
Calibración
Platt/Isotónica y subgrupos.
Explicabilidad, sesgos y equidad
Modelos útiles deben ser comprensibles y justos.
Fuentes de sesgo
- Muestreo, etiquetado, medición.
- Interacción y retroalimentación.
Auditorías
- Paridad, igualdad de oportunidades, equalized odds.
- Subgrupos e impacto.
Explicabilidad
- Global: SHAP, PDP/ICE.
- Local: contraejemplos y NLG.
Privacidad, seguridad y gobernanza
Privacidad por diseño
- Minimización, anonimización, masking.
- Consentimiento granular y revocable.
Técnicas avanzadas
- Aprendizaje federado y privacidad diferencial.
- HE/SMPC para colaboraciones.
Gobernanza
- Catálogo, riesgos, retención y borrado.
- Model/Data cards, comité ético, red teaming.
Casos de uso
Salud mental
Riesgo temprano, triage, adherencia digital.
Educación
Abandono, tutorización adaptativa, carga.
RR. HH.
Bienestar y prevención de burnout.
Finanzas
Fraude y educación financiera.
Marketing
Segmentación responsable y medición de experiencia.
Seguridad
Abuso y riesgo en comunidades con salvaguardas.
Qué evitar
- Inferencias sensibles sin consentimiento.
- Usos secundarios opacos.
- Correlaciones espurias.
Qué priorizar
- Valor para la persona.
- Transparencia y control.
- Evaluación continua.
Buenas prácticas
Checklist mínimo
- Propósito legítimo y proporcional.
- Datos adecuados y suficientes.
- Etiquetado fiable y acuerdos.
- Baselines comparables y documentación.
- Subgrupos y auditoría.
- Plan de salida y atención a quejas.
Equipo interdisciplinar
Psicología, datos, legal, UX, comunidades.
Comunicación
Lenguaje claro, límites del modelo, soporte.
Glosario esencial
Validez
Grado en que mide el constructo.
Fiabilidad
Estabilidad ante repeticiones.
Embeddings
Vectores de texto/imagen/audio.
Drift
Cambio de datos o relaciones.
SHAP
Contribución de variables.
Privacidad diferencial
Límite de filtrado individual.
Preguntas frecuentes
¿Puede un modelo “diagnosticar” trastornos?
No. Estima riesgo. No sustituye a profesionales.
¿Se necesitan grandes cantidades de datos?
No siempre. Calidad y validez primero.
¿Cómo gestionar sesgos?
Muestreo deliberado, auditorías y métricas de equidad.
¿Puedo usar LLMs?
Sí, con filtrado, anonimización y verificación humana.
Bibliografía sugerida
- Psicometría moderna y medición.
- ML para ciencias sociales y salud.
- Guías de ética en IA y protección de datos.
- Lingüística computacional y análisis multimodal.