Control Mioeléctrico Multi-DOF mediante
ML Incremental
Explora interactivamente la arquitectura de datos, el rigor del procesamiento de señales biológicas y el diseño de partición causal para evitar el Concept Drift en prótesis.
■ Fase 1: Acondicionamiento y Curaduría (Data)
Causalidad Fisiológica
La señal biológica siempre precede a la acción mecánica. Las etiquetas visuales del dataset son defectuosas por defecto debido al tiempo de reacción humana. Deben alinearse al onset muscular.
Drift Bias Inevitable
El cuerpo no es estático. El sudor, la fatiga y el movimiento de electrodos cambian la varianza. El concept drift no es un "error de lectura" a limpiar, es la naturaleza del sistema que debe ser modelada.
Desbalance Operacional
Las prótesis reales pasan el 90% del tiempo en reposo. Entrenar así sesga a la IA hacia la inacción. Se recorta la inactividad, pero preservando transiciones para no destruir la topología del movimiento.
Data Gravity (I/O)
El cuello de botella real en Machine Learning rara vez es la GPU, sino el disco leyendo archivos gigantes. Formatos binarios estructurados superan inmensamente a matrices planas en memoria.
Escepticismo del Sensor
Todo hardware tiene fallos silenciosos. El experto asume canales muertos o amplificadores saturados al tope (clipping). La limpieza matricial ocurre antes de ver cualquier métrica.
Importación NinaPro DB6 a Almacenamiento Local (Google Colab)
Proceso: Ingesta programática de conjuntos de datos biométricos masivos a entornos de cómputo en la nube. De la base de datos oficial (NinaPro DB6), se descargaron los archivos correspondientes a 10 sujetos de estudio, registrados a lo largo de 5 días en 2 sesiones por día.
Estos 100 archivos en formato .mat se comprimieron y se subieron mediante scripts (ej. wget o API de GDrive) a una carpeta de Google Drive, alcanzando un volumen aproximado de 32GB.
Propósito: Este proceso evita descargas manuales intermedias. Al comprimir los archivos y centralizarlos en Drive, pesan menos y son directamente accesibles por Google Colab, la plataforma donde se realizarán todos los procesos de limpieza, acondicionamiento, estructuración, modelamiento y entrenamiento. Esto asegura que la arquitectura de carpetas se instancie de forma idéntica, rápida y libre de errores en cada sesión efímera del contenedor.
Depuración de Canales Nulos (Remoción 9 y 10)
Proceso: Poda topológica algorítmica de canales ciegos. Se auditan las matrices de HD-sEMG buscando índices que no aportan señal útil (únicamente valores de cero durante toda la grabación). Específicamente para la base de datos NinaPro DB6, se descartaron las columnas correspondientes a los electrodos 9 y 10.
Ejemplo Práctico: Dejar un canal muerto permite que la red neuronal, por puro azar algorítmico, le asigne un peso alto. Al desplegar el modelo entrenado en una prótesis real donde ese canal sí funcione, las predicciones colapsarán drásticamente.
📑 Respaldo en la Literatura Científica
Detecting Domain Shifts in Myoelectric Activations: Challenges and Opportunities in Stream Learning
Sun, S., Dwivedi, A., et al. (2024)
"El primer paso en el flujo de trabajo de preprocesamiento es eliminar las columnas que contienen únicamente valores de cero durante toda la grabación. [...] Esto es muy relevante para la base de datos NinaPro DB6, ya que la columna 9 y la columna 10 contienen consistentemente lecturas de cero y no aportan ninguna señal útil para el análisis posterior, por lo que son descartadas."
Repeatability analysis of hand movement recognition for robotic hand prosthesis control based on sEMG data
Palermo, F. (2017)
"La variable emg consta de 16 columnas correspondientes a 14 electrodos reales, y precisa que dos columnas son iguales a 0 porque los electrodos 9 y 10 no se utilizan. De igual forma, en los datos del acelerómetro (acc) también hay columnas en cero que corresponden a estos mismos electrodos 9 y 10 ausentes."
Conversión a Formato Binario Optimizado (HDF5)
Proceso: Serialización jerárquica masiva. Transformar datos crudos .mat/.csv a formato binario HDF5 permite compresión y acceso por chunking. La RAM extrae solo pequeños lotes que necesita por época, resolviendo la barrera de latencia I/O.
⚙ Simulador: Manejo de Datos Tradicional vs HDF5
Haz clic en los archivos o nodos para simular cómo una IA extrae los datos de entrenamiento masivos.
⚠ Método Tradicional (Archivos Sueltos)
Directorio de OS (.mat / .csv)
/Proyecto/Datos_Crudos/
🗃 Método HDF5 (Árbol Interno)
Un solo archivo: ninapro_db6.h5
Script de Detección y Corrección de Anomalías
En nuestra investigación, adoptamos los principios fundamentales del estudio de Guo et al. para enfrentar el problema crítico de la inestabilidad en la calidad de la señal sEMG, la cual se ve frecuentemente afectada por la deriva de la línea base o el contacto deficiente entre el sensor y la piel. Implementamos una estrategia de reconstrucción topológica que permite reemplazar canales defectuosos por la media de sus electrodos adyacentes, aprovechando el fenómeno físico de conducción de volumen que asegura una alta correlación en la información capturada por sensores cercanos. Para optimizar este proceso, refinamos los criterios de detección propuestos en la literatura, como el Valor Cuadrático Medio y la correlación media, mediante el uso de un umbral dinámico basado en la varianza relativa que garantiza la integridad del sistema al aislar fallos específicos, como el identificado en el Canal 7, sin comprometer el desempeño global del reconocimiento de intención motora.
📑 Justificación Técnica según el Paper
Adaptive Online Decomposition of Surface EMG Using Progressive FastICA Peel-Off with Contaminated Channels Detection
Guo, Y., Zhang, X., et al. (2024)
Análisis de reconstrucción espacial y mitigación de artefactos mediante topología de electrodos adyacentes.
⚙ Simulador: Detección y Corrección Espacial (Atenuación)
Sustitución y atenuación de señales corruptas usando canales adyacentes.
1. Selecciona un Caso
2. Ejecución Pipeline
Pruebas de Estacionariedad (Deriva Inter-día)
Imagina que quieres medir la profundidad de un río. Si el río es un lago tranquilo y estacionario la profundidad que midas hoy será la misma mañana. Pero el músculo humano es un río caudaloso donde factores como el sudor la fatiga y el ligero movimiento de los sensores hacen que la electricidad muscular cambie sus reglas constantemente. El responsable de este problema es principalmente el fenómeno de deriva o concept drift y el desplazamiento del dominio. Si entrenamos a la inteligencia artificial con los datos del primer día para el tercer día los datos se habrán movido tanto que la red ya no los reconocerá provocando una caída drástica en el rendimiento del sistema.
Para medir este cambio las fuentes proponen someter la señal a un test de raíces unitarias llamado Augmented Dickey-Fuller. Tomamos la señal del primer día y la comparamos con los días sucesivos buscando un valor matemático que nos permita rechazar la hipótesis nula de que la señal es estable. Si el resultado del p-valor es mayor al margen de significancia confirmamos numéricamente que la media y la varianza de la electricidad del brazo han mutado. Implementamos estas pruebas para justificar la existencia del proyecto ya que queremos conocer la magnitud exacta de la deriva temporal antes de intentar arreglarlo. Esto nos da un sustento científico irrefutable demostrando que un modelo estático perderá casi una tercera parte de su capacidad en menos de veinticuatro horas. Al entender cómo muta la señal podemos diseñar estructuras de memoria que sepan exactamente cuándo el modelo debe olvidar lo viejo y aprender lo nuevo para que la prótesis nunca deje de responder.
📑 Herramientas: Las Fuentes de la Verdad
Detecting Domain Shifts in Myoelectric Activations: Challenges and Opportunities in Stream Learning
Yibin Sun, Nick Lim, et al.
Aporte: Esta fuente define matemáticamente el desplazamiento que ocurre entre sesiones (mañana vs. tarde) y entre días en la base de datos NinaPro DB6, utilizando técnicas como el análisis de componentes principales y detectores de deriva para resaltar estos cambios.
Analysis of the repeatability of grasp recognition for hand robotic prosthesis control based on sEMG data
Francesca Palermo, Matteo Cognolato, et al.
Aporte: Proporciona la base experimental (NinaPro DB6) y demuestra matemáticamente que la exactitud de una IA convencional disminuye, en promedio, un 27.03% cuando se prueba en una sesión distinta a la de entrenamiento.
Context-Informed Incremental Learning Improves Throughput and Reduces Drift
Evan Campbell, et al.
Aporte: Modela el impacto destructivo que el tiempo tiene sobre los modelos estáticos debido a la fatiga y el desplazamiento de electrodos, justificando por qué la adaptación incremental es la única forma de mantener la resiliencia del sistema.
⚙ Simulador: Pruebas de Estacionariedad (Test ADF)
Validación estadística de la Deriva Inter-día (Concept Drift) en señales sEMG.
1. Selección de Muestra
2. Análisis Matemático
H₀ (Nula): La serie muta temporalmente.
Si P-valor < 0.05, rechazamos H₀ → Estacionaria.
Si P-valor > 0.05, aceptamos H₀ → NO Estacionaria.
Esperando ingesta de tensores...
Mapeo Topológico: Covariate Shift
Imagina que entrenas a un arquero para darle siempre al centro de una diana azul donde el primer día el desempeño es perfecto pero al día siguiente alguien mueve la diana cinco centímetros a la derecha sin avisar provocando que el arquero falle a pesar de disparar al mismo lugar. En el análisis de señales electromiográficas esto se conoce como Covariate Shift o desplazamiento de covariables que ocurre cuando el usuario cree estar ejerciendo la misma fuerza pero para la computadora los números han migrado de lugar. Este fenómeno es causado principalmente por el reposicionamiento de los electrodos ya que al quitarse y ponerse la prótesis resulta imposible colocar los sensores en el microlugar exacto del día anterior alterando irreversiblemente la huella dactilar espacial de los músculos. Dado que contamos con catorce canales simultáneos y es imposible visualizar un gráfico de catorce dimensiones empleamos algoritmos de reducción de dimensionalidad como Kernel PCA o t-SNE que toman esta vasta información y la aplastan en un plano bidimensional. Al proyectar y dibujar los puntos correspondientes al mismo gesto en días distintos podemos observar nubes de puntos separadas si existe deriva mientras que el Análisis de Varianza nos proporciona la magnitud exacta de dicha separación. Realizamos todo este proceso para evidenciar visualmente la caducidad del modelo demostrando que una inteligencia artificial congelada dejará de funcionar inevitablemente porque el objetivo se movió de lugar. Simultáneamente este mapeo nos permite guiar la memoria de la inteligencia artificial incremental configurando cuánta plasticidad necesita el algoritmo para seguir a la diana sin perder la puntería y nos ayuda a validar la limpieza de los datos confirmando que si tras aplicar nuestros filtros las nubes de puntos se acercan el preprocesamiento está siendo efectivo.
📑 Herramientas: Las Fuentes de la Verdad
Detecting Domain Shifts in Myoelectric Activations: Challenges and Opportunities in Stream Learning
Sun, S., Dwivedi, A., et al. (2025)
Aporte: Define el uso de Kernel PCA con kernel de coseno para resaltar los desplazamientos entre sesiones. Explica cómo tratar cada franja de tiempo como un "dominio" distinto para observar su separación geométrica.
Analysis of the repeatability of grasp recognition for hand robotic prosthesis control based on sEMG data
Palermo, F., Cognolato, M., et al. (2017)
Aporte: Es la fuente base de NinaPro DB6. Documenta que la exactitud cae un 27.03% al cambiar de sesión porque las fronteras de decisión que aprendió la IA el primer día se vuelven obsoletas al moverse los electrodos.
Wavelet-based clustering para la discriminación de movimientos
Referencia: Basado en investigaciones de optimización de características (CMMM2014)
Aporte: Justifica el uso de mapas de clústeres (agrupaciones) para validar cómo las características musculares (como las Wavelets) forman grupos separados y cómo estos grupos se deforman o se alejan entre sí con el tiempo.
⚙ Simulador: Covariate Shift y Análisis de Varianza
Visualización interactiva de la divergencia del espacio de características (PCA) inter-sesión.
Evolución Temporal
Simula el paso de los días. Observa cómo mutan los clusters (nubes de puntos) respecto a la frontera de decisión estática (línea punteada).
Matemáticamente, la probabilidad de las características muta $P_1(X) \neq P_5(X)$, deformando el espacio topológico.
Calculando fronteras de decisión SVM (Estáticas)... Completado.
> Esperando transición temporal...
Sincronización Temporal (TKEO)
Proceso: Realineamiento cinemático-fisiológico usando el Operador de Energía Teager-Kaiser acoplado a un umbral CFAR. Corrige la latencia de reacción humana (donde la señal visual del software aparece ~300ms antes que el inicio real del músculo).
Entrada
sEMG Bruto + Etiqueta Retrasada (~300ms)
Cálculo TKEO
Ψ(xn) = xn² - xn-1xn+1
Salida
Relabeling Automático (Onset Real)
Balanceo con Preservación Temporal (Margin Truncation)
Proceso: Submuestreo causal. Los datasets tienen un exceso masivo de clase "0" (reposo). Eliminamos el grueso de esta inactividad, pero conservamos intencionalmente 1 segundo de margen antes y después de cada movimiento para preservar transiciones.
¿Re-etiquetar (Relabeling) o respetar la Verdad Terreno Visual? ▼
Pro TKEO (Fisiológico)
La etiqueta debe seguir al músculo. Las unidades motoras dictan la verdadera intención antes de que la cinemática reaccione.
Cinemático Clásico
Alterar etiquetas inyecta sesgo del investigador. Si el usuario quiere fuerza física inmediata, el modelo debe predecir la acción, no el inicio neural.
Consenso MEML2026: Se acepta TKEO para clasificación discreta (mejora convergencia), pero es peligroso en regresión simultánea compleja.
Limpieza Absoluta vs. Retención Orgánica de Ruido ▼
Señales Prístinas
Algoritmos clásicos como LDA colapsan si hay basura en los datos. Todo artefacto debe ser purgado en la ingesta.
Augmentation Natural
Un modelo purificado se sobreajusta. El ruido leve de movimiento y de sensores protege contra el colapso al usar la prótesis caminando.
Consenso MEML2026: Limpiamos ruido estático (50Hz), pero preservamos la estocasticidad menor para robustez de la IA.