Anti-Deepfake On-Device
Modelo LCNN cuantificado INT8 realiza detección de vivacidad de voz localmente en la NPU embebida. Puntuación en tiempo real por fotograma. También funciona en llamadas no cifradas (Teams, Zoom, WhatsApp, telefonía tradicional).
Por qué on-device, no en la nube
Enviar la voz a un servicio en la nube para autenticación introduce 3 problemas: (1) transmites la señal que deseas proteger, (2) el proveedor puede analizar a su discreción, (3) latencia incompatible con una conversación natural. Q-AUDION resuelve los tres ejecutando la inferencia en la NPU del auricular.
- Ningún audio transmitido jamás
- Latencia <30ms por fotograma
- Cero dependencia de servicios externos
Entrenamiento en ASVspoof 2019
El modelo LCNN está entrenado en ASVspoof 2019 Logical Access, el conjunto de datos estándar para anti-spoofing de voz. Reconoce ataques de síntesis de voz, conversión de voz, reproducción. Validación EER <2%.
- Pipeline de entrenamiento PyTorch pública (para auditoría)
- Cuantificación INT8 para despliegue en NPU embebida
- Exportación de modelo ONNX → TFLite → formato propietario de NPU
Puntuación expuesta vía GATT
Para cada fotograma de audio remoto, la puntuación 0-100 (probabilidad de que sea voz sintética) se expone al teléfono a través de una característica GATT personalizada. La aplicación muestra una advertencia en la interfaz de usuario cuando la puntuación supera el umbral. Funciona universalmente en cualquier VoIP.
- UUID de característica GATT f2c0_xxxx_xxxx_xxxx
- Frecuencia de actualización: 50Hz
- Umbral configurable a través de la política de Sovereign Server