ARQUITECTURA EN ESPERA DE PATENTE
Cuatro pilares de hardware diseñados para eliminar los vectores de interceptación de audio a nivel de OS.
End-to-End. Edge to Edge.
Voz de extremo a extremo
De edge a edge. El servidor es ciego.
Speaker A
Auricular · Secure Element
AES-GCM 256
ML-KEM-1024
BCrypto Relay
Solo ve tráfico opaco
AES-GCM 256
ML-KEM-1024
Speaker B
Auricular · Secure Element
Cifrado en el auricular
No en el teléfono. No en el servidor.
El relay solo reenvía
BCrypto no puede descifrar el tráfico que transporta.
Híbrido post-cuántico
ML-KEM-1024 + AES-GCM 256.
Las claves se negocian y desempaquetan dentro del secure element de los auriculares. El teléfono, la red y el BCrypto Relay solo ven ciphertext opaco.
Direct or relayed. Always blind.
See how the network mode is chosen automatically — and why the relay cannot read what it forwards. Deep dive
Arquitectura de red
P2P directo o relay de servidor. En ambos casos, el servidor es ciego.
Modo A
P2P Directo
Llamante
Peer
Cuando el NAT lo permite. Mínima latencia, mínimo coste.
Modo B
Modo Relay
Llamante
Peer
Cuando las redes bloquean el P2P. El relay solo reenvía ciphertext.
El servidor nunca posee las claves
Los endpoints derivan el secreto de sesión
ML-KEM-1024 + AES-GCM
Misma criptografía en ambos modos
Selección automática
Intenta P2P primero, recae con elegancia
El relay es un reenviador pasivo de paquetes. No puede leer, modificar ni reproducir el flujo de ciphertext — ni siquiera bajo coacción.
Core Technological Pillars
RUTA DE AUDIO VINCULADA AL HARDWARE
El controlador DMA transfiere el audio sin procesar de los micrófonos directamente a la SRAM segura a través de un bus aislado. Después del arranque seguro, los registros DMA están bloqueados para escritura: ningún malware, ni siquiera en el Anillo 0 del kernel, puede acceder a los datos de audio en claro o reconfigurar la ruta del controlador. Esto crea un límite de confianza físico matemáticamente independiente del estado de seguridad del dispositivo anfitrión.
MOTOR ANTI-DEEPFAKE EN EL DISPOSITIVO
Un motor de análisis residente en el TEE calcula en tiempo real un Índice de Confianza C utilizando el análisis espectral LFCC (detectando artefactos de vocoders neuronales por encima de 8 kHz), la coherencia respiratoria (detección de vitalidad) y la comparación de huellas de voz. Al ejecutar estos modelos neuronales completamente dentro del enclave seguro local, Q-AUDION garantiza una detección de latencia cero sin exponer datos de voz sensibles a servicios en la nube de terceros.
CRIPTOGRAFÍA SOBERANA ADAPTATIVA
Las claves de sesión combinan ML-KEM-1024 (estándar post-cuántico NIST) con una clave precompartida (PSK) residente en el hardware, inyectada exclusivamente a través de una interfaz física dedicada por el operador. La duración de la clave T es una función dinámica del Índice de Confianza C: cuando se detecta incluso una mínima anomalía acústica, el sistema activa automáticamente una secuencia de regeneración inmediata de las claves a través de la ruta PSK soberana. Toda la cadena Análisis de Presencia → Vocoder → Cifrado opera dentro de un presupuesto de latencia determinista inferior a 200 ms de extremo a extremo, cumpliendo los requisitos deterministas en tiempo real de las comunicaciones de voz tácticas.
RESISTENCIA AL ANÁLISIS DE TRÁFICO
A diferencia del VoIP cifrado basado en VBR, que sufre pérdidas de metadatos a través del análisis del tamaño de los paquetes, Q-AUDION impone un flujo de tasa de bits constante (CBR) estricto y temporizado por hardware. El relleno adaptativo criptográficamente seguro garantiza que cada paquete sea idéntico en tamaño y temporización, haciendo que los ataques de huella de tráfico sean computacionalmente prohibitivos incluso para actores estatales.
PROTECCIÓN SIEMPRE ACTIVA: EN CADA LLAMADA
El motor anti-deepfake y el análisis del Índice de Confianza C no requieren que la llamada esté cifrada para operar. La arquitectura hardware-bound de Q-AUDION separa físicamente la ruta de análisis de la ruta de cifrado: el TEE recibe el audio sin procesar del bus DMA independientemente de si el flujo de salida se cifra con ML-KEM-1024 o se transmite en claro a través de cualquier plataforma VoIP, aplicación de mensajería o red telefónica tradicional. En ambas ediciones —Estándar y Soberana— el motor calcula el Índice de Confianza C cada 20 ms, detecta artefactos de vocoders neuronales por encima de 8 kHz, evalúa la coherencia respiratoria y compara la huella de voz del interlocutor. El usuario recibe una advertencia discreta en tiempo real en caso de anomalía. Ningún dato de audio sale del chip seguro. Ningún servidor remoto está involucrado. Ninguna plataforma de llamada debe ser reemplazada o modificada.
ARQUITECTURA

SECUENCIA DE ARRANQUE SEGURO
RAÍZ DE CONFIANZA DE HARDWARE
El cargador de arranque seguro verifica la firma digital del kernel RTOS contra las claves fusionadas en la memoria OTP de hardware durante la fabricación.
BLOQUEO DE REGISTROS DMA
Después de la inicialización, la unidad de gestión de memoria bloquea los registros de direccionamiento DMA. Las rutas de audio están físicamente aisladas de los núcleos Cortex no seguros.
INICIO DEL ENTORNO TEE
El Trusted Execution Environment se inicializa con la asignación de SRAM cifrada, aislando el análisis biométrico y las operaciones criptográficas.
HANDSHAKE PQC+PSK
Las claves de sesión adaptativas se derivan utilizando ML-KEM-1024 y claves de hardware precompartidas para establecer el enlace ascendente soberano.
PREGUNTAS FRECUENTES TÉCNICAS
¿Cómo impide Q-AUDION la captura de audio pre-cifrado?
A diferencia de los auriculares Bluetooth estándar donde el sistema operativo móvil gestiona el controlador de audio, Q-AUDION dirige las señales de los micrófonos directamente a una SRAM segura interna a través de un bus I2S aislado. El dispositivo anfitrión solo recibe un flujo CBR cifrado. Incluso si el kernel del smartphone fuera comprometido por un spyware zero-click como Pegasus, no existiría un camino físico hacia los datos acústicos sin procesar y no cifrados.
¿Qué hace que ML-KEM sea resistente a los ataques cuánticos?
ML-KEM (Kyber) se basa en el problema reticular Module Learning with Errors (M-LWE), que se presume seguro contra algoritmos tanto clásicos como cuánticos. A diferencia de RSA y ECC, que el algoritmo de Shor puede violar, M-LWE sigue siendo matemáticamente inviable para las computadoras cuánticas criptográficamente relevantes (CRQC), garantizando la soberanía de los datos a largo plazo.
¿Qué es el Índice de Confianza C?
El Índice de Confianza C es una métrica dinámica calculada cada 20 ms por la NPU interna. Agrega el análisis espectral LFCC, la coherencia respiratoria y la entropía de la huella de voz. Si C cae por debajo de un umbral definido por el soberano —indicando una sospecha de inserción o manipulación de IA— el sistema activa el 'Re-keying adaptativo', rotando instantáneamente las claves de sesión a través de la ruta PSK de hardware.
¿Cómo funciona la detección de deepfakes en el dispositivo sin nube?
Q-AUDION cuenta con una NPU de bajo consumo optimizada para la inferencia de redes neuronales TinyML. Utiliza un modelo propietario entrenado para detectar artefactos sintéticos de vocoders y discontinuidades acústicas características de la conversión de voz por IA —incluidas las voces generadas por sistemas como ElevenLabs, RVC y arquitecturas de transformadores de voz. La ejecución se realiza completamente dentro del TEE local, eliminando la latencia y los riesgos de hombre en el medio de los servicios de IA basados en la nube. El motor está activo en cada llamada, independientemente de si la sesión está cifrada o no: la ruta DMA → TEE está arquitectónicamente separada del módulo criptográfico. Esto significa que la protección anti-deepfake funciona en cualquier plataforma —Teams, Zoom, WhatsApp, telefonía tradicional— sin que el usuario tenga que hacer nada y sin que ningún dato de audio salga nunca del chip seguro.
¿Por qué es importante la inyección de claves soberanas?
La Edición Soberana permite la inyección manual de claves soberanas ('Sovereign Key Injection') a través de una interfaz física air-gapped. Las agencias gubernamentales pueden inyectar su PSK maestra directamente en el enclave seguro del dispositivo. Esto garantiza que la comunicación permanezca cifrada con una clave poseída físicamente solo por la entidad soberana, no por el fabricante o terceros.
¿Cómo el bitrate constante (CBR) previene el análisis de tráfico?
El VoIP cifrado estándar utiliza el bitrate variable (VBR), que expone información a través de la temporización y el tamaño de los paquetes. Q-AUDION impone un flujo CBR estricto y temporizado por hardware con relleno adaptativo. Cada paquete es idéntico en tamaño y temporización, haciendo que el análisis de tráfico y los ataques de 'huella de tráfico (traffic fingerprinting)' por parte de adversarios sofisticados sean computacionalmente prohibitivos.
¿Cómo se establece la raíz de confianza de hardware?
Al encenderse, un cargador de arranque inmutable basado en ROM verifica la firma del firmware TEE. Una vez verificada, el hardware 'bloquea' los registros DMA, impidiendo que cualquier software —incluso un sistema operativo anfitrión malicioso con privilegios de root— reconfigure las rutas de audio o acceda a las áreas de memoria seguras donde residen las claves. Esto crea un límite de confianza de hardware persistente.
¿La Edición Soberana está protegida TEMPEST?
La Sovereign Edition está diseñada con blindaje PCB multicapa TEMPEST-ready y filtros de desacoplamiento RF. Esta arquitectura busca mitigar el riesgo de emanaciones comprometedoras en entornos SCIF y similares de alta seguridad. La evaluación TEMPEST independiente es un objetivo de hoja de ruta.
¿CÓMO FUNCIONA LA AUTENTICACIÓN DE VOZ 'VOICE-AS-KEY'?
Antes de iniciar cualquier sesión cifrada, Q-AUDION requiere que el operador pase una verificación biométrica de la huella de voz realizada completamente dentro del TEE de hardware sobre la señal de audio sin procesar. Esto impide el uso no autorizado del dispositivo incluso en caso de robo físico. El modelo de la huella de voz se almacena en la SRAM segura y nunca se expone al dispositivo anfitrión o a servicios externos.
¿LA DETECCIÓN DE DEEPFAKE FUNCIONA TAMBIÉN EN LLAMADAS NO CIFRADAS?
Sí. El motor de análisis reside en el TEE de hardware y recibe el audio sin procesar del controlador DMA antes de que el flujo se enrute a cualquier códec o pila de red. Esta ruta es arquitectónicamente independiente del módulo criptográfico ML-KEM+PSK. Cuando el cifrado no está activo —por ejemplo, durante una llamada telefónica normal en red GSM/VoIP o una videoconferencia en Teams, Zoom o WebEx— el TEE continúa analizando la señal y calculando el Índice de Confianza C. El usuario recibe la advertencia de anomalía exactamente como en modo cifrado. En ningún caso el audio sin procesar se transmite fuera del dispositivo o se envía a servicios en la nube.
ESPECIFICACIONES TÉCNICAS
| ESPECIFICACIÓN | VALOR OPERATIVO |
|---|---|
| Objetivo de latencia de extremo a extremo | < 200ms |
| Latencia de la ruta de audio | < 10ms (determinística) |
| Frecuencia de actualización del Índice de Confianza C | 20ms (50Hz) |
| Intervalo de duración de la clave (T) | 5s – 60s (adaptativa) |
| Cifrado | AES-256-GCM (implementación de tiempo constante) |
| Intercambio de claves | ML-KEM-1024 + HKDF con nonces criptográficos |
| Relleno | CBR adaptativo (complejidad guiada por C) |
Las especificaciones representan la arquitectura objetivo según el depósito de patente IT 2026.
¿LISTO PARA UNA REUNIÓN INFORMATIVA TÁCTICA?
Las especificaciones detalladas del protocolo y las guías de implementación soberana están disponibles para agencias gubernamentales y de defensa autorizadas.
SOLICITAR DOSSIER TÉCNICO COMPLETO