¿Por qué aislamiento hardware y no solo mejor software?

Si el SO puede leer el micrófono, cualquier spyware con root en el SO también puede. El aislamiento hardware liga el bus del micrófono al Secure World en el arranque — el Normal World literalmente no puede reconfigurarlo.

¿Qué es el DMA Air-Gap?

DMA Air-Gap es nuestro patrón con patente pendiente (UIBM 2026, Patente #1) para ligar los descriptores DMA de los periféricos al Secure World en el primer arranque. El periférico no aparece como dispositivo para el Normal World. Es la columna vertebral arquitectónica de la garantía anti-interceptación de Q-AUDION.

¿Por qué ML-KEM-1024 y no solo AES?

AES es un cifrado simétrico — ambas partes necesitan la misma clave. ML-KEM-1024 es el mecanismo de encapsulación de clave que permite a dos partes acordar esa clave AES sin que un atacante (incluso uno cuántico futuro) pueda recuperarla. Ambos se usan juntos.

¿El wire es idéntico en Android, iOS y Desktop?

Sí — byte-idéntico. Lo imponemos en CI con vectores Known-Answer-Test que las tres plataformas deben pasar antes de cada release.

VERDAD ARQUITECTÓNICA

ARQUITECTURA EN ESPERA DE PATENTE

Name: Q-AUDION
Brand: Q-AUDION

Cuatro pilares de hardware diseñados para eliminar los vectores de interceptación de audio a nivel de OS.

End-to-End. Edge to Edge.

Voz de extremo a extremo

De edge a edge. El servidor es ciego.

Speaker A

Auricular · Secure Element

AES-GCM 256
ML-KEM-1024

BCrypto Relay

Solo ve tráfico opaco

AES-GCM 256
ML-KEM-1024

Speaker B

Auricular · Secure Element

ciphertext opaco

Cifrado en el auricular

No en el teléfono. No en el servidor.

El relay solo reenvía

BCrypto no puede descifrar el tráfico que transporta.

Híbrido post-cuántico

ML-KEM-1024 + AES-GCM 256.

Las claves se negocian y desempaquetan dentro del secure element de los auriculares. El teléfono, la red y el BCrypto Relay solo ven ciphertext opaco.

Direct or relayed. Always blind.

See how the network mode is chosen automatically — and why the relay cannot read what it forwards. Deep dive

Arquitectura de red

P2P directo o relay de servidor. En ambos casos, el servidor es ciego.

Modo A

P2P Directo

Relay · inactivo

Llamante

Peer

Cuando el NAT lo permite. Mínima latencia, mínimo coste.

Modo B

Modo Relay

Llamante

Peer

NAT

BCrypto Relayreenvía · no puede descifrar

Cuando las redes bloquean el P2P. El relay solo reenvía ciphertext.

El servidor nunca posee las claves

Los endpoints derivan el secreto de sesión

ML-KEM-1024 + AES-GCM

Misma criptografía en ambos modos

Selección automática

Intenta P2P primero, recae con elegancia

El relay es un reenviador pasivo de paquetes. No puede leer, modificar ni reproducir el flujo de ciphertext — ni siquiera bajo coacción.

RUTA DE AUDIO VINCULADA AL HARDWARE

El controlador DMA transfiere el audio sin procesar de los micrófonos directamente a la SRAM segura a través de un bus aislado. Después del arranque seguro, los registros DMA están bloqueados para escritura: ningún malware, ni siquiera en el Anillo 0 del kernel, puede acceder a los datos de audio en claro o reconfigurar la ruta del controlador. Esto crea un límite de confianza físico matemáticamente independiente del estado de seguridad del dispositivo anfitrión.

→ VER PREGUNTAS FRECUENTES: ¿CÓMO EVITA Q-AUDION LA CAPTURA DE AUDIO PRE-CIFRADO?

MOTOR ANTI-DEEPFAKE EN EL DISPOSITIVO

Un motor de análisis residente en el TEE calcula en tiempo real un Índice de Confianza C utilizando el análisis espectral LFCC (detectando artefactos de vocoders neuronales por encima de 8 kHz), la coherencia respiratoria (detección de vitalidad) y la comparación de huellas de voz. Al ejecutar estos modelos neuronales completamente dentro del enclave seguro local, Q-AUDION garantiza una detección de latencia cero sin exponer datos de voz sensibles a servicios en la nube de terceros.

→ VER PREGUNTAS FRECUENTES: ¿CÓMO FUNCIONA LA DETECCIÓN DE DEEPFAKE SIN NUBE?

CRIPTOGRAFÍA SOBERANA ADAPTATIVA

Las claves de sesión combinan ML-KEM-1024 (estándar post-cuántico NIST) con una clave precompartida (PSK) residente en el hardware, inyectada exclusivamente a través de una interfaz física dedicada por el operador. La duración de la clave T es una función dinámica del Índice de Confianza C: cuando se detecta incluso una mínima anomalía acústica, el sistema activa automáticamente una secuencia de regeneración inmediata de las claves a través de la ruta PSK soberana. Toda la cadena Análisis de Presencia → Vocoder → Cifrado opera dentro de un presupuesto de latencia determinista inferior a 200 ms de extremo a extremo, cumpliendo los requisitos deterministas en tiempo real de las comunicaciones de voz tácticas.

→ VER PREGUNTAS FRECUENTES: ¿QUÉ ES EL ÍNDICE DE CONFIANZA C?

RESISTENCIA AL ANÁLISIS DE TRÁFICO

A diferencia del VoIP cifrado basado en VBR, que sufre pérdidas de metadatos a través del análisis del tamaño de los paquetes, Q-AUDION impone un flujo de tasa de bits constante (CBR) estricto y temporizado por hardware. El relleno adaptativo criptográficamente seguro garantiza que cada paquete sea idéntico en tamaño y temporización, haciendo que los ataques de huella de tráfico sean computacionalmente prohibitivos incluso para actores estatales.

→ VER PREGUNTAS FRECUENTES: ¿CÓMO IMPIDE LA TASA DE BITS CONSTANTE (CBR) EL ANÁLISIS DE TRÁFICO?

PROTECCIÓN SIEMPRE ACTIVA: EN CADA LLAMADA

El motor anti-deepfake y el análisis del Índice de Confianza C no requieren que la llamada esté cifrada para operar. La arquitectura hardware-bound de Q-AUDION separa físicamente la ruta de análisis de la ruta de cifrado: el TEE recibe el audio sin procesar del bus DMA independientemente de si el flujo de salida se cifra con ML-KEM-1024 o se transmite en claro a través de cualquier plataforma VoIP, aplicación de mensajería o red telefónica tradicional. En ambas ediciones —Estándar y Soberana— el motor calcula el Índice de Confianza C cada 20 ms, detecta artefactos de vocoders neuronales por encima de 8 kHz, evalúa la coherencia respiratoria y compara la huella de voz del interlocutor. El usuario recibe una advertencia discreta en tiempo real en caso de anomalía. Ningún dato de audio sale del chip seguro. Ningún servidor remoto está involucrado. Ninguna plataforma de llamada debe ser reemplazada o modificada.

→ FAQ: ¿FUNCIONA LA DETECCIÓN DE DEEPFAKE EN LLAMADAS NO CIFRADAS?

ARQUITECTURA

SOC SEGURO (ARM CORTEX-M33 + NPU)

BLINDAJE TEMPEST

DRIVER DE ALTAVOZ DE GRAFENO

MICRÓFONO MEMS TÁCTICO

RESINA DE ENCAPSULADO OPACA

METALIZACIÓN PVD

DIAGNÓSTICO DEL SISTEMA: NOMINAL

IMPLEMENTACIÓN TÉCNICA

SECUENCIA DE ARRANQUE SEGURO

RAÍZ DE CONFIANZA DE HARDWARE

El cargador de arranque seguro verifica la firma digital del kernel RTOS contra las claves fusionadas en la memoria OTP de hardware durante la fabricación.

BLOQUEO DE REGISTROS DMA

Después de la inicialización, la unidad de gestión de memoria bloquea los registros de direccionamiento DMA. Las rutas de audio están físicamente aisladas de los núcleos Cortex no seguros.

INICIO DEL ENTORNO TEE

El Trusted Execution Environment se inicializa con la asignación de SRAM cifrada, aislando el análisis biométrico y las operaciones criptográficas.

HANDSHAKE PQC+PSK

Las claves de sesión adaptativas se derivan utilizando ML-KEM-1024 y claves de hardware precompartidas para establecer el enlace ascendente soberano.

Análisis en Profundidad sobre Evaluación y Conformidad

PREGUNTAS FRECUENTES TÉCNICAS

¿Cómo impide Q-AUDION la captura de audio pre-cifrado?

A diferencia de los auriculares Bluetooth estándar donde el sistema operativo móvil gestiona el controlador de audio, Q-AUDION dirige las señales de los micrófonos directamente a una SRAM segura interna a través de un bus I2S aislado. El dispositivo anfitrión solo recibe un flujo CBR cifrado. Incluso si el kernel del smartphone fuera comprometido por un spyware zero-click como Pegasus, no existiría un camino físico hacia los datos acústicos sin procesar y no cifrados.

¿Qué hace que ML-KEM sea resistente a los ataques cuánticos?

ML-KEM (Kyber) se basa en el problema reticular Module Learning with Errors (M-LWE), que se presume seguro contra algoritmos tanto clásicos como cuánticos. A diferencia de RSA y ECC, que el algoritmo de Shor puede violar, M-LWE sigue siendo matemáticamente inviable para las computadoras cuánticas criptográficamente relevantes (CRQC), garantizando la soberanía de los datos a largo plazo.

¿Qué es el Índice de Confianza C?

El Índice de Confianza C es una métrica dinámica calculada cada 20 ms por la NPU interna. Agrega el análisis espectral LFCC, la coherencia respiratoria y la entropía de la huella de voz. Si C cae por debajo de un umbral definido por el soberano —indicando una sospecha de inserción o manipulación de IA— el sistema activa el 'Re-keying adaptativo', rotando instantáneamente las claves de sesión a través de la ruta PSK de hardware.

¿Cómo funciona la detección de deepfakes en el dispositivo sin nube?

Q-AUDION cuenta con una NPU de bajo consumo optimizada para la inferencia de redes neuronales TinyML. Utiliza un modelo propietario entrenado para detectar artefactos sintéticos de vocoders y discontinuidades acústicas características de la conversión de voz por IA —incluidas las voces generadas por sistemas como ElevenLabs, RVC y arquitecturas de transformadores de voz. La ejecución se realiza completamente dentro del TEE local, eliminando la latencia y los riesgos de hombre en el medio de los servicios de IA basados en la nube. El motor está activo en cada llamada, independientemente de si la sesión está cifrada o no: la ruta DMA → TEE está arquitectónicamente separada del módulo criptográfico. Esto significa que la protección anti-deepfake funciona en cualquier plataforma —Teams, Zoom, WhatsApp, telefonía tradicional— sin que el usuario tenga que hacer nada y sin que ningún dato de audio salga nunca del chip seguro.

¿Por qué es importante la inyección de claves soberanas?

La Edición Soberana permite la inyección manual de claves soberanas ('Sovereign Key Injection') a través de una interfaz física air-gapped. Las agencias gubernamentales pueden inyectar su PSK maestra directamente en el enclave seguro del dispositivo. Esto garantiza que la comunicación permanezca cifrada con una clave poseída físicamente solo por la entidad soberana, no por el fabricante o terceros.

¿Cómo el bitrate constante (CBR) previene el análisis de tráfico?

El VoIP cifrado estándar utiliza el bitrate variable (VBR), que expone información a través de la temporización y el tamaño de los paquetes. Q-AUDION impone un flujo CBR estricto y temporizado por hardware con relleno adaptativo. Cada paquete es idéntico en tamaño y temporización, haciendo que el análisis de tráfico y los ataques de 'huella de tráfico (traffic fingerprinting)' por parte de adversarios sofisticados sean computacionalmente prohibitivos.

¿Cómo se establece la raíz de confianza de hardware?

Al encenderse, un cargador de arranque inmutable basado en ROM verifica la firma del firmware TEE. Una vez verificada, el hardware 'bloquea' los registros DMA, impidiendo que cualquier software —incluso un sistema operativo anfitrión malicioso con privilegios de root— reconfigure las rutas de audio o acceda a las áreas de memoria seguras donde residen las claves. Esto crea un límite de confianza de hardware persistente.

¿La Edición Soberana está protegida TEMPEST?

La Sovereign Edition está diseñada con blindaje PCB multicapa TEMPEST-ready y filtros de desacoplamiento RF. Esta arquitectura busca mitigar el riesgo de emanaciones comprometedoras en entornos SCIF y similares de alta seguridad. La evaluación TEMPEST independiente es un objetivo de hoja de ruta.

¿CÓMO FUNCIONA LA AUTENTICACIÓN DE VOZ 'VOICE-AS-KEY'?

Antes de iniciar cualquier sesión cifrada, Q-AUDION requiere que el operador pase una verificación biométrica de la huella de voz realizada completamente dentro del TEE de hardware sobre la señal de audio sin procesar. Esto impide el uso no autorizado del dispositivo incluso en caso de robo físico. El modelo de la huella de voz se almacena en la SRAM segura y nunca se expone al dispositivo anfitrión o a servicios externos.

¿LA DETECCIÓN DE DEEPFAKE FUNCIONA TAMBIÉN EN LLAMADAS NO CIFRADAS?

Sí. El motor de análisis reside en el TEE de hardware y recibe el audio sin procesar del controlador DMA antes de que el flujo se enrute a cualquier códec o pila de red. Esta ruta es arquitectónicamente independiente del módulo criptográfico ML-KEM+PSK. Cuando el cifrado no está activo —por ejemplo, durante una llamada telefónica normal en red GSM/VoIP o una videoconferencia en Teams, Zoom o WebEx— el TEE continúa analizando la señal y calculando el Índice de Confianza C. El usuario recibe la advertencia de anomalía exactamente como en modo cifrado. En ningún caso el audio sin procesar se transmite fuera del dispositivo o se envía a servicios en la nube.

ESPECIFICACIONES TÉCNICAS

ESPECIFICACIÓN	VALOR OPERATIVO
Objetivo de latencia de extremo a extremo	< 200ms
Latencia de la ruta de audio	< 10ms (determinística)
Frecuencia de actualización del Índice de Confianza C	20ms (50Hz)
Intervalo de duración de la clave (T)	5s – 60s (adaptativa)
Cifrado	AES-256-GCM (implementación de tiempo constante)
Intercambio de claves	ML-KEM-1024 + HKDF con nonces criptográficos
Relleno	CBR adaptativo (complejidad guiada por C)

Las especificaciones representan la arquitectura objetivo según el depósito de patente IT 2026.

¿LISTO PARA UNA REUNIÓN INFORMATIVA TÁCTICA?

Las especificaciones detalladas del protocolo y las guías de implementación soberana están disponibles para agencias gubernamentales y de defensa autorizadas.

SOLICITAR DOSSIER TÉCNICO COMPLETO