Anti-Deepfake On-Device
Quantisiertes INT8 LCNN-Modell führt Voice Liveness Detection lokal in der Embedded NPU aus. Echtzeit-Score pro Frame. Funktioniert auch bei unverschlüsselten Anrufen (Teams, Zoom, WhatsApp, traditionelle Telefonie).
Warum On-Device, nicht Cloud
Das Senden von Sprache an einen Cloud-Dienst zur Authentifizierung führt zu 3 Problemen: (1) Sie übertragen das Signal, das Sie schützen möchten, (2) der Anbieter kann es nach eigenem Ermessen analysieren, (3) die Latenz ist mit einer natürlichen Konversation unvereinbar. Q-AUDION löst alle drei Probleme, indem es die Inferenz in der NPU des Headsets ausführt.
- Kein Audio jemals übertragen
- Latenz <30ms pro Frame
- Keine Abhängigkeit von externen Diensten
Training auf ASVspoof 2019
Das LCNN-Modell wird auf ASVspoof 2019 Logical Access trainiert, dem Standarddatensatz für Voice Anti-Spoofing. Es erkennt Angriffe durch Sprachsynthese, Sprachkonvertierung und Replay. Validierungs-EER <2%.
- Öffentliche PyTorch Trainingspipeline (für Audit)
- INT8 Quantisierung für Embedded NPU-Bereitstellung
- Modell-Export ONNX → TFLite → NPU proprietäres Format
Score über GATT verfügbar gemacht
Für jeden entfernten Audio-Frame wird der Score 0-100 (Wahrscheinlichkeit, dass es sich um synthetische Sprache handelt) über eine benutzerdefinierte GATT characteristic an das Telefon gesendet. Die App zeigt eine Warnmeldung an, wenn der Score den Schwellenwert überschreitet. Funktioniert universell mit jedem VoIP.
- GATT char UUID f2c0_xxxx_xxxx_xxxx
- Update-Frequenz: 50Hz
- Schwellenwert konfigurierbar über Sovereign Server Policy