| Dải dBFS | Đánh giá |
|---|---|
| 0 đến -3 dBFS | Max to, dễ vỡ âm thanh (clip) |
| -3 đến -10 dBFS | To |
| -10 đến -30 dBFS | Chuẩn âm thanh OK |
| -30 đến -40 dBFS | Nhỏ |
| < -40 dBFS | Yên lặng |
| Speech - Noise (dB) | Mức nghe hiểu |
|---|---|
| 0 đến 10 dB | Unacceptable đến Poor |
| 10 đến 20 dB | Poor đến Fair |
| 20 đến 30 dB | Fair đến Good |
| 30 đến 50 dB | Good đến Excellent |
Bước 1: Nhập user_id và ghi 5 mẫu giọng (pyannote embedding) → AI upload embeddings.npy lên BE.
Bước 2: Wake word:
WS tắt → Hey Jarvis (openWakeWord, ngưỡng 0.1): load model → AI lấy embedding từ BE theo user_id → so sánh khi detect;
WS bật → Soniox + cụm tiếng Nhật/romanized (xem
wake_word_phrases.json).
Popup chỉ khi đúng giọng enroll của session hiện tại (không trùng trong 3s/session).
Upload embeddings.npy theo user_id lên BE để lưu và lấy ra so sánh.
UI này gọi qua proxy của server hiện tại (không lộ X-API-Key trong browser).
Đúng cụm wake word và đúng giọng người đã đăng ký.