背景与价值语音输入降低键入成本,语音合成提升辅助可用性;在移动与桌面场景均有价值。语音识别(实验性,前缀差异)const SR = (window as any).SpeechRecognition || (window as any).webkitSpeechRecognition; function startRecognition(lang = 'zh-CN') { if (!SR) return { ok: false, reason: 'unsupported' }; const rec = new SR(); rec.lang = lang; rec.continuous = false; rec.interimResults = true; rec.onresult = (e: any) => { const last = e.results[e.results.length - 1]; const text = last[0].transcript; renderPartial(text, last.isFinal); }; rec.onerror = (e: any) => console.error('sr-error', e); rec.start(); return { ok: true }; } 语音合成(朗读)function speak(text: string, lang = 'zh-CN') { const ut = new SpeechSynthesisUtterance(text); ut.lang = lang; ut.rate = 1; ut.pitch = 1; speechSynthesis.speak(ut); } 指标验证(Chrome 128/Edge 130)识别成功率:环境支持下 ≥ 90%。首次识别延迟(P95):≤ 1.2s;合成启动 ≤ 300ms。误识率:在静音/安静环境下 ≤ 8%。回退策略不支持识别:提示使用键盘输入与服务器端语音转写接口;保留合成功能。权限拒绝:在用户明确按钮下再次请求,避免重复打扰。测试清单不同语言与口音:识别与合成路径正确;错误处理与停止有效。

发表评论 取消回复