WhisperX 使用 **字级强制对齐 (forced alignment)** 模块(基于 `Montreal Forced Aligner` 思路)
对每个单词重新计算时间戳,实现毫秒级精准同步* Hugging Face 提供官方预训练模型
> * 支持 GPU / CPU 推理
> * 能在嘈杂环境中保持高准确率
> * 结果与 Whisper 时间戳自然对齐
---
### 🧩 二者协作流程图我帮你整理成简洁、清晰、可复制的格式(含注释),适合直接放进教程文中👇
---
## 🧩 WhisperX 三大常用命令总结
WhisperX 的 CLI(命令行接口)设计非常统一,
只要记住「`输入文件` + `模型选择` + `功能参数`」三要素,就能快速完成各种任务。large-v3`:使用最新的 Whisper Large V3 模型(最准确)
* `--fp16 True`:启用半精度推理,加快速度(需 GPU)
* `--compute_type int8`:进一步量化优化