[Windows] WhisperDesktop1.8音频转文字软件【免费开源】

mind · 发表于 2023-11-17 14:01:47

您需要登录才可以下载或查看，没有账号？立即注册

×

资源来自互联网分享，侵权请告知删除。
如链接失效，请联系管理

WhisperDesktop1.8音频转文字软件【免费开源】

可实现本地电脑的音频转文字软件！完全免费开源！支持 Windows、macOS、Linux
（目前界面只有英文的，但支持中文的转换）

特征

基于 DirectCompute 的供应商不可知的 GPGPU；该技术的另一个名称是“Direct3D 11 中的计算着色器”
纯 C++ 实现，除了基本的 OS 组件外没有运行时依赖性
比 OpenAI 的实现快得多。
混合 F16 / F32 精度：自 D3D 版本 10.0 起，Windows [color=var(--color-accent-fg)]需要缓冲区的支持R16_FLOAT
内置性能分析器，可测量单个计算着色器的执行时间
内存使用率低
用于音频处理的媒体基础，支持大多数音频和视频格式（Ogg Vorbis 除外），以及大多数在 Windows 上运行的音频捕获设备（除了一些专业的，它们只实现 ASIO API [color=var(--color-accent-fg)]。
用于音频捕获的语音活动检测。

使用步骤：
下载 WhisperDesktop.zip、ggml-medium 语音模型（官方那里有好多规格如图一，作者推荐1.42G这个模型，下面百度云盘下载链接）

解压WhisperDesktop.zip，打开WhisperDesktop.exe，首先选择要加载的语音模型

加载完成后，就可以进行语音转文了

转换的过程如下图：

结果以文本格式输入。

另外一个功能是允许从麦克风捕获和转录或翻译实时音频

ggml-medium 语音模型（官方）：
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main

作者推荐ggml-medium.bin（大小为 1.42GB）
链接：https://pan.baidu.com/s/1vszwzTdPOfmd041ywbAFHQ?pwd=xnbc
提取码: xnbc

蓝奏下载（最小的体验包）:https://wwnn.lanzoue.com/iZVcM0wq5lvg 密码:7go1

Whisper ：开源项目（官方）
https://github.com/Const-me/Whisper

蓝奏下载 :https://wwnn.lanzoue.com/iDT010wq4q6f 密码:57ko

		自动登录	找回密码
密码			立即注册