找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 131|回复: 0

[Windows] WhisperDesktop1.8音频转文字软件【免费开源】

[复制链接]

2万

主题

135

回帖

13万

积分

管理员

积分
137739
发表于 2023-11-17 14:01:47 | 显示全部楼层 |阅读模式 IP:山东省临沂市 电信

登录后更精彩...O(∩_∩)O...

您需要 登录 才可以下载或查看,没有账号?立即注册

×
资源来自互联网分享,侵权请告知删除。
如链接失效,请联系管理



WhisperDesktop1.8音频转文字软件【免费开源】




可实现本地电脑的音频转文字软件!完全免费开源!支持 Windows、macOS、Linux

(目前界面只有英文的,但支持中文的转换)

特征
  • 基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
  • 纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性
  • 比 OpenAI 的实现快得多。
  • 混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(--color-accent-fg)]需要缓冲区 的支持R16_FLOAT
  • 内置性能分析器,可测量单个计算着色器的执行时间
  • 内存使用率低
  • 用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(--color-accent-fg)]。
  • 用于音频捕获的语音活动检测。

使用步骤:
下载 WhisperDesktop.zip、ggml-medium 语音模型(官方那里有好多规格如图一,作者推荐1.42G这个模型,下面百度云盘下载链接)

解压WhisperDesktop.zip,打开WhisperDesktop.exe,首先选择要加载的语音模型



加载完成后,就可以进行语音转文了



转换的过程如下图:


结果以文本格式输入。


另外一个功能是允许从麦克风捕获和转录或翻译实时音频





ggml-medium 语音模型(官方):
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main

作者推荐ggml-medium.bin(大小为 1.42GB)
链接:
https://pan.baidu.com/s/1vszwzTdPOfmd041ywbAFHQ?pwd=xnbc
提取码: xnbc

蓝奏下载(最小的体验包):https://wwnn.lanzoue.com/iZVcM0wq5lvg 密码:7go1

Whisper :开源项目(官方)
https://github.com/Const-me/Whisper

蓝奏下载 :https://wwnn.lanzoue.com/iDT010wq4q6f 密码:57ko

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|时间戳|加密|CTF WiKi|CTF平台汇总|CTF show|ctfhub|棱角安全|rutracker|攻防世界|php手册|peiqi文库|CyberChef|猫捉鱼铃|手机版|小黑屋|cn-sec|IOTsec-Zone|在线工具|分享屋 ( 鲁ICP备2021028754号 )

GMT+8, 2024-9-17 04:13

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表