精简阅读
你整理录音时还在手动逐字敲打吗?那些会议记录、访谈素材和播客内容堆积如山,每次打开音频文件都感到无从下手。更可怕的是,市面多数转录工具要么准确率堪忧,要么需要上传云端——你的隐私和效率都在被消耗。但这套基于OpenAI Whisper模型的工具在本地就能达到99.8%的准确率,连背景噪音和专业术语都能精准识别。最让人意外的是,它处理批量任务时的一个隐藏设定,竟然能让转换速度提升三倍以上。想知道如何在完全离线的状态下,一次性处理上百个音频文件吗?
— www.kbid.com.cn

Reactorcore Whisper Batch Transcriber (Voice-To-Text Converter) v2.0 是一款基于先进人工智能技术的强大音频转文本工具,其核心采用了OpenAI开源的Whisper模型,能够高效、精准地将大量音频文件批量转换为可编辑的文本格式。该软件支持包括MP3、WAV、M4A在内的多种常见音频格式,并允许用户自定义输出为TXT、SRT或VTT等字幕文件,极大地方便了内容创作者、研究人员以及需要处理会议记录或访谈录音的商务人士。与旧版本相比,v2.0在转录准确率上有了显著提升,尤其是在处理带有口音、背景噪音或专业术语的复杂音频时表现更为出色;同时,其用户界面经过重新设计,操作流程更加直观简洁,新增的批量任务队列管理和实时进度显示功能,让用户能够轻松监控大规模转录任务的执行情况。此外,软件还提供了对多语言音频的自动识别与转录支持,覆盖了从英语、中文到西班牙语等数十种主流语言,确保了其在全球化应用场景中的广泛适用性。无论是用于制作视频字幕、整理学术访谈,还是进行语音数据的结构化分析,Reactorcore Whisper Batch Transcriber v2.0 都以其可靠性能和高效处理能力,成为音频转录领域一款不可或缺的得力助手。

支持系统:Windows

音源厂商:https://reactorcore.itch.io/whisper-batch-transcriber

独立安装程序 PC

文件大小:1.8GB

自动将您的所有录音转换为干净、有序、整洁的文本文件。

它采用先进的语音转文本技术,完全自动化,无限制运行。可在您的电脑上 100% 离线私密地运行。将演讲、播客、网络研讨会、独白、故事叙述和其他音频语音转换为格式化的 .txt 文件。通常每行一个句子,首字母大写,末尾以句号结尾。易于阅读。

使用方法:
将您的音频文件放入名为: 将您的音频文件放入此处的文件夹
双击运行转录器:▶ whisper_transcriber.py
转录结果将保存为 .txt 文件,位于: output_transcripts
就这样!非常简单。

您可以在两个 Whisper AI 模型之间进行选择:
Small_en - 需要 2GB 显存,准确率 96%
Large_v3_Turbo - 需要 6GB 显存,准确率 99.8%

这两个模型的结果都非常出色。它们的速度相对接近,所以如果您的电脑性能足够强大,可以运行 Large_v3_turbo,那么就推荐使用这个模型。

这两个模型都已预装在软件包中,因此您无需单独下载。

Automatically convert all of your voice recordings into clean, organized, neat text files.

It's fully automated, unlimited, using state-of-the-art speech-to-text technology. Works 100% offline on your computer, privately. Convert speeches, podcasts, webinars, monologues, storytellings and other audio speech into a formatted .txt file. Usually it's one sentence per line, with a capitalized first letter and period at the end. Easy to read.

How to Use:
Put your audio files into the folder called: put your audio files here
Run the transcriber by double-clicking: ▶ whisper_transcriber.py
The transcriptions will be saved as .txt files inside: output_transcripts
That's all! Easy as pie.

You can choose between two Whisper AI models:
Small_en - requires 2GB of VRAM, 96% accuracy
Large_v3_Turbo - requires 6GB of VRAM, 99,8% accuracy

The results with both models are REALLY GOOD. They're relatively similar in speed, so if you do have a powerful enough computer to run Large_v3_turbo, then always use that.

Both models are pre-included in the package, so you don't have to download them separately.

 

软件资源均来自于网络,仅作交流学习研究使用,版权归属原著作者权利人所有,请支持正版软件获得更好的服务。