V6.6
- 实时转录支持 OpenAI 实时 API(支持 Azure 主机)
- 实时转录支持词典功能。
- 实时转录过程中会创建空白快照,以便在同一个父项目中转录不同的子项目。
- 实时转录现在支持在句子尚未完全识别时调用翻译。推荐使用 Apple 内置的机器翻译(免费,macOS 15+)。
- 嵌入式播放器支持 0.25x、0.5x、0.75x 重放速度(快捷键 ⌥⌘[ 和 ⌥⌘])。
- 嵌入式播放器支持快捷键 ⌘+⇧+(+/-) 快速更改预览器的字幕大小。
- 嵌入式 ChatGPT 支持 Azure OpenAI 主机(请参阅在线帮助了解更多信息)。
- 字幕编辑器支持快速粘贴 SRT 内容作为快照(您可以先导出 SRT 内容,再使用 GPT 将行合并并优化语法,然后将返回的 SRT 格式内容复制并粘贴回 Whisper Mate 的快照中)。
- 字幕编辑器在使用上下箭头键切换字幕行时支持同步到相应的播放器预览位置。
- 标记的项目现在将固定在项目列表的顶部。
- 硬字幕烧录和 .mkv 格式导出现在支持仅导出选定的行范围。
- 新增功能,自动根据句末标点将不完整的字幕行连接到下一行。
- 修复了快速剪切功能的问题。
- 修复了在自动翻译的实时转录过程中自动滚动无法滚动到可见区域的问题。
- 修复了导出 .mkv 时未设置默认字幕轨道的问题。
- 修复了拖动播放器进度条时的抖动问题。
- 其他小问题修复。
- DMG 135 MB
- ZIP 135 MB
V6.5
- 支持 macOS 15 及更高版本的 Apple 翻译
- 已添加将翻译文本导出为 Final Cut Pro (.fcpxml) 格式的示例
- 在 macOS 12 和 15 中的用户界面问题现已解决
- 现在可以将现有的 .srt 文件作为字幕拖放到视频项目中进行字幕编辑
- DMG 133 MB
- ZIP 133 MB
V6.3
- 添加针对一般场景的新降噪选项
- 添加词典功能,允许将常见短语或单词直接替换为目标短语和单词
- 修复错误并改善性能
- DMG 133 MB
- ZIP 133 MB
V6.2
- .gguf 格式支持本地模型
- 解决了被屏蔽的 URL 加载问题
- 修复了翻译中的拼写错误
- DMG 133 MB
- ZIP 132 MB
V6.1
- 已添加在一分钟数据内的音频转录能力(以测试模型参数的影响)。
- 添加了自动标记重复句子的功能,如果没有自动拼接。您可以通过使用 F2 快速切换到下一个重复句子。您可以选择是否根据需要对重复部分进行转录和分组。
- 已添加以 .mkv 格式导出视频和字幕的功能。
- 扩展了嵌入式字幕的能力。
- 已为在 fps30、fps50、fps59.94 格式下的 Final Cut Pro 提供了导出示例。
- 用户界面已更新,以改善字段编辑功能并提供快速激活支持。
- 修复了与 LLM-automation 作为翻译器不工作相关的错误。
- 修复了在字幕中搜索文本的问题。
- 修复了某些音频文件重复内容的问题。
V6.0.3
- 修复了特殊界面的压缩错误。
- 要将项目从项目列表中删除,您可以点击彩色图标。
- DMG 133 MB
- ZIP 132 MB
V6.0.2
- 自动识别并翻译输入的标准SRT格式的文本文件
- 在Cloud标签页中添加更多的Whisper模型
- 修复在界面中显示模型名称的错误
- 修复云系统要求模型的错误
- 133 MB
V6.0.1
- 请配置项目的聊天窗口。默认情况下它是关闭的,您可以根据需要启用或禁用它。
- 您可以上传以.flac格式的音频文件到项目中(右键单击主窗口)。
- 为云聊天添加快速访问按钮。
- 修复了对文件访问权限的错误。
V6.0
- 增加了对文本输入的语音功能支持。
- 在语言模型设置中添加了对LLM服务的翻译支持。
- 添加了LLM应用模型,用于智能分析对话记录、面试等句子的分句;同时还可以调整速度。
- 添加了一个JavaScript示例,允许使用特殊字符(. ? !等)来合并或拆分句子。Whisper V2模型有时会将句子拆分成多行,但这些命令允许自动合并句子并支持特殊分隔符。
- 更新了初始语言模型选项,以支持通用的模型封装。
- 在“模型策略”部分添加了“应用注意力”的选项(仅在Apple Silicon设备上支持),可以提高语音翻译质量高达25%。
- 添加了以.mp3格式上传.wav文件的功能。
- 在文本编辑上下文菜单中添加了直接调用JavaScript操作的功能。
- 添加了文本编辑窗口的文本大小调整功能。
- 添加了直接从项目加载模型文件的功能(在“模型教程”选项卡中)。
- 修复了编辑界面中示例展示窗口自动滚动的错误。
- 修复了编辑界面中选择行选项的位置问题。
- 156 MB
V5.5.3
- 添加实时的时间跟踪、屏幕截图和录制视频的功能
- 添加实时的文本搜索和接收来自Slack和系统的电子邮件和消息的能力
- 添加实时录音功能,包括指定的最大时长和行数
- 更新Pyannote发布策略(可选:手动发布所有项目或通过快速菜单发布)
- 更新实时录音功能
- 更新实时录音,使用新的Deepgram模型
- 修复媒体文件相关的错误
- 修复fcpxml模型相关的错误
- 148 MB
V5.5.2
- 在pyannote的音频检测结果中添加字幕管理功能。
- 在新的媒体播放器项目中添加音频和字幕回放功能。
- 在媒体播放器中增加隐藏扬声器名称的选项(即使扬声器名称为空)。
- 为标准模型添加特殊功能:删除 | 四舍五入 | 执行 | 设置变量 | MS FR格式化。
- 在查看标准模型菜单中,添加以29.97帧每秒的FPS速率将文件导出为FCPXML格式的选项,用于专业模型。
- 在查看标准模型菜单中,添加以25帧每秒的FPS速率将文件导出为Legendas DS(.txt)格式的选项,用于专业模型。
- 修复与Turbine AI模型的连接减速问题。
- 更新所有导出.fcpxml模型的命令中的功能。
- 148 MB
V5.5.1
- 修复了在自动化翻译时项目完成时崩溃的问题
- 148 MB
V5.5.0
- 添加Deepgram nova-2模型选项。
- 添加实时语音处理的透明度设置。
- 添加实时翻译结果显示设置。
- 添加自定义实时窗口背景和文本颜色设置。
- 修复使用Deepgram模型时自动配置未被应用的错误。
- 修复实时滚动窗口不能保持打开的错误。
- 148 MB
V5.4.9
- 添加批量导出项目模板功能,可以从模板脚本中将选定的项目结果导出到一个文件中
- 修复错误和提升性能
- 148 MB
V5.4.8
- 在主窗口底部状态栏中添加隐私设置,可以禁用事件分析、崩溃报告和本地日志
- 添加删除符合条件行的脚本示例
- 添加替换字幕字符串的脚本示例,例如将“(音乐)音乐[音乐]”替换为空字符串
- 添加写回属性.memo .markWarn .warnMsg的脚本示例
- 添加预览字幕延迟显示选项
- 在字幕编辑工具包中添加批量修改字幕开始或结束时间的功能
- 在字幕编辑器中添加(⇧)+←→快捷键,以快速跳转到预览器5秒或30秒的位置
- 添加演讲者控制栏,并支持使用快捷键快速设置
- 修复预览器字幕无法隐藏的问题
- 修复模板编辑器无法将文本剪切到剪贴板和无法通过拖动选择的问题
- 修复导出自定义模板.t0f5 .t0f4 .t0f2时间范围格式仍然返回3位数字的毫秒问题
- 148 MB
V5.4.7
- 在项目列表中添加文件时,添加自动启动项目选项(在主窗口底部状态栏上切换)。
- 添加自动导出文件到自定义文件夹的自动化步骤。
- 添加将结果发送到您的邮箱的自动化步骤(可以自动使用之前的自动导出结果作为附件)。
- 升级模板和JavaScript编辑器以修复崩溃问题。
- 148 MB
V5.4.6
- 添加媒体预览字幕布局选项,原始文本和翻译字幕可以控制显示在上或下方。
- 添加了大型v3 coreml模型。
- 添加⌘+⌥+f快捷键或双击预览以快速切换到全屏。
- 现在一些快捷键支持按下单个字符触发(合并,拆分,调整)。
- 合并字幕后,现在会自动选择第一个合并的行。
- 取消绑定默认打开声音和视频文件的whisper mate应用程序。
- 修复了V5.4.5中的一些崩溃错误。
- 修复了通知显示问题。
- 修复了一些翻译问题。
- 123 MB
V5.4.5
- ❗通用版本可能需要重新下载。因为我升级了我的开发设备,并忘记保存通用部署EDKey。
- 添加自动化功能,在项目转录完成后执行作业(合并重复/快照/脚本/翻译)。
- 添加最大分段长度转录选项。
- 添加模型提示示例。
- 在替换功能中使用replace to with char ‘\n’(单斜杠加字符n)来换行。
- 升级项目转录选项配置界面。
- 122 MB
V5.4.4
- 在模型配置面板中添加模型云列表,支持2个下载主机(如果无法在主机1中下载,请切换到主机2)。
- 当在通用设置中禁用GPU加速选项时,启用CoreML模块作为备选支持。
- 修复了下载大型模型失败的问题。
- 修复了在非Apple Silicon设备上崩溃的问题。
- 122 MB
V5.4.3
- 提高转录速度
- 添加对Whisper大型v3模型的支持
- 添加对LibreTranslator引擎的支持
- 在项目上下文菜单中添加复制项目功能
- 在编辑模式(⌘+E)中可以直接输入更新说话者字段
- 修复当选项卡数量大于2时出现的选项卡窗口问题
- 修复波形视图有时崩溃的问题
- 修复字幕编辑器中无法翻译选定行的问题
V5.4.2
- 添加配置文件密语处理线程数选项。(使用较少的线程,让计算机处理其他任务,但处理时间会增加)
- 添加Deepgram语音转录引擎支持,还支持实时流式转录模式。
- 添加导出仅包含自定义发言者内容的模板示例。
- 添加以@开头的关键字搜索功能,用于过滤发言者行或将所有发言者名称替换为另一个名称(例如:@tom–>jack)。
- 添加保存最新项目发言者配置并在新项目中重复使用的功能。
- 自定义模板导出现在支持9个自定义模板。
V5.4.1
- 添加内网网页远程管理功能,您可以使用手机或其他设备添加文件进行处理并查看处理状态(在主窗口底部状态栏中)
- 添加AI参数配置模板选择器。
- 添加抑制标点符号的AI参数。
- 使用同步的HTTP请求来进行数据的获取或者提交(可以使用它来将字幕的行数据提交到本地的llm服务以获取修正的推理结果,并将结果填回到原始的字幕中,或者提交到其他的HTTP/HTTPS系统服务,请查看javascript处理器中的HTTP示例来了解如何使用它)。
- 修复包含空格字符的文件路径时噪音消除WAV文件错误。
V5.4
- 添加快速剪切功能
- 添加快捷键(C)以显示或隐藏字幕编辑器预览播放器
- 添加快捷键以更改字幕编辑器预览播放器的速度
- 将静默策略替换为分块策略
- 修复去噪选项错误
新的快速剪切功能具有以下功能:
- 可视化音频波形以精确定位和修剪视频。
- 将较长的多媒体文件分割成多个段落,以便在转录之前单独处理。
- 使用分块策略跳过静默或不可转录的片段。
- 将需要转录的片段分别修剪为单独的文件。
V5.3.1
- 在批处理队列中添加项目优先级属性,优先级高的将先处理(选项在右键菜单中)
- 字幕文本替换功能还会替换翻译文本中的匹配关键字
- 修复了重新转录时跳过静音策略和减少噪音的问题
V5.3
- 为语言添加更多调整过的模型(小/中型)
- 添加传输策略以跳过静音片段(根据分贝和静音持续时间进行分类)
- 添加减少背景噪音的选项
- 添加使传输压制字幕提前显示时间戳的选项(不剧透)
- 添加示例JavaScript处理器以大写片段字幕
V5.2
- 添加了对不同语言推理的优化模型。包括粤语/中文/韩语/日语/德语/法语/泰语/乌克兰语等。
- 添加了将本地优化的Whisper AI模型加入Whisper Mate的功能。
- 添加了批量设置项目模型参数的功能。
- 添加了选项,防止运行队列时启动屏幕保护。
- 修复了系统启动屏幕保护时任务暂停的问题。
- 修复了有时无法通过点击字幕编辑器行来导航到播放器位置的问题。
- 修复了无法通过右键菜单调用撤销和重做修改的文本的问题。
- 修复了批量导出时合并时间范围不匹配的问题。
V5.1
- 添加批量导出项目片段/srt模板的功能,并添加选项将它们合并为一个文件。
- 添加重新转录所选行的功能,可更改AI参数。
- 添加在字幕文本内容中撤销或重做文本更改的功能,可通过手动更改键盘快捷键(⌘+Z 撤销 / ⌘+⇧+Z 重做)实现。
- 添加在选定行下方添加新的空白字幕行的功能(快捷键⌘+N)。
- 添加通过Slack传入Webhook发送项目完成通知的功能。(可以在每个项目转录完成后通过手机收到通知)
- 修复了播放媒体控制框在上下样式布局中未对齐居中的问题。
V5.0
- 添加批量合并连续段落的快速自动合并字幕的工具
- 添加自定义脚本处理器以批处理调整转写的字幕
- 添加字幕编辑器调整功能,类似于分割和合并功能,可以选择多行然后在一个文本框中逐行调整它们
- 添加更多的快捷键支持的字幕编辑器
- 在视频预览的字幕样式配置面板中添加自定义字体的选项
- 在将硬字幕烧录到原始视频的配置面板中添加自定义字体的选项
- 添加导出为Pdf或Docx文件的支持,只需要将导出后缀设置为pdf或docx
- 添加更多预定义的导出示例格式,您可以从例子中加载,然后简单地调整模板结果
- 添加对当前项目字幕状态进行快照的功能。然后方便地恢复到保存的快照状态
- 添加将.Srt导入到当前项目作为快照的选项
- 添加选项将预览视频的字幕显示翻译文本覆盖源文本
- 添加自定义导出函数。随机数字& 随机GUID & escXML & 用自定义格式替换字符串
- 添加自定义导出输出类型(文件或剪贴板)
- 添加自定义导出选项,使用所有字幕进行导出或仅选择的字幕
- 添加项目编辑窗口组与主窗口选项
- 在模型选择器(右下角)中添加额外的耳语模型处理参数配置,可能不容易找到。因为大多数情况下不需要修改这些参数
- 优化全屏预览视频的行为
- 搜索关键字支持条件(使用|作为或关键字。例如“hi|hello|hey”)
- 优化搜索和替换逻辑。当执行替换时,搜索关键字将调整以显示源关键字和替换关键字
- 优化实时流转录逻辑
- 修复一些子窗口不带到前台的问题
- 修复导出xml格式的一些错误
- 修复一些媒体提取wav失败的问题
- 修复离开替换关键字字段将自动触发替换操作的问题
- 修复某些流项目崩溃的问题
V4.0
- 增加功能以记住项目字幕编辑器的布局属性。每个项目可以使用不同的布局和预览播放器大小。(旧项目需要重新打开才能记住布局属性)
- 添加在编辑器中查找重复字幕的选项。
- 添加上下文菜单选项,即使转录脚本进程未启动也可以打开编辑器。
- 添加将字幕导出为.sbv格式的选项。
- 添加自定义导出模板功能(例如.fcpxml,.itt,.ttml)。
- 添加新插件。
- 添加常用关键词和替换配置选项,以便快速重用搜索或替换。
- 添加标记的行在预览播放器的进度视图中显示标记标志。
- 添加在字幕编辑器上下文菜单中添加标记选项。
- 在选择单行时,在字幕编辑器中添加拆分行功能。
- 添加搜索结果中显示项目名称的行。
- 在预处理媒体遇到错误时显示错误信息。
- 添加隐藏编辑器定位行按钮的选项。
- 添加⌘+S快捷键,快速将.srt导出到文件。
- 修复媒体通道音频元信息获取两个音频通道,但实际上只有一个。(添加选项忽略音频通道选择)
- 修复更改项目名称后烧录字幕失败的问题。
- 修复macOS12上的一些UI问题。
- 修复保持在功能中未锁定显示状态栏图标的选项。
- 修复一些浅色主题下的UI显示问题。
V3.5
- 新增字幕音频下载功能。现在您可以选择任何字幕,然后使用上下文菜单下载其音频剪辑,当选择多行时,它们会自动合并为一个音频剪辑。
- 添加了实时捕获音频的小型浮动窗口样式。
- 添加菜单栏上的上下文菜单,可以快速开始将记录流到新的浮动窗口项目。
- 在全局搜索结果中快速播放段落范围内的音频,或直接下载搜索结果的音频范围剪辑。
- 模型下载现在支持断点续传。
- 添加了字幕备忘录功能,您现在可以在编辑器中为任何字幕添加备忘录。
- 添加Azure翻译选项。
- 在所有项目中添加全局字幕搜索。
- 在搜索结果中添加搜索关键词的突出显示。
- 为快速控制窗口添加了默认快捷键,例如关闭/缩放/最小化。
- 添加了隐藏主工具栏标签的选项。
- 将批量启动按钮从主工具栏移到上下文菜单中。
- 修复替换无法替换为空字符串的问题。
- 修复备份服务器缺少小型和小型英文模型的问题。
- 修复录制的音频文件播放器滑块位置字幕问题。
V3.0
- 添加将选定的字幕媒体范围导出到一个新的媒体剪辑文件
- 添加将视频与烧录硬字幕导出到原始视频和自定义字幕样式
- 添加在视频预览中直接预览字幕(字幕样式可以在偏好设置面板中自定义)
- 添加录制麦克风音频并支持实时转录(macOS13+)
- 添加字幕合并功能。段落范围和字幕将合并为一行。
- 添加应用程序音频录制将自动保存为文件,并可将其转换为新的转录项目。
- 添加选项以复制字幕行,并允许修改内容或时间范围以微调完整字幕。
- 添加选项在项目模型配置面板中启用Whisper嵌入式英语翻译。
- 添加选项在项目模型配置面板中使用Whisper提示令牌配置。
- 添加选项禁用预览视频时自动滚动字幕行。
- 添加支持自定义媒体预览重放速度。
- 添加支持使用⌘+V将复制的文件粘贴到处理队列中。
- 添加快速切换到编辑模式的功能。所有字幕可以通过快捷键(⌘+E)进行编辑或查看切换。
- 添加Whisper处理时显示CPU使用率百分比。
- 添加通过上下文菜单归档项目的支持(保持工作项目列表清洁)。
- 添加字幕翻译控制中的谷歌翻译。
- 添加支持更多应用程序语言。
- 添加全尺寸预览媒体与字幕布局。
- 添加支持在Finder的“打开方式”功能中打开媒体文件。
- 优化大量数据行渲染速度的字幕编辑器。
- 修复多音频通道视频选择问题。
- 修复预览和编辑字幕跳动和视频滑块导航问题。
版本2.0
- 支持在其他应用程序(如Zoom/Skype/Teams/会议应用程序,仅限macOS13.0+)中捕捉和转录音频
- 添加插件以批量转换简体中文字幕为繁体或反向转换(需先在首选项面板中激活插件)
- 修复项目编辑器无法使用空格快捷键播放或停止媒体的问题
- 修复SRT和VTT导出格式的错误
版本1.0
- 转录音频或视频文件
- 使用deepl免费api翻译字幕
- 嵌入字幕编辑器,以修正转录错误
- 导出为SRT、VTT、CSV、JSON、SEGMENT格式
- 支持为每个字幕设置发言人
- 大多数操作支持批量选择,例如批量运行任务、批量翻译行或批量设置发言人
- 支持拖放文件开始转录
- 支持在搜索转录时键入文本
- 编辑器可预览音频或视频文件,并与播放范围同步
- 支持多语言转换
- 支持自定义常用语言,以供转换或翻译使用