【用户文档】MacOs版

实时语音显示区： 显示实时捕获的语音转文字内容。
数字标签： 在每段转录文字前以"[编号]"标识当前语句的数字编号。
互动提醒： 对于点击互动，例如单击历史对话，或者双击历史对话；使用橘黄色标记，突出显示当前选择。
文字颜色：
如下图所示，文字颜色分为绿色和白色两种，具体含义如下：
- 绿色： 表示当前语句还没有生成对应的回复。具体情况包括：
  1. 当前语句还没有结束。
  2. 当前语句已经结束，但是GPT尚未生成回复。
- 白色： 表示当前语句已经结束，并且已经生成对应的GPT回复。
  
  文字颜色

3.2.2 右侧区域：智能GPT辅助

智能辅助： 自动识别转录内容中的关键信息，并生成智能辅助回复。
历史回放： 为历史对话提供辅助回复回放，方便用户准确回顾讨论的内容。

3.2.3 底部区域：状态操作栏

冻结/恢复刷新按钮： 冻结/恢复对话界面刷新
重新回复按钮： 重新生成当前对话的回复

按钮操作具体含义请参考下一段落:界面状态说明

3.3 界面状态说明

在应用程序运行过程中，对话界面将根据用户的交互行为切换在以下两种状态之间：

1. 冻结态：

当用户下拉对话历史查看旧的转录内容、单击或双击历史对话记录，或者点击“冻结刷新”按钮时，对话界面将进入冻结态。
在冻结态中，对话界面会停止自动刷新，使用户可以在不被新消息打扰的情况下，安心查阅历史信息。

2. 刷新态：

在冻结态下，用户可通过点击“恢复刷新”按钮，或者将对话历史上拉至最顶部来退出冻结态。
一旦回到运行态，对话界面将恢复实时更新，即时展示最新的语音转录和GPT的回复，确保用户不错过任何新的互动。

请注意在查看完历史对话记录后切换回运行态，以避免遗漏新的语音转录或回复。

4. 功能使用指南

4.1 开始/停止按钮

在应用界面右上角，您会看到一个明显的“开始”按钮。点击此按钮，应用将开始实时识别您的语音输入，将其转换为文字，并使用GPT模型生成回复。再次点击该按钮，将暂停识别功能。

开始/暂停

4.2 操作手势指南

单击历史对话记录：在历史对话栏点击某条记录，右侧将展示该历史对话相应的历史回复。对话界面将进入冻结态暂停自动刷新。
双击历史对话记录：若回答未能满足您的期望，双击相关对话记录，重新生成GPT回复。对话界面将进入冻结态暂停自动刷新。
向下滑动历史对话：滑动查看对话历史时，对话界面将进入冻结态暂停自动刷新。
向上滑动历史对话至顶部：滑动到历史对话顶部时，对话界面将退出冻结态，恢复页面自动刷新展示最新实时对话与回复。
点击冻结刷新按钮/空格键：点击冻结刷新按钮，或者按下空格键，对话界面将进入冻结态暂停自动刷新。
点击恢复刷新按钮/空格键：点击恢复刷新按钮，或者按下空格键，对话界面将退出冻结态，恢复页面自动刷新展示最新实时对话与回复。
点击重新回复按钮：在冻结态情况下，可手动重新生成对话的GPT回复。

操作手势指南

4.3 语音输入设备

4.3.1 麦克风语音输入

4.3.1.1 麦克风访问授权

当使用麦克风进行语音输入时，请注意以下几点：

权限授权: 在首次打开应用时，macOS将请求访问麦克风的权限。请确保授予权限，以便应用能够正常捕获语音。
权限手动授权: 如果您之前拒绝了麦克风访问权限，您可以通过以下步骤重新授权：
- 打开“系统偏好设置”。
- 点击“安全性与隐私”。
- 在“隐私”标签下，选择“麦克风”。
- 找到并勾选本应用的名字以允许其访问麦克风。
- 重启应用以获得麦克风访问权限
确保麦克风是正常工作的，并且已经被系统正确识别。
为确保最佳语音识别效果，请在静谧环境下使用麦克风。
当您启用麦克风作为语音输入设备，并且扬声器处于外放状态时，麦克风可能会同时捕捉到扬声器发出的声音和使用者的声音，请注意调整以避免干扰。
网络代理
- 如果您在中国境内遇到使用问题：检查是否启用了网络代理，如果是，请尝试关闭代理后重新连接。
- 如果您在国外使用遇到问题：请确保您的网络代理设置指向中国境内的服务器，以获得最佳访问体验。

4.3.1.2 麦克风语音识别异常

若遇到麦克风语音识别不准确、遗漏词汇或句子中断等情况，建议从下面3个方面检查：

1、观察如下图的音量检测，音量是否达到了最高

观察音量大小是否符合预期

2、如果音量没有达到最高，我们建议您参考下图采取以下措施优化麦克风设置：

检查并调整麦克风的输入音量，确保其设置在合适的水平。
如果您的麦克风支持环境噪音抑制功能，尝试关闭此功能以查看是否改善识别准确性。

1、打开面板

2、打开声音设置

3、调整输入麦克风音量，关闭环境噪声功能

发音易混淆词汇识别错误

部分专业词汇，与普通词汇发音一样，可能无法正确识别，如下图所示：

易混淆词汇

此时可以通过配置岗位热词提高语音识别专业术语准确度。操作步骤:

点击“菜单栏-岗位术语热词”
可选默认预设岗位，预设热词不可变更。如需更改热词，需先添加自定义岗位。
添加自定义岗位后，支持同步预设热词至自定义岗位，并且可手动修改。（同步预设热词方法：勾选需要同步的预设热词库，点击“复制勾选热词至自定义岗位”）
注意事项：不要配置词组，尽量配置单词，否则会影响识别效果，例如：“zookeeper” 需要拆分成 “zoo” 和 “keeper”；“项目经理” 需要拆分成 “项目” 和 “经理”。

选择预设岗位热词

添加自定义岗位，编辑热词

4.3.2 扬声器语音输入

对于 macOS 用户，如果您想从扬声器捕获声音，我们推荐使用 BlackHole。它是一款macOS专用的虚拟音频驱动，可以将音频从一个应用路由到另一个应用。

BlackHole 安装与配置:

下载 BlackHole 安装文件:下载链接 ( 备用下载链接 )
下载后，双击 pkg 文件并遵循安装提示完成安装。
按如下方步骤操作，在“音频MIDI设置”中添加一个新的多输出设备，并选择BlackHole和您的扬声器(或其他输出设备，如耳机)。

打开 "音频MIDI设置"，通常可以在您的应用程序或系统设置中找到此选项。
添加一个新的多输出设备
在配置选项中，您可以选择BlackHole和扬声器设备，这样多输出设备就等效于扬声器，且 "多输出设备" 可以将音频同时输出到扬声器和面试GPT软件中。
或者，您可以选择BlackHole和外接耳机设备，这样多输出设备就等效于外接耳机，且 "多输出设备" 可以将音频同时输出到外接耳机和面试GPT软件中。

第1步

第2步

第3步

第4步勾选扬声器/耳机 + BlackHole

调整Blackhole输出音量到最大

调整Blackhole输出音量到最大

设置您的系统声音输出为新创建的多输出设备。

需要注意选择"多输出设备"后，无法调整输出音量。因此，建议您在选择之前先调整好扬声器/耳机的音量。

第1步

第2步

现在，您可以在应用软件中选择语音输入设备为“扬声器”，同时仍然能从扬声器/耳机听到声音。

但是，对于如腾讯会议、钉钉、Zoom等专业会议视频软件，您需要在会议设置中将扬声器设备更改为多输出设备，以确保会议的音频输出能够被应用软件准确捕捉并处理。具体操作步骤，请参考下一节：会议视频软件配置。

会议视频软件配置:

在使用会议视频软件时，请依照下图指引调整会议中的扬声器设备设置。这样做能够确保会议的音频输出被应用软件有效识别，从而保障流畅、无干扰的会议体验。

钉钉

飞书

腾讯会议

Zoom

云视讯

华为云会议-1

华为云会议-2

Microsoft Team -1

Microsoft Teams-2

现在，您可以在应用软件中选择语音输入设备为“扬声器”，同时仍然能从扬声器/耳机听到会议声音。

4.3.3 配置岗位术语热词

配置热词可提高语音识别专业术语的准确度。操作步骤如下：点击“菜单栏-岗位术语热词”

可选默认预设岗位，预设热词不可变更。如需更改热词，需添加自定义岗位。
可添加自定义岗位，支持同步预设热词并手动增删改热词。同步预设热词方法：勾选需要同步的预设热词库，点击“复制勾选热词至自定义岗位”
注意事项：不要配置词组，尽量配置单词，否则会影响识别效果，例如：“zookeeper” 需要拆分成 “zoo” 和 “keeper”；“项目经理” 需要拆分成 “项目” 和 “经理”。

选择预设岗位热词

添加自定义岗位，编辑热词

4.4 手机远程快捷控制

手机远程快捷控制，可以让您通过手机轻松控制本应用。您只需在手机上扫描二维码，打开网页，即可在手机上看到桌面应用的操作界面，便可实现对应用的操控。

4.4.1 操作步骤：

请先将手机和电脑连接到同一个WiFi网络。
打开桌面应用，点击左上角的“手机控制”按钮。使用手机扫描二维码，打开网页，进入镜像控制界面。
手机控制无法启动，点击查看解决方案：链接

控制二维码

手机控制界面

6. 客户支持

邮箱：yanzhishenying@gmail.com
淘宝店铺客服：

感谢您选择我们的产品，祝您使用愉快！