使用谷歌文档在 Ubuntu 中对文本进行语音识别
创始人
2024-03-02 12:49:46
0

这就是在包括 Ubuntu 在内的 Linux 系统中将语音转换为文本的方法。

Linux 系统中可用的语音识别软件不多,尤其是原生桌面应用。有一些可用的应用使用 IBM Watson 和其他 API 将语音转换为文本,但它们的用户交互不友好,需要一些复杂的用户交互,例如用相应的语言进行一些编程或脚本编写。

但是,没有多少用户知道 谷歌文档 Google Docs 使用自己的 AI 技术提供了高级语音识别,它可以通过 Chrome 访问谷歌文档使用。

任何用户都可以使用此功能将语音转换为文本,而无需高级计算机知识。谷歌文档的这个功能最好的一点是你可以在任何 Ubuntu 衍生版或任何支持 Chrome 的 Linux 发行版中使用它。

让我们看看如何在 Ubuntu 中启用它。

如何将语音转换为文本

先决条件是你应该在系统中安装 Chrome 并拥有谷歌帐户。如果你没有安装 Chrome,你可以访问 此链接 并下载、安装 Chrome。

此外,如果你没有谷歌帐户,你可以使用 此链接 免费创建一个。

步骤 1

从 Chrome 打开 https://docs.google.com 并创建一个空白文档。

创建一个空文档

步骤 2

加载空白文档后,从菜单中单击“工具 > 语音输入”。

启用语音输入

步骤 3

在左侧,你可以看到一个麦克风图标。单击麦克风图标,Chrome 会首次要求允许通过浏览器访问麦克风。单击允许。

点击麦克风

允许文档访问麦克风

默认情况下,它使用你的系统语言作为语音的检测语言,同时将其转换为文本;但是,你可以根据可用的语言列表将其更改为所需的任何语言。到目前为止,谷歌文档支持和识别超过 60 多种语言,同时将它们转换为文本。

步骤 4

单击允许后,麦克风图标将变为橙色,现在它已准备好接受或识别你的声音。开始说任何你想说的话,瞧!你将看到你的演讲被转换为文本并写入文档。

正在进行语音转文字

完成了。你已通过谷歌 Chrome 和谷歌文档在 Ubuntu 中成功地将语音转换为文本。

所有 Linux 用户都可以免费使用这个很棒的功能。如果你知道其他可以在 Linux 中将语音转换为文本的应用,请在下方的评论区发表评论。另外,让我知道你是否觉得这篇文章有用。

故障排除

如果上述功能在你的浏览器中不起作用,请务必查看以下内容。

  • 打开设置窗口(在 Ubuntu 或其他发行版的 GNOME 桌面中)。
  • 转到“隐私 > 麦克风”。
  • 并确保它已启用。

检查 Ubuntu 中的麦克风设置

总结

虽然,最近有一种基于云的解决方案可用,例如 Amazon Polly 等。但它们的价格很高。另外还需要一些有用的知识。

而谷歌 Chrome 的内置语音识别功能简单易用。虽然它有点慢,但它可以为普通用户完成工作。

也就是说,我希望本指南可以帮助你将语音转换为文本,如果你知道这样的免费应用,请在评论区告诉我。


via: https://www.debugpoint.com/speech-recognition-to-text-in-linux-ubuntu-using-google-docs/

作者:Arindam 选题:lkxed 译者:geekpi 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

相关内容

千问AI打电话订餐真假难辨...
近日,千问App最新上线的“打电话订餐厅”功能引发广泛关注,网友热...
2026-01-26 14:19:02
南加州大学让AI说话更有口...
当我们听到不同地区的人说英语时,总能轻松区分出美式英语和英式英语的...
2026-01-25 18:46:57
FlashLabs首创语音...
这项由FlashLabs公司开发的突破性研究于2026年1月发表在...
2026-01-25 17:21:34
东软集团与赛轮思AI签署合...
1月21日,东软集团与赛轮思AI(Cerence AI)正式签署合...
2026-01-22 10:19:47
AI应用领域的龙头股
AI应用领域的龙头股主要集中在智能语音、行业大模型、AI安全、创意...
2026-01-20 18:24:56
DeepSeek最新版本更...
1月9日,近日,DeepSeek更新至1.6.3版本,支持语音输入...
2026-01-19 19:24:57

热门资讯

2020 年的 GitHub ... 距离 2020 年结束只剩下区区 24 天,我们即将结束魔幻的 2020 ,迎来新的一年,新的一年或...
开源新闻速递:openSUSE... 今日关注openSUSE 项目组的 Dominique Leuenberger 在他的周报中说:“这...
KDE4.11 Beta1 正...   KDE 项目工作组刚刚发布了 KDE Software Compilation 4.11 Bet...
如何在 Github 上创建一... 学习如何复刻一个仓库,进行更改,并要求维护人员审查并合并它。你知道如何使用 git 了,你有一个 G...
《Apex 英雄》正式可在 S... 《Apex 英雄》现已通过 Steam Deck 验证,这使其成为支持 Linux 的顶级多人游戏之...
Helix:高级 Linux ... 说到 基于终端的文本编辑器,通常 Vim、Emacs 和 Nano 受到了关注。这并不意味着没有其他...
使用时间序列数据,用开源工具助... InfluxData 是一个开源的时间序列数据库平台。下面介绍了它是如何被用于边缘应用案例的。收集到...
JStock:Linux 上不... 如果你在股票市场做投资,那么你可能非常清楚投资组合管理计划有多重要。管理投资组合的目标是依据你能承受...
Textual:为 Pytho... 快速入门使用 TextualPython 在 Linux 上有像 TkInter 这样的优秀 GUI...
硬核观察 #1245 Open... #1 OpenAI 悄然删除禁止将 ChatGPT 用于 “军事和战争” 的禁令在 1 月 10 日...