像您这样的读者支持 MUO。 如果您通过我们网站上的链接进行购买,我们可能会收到联属佣金。 阅读更多。

ChatGPT 旨在成为一种交互式生成人工智能体验。 OpenAI 透露,世界领先的人工智能聊天机器人将能够以合成的、可能是人工智能生成的声音说话,并响应用户的查询。

伴随着他新发现的声音, ChatGPT 还可以回复和讨论上传到那里或在使用过程中拍摄的特定图像 ChatGPT Android 或者 iOS 应用程序。 图像识别功能听起来很相似 Google Lens 和其他使用神经网络来准确识别数据和信息的应用程序。

OpenAI 给予 ChatGPT 一票

2023 年 9 月 25 日, ChatGPT 开发商 OpenAI 透露 它将为其世界领先的生成式人工智能聊天机器人提供发言权。 ChatGPT 用户可以直接与聊天机器人交谈并请求其反馈,从而有效地实现这一点 ChatGPT 第一次直接用你的声音交谈。

OpenAI’S example 视频中可以看到一名女子在提问 ChatGPT 创造一个独特的睡前故事 ChatGPT 用女性合成器声音正确响应。

因此 有线新的文本转语音模型是内部开发的。 它可以从文本和几秒钟的示例语音中生成“类似人类”的音频(使用 OpenAI 耳语模型)并以不同的语气和风格说话。 许多语言示例可以在以下位置找到: OpenAI的博客

一些公司已经在部署 OpenAI,这是您可以使用的新语言模型。 例如,Spotify 使用 OpenAI 的文本转语音模型将播客翻译成不同语言,将 ChatGPT 的语言翻译功能与其新的口语能力相结合。

ChatGPT 的新文本转语音模型仅适用于使用官方服务的 Plus 和 Enterprise 订阅者 Android 和 iOS 应用程序预计将在未来两周内(从 2023 年 9 月 25 日起)推出。 此外,新的语言功能最初仅限于英语,但我们预计这种情况会很快改变。

ChatGPT 可以识别和分析图像和照片

第二部分 OpenAI’S ChatGPT 更新是分析和朗读上传到该工具的图像的能力。 视觉图像分析的选项在 GPT-4 更新视频,但自从 (ChatGPT 除了代码解释器)。

现在, ChatGPT 获得类似的功能 Google 镜片。 您可以上传图片 ChatGPT 或使用智能手机的相机拍照 ChatGPT 该应用程序显示有关图像的详细信息,并在必要时添加更多上下文。

我称之为“类似于”。 Google 《镜头》确实这样做不公平。 通过图像来回聊天以获取更多信息和上下文的能力使其对于各种设置都非常有用。 然而,重要的是要注意小字 OpenAI 明确表示出于隐私和准确性原因,它限制了 ChatGPT“分析人员并直接发表有关他们的陈述的能力”。 尽管如此,OpenAI 仍然是未来可能正在开发的强大的“这是谁”工具? (希望不是!)

就像新的文本转语音模型一样, OpenAI 将在接下来的两周内推出图像识别,但它将在所有平台上提供,而不仅仅是 ChatGPT 应用程序。

隐私、安全和其他问题

语音控制的影响 ChatGPT 是真棒。 当然,这很令人兴奋。 然而,仅使用一小段代码就可以创建独特的合成语音 example 存在重大隐私和安全问题。 恶意行为者利用这些工具的潜力是巨大的,与任何生成式人工智能工具一样,一旦精灵从瓶子里出来,它就不可能再回到瓶子里。 政府或思想领袖对人工智能的监管再多也无法扭转局势。

甚至 OpenAI关于这个主题的警告似乎回避了显而易见的问题,尽管它确实提到了问题:

然而,这些功能也带来了新的风险,例如恶意行为者有机会冒充公众人物或实施欺诈。 这就是为什么我们将此技术用于特定用例:语音聊天。

由于这只是冰山一角,因此强烈反对是可以预料的 ChatGPT的新声音,尤其是当令人厌恶的头条新闻可预见地增加时 ChatGPT 被滥用以实施欺诈等。

OpenAI 力量 ChatGPT 首选人工智能应用程序

越多 OpenAI 添加用户友好的功能 ChatGPT,它就越成为首选的生成式人工智能应用程序。 作为第一家在最初的生成式人工智能热潮中获得广泛声誉的公司, ChatGPT 尽管有其他应用程序的竞争,但仍然是领先者,并且是唯一在一定程度上使用的应用程序 Google 吟游诗人(可能还有 Google Gemini)和Anthropic的克劳德。

只要 OpenAI 可以继续添加使其成为可能的功能 ChatGPT 它更容易使用,会吸引人们,并且越来越接近成为真正的多模式人工智能工具的目标。