人工智能(AI)正在迅速发展,中国开发的人工智能聊天机器人 DeepSeek 是掀起波澜的最新技术之一。 DeepSeek 快速而详细的响应有很多优点,但也有一些缺点,可能不是您正在寻找的 AI 工具。
什么是 DeepSeek?
了解DeepSeek:中国全新超强AI模型图1
DeepSeek是一家中国科技公司开发的人工智能新技术。其旗舰型号 DeepSeek-V3 采用独特的专家混合 (MoE) 架构。将其视为一个专门人工智能系统的“团队”,其中只有最相关的专家被“激活”来处理特定任务,其中每个“专家”都是一个专门的神经网络。
DeepSeek 声称其 LLM V3 接受了高达 14.8 万亿个代币的训练,其中 100 万个代币相当于约 75 万个单词。 DeepSeek V3 总体上也是一个庞大的 LLM,其整个 MoE 架构中有 6710 亿个参数,其中每个令牌激活了 370 亿个参数。这意味着每个提示背后都有强大的处理能力,从而实现更快、更高效的性能。
此外,它是一个开源人工智能模型,这意味着任何人都可以免费探索、实验和构建它。这使其与那些将模型保留在付费墙后面的竞争对手区分开来。
检查 DeepSeek
为了了解 DeepSeek-V3 的表现,我们在三个实际任务上对其进行了测试:创意写作、代码支持和生产力。它的性能展示了多功能性和原始动力,但一路上也出现了一些小问题。
任务 1:写一个虚构人物的描述
文章作者要求 DeepSeek 详细描述一个虚构人物:一位领导反抗邪恶帝国的叛逆女王。输出生动且引人入胜。
了解DeepSeek:中国全新超强AI模型图2
任务 2:调试 JavaScript 函数
通过向 DeepSeek 提供一个计算数字阶乘的错误 JavaScript 函数来测试 DeepSeek 的编程技能。这是它得到的错误代码:
function factorial(n) { if (n = 1) { return 1; } return n * factorial(n - 1); }
DeepSeek立即发现了问题:条件中的等号(=)导致了逻辑错误。它提供了更正的代码并解释了问题:
了解DeepSeek:中国全新超强AI模型图3
这个修复工作完美,并且它的解释足够清晰,足以让 JavaScript 新手理解。
任务 3:生产力 - 创建会议议程
为了测试生产力,请让 DeepSeek 为有关新产品发布的项目团队会议起草一份简明议程。
了解DeepSeek:中国全新超强AI模型图4
DeepSeek 擅长创意、编程和生产力任务,全面提供精美的输出。与任何人工智能工具一样,考虑输出的准确性很重要,尤其是当准确性是一个关键因素时。
DeepSeek 的优点、缺点和注意事项
对 DeepSeek 进行测试后,该人工智能模型的一些优点和缺点变得显而易见。它还以一些意想不到的方式让我们感到惊讶。
DeepSeek 可以轻松处理各种任务。从创建生动的作品到调试复杂的代码,它已被证明与领先的人工智能模型一样通用。其 Mixture-of-Experts 架构兑现了其承诺,使 DeepSeek 在不牺牲输出质量的情况下快速运行。例如,它可以在几秒钟内生成详细的输出,例如角色描述或会议议程。 DeepSeek 可以轻松调整其语气和风格。无论是处理正式文件还是作品,它都可以根据任务定制响应。
与许多人工智能模型一样,DeepSeek 有时会提供不正确或不完整的信息,特别是当被问及深入或非常具体的主题时。例如,在一次与历史事件相关的测试中,它自信地给出了错误答案。
了解DeepSeek:中国全新超强AI模型图5
虽然 DeepSeek 是开源的,但其支持文档和教程不如 GPT-4 等工具强大,这使得新用户很难最大限度地发挥模型的潜力。由于它起源于中国,一些用户可能会担心他们的数据是如何处理或存储的。虽然没有证据表明他们的数据被滥用,但对于敏感任务(就像任何人工智能聊天机器人一样!),这些担忧值得考虑。
也许最令人惊讶的是,对于在中国开发的模型,DeepSeek 表现出了对全球文化和观点的令人难以置信的理解。它显示了对从欧洲文学到非洲历史等主题的深刻理解。 DeepSeek 的另一个意想不到的优势是它的创造力。当被要求描述一个角色时,它不仅提供了描述,而且还围绕该角色创建了上下文以及该角色与其他角色的关系。
4 ★ | 1 票