国产AI应用体验测评

发表于 2025/11/26

作者

7 分钟阅读

自ChatGPT横空出世惊艳世人以来，各大互联网厂商纷纷推出了自家的AI应用，潜移默化地改变着我们的生活。最近我深度体验了几款国产AI应用，今天就从几个我个人比较关注的维度，对这些AI助手进行一次横向测评。本次的“参赛选手”包括：通义千问、腾讯元宝、豆包、Kimi、DeepSeek以及文心一言。

外观美观度与易用性（移动端）：
- 元宝：界面干净整洁，风格清新，操作流畅且无臃肿元素。毫无疑问，它的视觉舒适度和用户体验是目前最好的。
- DeepSeek 和 Kimi：界面设计非常原始，甚至可以说是“毛坯房”风格，适合偏爱极简主义的用户。
- 豆包：移动端的风格更接近微博这类传统APP，底部强行加入了一个略显多余的通知菜单，推测是为了服务于社交功能。
- 千问和文心：在近期更新前显得无比臃肿，侧边菜单逻辑不清，滑动甚至会出现卡顿。虽然更新后有所改善，但只能说是勉强及格。
对话分组与临时对话：随着使用时间的增加，积累的对话会越来越多。如果不能分组，历史记录会显得非常凌乱；而如果都在同一个对话窗口中继续，又容易引入不必要的上下文干扰。对于有整理习惯的用户来说，对话分组和临时对话是非常重要的功能。元宝率先实现了这一点，值得一个大大的赞。千问的网页端和桌面端最近也更新了对话分组功能，遗憾的是移动端尚未同步。此外，分组功能通常还支持为组内对话添加特定指令以定制输出风格（类似于豆包中的“智能体”），例如设定以媒体记者的视角来回答问题。
结果质量与生成速度：在我的主要使用场景（即作为搜索引擎的替代品）中，各家AI的输出质量并没有拉开明显的差距，但在拟人化情感表达上各有特点。
- 千问：默认风格比较活泼调皮，喜欢使用语气词和Emoji表情，像是一只快乐的AI修勾🐶。但在询问严肃问题时，这种风格有时会显得不够专业。
- 豆包：习惯在回答结束后反问相关问题，这一点与ChatGPT类似。缺点是过于注重娱乐和社交属性，有时会在结果中插入短视频为抖音引流，体验令人一言难尽。
- Kimi：生成速度明显最慢，且“深度研究”功能目前尚未对普通用户开放。
文字排版、Markdown支持及公式代码显示：
- 千问和豆包：属于第一梯队，正文中夹带的公式和代码显示准确。
- DeepSeek、元宝和 Kimi：偶尔会出现LaTeX公式渲染出错的问题。
- Kimi：排版能力较弱，输出结果几乎没有加粗高亮或标题字号放大，复制出来的表格也不是Markdown格式。
代码能力：目前我还没有尝试用这些AI助手编写复杂的项目。在我的使用习惯中，它们更多是替代了知乎、CSDN、博客园等传统技术社区的生态位，用于查询和学习具体的编程技术；真正编写代码时，我还是更倾向于使用ChatGPT、Gemini或Claude。值得一提的是，豆包和元宝支持（包括移动端）直接运行代码。在缺乏开发环境时，运行一些简单的代码片段确实有所帮助。但由于它们生成的往往是不完整的代码片段，这一功能的实际应用场景其实比较有限。
进阶玩法：豆包、千问和文心都支持“AI创作”和“智能体”玩法，元宝中的“分组指令”也与之类似，不过我目前体验不多。实际上，这些功能通过普通的对话Prompt也能实现，体验上没有本质差别。厂商单独在APP中开放入口，更多是探索AI应用落地场景以及争夺流量入口的尝试。参考国外的同类应用，目前大多尚未加入此类功能。

作为一个80%的使用场景都是将AI助手当作百科全书来搜索资料的用户，我并没有感觉到哪一款AI在生成结果方面能稳稳领先其他选手一个身位。因此，我经常会向每一个AI提问，然后从中选择一个最好的回答进行总结记录。毕竟我没有为其中任何一个付费，既然是免费的Token，自然要“货比三家”，尽力白嫖。

本文最终由Gemini 3 Pro进行润色。

扯

AI GPT AI助手 AI应用

本文由作者按照 CC BY 4.0 进行授权

热门标签