国产AI应用体验测评
自ChatGPT横空出世惊艳世人以来,各大互联网厂商纷纷推出了自家的AI应用,潜移默化地改变着我们的生活。最近我深度体验了几款国产AI应用,今天就从几个我个人比较关注的维度,对这些AI助手进行一次横向测评。本次的“参赛选手”包括:通义千问、腾讯元宝、豆包、Kimi、DeepSeek以及文心一言。
- 外观美观度与易用性(移动端):
- 元宝:界面干净整洁,风格清新,操作流畅且无臃肿元素。毫无疑问,它的视觉舒适度和用户体验是目前最好的。
- DeepSeek 和 Kimi:界面设计非常原始,甚至可以说是“毛坯房”风格,适合偏爱极简主义的用户。
- 豆包:移动端的风格更接近微博这类传统APP,底部强行加入了一个略显多余的通知菜单,推测是为了服务于社交功能。
- 千问 和 文心:在近期更新前显得无比臃肿,侧边菜单逻辑不清,滑动甚至会出现卡顿。虽然更新后有所改善,但只能说是勉强及格。
- 对话分组与临时对话: 随着使用时间的增加,积累的对话会越来越多。如果不能分组,历史记录会显得非常凌乱;而如果都在同一个对话窗口中继续,又容易引入不必要的上下文干扰。对于有整理习惯的用户来说,对话分组和临时对话是非常重要的功能。元宝率先实现了这一点,值得一个大大的赞。千问的网页端和桌面端最近也更新了对话分组功能,遗憾的是移动端尚未同步。此外,分组功能通常还支持为组内对话添加特定指令以定制输出风格(类似于豆包中的“智能体”),例如设定以媒体记者的视角来回答问题。
- 结果质量与生成速度: 在我的主要使用场景(即作为搜索引擎的替代品)中,各家AI的输出质量并没有拉开明显的差距,但在拟人化情感表达上各有特点。
- 千问:默认风格比较活泼调皮,喜欢使用语气词和Emoji表情,像是一只快乐的AI修勾🐶。但在询问严肃问题时,这种风格有时会显得不够专业。
- 豆包:习惯在回答结束后反问相关问题,这一点与ChatGPT类似。缺点是过于注重娱乐和社交属性,有时会在结果中插入短视频为抖音引流,体验令人一言难尽。
- Kimi:生成速度明显最慢,且“深度研究”功能目前尚未对普通用户开放。
- 文字排版、Markdown支持及公式代码显示:
- 千问 和 豆包:属于第一梯队,正文中夹带的公式和代码显示准确。
- DeepSeek、元宝 和 Kimi:偶尔会出现LaTeX公式渲染出错的问题。
- Kimi:排版能力较弱,输出结果几乎没有加粗高亮或标题字号放大,复制出来的表格也不是Markdown格式。
- 代码能力: 目前我还没有尝试用这些AI助手编写复杂的项目。在我的使用习惯中,它们更多是替代了知乎、CSDN、博客园等传统技术社区的生态位,用于查询和学习具体的编程技术;真正编写代码时,我还是更倾向于使用ChatGPT、Gemini或Claude。 值得一提的是,豆包和元宝支持(包括移动端)直接运行代码。在缺乏开发环境时,运行一些简单的代码片段确实有所帮助。但由于它们生成的往往是不完整的代码片段,这一功能的实际应用场景其实比较有限。
- 进阶玩法: 豆包、千问和文心都支持“AI创作”和“智能体”玩法,元宝中的“分组指令”也与之类似,不过我目前体验不多。实际上,这些功能通过普通的对话Prompt也能实现,体验上没有本质差别。厂商单独在APP中开放入口,更多是探索AI应用落地场景以及争夺流量入口的尝试。参考国外的同类应用,目前大多尚未加入此类功能。
作为一个80%的使用场景都是将AI助手当作百科全书来搜索资料的用户,我并没有感觉到哪一款AI在生成结果方面能稳稳领先其他选手一个身位。因此,我经常会向每一个AI提问,然后从中选择一个最好的回答进行总结记录。毕竟我没有为其中任何一个付费,既然是免费的Token,自然要“货比三家”,尽力白嫖。
本文最终由Gemini 3 Pro进行润色。
本文由作者按照 CC BY 4.0 进行授权