Appearance
大家好,我是 Ai 学习的老章
迄今为止最强大的开源模型:Kimi K2 Thinking ,比肩闭源模型
本文测试一下表现如何,测试题目与
迄今为止最强的中文模型 Qwen3-Max,实测,略失望一文中完全相同,顺便对比 K2 Thinking 与 Qwen3-Max
我是使用的网页版——https://www.kimi.com
开启了长思考,关闭了联网

测试 1:总结朱自清《背影》绘制 SVG

比拉垮的 Qwen3-Max 强太多了,识别出了 4 次背影并正确引用原文,就是样式有点丑。
下图是 Qwen3-Max 的表现

测试 2:生成器官分布

就详细程度,Qwen3-Max 绿剩一周
测试 3:创建一个带有旋转星云和动态光照的 3D 粒子星系。 
这一题各有千秋,K2 Thinking 看起来可调节参数少,但是 Qwen3-Max 很多都是摆设。
测试 4:发挥你的最大才能,用你最擅长的工具,生成一组数据后绘制数据大屏,主题自拟。
K2 Thinking 生成的是"未来智慧城市运营中心"主题的数据大屏,包含动态生成的多维度城市运营数据。一共 285 行代码。
但是。。。报错了

再次生成后依然报错

第三次成功生成!

对比 Qwen3-Max⬇️,它第一次的代码也报错,第二次成功

测试 5:3D 动画演示月食原理及全过程
Qwen3-Max 生成了若干次都无法正常运行
K2 Thinking 一次成功
![[11月8日Kimi K2 Thinking生成月食动画 copy.mp4]]
测试 6:生成一个动态网页,展现绚丽多彩的烟花盛况,样式要多,颜色要炫
这个 K2 Thinking 碾压式完胜
请看视频
测试 7:解决一个几何问题
正方形里面有一个小圆,请问小圆的半径与正方形边长的关系是多少?

这道题很不容易,答案是正方形边长的 4/33。
至今没有模型可以正确回答
总体看,K2 Thinking 打 Qwen3-Max 毫无问题
