Skip to content

大家好,我是 Ai 学习的老章

感觉最近的国产大模型,最好的开源大模型都是由中国开发的,不但 HF 上下载量已经反超美国,路线更加多样了。比如

目前阿里是开源世界数量最多,系列最广泛,下载次数最多的大模型厂商。前段时间阿里_开源_大模型全球第一,但,最强大模型_不开源_了一文中提到了 Qwen3-Max-Instruct

预览版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

Qwen3-Max 的推理增强版本—— Qwen3-Max-Thinking 正在训练

这不,它来了

必然是不开源,线上可试用,API 也可以用了

今天就来测试一下

好久没有登录 chat.qwen.ai 了,发现它新增了记忆功能,可以记住所有对话中的用用细节和偏好,提供个性化、一致性的回复

左上角切换,选择Qwen3-Max,下方选中深度思考模式

测试 1:总结朱自清《背影》绘制 SVG

很拉垮,没有识别 4 次背影,样式很丑,不如 M2,更别提 Claude 了

它一开始还没有生成可以预览的 svg,让其生产 html 预览版,它就稍微随意发挥了一些

测试 2:生成器官分布

效果非常好,比智谱的 GLM-4.5-Air 还要好,这题目的其他模型测试我在这篇文章有介绍:快手编程大模型真实水平,本地部署,实测

测试 2:创建一个带有旋转星云和动态光照的 3D 粒子星系。

也可以,可调整参数都能生效

测试 4:发挥你的最大才能,用你最擅长的工具,生成一组数据后绘制数据大屏,主题自拟。

它用 Python 的 Plotly 和 Dash 框架创建的交互式数据大屏。这个大屏展示了全球气候变化的关键指标,包含四个核心可视化模块,所有数据均为模拟生成(基于真实趋势)。

但是,bug 了

报错给到它之后,修复了

还不错,是可交互的,但是为何是英文页面呢,而且鼠标移动到图上,数字示例的背景色也不太理想

测试 5:3D 动画演示月食原理及全过程

它没有给我想要的东西,而是给了设计方案

追问让其给我具体可执行代码后,它换成了 3D.js 实现,代码量 481 行

想法挺好的

但是首次预览,失败了,报错:Uncaught TypeError: Failed to resolve module specifier "three". Relative references must start with either "/", "./", or "../".

二次生成的代码,运行依然不 ok

测试 6:生成一个动态网页,展现绚丽多彩的烟花盛况,样式要多,颜色要炫

它用 Canvas 来实现包含多种烟花类型、粒子效果和交互功能,代码量 612 行

运行 ok,但是烟花类型很单一,提到的柳条、棕榈、环形、星形都看不到

测试 7:解决一个几何问题

正方形里面有一个小圆,请问小圆的半径与正方形边长的关系是多少?

这道题很不容易,答案是正方形边长的 4/33。

Qwen3-Max 回答错误

试了 Kimi-K2、Minimax-M2 Agent 模式、Gemini-CLI 也错误

可能确实太难了

综上:Qwen3-Max 不给力啊?

Generated by Gemini CLI