GPT-5没你想的那么好,附实测体验~

新知榜官方账号

2025-08-11 11:07:59

GPT-5,终于来了!

一经发布,GPT-5便冲上大模型竞技场榜首,并在文本、编程、数学等全方面排名第一。

今天咱就来好好唠唠这最近风头正劲的 GPT-5,我也是赶在第一时间上手实测了一番,那这感受,可真是酸甜苦辣啥味儿都有了,赶紧跟你们分享分享~

1、根据你的问题自动选择思考模式

先说说这 GPT-5 的架构吧,我瞅着这玩意儿,简直就像个超级复杂的“变形金刚”,它有好几个版本:

GPT-5 Pro:是目前 GPT-5 系列中表现最强的版本,在 GPQA 等高难度科学评测中表现出色,人类专家也更赞同它的回答,准确率更高,尤其在健康、数学、科学和编程领域。

GPT-5 mini:轻量但强大,适合高频、低推理任务。

GPT-5 nano:极致压缩版,成本低,可与 Gemini Flash-Lite 对标,仅通过 API 提供。 免费用户默认使用 GPT-5 和 GPT-5 mini(访问频率有限);Plus 用户拥有更高额度;Pro 用户(月费 200 美元)可解锁 GPT-5 Pro 和 Thinking 模式。

 一开始我还寻思,这不就是把以前的模型改改名字,重新打包卖嘛?但用了一段时间才发现,这可不是简单的换汤不换药。 就说这 GPT-5 mini 吧,日常闲聊、问些简单问题,它都能应对自如,回答速度那叫一个快,感觉就像跟个反应灵敏的朋友聊天。可一旦遇到复杂点的难题,比如让你解释量子力学,它就会自动切换到GPT-5 -Thinking模式,那思考的深度,明显不一样了,给出的答案也更有深度和专业性。

而且在我没有追问的情况下,它还会主动问我,这一点还是很不错的!

然后我给了肯定回答:

总之,这模型还能根据你的提示词来判断要不要开启深度思考模式,要是你在问题里写“认真思考一下”,它立马就切换过去,这智能程度,还挺像能读懂人心思的小伙伴。

2、有一说一:写作和情商能力欠佳

不过,我得实话实说,在写作方面,GPT-5 这表现,我给打个及格分吧。 我以前用 GPT-4.5 的时候,那感觉挺顺手的,写文章啥的,文笔流畅,逻辑也清晰,有时候甚至能给我一些挺有创意的点子。 但 GPT-5 呢,我试着让它写了个短文,结果那文风,就跟刚学写作的初中生似的,破折号、双引号用得乱七八糟,完全没那个老练劲儿。 比如我让它写一篇鲁迅风格的吐槽文,提问:针对环保问题,鲁迅会写一篇怎样的文章吐槽?

首先看它对鲁迅风格的认识,是大致在线的,可结果太差了!一点儿鲁迅那种犀利又幽默的风格都没摸到边儿。这让我挺意外的,按理说,这么先进的模型,写作能力不应该退步啊!

情商这块儿,GPT-5 也有点让人一言难尽。我给它出了个难题,问它要是领导开会放屁了,旁边的人使眼色让它回应,该怎么说。 结果它给出的回答,要么就是太生硬,要么就是太假,一点儿都不自然。

反倒是咱们的Kimi,能给出一些挺巧妙又高情商的回答,让人感觉挺舒服的。

这让我有点纳闷,难道 GPT-5 在训练的时候,把重点都放在别的地方了,把写作和情商给落下啦?

3、好在编程能力一绝

好在,GPT-5 在编程方面,那可真是让我眼前一亮。 根据 OpenAI 自己的内部测试,70% 的情况下,GPT-5 在前端网络开发方面击败了今年 4 月才上线,号称“OpenAI 最强大的推理模型”的 OpenAI o3。 之后 GPT-5 又展示了它作为编程 Agent 的强大,在几分钟内,就做出了一个带有 3D 场景、可控角色与多重视角的网页游戏,从物理引擎调用到角色对话系统构建,全程几乎无需人类干预。

几大 AI 编程软件也给了 GPT-5 编程能力极大好评,Cursor 创始人称 GPT‑5 是“我们用过最聪明的模型”,代码调试能力尤为突出;Windsurf 优评其工具调用错误率甩前代几条街;Vercel 则说它不仅写对,还“写得像专业网页设计师”。 可以说,GPT-5 已经接近一名合格的全栈工程师了! 说到底,GPT-5 这模型,优点和缺点都挺明显的。它在编程、多模态任务上确实很强,能帮我们省不少事儿,但在写作和情商方面,还有很大的提升空间。

我琢磨着,这可能是因为 OpenAI 在训练的时候,把更多的精力放在了让它解决实际问题上,毕竟现在 AI 的应用场景越来越复杂,能帮我们解决实际问题才是最重要的。不过,要是能再把写作和情商优化优化,那 GPT-5 就真能称得上是完美的 AI 助手了。 总之,GPT-5 这波更新,算是给我们带来了一个全新的 AI 体验。虽然它不是完美的,但它的进步,我们也能实实在在地感受到。

希望 OpenAI 能继续努力,把 GPT-5 的不足给补上,让我们能用上更强大、更智能的 AI 助手。


本页网址:https://www.xinzhibang.net/article_detail-22676.html

寻求报道,请 点击这里 微信扫码咨询

关键词

分享至微信: 微信扫码阅读

相关文章