新知榜官方账号
2023-08-05 22:02:26
ChatGPT的推理能力被人们广泛关注,本文以一系列逻辑推理题为例,测试ChatGPT的推理能力。
首先一个非常简单的问题:找出与确信意思相同或者意义最相近的词。
ChatGPT给出的答案是:肯定。完全正确,这说明它对中文词意的理解是比较到位的。
下一个问题:找出与众不同的一个
给出的答案是:水泥。完全正确,水泥是人造建筑材料,其他四个都是自然界中存在的东西。
对于基本的特征识别问题,AI表现的非常好,那么我们再稍微的把这个难度给提高一点。
问题是:樱桃对于红相当于牛奶对于湿冷白甜熟
给出的答案是:白。回答正确,并且给出了推理过程,解释的还很流畅。
下一题:全班学生排成一行从左数和从右数甲都是第15名,那么问全班一共有多少学生
给出答案是:29人。回答正确,一个简单的数学题,完美解答。
接下来我们开始真正的暴击,看一看ChatGPT对于较长的token理解如何?
题目是:假如你给女朋友发红包发了0.1元,结果女友回了0.2元,于是你再次发0.3元,女友再次回了你0.4元……,那么你再次发了99.9元,女友这次没有回你了,真的没有回你了,那么请问你亏了多少钱。
ChatGPT给出的计算结果是50元,答案有点喜感哈哈哈,正确答案是50元。看来ChatGPT3.5对于复杂的问题理解能力还是有限的。下次我们用ChatGPT4.0来测试一下。
GPT4拥有超过100万亿个参数(1e+15),而GPT3只有1750亿个参数(1.75e+11),这意味着GPT4可以处理更多的数据,生成更长、更复杂、更连贯、更准确、更多样化和更有创造力的文本。
有什么想测试的问题欢迎评论区留言,让我们一起测试一下ChatGPT的能力究竟怎样。
微信扫码咨询
相关工具
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49