ChatGPT的推理能力测试

新知榜官方账号

2023-08-05 22:02:26

ChatGPT的推理能力测试

ChatGPT的推理能力被人们广泛关注,本文以一系列逻辑推理题为例,测试ChatGPT的推理能力。

测试正式开始

首先一个非常简单的问题:找出与确信意思相同或者意义最相近的词。

  1. 正确
  2. 明确
  3. 信心
  4. 肯定
  5. 真实

ChatGPT给出的答案是:肯定。完全正确,这说明它对中文词意的理解是比较到位的。

下一个问题:找出与众不同的一个

  1. 太阳
  2. 汽油
  3. 水泥

给出的答案是:水泥。完全正确,水泥是人造建筑材料,其他四个都是自然界中存在的东西。

对于基本的特征识别问题,AI表现的非常好,那么我们再稍微的把这个难度给提高一点。

问题是:樱桃对于红相当于牛奶对于湿冷白甜熟

给出的答案是:白。回答正确,并且给出了推理过程,解释的还很流畅。

下一题:全班学生排成一行从左数和从右数甲都是第15名,那么问全班一共有多少学生

给出答案是:29人。回答正确,一个简单的数学题,完美解答。

接下来我们开始真正的暴击,看一看ChatGPT对于较长的token理解如何?

题目是:假如你给女朋友发红包发了0.1元,结果女友回了0.2元,于是你再次发0.3元,女友再次回了你0.4元……,那么你再次发了99.9元,女友这次没有回你了,真的没有回你了,那么请问你亏了多少钱。

ChatGPT给出的计算结果是50元,答案有点喜感哈哈哈,正确答案是50元。看来ChatGPT3.5对于复杂的问题理解能力还是有限的。下次我们用ChatGPT4.0来测试一下。

GPT4拥有超过100万亿个参数(1e+15),而GPT3只有1750亿个参数(1.75e+11),这意味着GPT4可以处理更多的数据,生成更长、更复杂、更连贯、更准确、更多样化和更有创造力的文本。

有什么想测试的问题欢迎评论区留言,让我们一起测试一下ChatGPT的能力究竟怎样。

本页网址:https://www.xinzhibang.net/article_detail-9301.html

寻求报道,请 点击这里 微信扫码咨询

关键词

ChatGPT 推理能力 AI测试

分享至微信: 微信扫码阅读

相关工具

相关文章