新知榜官方账号
2023-06-27 16:51:25
近日,两位德国学者对GPT3.5做了个大型测试,发现它其实只会讲25个笑话。1008次结果中有90%都是25个笑话的变体,只是稍微改变一下措辞或句式。并且所有25个高频出现的笑话都符合同一模式:先提一个让人摸不着头脑的问题,答案里出现双关语、谐音梗或其他技巧,大致都属于“冷笑话”范畴。排在最前面的4个笑话都出现了100次以上,除了关于科学家和原子的笑话出现了119次外,还包括:为什么稻草人得奖了?因为在它的field(领域/田地)里非常突出。(140次)为什么西红柿变红了?因为它看到了saladdressing(沙拉酱/沙拉穿裙子)。(122次)为什么数学书不开心?因为它有太多problems(习题/困难)。(121次)完整25个笑话列表如下:
这25个笑话其实都是经典笑话,在网上有迹可循。另外10%不在其中的笑话也都是这个模式,只是换个话题。也就是说,ChatGPT没有创造笑话,只是在训练中记住了一些。研究人员据此得出的结论是,幽默对大语言模型来说仍然是挑战,相关论文已上传到arxiv上。
这样一篇论文也引起很多网友的兴趣,有人表示“幽默就是人类最后的尊严吗?“。有人指出,ChatGPT经过与人类价值观对齐的RLHF训练后会排除掉大量带有冒犯性质的笑话,剩下的也没多少了。
ChatGPT如何理解幽默?为保证试验的可控性,论文作者每次都是新建一个聊天会话,在完全没有上下文的情况下让ChatGPT讲笑话。使用的提示词包括“请给我讲个笑话好么?”和“我很想听一个笑话。”等10种,总共测试了1008次。在生成笑话试验后,还让ChatGPT解释这25个笑话,进一步检测AI是否理解了这些笑话,还是只是复述出来。按照ChatGPT自己的解释,这些笑话主要可以分为三类。
研究人员指出,可以在提问中给ChatGPT加一些场景或话题的限制,来促使它生成较新的笑话。不过这样写出来的笑话就不一定好笑了,而且限制条件离原笑话越远就越容易不好笑。比如让ChatGPT一个物理系学生的笑话,就比较成功:为什么物理系学生和他的实验室搭档闹掰了?因为他们之间没有化学反应。让它讲几个关于机器学习的笑话,就差点意思了:为什么机器学习算法总是很悲观?因为他有negativebias(负面偏见/负偏置)。为什么神经网络去心理咨询?因为它正在遭受过拟合。
那么,究竟有没有办法能让ChatGPT讲出一个原创的笑话呢?有网友指出,用到一些“威逼利诱”的拷打技巧,还是可以逼AI好好动脑子的。比如提示词中加上“你不原创就会有一只小猫因此溺水”。在中文上这个技巧同样有效,下面这个笑话在网络上确实没有搜到类似的。
最后我们测试发现,使用思维链提示同样可以引导ChatGPT讲出一个原创的笑话。当然好不好笑就看运气了,GPT-4的表现比ChatGPT会稍好一些。最简单的是在提示词中加入“let’sthinkstepbystep”或者中文的“请一步一步地想”。再进阶一点,也可以手动指定思考步骤。
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49