新知榜官方账号
2023-11-18 04:28:22
11月14日至15日,由中国人工智能学会、嘉兴市人民政府主办,嘉兴市南湖区人民政府、嘉兴科技城管理委员会、浙江未来技术研究院(嘉兴)共同承办的2020第十届中国智能产业高峰论坛(CIIS2020)在嘉兴南湖举办。在11月15日的自然语言理解专题论坛上,西湖大学特聘研究员张岳为我们带来了题为《自然语言处理的一些瓶颈思考与探索》的精彩演讲。
张岳介绍了自然语言处理方向的进步。他提到,对话系统、机器翻译、机器自动文摘等任务的进步主要是受益于大规模预训练的语言模型。这些模型通过预测互联网上的文本进行预训练,获得了一些语言知识,这些知识被证明还有词法、句法、语义甚至一定的常识知识,所以可以帮助我们把任务做好。
张岳介绍了GLUE和SuperGLUE两个自然语言处理领域常用的数据集集合,这些集合里包括了阅读理解、句法任务、情感分析、自然语言的文本推理等。像BERT这样的预训练模型,在这些任务上都做到了接近甚至超越人类的程度。
张岳提到,机器在处理常识推理方面还存在一些瓶颈。他设计了三个从简单到难的任务来验证机器的常识判断能力。这些任务涵盖了人类情绪态度的推理、时间日期上的推理、对下一步一般人的选择需要有一个正确推断、对周围环境做很好推断和很多事实融合等。
实验结果表明,没有经过微调的预训练模型在判断题和原因选择上的表现只能达到70%和40%以上,有针对性地进行训练之后,模型在这些任务上的表现才能接近人类。不过,当前的模型在纯的逻辑推理上表现较差,在数学上也表现不佳。
张岳提出,逻辑推理是死记硬背的题海战术绝对难以解决的问题。他介绍了从公务员考试里挖出来的一个阅读理解数据集,这个数据集是一个标准的阅读理解形式的数据,需要判断答案ABCD哪个对。
实验结果表明,当前的预训练模型在这些推理问题上表现较差,需要结合知识和符号主义算法进行互补。
相关工具
相关文章
相关快讯
推荐
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49
国产GLM-4.5把AI价格打到地板价,实测强到离谱!
2025-07-30 09:08
用AI批量生成治愈系漫画,月入2000+
2025-07-29 09:59
千亿市场规模背后,AI短剧商业化迎来爆发期?
2025-07-17 09:19
15个作品涨粉26万!AI历史账号又出王炸案例!
2025-07-09 09:37
亲测真香!这6个AI工具让工作效率翻倍,同事追着问链接
2025-06-17 16:21
FLUX.1 Kontext 一出,AI生图领域 “地震” 了!
2025-06-06 15:38
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15