新知榜官方账号
2023-09-25 02:34:46
自然语言理解(NLU)是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。近年来,机器学习虽然被广泛使用,但是却不能很好的解决自然语言理解问题,其中可能涉及很多原因,ONTOLOGIK.AI的创始人和首席NLU科学家WalidSaba给出了自己的观点。
20世纪90年代早期,一场统计学革命取代了人工智能,并在2000年达到顶峰,而神经网络凭借深度学习成功回归。这一经验主义转变吞噬了人工智能的所有子领域,其中这项技术最具争议的应用领域是自然语言处理。以数据为驱动的经验方法在NLP中被广泛使用的原因主要包括:符号和逻辑方法在取得三十年的霸权后未能产生可扩展的NLP系统,从而导致NLP中所谓的经验方法(EMNLP)兴起,这些方法可以用数据驱动、基于语料库、统计和机器学习来统称。
这种向经验主义转变的背后动机非常简单:在我们对语言是如何工作、以及语言如何与日常口语中谈论的世界知识相关联的,在对这些了解之前,经验和数据驱动的方法有助于构建文本处理应用程序。正如EMNLP的先驱之一KennethChurch所解释的那样,在NLP领域,倡导数据驱动和统计方法的科研人员,他们对解决简单的语言任务感兴趣,其动机从来不是暗示语言就是这样工作的,而是做简单的事情总比什么都不做要好。
这种被误导的趋势导致了一种不幸的情况:坚持使用大型语言模型(largelanguagemodel,LLM)构建NLP系统,这需要巨大的计算能力,而且试图通过记忆大量数据来接近自然语言对象,这种做法是徒劳的。这种伪科学的方法不仅浪费时间和资源,而且会误导新一代的年轻科学家,错误地让他们认为语言就是数据。更糟糕的是,这种做法还阻碍了自然语言理解(NLU)的发展。
虽然自然语言处理(NLP)和自然语言理解(NLU)经常互换使用,但是两者之间存在实质性差异,突出这种差异至关重要。事实上,区分自然语言处理和自然语言理解之间的技术差异,我们可以意识到以数据驱动和机器学习的方法虽然适用于NLP任务,但这种方法与NLU无关。
在NLP中最常见的下游任务包括:摘要;主题抽取;命名实体识别;语义检索;自动标签;聚类。上述任务与PAC(ProbablyApproximatelyCorrect,可能近似正确)范式一致。具体地,NLP系统的输出评估是主观的:没有客观的标准来判断诸如一个摘要优于另一个,或某个系统提取的主题、短语比另一个系统提取的更好等等。然而,自然语言理解不允许有这样的自由度。要完全理解一个话语或一个问题,需要理解说话者试图表达的唯一思想。
总而言之,对普通口语的真正理解与单纯的文本(或语言)处理是完全不同的问题。在文本(或语言)处理中,我们可以接受近似正确的结果——结果在可接受的概率下也是正确的。通过这个简短的描述,我们应该可以清楚地了解为什么NLP与NLU不同,以及为什么NLU对机器来说是困难的。
NLU难点在于缺失文本现象所谓的缺失文本现象(missingtextphenomenon,MTP),可以将其理解为NLP任务挑战的核心。在语言交流中,有两种可能的优化方案:(1)说者可以压缩(和最小化)在编码中发送的信息量,并希望听者在解码(解压缩)过程中做一些额外的工作;(2)说者尽最大努力传递所有必要的信息来传达思想,而听者几乎什么也不用做。遗漏的信息对于说者和听者来说,是可以通过安全假设获得的信息,这正是我们经常说的普通背景知识。
然而,一个概念与实际(不完美)实例不同,在完美的数学世界中也是如此。在应用科学(工程、经济学等)中,我们可以认为这些对象是相等的,如果它们在值上是相等的,但在认知中,这种相等是不存在的。因此,机器学习和数据驱动方法并不能很好的解决NLU问题。虽然机器学习被广泛使用,但是却不能很好的解决自然语言理解问题,其中可能涉及很多原因,本文分析了机器学习和数据驱动方法与NLU无关的三个原因。
相关工具
相关文章
推荐
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49
国产GLM-4.5把AI价格打到地板价,实测强到离谱!
2025-07-30 09:08
用AI批量生成治愈系漫画,月入2000+
2025-07-29 09:59
千亿市场规模背后,AI短剧商业化迎来爆发期?
2025-07-17 09:19
15个作品涨粉26万!AI历史账号又出王炸案例!
2025-07-09 09:37
亲测真香!这6个AI工具让工作效率翻倍,同事追着问链接
2025-06-17 16:21