OpenAI发布最新NLP模型GPT-3,引爆代码自动生成网站Debuild

新知榜官方账号

2023-08-15 02:14:35

背景

近日,OpenAI发布了最新的NLP模型GPT-3,这个模型使用的数据集容量达到45TB,参数个数1750亿,一个训练好的模型就要700G的硬盘空间来存储。

Debuild是一个能够自动生成代码的网站。用户只要用英语描述需求,前端代码会自动生成。不过目前该网站已关闭新增注册的功能。

OpenAI的历程

OpenAI在去年DOTA2的顶级赛事TI8后,与世界冠军OG战队举行了一场表演赛,当时OpenAI的强化学习模型,在英雄阵容限定17个,部分道具和功能禁用的条件下,以2:0完胜了人类冠军。

其开源的强化学习模型gym是业界较认可的游戏类模型包。除了做游戏AI,OpenAI还做这种自动玩魔方的机器人。

尽管NLP不是OpenAI最为关注的领域,但他们在自然语言处理方面成果一直引人关注。在去年底《权利的游戏》全面烂尾后,有人使用模型GPT-2来重写剧本的结局。网友普遍反应AI改写的新结局比电视剧的版本要好。

自然语言处理的发展历程

机器学习是通过找到结果与多维输入之间的关系来进行预测。自然语言处理方面的程序一直比较慢,直到WordtoVector出现。

word2vec的核心理念是一个单词是通过其周围的单词来定义。word2vec算法通过负例采样暨观察一个单词不会和哪些单词一起出现;跳字处理暨观察一个单词周围的单词都有哪些,来完成单词到向量的转化过程。将单词转化为向量也被称为词嵌入的过程,从而让自然语言处理变成一个能让计算机自动执行的过程。

GPT、BERT、XLNET等模型相继被提出,虽然他们的流派有自编码和自回归的不同,但是对传承词嵌入思想的继承还是比较一致的。

GPT-3的应对之道

GPT-3的作者在论文开头就指出,通过对大量文本进行预训练,针对特定任务进行微调,模型的性能可以在许多NLP任务以及基准测试中获得显著提升。

GPT-3最主要提升点在于其在transformer的各层上都使用了交替密集和局部带状稀疏的注意力模式。注意力一直是自然语言理解和自然语言生成模型的重要组成部分。因此交替密集和局部带状稀疏的注意力模式只关注k个贡献最大的状态,对于与查询不高度相关的值将被归0。

Debuild的未来

Debuild能够自动生成代码,只需要用英语描述需求,前端代码就会自动生成。如果能继续向前推进使得产品经理的需求描述,直接变成可执行的全套代码,其颠覆性是我们根本无法想象的。

目前已经有消息称OpenAI已经开始关注GPT-3有可能引发的道德风险了,不过大的趋势不可阻挡,也许AI会先“革了”程序员的饭碗,把程序员的工作完全替代。

本页网址:https://www.xinzhibang.net/article_detail-9851.html

寻求报道,请 点击这里 微信扫码咨询

关键词

OpenAI NLP GPT-3 代码自动生成 Debuild 人工智能

分享至微信: 微信扫码阅读

相关工具

相关文章