昆仑万维和奇点智源合作推出天工文本预训练大模型

新知榜官方账号

2023-07-10 07:50:36

昆仑万维和奇点智源合作推出天工文本预训练大模型

天工是如何诞生的?昆仑万维和奇点智源合作自研,实现真正智能涌现的国产大模型,对话式助手。

为什么现在要搞天工?昆仑万维当初是以网游题材上市的,上市之后在海外进行了多元化的发展,业务包括浏览器、社交、娱乐、新闻等板块,所以对内容生成方面的技术进展一直非常敏感。从2020年起开始在音乐的AIGC领域进行投入,而奇点智源在2020年就意识到AI技术在未来的应用潜力。当时GPT3诞生以后,奇点智源判断这是内容生成领域的里程碑,因此果断投入了大规模的算法和算力资源,聚集了一支国内最高水平的科研团队,开始构建自己的技术和研发矩阵。到了2022年,我们昆仑准备从音乐AI往多模态AI扩展,同时奇点智源也越发强烈地意识到千亿级的文本大模型是AIGC的一个突破口,并且只有自研迁移及大文本大模型才能建立核心壁垒、掌握主动权。所以我们双方一拍即合,开始搞天工文本预训练大模型是一个水到渠成的选择。

天工为什么很快出来了?过程中遇到最困难技术挑战是什么?(1)2020年就开始投入积累,起步早;(2)奇点智源技术实力很强挑战:训练收敛问题,跑飞问题都难解决;海量数据集都是公开的,但质量参差不齐,如何预处理解决质量问题很重要。

天工拥有超强的记忆能力,目前最多可以支持1万字以上的文本对话,实现20轮以上的问答交互。其他的国产大模型在实现连续对话的时候体验没有那么好。在推理的时候,天工采用了蒙特拉卡洛搜索树的算法进行优化,让解码过程中的准确性和安全性得到了提高,让天工在复杂任务和场景中间能够快速和准确的响应指令,输出高质量的回答。采用了双千亿参数的超大规模结构,包括一个千亿级别的基座模型和一个千亿级别的排序模型,具有了更高级的自主学习和智能涌现的能力,从而能解决跨领域的问题和比较复杂的逻辑问题。在大规模预训练的基础上还做了场景化的微调,让他在各种场景下都能给展开流畅且能智能的对话,提供高效以及个性化的帮助。

昆仑万维大模型开发成功之后,会进行人员优化吗?每个人都需要考虑组织结构和人才培养才能适应AI新时代,但更多带来的是效率提升和创造力扩展,创造出更大价值。使用AI大模型价值不在于降本,而在于增效。

本页网址:https://www.xinzhibang.net/article_detail-7324.html

寻求报道,请 点击这里 微信扫码咨询

关键词

天工 文本预训练 大模型

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯