TigerBot:虎博科技犀利小团队打破“成本魔咒”

新知榜官方账号

2023-10-08 10:06:46

拥有多年NLP经验的虎博科技,凭借自身独特的技术创新,打破“成本魔咒”,重新定义“短小精悍”。国内大模型创业迎来了新面孔。包含70亿参数和1800亿参数两个版本的大模型TigerBot正式亮相,一经推出,就以独特的实力,引起了外界瞩目。从评测结果可见,TigerBot与OpenAI同规模模型的得分十分接近作为一款国产自研的多模态大语言模型,TigerBot不仅能进行编程、画图、翻译,还支持多种办公场景下的任务,具有高效的学习能力、创造力和可控性。更重要的是,借助更先进的微调算法,TigerBot在只使用少量参数的情况下,就能快速理解人类的问题,提升回答的准确性。在同样50万条数据训练的情况下,TigerBot的收敛速度比斯坦福推出的Alpaca快5倍,在公开数据集上评测显示性能提升17%。有点难以置信的是,研发了如此强劲大模型的团队,最初只有5个人,身为CEO兼首席科学家的团队Leader陈烨,担任了最核心的代码工作。后来成员规模虽有扩充,但也只控制在了10人左右。

众所周知,训练大模型所需的高昂算力、成本,一度使得ChatGPT这样的通用大模型,成为了少数科技巨头的专利。然而,拥有多年NLP经验的虎博科技,却凭借自身独特的技术创新,打破了这一“成本魔咒”,并重新定义了何谓“短小精悍”。具体来说,为了降低模型的训练成本和难度,虎博科技在以下几个方面进行了创新:

  • 指令完成监督微调
  • 突破并行训练难关

除了模型的底层架构上的改进外,TigerBot另一大降低训练难度和成本的创新,就是突破了deep-speed等主流框架中的若干内存和通信问题,实现了千卡环境下训练数月无间断。

除了上述提到的技术外,虎博科技在大模型方面,还运用ensemble和probabilisticmodeling的方法,让模型在创造性和可控性上做出了适当的权衡。同时,针对中文连续性强、多义歧义情况多等问题,虎博科技通过不断吸取开源模型和代码中的优点,从tokenizer到训练算法上,都做了相应优化。而这些提升性能、降低成本的技术创新,和自然界中的生物面临环境压力时,所激发出的“突变”和“进化”,有着异曲同工之妙。

纵观TigerBot诞生的过程,我们可以发现,这是一个既守住了饭碗,又赢得了理想的故事。科研出身的陈烨,有技术,也有情怀,但却并没有在现实与理想之间顾此失彼,而是以用户需求为导向,结合自身的技术优势,开发出多种适用于不同场景的AI产品。在此过程中,其依据对技术前沿趋势的敏锐洞察,逐步提高了自身的开发能力和工程化水平,从而在后来的大模型研发中,突破了主流框架中的技术难点和瓶颈。如果说,当下的大模型竞争,是一场物竞天择的竞赛,那么唯有那些在广泛的产品和服务中,积累了足够多技术因子的企业,才能在压力和挑战面前,完成“进化”与“突变”。

本页网址:https://www.xinzhibang.net/article_detail-15928.html

寻求报道,请 点击这里 微信扫码咨询

关键词

TigerBot 虎博科技 大模型

分享至微信: 微信扫码阅读

相关工具

相关文章