开源大模型浪潮分析报告

新知榜官方账号

2023-09-19 03:28:22

引言

本报告试图剖析这波开源大模型风潮的共同点,回顾开源标杆Linux的发展史,回答以上问题,展望大模型的未来。

开源大模型集中出现,堪称风潮

Meta发布LLaMA开源大模型,此后,市场集中涌现出一批大模型,大致可以分为三类。

学习ChatGPT方法论,引入人类指令数据集

微调是指在已经预训练的模型上,使用具有标注数据的特定任务数据集,进一步小规模训练。

多模态化:助力通用人工智能(AGI)发展

多模态即图像、声音、文字等多种模态的融合。

专业化:下游生态发力,针对特定任务微调模型

自开源大模型LLaMA推出后,基于LLaMA预训练模型微调的下游专业化模型开始浮现,例如医疗问诊领域中的华驼。

投资分析

我们认为,短期内,ChatGPT系仍是能力最强的大模型,与其深度合作的微软将受益。英伟达是当前AI算力的领头羊,受益于开源大模型带动应用风起,算力需求狂飙。Meta可能通过LLaMA,加深与下游大模型开发厂商的合作,将自身体系中的专有产品,绑定销售给客户。

本页网址:https://www.xinzhibang.net/article_detail-12367.html

寻求报道,请 点击这里 微信扫码咨询

关键词

开源 大模型 ChatGPT LLaMA 算力 微调

分享至微信: 微信扫码阅读

相关工具

相关文章