新知榜官方账号
2023-10-02 01:52:52
在魔都的东南角临港新片区,商汤科技人工智能计算中心AIDC在2022年启动运营,楼宇俯瞰宛若芯片。自ChatGPT以来,国内各家对大模型的追逐马不停蹄,继百度「文心一言」、阿里「通义千言」之后,昨日下午,商汤终于在AIDC亮相了其自研千亿参数中文语言大模型——「商量SenseChat」。而商汤这次拿出的,不止一个类ChatGPT。
在技术交流日现场,商汤科技CEO徐立展示了商汤「日日新SenseNova」大模型研发体系,以及文生图、数字人视频生成、3D内容生成等一系列AIGC应用,演示期间惊叹和掌声此起彼伏。商汤科技CEO徐立展示「日日新」大模型体系回过头看商汤在过去几年大模型研发和算力基础设施上的积累,观赛者们惊觉:在这一波大模型的竞技场上,商汤原来早有准备,出场迅速,且武艺绝佳。
ChatGPT演示了AI大模型的能力,建立了人们对大模型实现通用人工智能(AGI)潜力的共识,也掀起了AIGC淘金热。对商汤而言,ChatGPT则印证了:过去几年,商汤做对了。在国内群雄逐鹿AI大模型的当下,商汤在其中究竟扮演了怎样的角色?雷峰网的观点是,各家有各家的位置。商汤的位置已经清晰:一是「日日新SenseNova」大模型体系以CV、NLP、AIGC等为核心,目标打造多模态大模型、最终通向AGI;二是拥有业内稀缺的大模型专业基础设施SenseCoreAI大装置;三是以「大模型+大装置」的路线在业务和行业落地。
大模型非一日之功,大算力更非一天能建成。大模型浪潮掀起,但入局者大多面临着算力之困:许多下场的企业并没有足够的算力储备;英伟达A100和A800仍是训练大模型的最优选,国产芯片目前还仅能去做小模型和中模型的训练和推理,在大模型上性价比没那么高。真正能够马上提供足够算力支持的没有几家,商汤就是其中一个。
支持商汤大模型训练的SenseCoreAI大装置目前拥有2.7万块GPU,是亚洲最大的智算中心之一。其输出的算力十分惊人:峰值算力高达5000Petaflops;可以并行训练20个以上的ChatGPT类模型;1750亿参数的GPT-3在AIDC一天就能完成1次训练。
商汤一次性推出大模型体系和多个生成式AI应用,向业界表明,商汤大模型的技术与落地是在同时进行的。从数十亿参数级的大模型开始,在每一次的迭代中,商汤都将大模型用在实际的产品和行业中,构建用户反馈的闭环。通过飞轮效应,一方面把模型越做越大,另一方面把模型越做越有用,而非一步登天地做出一个万亿级模型、却无法在真实场景中落地。这种更为平滑的路线,适合商汤自身,也向行业释放了大模型的生产力。
商汤的产品体系和技术体系,都可以依托大模型去做支撑。「日日新」大模型体系已经深度结合在商汤的智能汽车、智慧生活、智慧商业、智慧城市四大业务板块中。在生物医药领域,商汤去年与生物企业合作,通过AI大装置为蛋白质结构大模型提供推理算力,把推理时间缩短了60倍,只需要数分钟就能得到蛋白质结构预测结果。
相关工具
相关文章
推荐
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49
国产GLM-4.5把AI价格打到地板价,实测强到离谱!
2025-07-30 09:08
用AI批量生成治愈系漫画,月入2000+
2025-07-29 09:59
千亿市场规模背后,AI短剧商业化迎来爆发期?
2025-07-17 09:19
15个作品涨粉26万!AI历史账号又出王炸案例!
2025-07-09 09:37
亲测真香!这6个AI工具让工作效率翻倍,同事追着问链接
2025-06-17 16:21
FLUX.1 Kontext 一出,AI生图领域 “地震” 了!
2025-06-06 15:38
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15