新知榜官方账号
2023-09-20 01:35:15
“AI大模型”无疑是今年最热的话题。2023年1月末,ChatGPT的月活用户在两个月内突破1亿,成为了史上用户增长速度最快的消费级应用程序。此后,中国企业百舸争流,纷纷开启大模型创业。
前微软全球副总裁、百度COO、奇迹创坛创始人陆奇曾说:“AI是未来10到20年推动社会进步最重要的因素。从现在开始,不论工作还是创业,请确保自己跟AI有关。”
仅仅过去半年多,百度文心一言、智谱AI、百川智能、抖音云雀、商汤日日新等8家企业/机构的大模型便在8月31日正式上线,开始面向公众提供服务。自此,中国的大模型群雄逐鹿战正式拉开序幕。
超级AI的能力边界在一次次迭代中不断扩展,企业和个人使用量持续增多,全世界在人工智能上的投入也将越来越大,但同时,这一切都给算力供应带来了更大的挑战。生成式AI的算力消耗巨大,并且仍在加速狂飙。
据中国信通院等机构的调研数据,仅ChatGPT的单日运营算力消耗就已占2021年整个中国智能算力总规模的3%。中国信通院曾测算,2021年,全球计算设备算力总规模将达到615EFLOPS(每秒一百京次(=10^18)浮点运算);到2025年,全球算力规模将达6.8ZFLOPS(每秒十万京次(=10^21)的浮点运算),与2020年相比提升30倍;到2030年,有望增至56ZFLOPS。不难发现,算力需求翻倍时间在明显缩短。
大模型的出现带来了新的算力增长趋势,平均时间仅为9.9个月。这也意味着,市场对算力增长的需求越来越迫切。此外,AI算力的使用成本同样巨大。在2023年世界半导体大会(WSCE)上,AI大算力芯片公司亿铸科技在演讲中表示:“假设目前的ChatGPT3平均每张H100每秒可以生成6个tokens(FP16,参数350GB),在不考虑级联或者模型稀疏化的前提下,假设每人每天提5个问题,每个问题会和GPT交互5次,每次消耗30个tokens,那么每人每天会消耗750个tokens,如果每天有1亿人在线使用查询,就需要约15万颗H100芯片,仅仅H100卡的硬件成本会达到50亿美元以上。如果计算系统成本的话,100亿美元也很难覆盖。”
大算力的需求激增以及高企的使用成本都无一不刺激着AI芯片朝着更高算力、更低功耗的方向发展。但另一个残酷的现实是,过去数十年间,通过工艺制程的提升改善芯片算力问题的“老办法”正在逐步失效,摩尔定律正在走向物理极限,HBM、3DDRAM、更好的互联等传统“解法”也“治标不治本”,晶体管微缩越来越难,提升算力性能兼具降低功耗这条路越走越艰辛。
大模型时代来临,未来模型对于芯片算力的需求将会要突破1000TOPS,更大量的数据计算,无疑进一步放大了“三道墙”的影响。由此,“存算一体”芯片架构的优越性更为明显,存算一体架构将所有的计算都放在存储器内实现,从根本上消除了因存算分离带来的“存储墙”问题,提升了数据传输和处理的速度,大大降低功耗。
同时,由于计算编程模型被降低,编译器也可以感知每一层的数据状态,编译效率也将大幅度提升,“编译墙”的问题也得到了解决。
亿铸科技选择了专注AI大算力,目前,亿铸科技首次流片已回片,并成功点亮首颗面向数据中心、云计算、自动驾驶等场景的人工智能(AI)算力芯片,具有大算力、低功耗、不依赖先进制程等优势,可满足大模型的算力及功耗需求。亿铸科技表示,公司可实现“基于成熟工艺制程,单卡突破P级算力”的极强性能与极高能效比,远超英伟达基于5nm工艺制程的H100系列能效比。
亿铸科技的新思路面向大算力场景,亿铸科技提出了极具创新的芯片设计方案。首先是在存储介质方面,亿铸科技选择了新型存储器ReRAM(RRAM,阻变存储器)。
ReRAM的单元面积极小,读写速度是NANDFLASH的1000倍,同时功耗下降15倍,兼容CMOS工艺,工艺成熟,可量产出货。
其次,亿铸创新性地采用了全数字化技术路径。一般来说,芯片中模数和数模(AD/DA)转换的电路设计会占据芯片整体70%面积和80%以上的功耗,这也正是存算一体芯片在精度、能效比、性能和算力的瓶颈所在。亿铸科技的全数字存算一体架构,无须AD/DA(数模转换)部分,将芯片的面积和能耗用于数据计算本身,从而实现大算力和高精度的多维度满足。
亿铸科技还提出了“存算一体超异构”这一系统级创新理念,即以存算一体(CIM)AI加速计算单元为核心,以统一ISA指令集和架构对不同的计算单元进行异构集成和系统优化,从而实现更大的AI算力及更高的能效比,并提供了一个更易于编程和更为通用的应用生态,为大模型时代AI大算力芯片换道发展提供全新思路。
亿铸科技的技术路线与应用创新是超前的。这一切都根植于亿铸科技团队在产、学、研各界的深厚积淀。亿铸科技带头人熊大鹏博士在中美有近30年的芯片行业经验,曾任世界著名AI芯片公司WaveComputing中国区总经理;带领ApexoneMicro的芯片产品线击败AWAGO夺得全球市场第二名;也曾作为ADCTelecomm最年轻的资深技术经理和大产品线经理,带领70多人的核心研发团队成为公司明星团队,贡献了数亿美元年度销售额。
亿铸科技的研发团队来自国内外多家知名芯片企业和多所国内外著名大学,比如斯坦福、哈佛大学、上海交大、复旦大学等,团队在顶尖学术和产业价值的峰会上发表论文达40+篇,超过国内其他同类赛道团队的顶会论文总和,且研究成果已在Intel、IBM、NVIDIA、华为等公司商用化。
此外,亿铸科技拥有全链条的芯片团队建制。公司的核心设计团队完整覆盖器件、芯片架构、SoC设计、软件系统及AI算法等全部技术领域,这让亿铸科技具备充足的人才,去解决系统性难题。
亿铸科技的存算一体超异构架构则能在大算力场景中为用户提供更好的支持力度,成为AI大算力芯片市场的新势力。
相关工具
相关文章
相关快讯
推荐
亲测真香!这6个AI工具让工作效率翻倍,同事追着问链接
2025-06-17 16:21
FLUX.1 Kontext 一出,AI生图领域 “地震” 了!
2025-06-06 15:38
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53