新知榜官方账号
2023-09-16 23:20:28
随着大型语言模型(LLM)的发展,人工智能正处于变革的爆发期。众所周知,LLM可用于商业、科学和金融等应用,因而越来越多的公司(OpenAI、AI21、CoHere等)都在提供LLM作为基础服务。尽管像GPT-4这样的LLM在问答等任务中取得了前所未有的性能,但因为其高吞吐量的特质,使得它们在应用中非常昂贵。例如,ChatGPT每天的运营成本超过70万美元,而使用GPT-4来支持客户服务可能会让一个小企业每月花费超过2.1万美元。除了金钱成本外,使用最大的LLM还会带来巨大的环境和能源影响。
现在很多公司通过API提供LLM服务,它们收费各异。使用LLMAPI的成本通常包括三个组成部分:1)prompt成本(与prompt的长度成比例),2)生成成本(与生成的长度成比例),以及3)有时还会有对于每个查询的固定成本。FrugalGPT是一种将GPT-4与更低廉的模型和支持性基础设施相结合的方法,可实现高性能和低成本的利用LLM。它通过识别那些可以由较小的LLM准确回答的查询,从而只调用那些具有成本效益的LLM。而强大但昂贵的LLM,如GPT-4,只用于由FrugalGPT检测到的挑战性查询。此外,FrugalGPT可以识别那些可以由较小的LLM准确回答的查询,从而只调用那些具有成本效益的LLM。
研究者通过实验表明,FrugalGPT可以与最佳个体LLM的性能相媲美,成本降低高达98%,或者在相同成本下将最佳个体LLM的准确性提高4%。他们还发现,多个LLMAPI有可能产生比最好的单个LLM更好的性能,这是由于生成的多样性。为了衡量这种多样性,研究者使用最大的性能改进指标,该指标衡量了在调用不同LLMAPI的同时调用它们所能达到的最大性能提升。FrugalGPT的结果是既提高了准确率又降低了成本。例如,在一个金融新闻数据集上,FrugalGPT准确地预测了价格将下跌,而GPT-4提供了一个错误的答案。总体来说,FrugalGPT能够在所有被评估的数据集上实现平滑的性能-成本权衡,它为LLM用户提供了灵活的选择,并有可能帮助LLMAPI供应商节约能源和减少碳排放。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49