FrugalGPT:降低LLM使用成本的解决方案

新知榜官方账号

2023-09-16 23:20:28

背景

随着大型语言模型(LLM)的发展,人工智能正处于变革的爆发期。众所周知,LLM可用于商业、科学和金融等应用,因而越来越多的公司(OpenAI、AI21、CoHere等)都在提供LLM作为基础服务。尽管像GPT-4这样的LLM在问答等任务中取得了前所未有的性能,但因为其高吞吐量的特质,使得它们在应用中非常昂贵。例如,ChatGPT每天的运营成本超过70万美元,而使用GPT-4来支持客户服务可能会让一个小企业每月花费超过2.1万美元。除了金钱成本外,使用最大的LLM还会带来巨大的环境和能源影响。

解决方案

现在很多公司通过API提供LLM服务,它们收费各异。使用LLMAPI的成本通常包括三个组成部分:1)prompt成本(与prompt的长度成比例),2)生成成本(与生成的长度成比例),以及3)有时还会有对于每个查询的固定成本。FrugalGPT是一种将GPT-4与更低廉的模型和支持性基础设施相结合的方法,可实现高性能和低成本的利用LLM。它通过识别那些可以由较小的LLM准确回答的查询,从而只调用那些具有成本效益的LLM。而强大但昂贵的LLM,如GPT-4,只用于由FrugalGPT检测到的挑战性查询。此外,FrugalGPT可以识别那些可以由较小的LLM准确回答的查询,从而只调用那些具有成本效益的LLM。

实证研究

研究者通过实验表明,FrugalGPT可以与最佳个体LLM的性能相媲美,成本降低高达98%,或者在相同成本下将最佳个体LLM的准确性提高4%。他们还发现,多个LLMAPI有可能产生比最好的单个LLM更好的性能,这是由于生成的多样性。为了衡量这种多样性,研究者使用最大的性能改进指标,该指标衡量了在调用不同LLMAPI的同时调用它们所能达到的最大性能提升。FrugalGPT的结果是既提高了准确率又降低了成本。例如,在一个金融新闻数据集上,FrugalGPT准确地预测了价格将下跌,而GPT-4提供了一个错误的答案。总体来说,FrugalGPT能够在所有被评估的数据集上实现平滑的性能-成本权衡,它为LLM用户提供了灵活的选择,并有可能帮助LLMAPI供应商节约能源和减少碳排放。

本页网址:https://www.xinzhibang.net/article_detail-11681.html

寻求报道,请 点击这里 微信扫码咨询

关键词

LLM FrugalGPT 成本 性能 API 机器学习

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯