月之暗面发布“上下文缓存”技术,称最高可降本90% 月之暗面深度解析 月之暗面分析邮件
创始人
2025-06-03 07:22:23
0

澎湃新闻消息,以“价格战”为代表的大模型降本仍在继续,但相比直接降价,北京月之暗面科技有限公司(简称“月之暗面”)提出了增效方案。7月2日,该公司对外宣布,其大模型Kimi正式开放平台正式公测新技术——上下文缓存技术(Context Caching)。月之暗面方面称,这项技术将降低开发者使用长文本旗舰大模型的成本,最高可降本达90%。

上下文缓存(Context Caching)技术是指系统预先存储那些可能会被频繁请求的大量数据或信息。当用户再次请求相同信息时,系统可以直接从缓存中快速提供,而无需重新计算或从原始数据源中检索。

月之暗面发布长下文缓存技术

月之暗面以常见的固定文档大量提问场景为例举例称,一份近9万字的硬件产品说明书,一般售前支持人员需要在10分钟内对产品的功能/使用方式进行40次问答,每次的问题大概在100个字,回答在120字以内。在接入上下文缓存技术后,9万字的文档只需创建并存储一次缓存,40次问答将仅只收取问题的100字加回答的120字的费用,预计花费11.88元,相当于比之前节省了141.95元,费用降低了90%。

有业内人士向澎湃科技指出,月之暗面此次通过降低开发者使用长文本大模型的成本,本质在于提高长文本大模型产品竞争力。近期,自OpenAI宣布从7月9日起对国内开发者断供API后,从6月25日开始,国内多家大模型厂商纷纷表态可提供免费的迁移方案。有投资界人士向澎湃科技表示,大模型厂商纷纷提供可免费的迁移方案的背后,反映出一个核心问题,即这些大模型厂商的模型能力暂无法与其他家模型拉开一定差距,大部分的模型能力都差不多,没有太大差距。

原标题:月之暗面发布“上下文缓存”技术,称最高可降本90%

编辑:吴光亮    责编:周尚斗     审核:冯飞

相关内容

热门资讯

可以一次性拔掉4颗智齿吗?医生... 医生,长痛不如短痛,我可以一次性拔除四颗智齿吗?"对于很多长了智齿的朋友来说,可能会时不时地冒出这个...
图说丨夏秋花粉过敏几多愁?恰似... 编辑:封雪 责编:李奇 ...
所有人都在讨论的“DeepSe... 当地时间1月27日,纳斯达克股指出现3%下跌,原因是中国人工智能公司DeepSeek模型引发美国投资...
2025年9月7日比特币(BT... 截至2025年9月7日数据显示,比特币报价110400,近期走势呈现技术面转弱特征。从形态来看,比特...
2025年9月3日比特币(BT... 比特币现报111000附近。从当前盘面来看,多空力量较为胶着,趋势尚未完全明朗。技术指标显示,短期动...
比特币“疯涨”!特朗普再添一把... 一路“疯涨”过后,5月21日,比特币重回70000美元,当日最高价格达到71650美元。在这样的背景...
用水稻造“人血”?!武汉禾元生... 近期,血液制品行业迎来重磅消息! 全球首创“稻米造血”2025年即将在光谷量产,有望把这一“救命药”...
im Token钱包:Coin... 这是一款广受欢迎的数字钱包,在全球超 200 个国家和地区收获了超两千万用户的信赖。它致力于为用户打...
江南新材IPO定价10.54元... 日前,江西江南新材料科技股份有限公司(以下简称为“江南新材”)披露了发行公告,确定主板上市发行价10...
24岁女舞蹈老师骑电动车直行,... 大风新闻消息,3月8日,24岁的她头戴亮蓝色头盔,骑电动车去舞蹈班代课。可她的学生再也见不到她了。网...