新知榜官方账号
2023-10-06 10:28:31
据IT之家报道,近日,阿里云举办通义千问开源发布会,正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat,开源、免费。Qwen-14B在众多同尺寸20B以内开源模型中突出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩,超越所有测评中的SOTA大模型。通义千问团队升级了Qwen模型对接外部系统的能力,开发者可以通过简单的操作实现复杂的插件调用,也可以基于Qwen系列基座模型快速开发Agent等AI系统,利用Qwen的理解和规划能力完成复杂的任务。同时,Qwen-7B也实现了全面升级,核心指标最高提升22.5%。
据网易报道,百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。Baichuan2-53B的数学和逻辑推理能力显著提升,并通过高质量数据体系和搜索增强大幅降低了模型幻觉,是目前国内幻觉问题最低的大模型。百川智能此次还开放了Baichuan2-53B API接口,宣布正式进军ToB领域。
据IT之家报道,援引Meta内部人士透露,该公司计划在其社媒App中推出“具有鲜明个性的”AI聊天机器人,用来吸引年轻用户。报道称,Meta将推出的聊天机器人正处于员工内测阶段,预计将在周三开始的MetaConnect会议上首次得到官宣。
据量子位报道,现在,15小时、几千块钱、85亿Tokens数据,即可训出中文版Llama2。Colossal-LLaMA-2近期把大模型门槛打下来了,同时开源团队还提供了一个完整的评估体系框架ColossalEval,以实现低成本的可复现性。这一模型综合性能达到开源社区同规模从头预训练SOTA模型水平。方案完全开源,包括全套训练流程、代码及权重;而且无商业限制,还可迁移应用到任意垂类领域和从头预训练大模型的低成本构建。
近日,AI原生国际性人力资源服务提供商TTC完成数千万元人民币Pre-A轮融资,本轮融资领投方为创新工场。
相关工具
相关文章
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16