新知榜官方账号
2023-10-06 10:28:31
据IT之家报道,近日,阿里云举办通义千问开源发布会,正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat,开源、免费。Qwen-14B在众多同尺寸20B以内开源模型中突出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩,超越所有测评中的SOTA大模型。通义千问团队升级了Qwen模型对接外部系统的能力,开发者可以通过简单的操作实现复杂的插件调用,也可以基于Qwen系列基座模型快速开发Agent等AI系统,利用Qwen的理解和规划能力完成复杂的任务。同时,Qwen-7B也实现了全面升级,核心指标最高提升22.5%。
据网易报道,百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。Baichuan2-53B的数学和逻辑推理能力显著提升,并通过高质量数据体系和搜索增强大幅降低了模型幻觉,是目前国内幻觉问题最低的大模型。百川智能此次还开放了Baichuan2-53B API接口,宣布正式进军ToB领域。
据IT之家报道,援引Meta内部人士透露,该公司计划在其社媒App中推出“具有鲜明个性的”AI聊天机器人,用来吸引年轻用户。报道称,Meta将推出的聊天机器人正处于员工内测阶段,预计将在周三开始的MetaConnect会议上首次得到官宣。
据量子位报道,现在,15小时、几千块钱、85亿Tokens数据,即可训出中文版Llama2。Colossal-LLaMA-2近期把大模型门槛打下来了,同时开源团队还提供了一个完整的评估体系框架ColossalEval,以实现低成本的可复现性。这一模型综合性能达到开源社区同规模从头预训练SOTA模型水平。方案完全开源,包括全套训练流程、代码及权重;而且无商业限制,还可迁移应用到任意垂类领域和从头预训练大模型的低成本构建。
近日,AI原生国际性人力资源服务提供商TTC完成数千万元人民币Pre-A轮融资,本轮融资领投方为创新工场。
微信扫码咨询
相关工具
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49