AI前沿:阿里云通义千问140亿参数Qwen-14B发布、百川智能发布Baichuan2-53B闭源大模型、Meta或于本周发布系列AI聊天机器人、开源可商用的中文版Llama2发布

新知榜官方账号

2023-10-06 10:28:31

阿里云通义千问140亿参数Qwen-14B发布

据IT之家报道,近日,阿里云举办通义千问开源发布会,正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat,开源、免费。Qwen-14B在众多同尺寸20B以内开源模型中突出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩,超越所有测评中的SOTA大模型。通义千问团队升级了Qwen模型对接外部系统的能力,开发者可以通过简单的操作实现复杂的插件调用,也可以基于Qwen系列基座模型快速开发Agent等AI系统,利用Qwen的理解和规划能力完成复杂的任务。同时,Qwen-7B也实现了全面升级,核心指标最高提升22.5%。

百川智能发布Baichuan2-53B闭源大模型

据网易报道,百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。Baichuan2-53B的数学和逻辑推理能力显著提升,并通过高质量数据体系和搜索增强大幅降低了模型幻觉,是目前国内幻觉问题最低的大模型。百川智能此次还开放了Baichuan2-53B API接口,宣布正式进军ToB领域。

Meta或于本周发布系列AI聊天机器人

据IT之家报道,援引Meta内部人士透露,该公司计划在其社媒App中推出“具有鲜明个性的”AI聊天机器人,用来吸引年轻用户。报道称,Meta将推出的聊天机器人正处于员工内测阶段,预计将在周三开始的MetaConnect会议上首次得到官宣。

开源可商用的中文版Llama2发布

据量子位报道,现在,15小时、几千块钱、85亿Tokens数据,即可训出中文版Llama2。Colossal-LLaMA-2近期把大模型门槛打下来了,同时开源团队还提供了一个完整的评估体系框架ColossalEval,以实现低成本的可复现性。这一模型综合性能达到开源社区同规模从头预训练SOTA模型水平。方案完全开源,包括全套训练流程、代码及权重;而且无商业限制,还可迁移应用到任意垂类领域和从头预训练大模型的低成本构建。

AI原生人力资源服务商TTC获千万人民币融资

近日,AI原生国际性人力资源服务提供商TTC完成数千万元人民币Pre-A轮融资,本轮融资领投方为创新工场。

本页网址:https://www.xinzhibang.net/article_detail-15548.html

寻求报道,请 点击这里 微信扫码咨询

关键词

阿里云 百川智能 Meta Llama2

分享至微信: 微信扫码阅读

相关工具

相关文章