您现在的位置是:海口秀英一顿干三碗汽车销售商行 > 耸听

阿里云宣布Qwen2开源 性能超美国开源模型Llama3一走了之

海口秀英一顿干三碗汽车销售商行2024-12-13 18:35:01【耸听】2人已围观

简介【TechWeb】6月7日消息,阿里云今日宣布,比美国开源Llama3和中国闭源模型们更强的Qwen2今日开源,免费下载。阿里云表示:历经数月努力,我们很高兴迎来了Qwen系列模型从Qwen1.5到Q 一走了之

阿里云宣布Qwen2开源 性能超美国开源模型Llama3一走了之

【TechWeb】6月7日消息,阿里阿里云今日宣布,云宣源性比美国开源Llama3和中国闭源模型们更强的开开源Qwen2今日开源,免费下载。美国模型一走了之

阿里云表示:历经数月努力,阿里我们很高兴迎来了Qwen系列模型从Qwen1.5到Qwen2的云宣源性好说歹说重大升级。这一次,开开源我们为大家带来了:

* 5个尺寸的美国模型预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、阿里Qwen2-7B、云宣源性Qwen2-57B-A14B以及Qwen2-72B;

* 在中文英语的开开源基础上,训练数据中增加了27种语言相关的美国模型高质量数据;

* 多个评测基准上的领先表现;

* 代码和数学能力显著提升;

* 增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。阿里枝叶扶疏

Qwen2-72B-Instruct能够完美处理128k上下文长度内的云宣源性信息抽取任务;Qwen2-7B-Instruct几乎完美地处理长达128k的上下文;Qwen2-57B-A14B-Instruct则能处理64k的上下文长度;而该系列中的两个较小模型则支持32k的上下文长度。

目前,开开源上述Qwen2系列模型已在Hugging Face和ModelScope上同步开源。赏心悦目

阿里云强调,此次采用不同的模型许可。除了Qwen2-72B依旧使用此前的不分彼此Qianwen License外,其余模型,包括Qwen2-0.5B、Qwen2-1.5B、翻山越岭Qwen2-7B以及Qwen2-57B-A14B在内,均采用Apache 2.0的许可。我们希望本次开放程度的空口无凭提升能够加速Qwen2在全球各地的落地及商业应用。

很赞哦!(412)

相关文章