找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 160|回复: 0

昆仑万维天工通用大模型推理能力超过GPT-3.5和LLaMA2

[复制链接]

38

主题

4

回帖

221

积分

中级会员

积分
221
发表于 2023-9-18 08:29:08 | 显示全部楼层 |阅读模式
  昆仑万维发布消息称,在权威推理榜单Benchmark GSM8K 测试中,昆仑万维自研的通用基座大模型天工大模型以80%的正确率脱颖而出,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),“标志着天工大模型的推理能力达到全球领先,接近GPT-4”。

  消息称,天工大模型不仅在推理性能上有着强大的竞争力,在MMLU、C-EVAL、HumanEval等三项数据集测试中也同样表现出色。在MMLU数据集测试中,天工大模型以65%准确率超越了LLaMA-65B的63.4%;在C-EVAL数据集测试中,天工大模型以65%准确率超越了GPT3.5的54.4%。在HumanEval数据集测试中,天工大模型以37.2%的准确率超过了PaLM-540B(26.2%)、LLaMA-65B(23.7%)、LLaMa2 -70B(30.5%)。
-北京商报讯(记者 杨月涵)9月16日

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Bluetooth-UWB 联盟论坛 ( 京ICP备19003900号-5 )

GMT+8, 2024-11-23 21:18 , Processed in 0.021543 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表