快手自研模型“快意”成中文能力top1 61分成绩超ChatGPT


(相关资料图)

近期,快手自研的大型人工智能模型“快意”(KuaiYii)在AI综合中文评估基准CMMLU的榜单中崭露头角。据悉,该模型的13B版本KwaiYii-13B在five-shot和zero-shot项目下的中文向均位列第一名,尤其在人文学科、中国特定主题等方面表现突出,平均分超过61分。根据快手在GitHub页面公布的信息,快意是其AI团队独立研发的大规模语言模型。目前,该模型已经覆盖了预训练模型(KwaiYii-Base)和对话模型(KwaiYii-Chat)。快意的主要特点包括:首先,KwaiYii-13B-Base预训练模型具备优异的通用技术底座能力,在大部分权威的中/英文Benchmark上取得了同等模型尺寸下的最佳效果。例如,该模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平。其次,KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务。人工评估结果显示,KwaiYii-13B-Chat超过了主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。

关键词:

编辑: MO
下一篇: 最后一页

相关新闻

精彩推送