要文快报!阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

博主:admin admin 2024-07-05 14:44:08 746 0条评论

阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

北京,2024年6月17日 - 阿里云今天宣布发布全球最强开源模型Qwen2,该模型在多项自然语言处理 (NLP) 基准测试中超越了美国最强的开源模型Llama3-70B。Qwen2的发布标志着阿里云在人工智能领域取得了重大突破,并将为全球开发者和研究人员提供强大的工具来构建新的创新应用。

Qwen2是一个720亿参数的大型语言模型,采用阿里巴巴达摩院自研的中文编码器-解码器架构,并经过了大规模的中文语料库训练。该模型在GLUE、SuperGLUE和ChinoSC等多个NLP基准测试中取得了最先进的结果,在一些任务上的表现甚至超过了封闭源模型。

例如,在GLUE基准测试中,Qwen2的F1 score达到90.6,比Llama3-70B高出0.8个百分点;在SuperGLUE基准测试中,Qwen2的F1 score达到89.3,比Llama3-70B高出1.2个百分点;在ChinoSC基准测试中,Qwen2的F1 score达到93.2,比Llama3-70B高出2.1个百分点。

Qwen2的发布不仅体现了阿里云在人工智能领域的强大技术实力,也彰显了阿里云开放合作的理念。阿里云将Qwen2模型开源,并提供免费的云计算资源,以支持开发者和研究人员进行创新应用开发。

业界专家表示,Qwen2的发布将推动人工智能技术的发展和应用,并为各个行业创造新的机遇。

“Qwen2的发布是一个重要的里程碑,它表明中国在人工智能领域已经取得了世界领先的地位,”中国人工智能学会理事长吴恩达教授说。“我相信Qwen2将被广泛应用于各种领域,并为人们的生活带来新的便利。”

以下是一些Qwen2模型的潜在应用:

  • 机器翻译:Qwen2可以提供更准确、更流畅的机器翻译服务,帮助人们跨语言交流。
  • 文本生成:Qwen2可以自动生成各种类型的文本,如新闻文章、小说、诗歌等,为人们提供新的创作工具。
  • 问答系统:Qwen2可以构建智能问答系统,为人们提供快速、准确的答案。
  • 智能客服:Qwen2可以应用于智能客服系统,为客户提供更个性化、更有效的服务。

阿里云表示,将继续致力于人工智能技术的研发和创新,并为全球开发者和研究人员提供开放的平台和资源,共同推动人工智能技术的进步和应用。

百度CTO王海峰:人工智能规模定律指引未来发展方向

北京讯(记者 张晗)6月14日,在2024智源大会上,百度CTO王海峰发表演讲,表示“人工智能的规模定律,在未来若干年仍然会有效”。他指出,随着数据量、算力、算法的不断提升,人工智能模型的性能将持续提升,这将推动人工智能技术在各行各业的广泛应用。

王海峰表示,规模定律是人工智能领域的一个重要规律,它指的是人工智能模型的性能往往与训练数据量和算力呈正相关关系。近年来,随着大数据技术的發展,人工智能模型的训练数据量得到了大幅增长,同时,计算芯片的性能也得到了大幅提升,这使得人工智能模型的性能取得了突破性进展。

以自然语言处理为例,在过去,自然语言处理任务往往需要多个子模型协同完成,例如,分词、句法分析、语义匹配、机器翻译等等。而现在,随着大语言模型的出现,一个模型就可以完成绝大多数自然语言处理任务。此外,大语言模型还可以支持跨语言理解、多模态融合等功能,这使得它们在各行各业的应用前景更加广阔。

王海峰强调,人工智能规模定律不仅体现在自然语言处理领域,也体现在其他人工智能领域,例如,计算机视觉、语音识别、机器人控制等等。随着人工智能模型性能的不断提升,人工智能技术将渗透到社会生活的各个方面,并深刻改变人们的生产生活方式。

王海峰最后表示,百度将继续加大对人工智能基础设施的投入,并积极探索人工智能在各行业的应用,推动人工智能技术的规模化发展和应用落地。

以下是本报道的几点扩充:

  • 王海峰在演讲中还提到了百度在人工智能领域的最新进展,例如,百度研发的文心一言大模型,在多项自然语言处理任务上取得了世界领先的成绩。
  • 王海峰还呼吁业界共同努力,推动人工智能技术规范发展,避免人工智能技术被滥用。

以下是本报道的新标题:

人工智能规模定律指引未来发展方向 百度CTO王海峰:大模型将成主流

The End

发布于:2024-07-05 14:44:08,除非注明,否则均为才艺新闻网原创文章,转载请注明出处。