新京报讯(记者罗亦丹)12月15日下午,中国科学院孵化的AI公司北京中科闻歌科技股份有限公司推出雅意2.0大模型。

  中国科学院自动化研究所研究员、中科闻歌董事长王磊表示,雅意2.0是为数不多的从头进行预训练的国产原生大模型。雅意2.0基于240TB多源基础数据,1000余道数据清洗工序,2.65万亿Tokens(语句单位)训练数据,其模型架构、模型代码均为自主研发,可面向行业应用场景自主训练和微调,支持多款国产算力硬件兼容。基于雅意2.0,中科闻歌推出了政务智能和商业智能行业模型体系,面向安全、媒体、金融、舆情、法律、中医等领域构建行业大模型应用。

  王磊表示,未来大模型的发展方向,瞄准通用人工智能前沿技术,“从理解语义到理解世界,从感知智能向认知和决策智能跨越,不唯参数规模,做小做精做深大模型,打造更高效、更经济的轻量化行业专用模型,围绕AI定义软件3.0,赋能行业数智化。”