需要关注场景和应用
斯坦福大学今年4月发布的人工智能指数报告称,2023年,著名人工智能模型中有61个源自美国,中国则有15个。业内人士指出,中美是全球人工智能发展的“领头羊”,展现出了不同的发展趋势和战略重点。美国在高端芯片制造、基础研究和技术创新上优势明显;而中国拥有庞大的互联网用户基数,提供了丰富的场景等方面数据资源,这对于训练大模型来说是重要优势。
“大模型的竞赛可以分为几个阶段,第一个阶段是‘卷指标’,在参数和指标的提升中重点关注性能问题,但这也造成了目前的一个行业通病问题——大模型性能和应用严重分离,也就是大家所讨论的‘拿着锤子找钉子’的问题。因此,发展至第二个阶段‘卷场景和体验’,成为一种必然。”陶明说。
上海市数据科学重点实验室主任肖仰华在接受新华社记者采访时指出,应该看到这一轮竞争中应用场景的重要性。中国企业可以先从应用层面切入,反哺和推动基础模型性能提升。
在谈到数据问题时,肖仰华说,GPT等大模型仍然是主要基于互联网通用开放语料进行训练。这类通用大模型一旦用于千行百业,可能存在领域知识匮乏的根本性问题,从而限制了大模型在具体领域的价值发挥。
零一万物公司模型训练负责人黄文灏表示,他看到GPT-4o更新了分词器的词表,但其中和中文相关的词元质量还是没跟上。他认为这可能是由于他们缺乏高质量的中文语料,这对中国企业是一个机会。“国内的工程师可以更沉下心来对数据进行研究、分析,将数据质量做到非常高的水平。”
|