每经记者:王晶 每经编辑:梁枭
(相关资料图)
当前,国内大模型进展不断。7月7日,在华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安发布了盘古大模型3.0。据他介绍,盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构。
传统的AI开发模式下,一个场景对应一个模型,数据质量差、样本少,模型精度差,并且应用场景相对单一。不同行业、不同场景对AI的需求既复杂且碎片化,每个痛点都需要进行定制化地开发和改造;另一方面,AI算法从理论上能够极大提升产品及服务的价值量,但由于开发过程中存在大量的碎片化因素,不同的应用场景往往需要独立的架构设计与调参,效率相对较低。“小作坊式”的AI开发模式在一定程度上限制了生产力。
华为云CEO张平安 图片来源:官方供图
从华为盘古大模型的进化路径可以看出,主要分为L0、L1、L2三个阶段。L0指基础大模型,L1是在L0基础上导入行业数据进行训练后衍生出的行业大模型,L2是在L1基础上结合行业细分场景得到的推理模型,上层是在下层的基础上演化而来,层层递进。国金证券认为,华为盘古大模型是一种工业化AI开发的新模式,可以解决小模型的定制化难题,使一个模型应用到多个场景中。
具体来看,其中,L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,包括NLP(自然语言处理)大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力。
L1层是指N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务、金融、制造、矿山、气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。L2层则提供面向各行业中更细化场景的模型,如先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景等。
公开资料显示,华为盘古大模型于2020年启动研发。2021年4月,华为发布了NLP大模型、视觉大模型和科学计算大模型。此后,盘古大模型在性能、深度、架构方面及数据增强方面持续升级。当前,盘古大模型的核心定位是为各行各业赋能。
会上,张平安分别介绍了盘古大模型在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥的价值。
例如,在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,减少安全事故;在气象领域,原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,10秒内就可以获得更精确的预测结果。
张平安表示,华为的盘古大模型不会写诗,只会做事。它要帮助各行各业,在各个领域都要让AI来赋予它们价值。比如金融、矿山、政务,有很多工作小组都派下去。“我们一直坚持的方向就是‘AI for Industries’”
每日经济新闻
关键词:
相关的文章>>
热门搜索:
资讯
更多图说健康
更多疏风解毒胶囊的作用与功效是什么?疏风解毒胶囊可以起到解毒利咽...
艾叶的功效与作用有哪些?1、散寒止痛艾叶为菊科蒿属植物艾的叶...
治疗白发的偏方有哪些?1 桑白皮30克,五倍子15克,青葙子60...
紫癜性肾炎是什么病?所谓的紫癜性肾炎,就是由于患者对于某些东...
维生素ad是什么?维生素AD是指维生素A和D的混合制剂,是两种脂溶...
乙肝小三阳严重吗?乙肝小三阳有些比较严重,也有些不太严重的,...
常见疾病
更多体育健身
更多新华社北京7月7日电日本东京都政府6日说,围绕驻日美军承认曾泄...
“薰风愠解引新凉,小暑神清夏日长。”7月,伴着蝉鸣与温风小暑...
暑期将至,为进一步改善停车秩序,给广大市民营造安全、便利的...
黑马原力G60小黑首秀2023WAICMPS让能源无处不在2023年7月6日(上海)—
天色渐暗滂沱大雨中一位长发姑娘浑身湿透来回奔走怎么回事?看...
截至2023年7月7日收盘沪光股份605333报收于1716元上涨375换手率994成交