周末,讨论最多的就是“人工智能大模型技术高峰论坛”,在这次论坛上,最关注的就是华为大模型。
华为云人工智能领域首席科学家在论坛上表示,人工智能行业渗透率将持续提速,2026年将达到20%,他将大模型划分为“L0-L2"的不同阶段,L0就是基础通用模型,比如GPT-3,在L0的基础上加入行业数据,混合训练得到大模型L1,再把L1在具体下游千行百业细分场景进行一些部署,得到部署模型或细分场景任务模型L2。
同时,他提出了人工智能发展的两大趋势:
第一,大模型可能收编高度定制化的小模型,导致市场向大公司集中,大模型资本和技术门槛高,开发和训练一次1200万美元;
第二,人工智能与科学计算的交汇,工业、气象、能源、生物医学等众多领域都受到AI的深刻影响。
2019-2021年,华为盘古大模型开始立项,2021年4月正式发布盘古NLP、CV、盘古科学计算大模型,2021年9月发布药物分子大模型,2022年6月发布矿山大模型,2022年11月发布了气象、海浪、金融大模型。其中,盘古NLP大模型是业界首个千亿参数中文语言预训练模型,是最接近人类中文理解能力的AI大模型,盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。
华为认为Al for Industries将是人工智能新的爆发点,盘古大模型将为煤矿、水泥、电力、金融、农业、国家云创造产业价值:
比如盘古矿山大模型案例中,可以在采掘场景上通过5G+Al的全景拼图技术使井下场景传输至地面,在地面进行采掘机器控制,可以在主运输皮带式进行异物检测,识别精准度达到98%。
比如通过开发铁路TFDS开发方案,降低人工劳动强度,并实现高达99%铁路缺陷或故障检测。
华为大模型的发布,可能将市场关注点转向AI在工业领域的应用,包括电力、无人工厂等等。
在Al for science方面,盘古气象大模型是全球首个精度超过传统预报方式的AI模型,可以在秒级时间内完成全球未来1个小时到7天的天气预报,精度超过传统数字分析方法的同时预测速度提升1万倍。盘古药物分子大模型可以提高小分子合成物筛选速度,使过去数年的传统药物研发周期缩短至一个月以内