1、DeepSpeed Chat开源,大模型百花齐放时刻即将到来,数据要素重要性进一步上升
Deepspeed是微软开源的深度学习优化库,4月12日,微软开源了基于此优化库的DeepSpeed Chat,进一步方便大语言模型的开发,Deep Speed Chat拥有强化推理、RLHF模块、RLHF系统三大核心功能。
(1)简化 ChatGPT 类模型的训练和强化推理,仅需一个脚本即可实现多个训练步骤;
(2)DeepSpeed-RLHF 复刻了 InstructGPT 论文中的训练模式, 包括监督微调(SFT)、 奖励模型微调和 基于人类反馈的强化学习(RLHF)在内的三个步骤;
(3)将 DeepSpeed 的训练和推理能力整合到一个统一的混合引擎(DeepSpeed-HE)中用于 RLHF 训练,简化包括量并行计算、内存管理等工程类工作。
Deepspeed chat使得RLHF的训练大幅加快(比现有系统快15倍)、成本降低且易于大规模推广(仅单GPU就可支持超130亿参数的模型)。
以Deepspeed为代表的的AI开源生态正在为大语言模型的训练和部署门槛不断降低,我们认为(1)未来拥有一个自己的大语言模型难度不断下降,应用层百花齐放指日可待;(2)打造行业垂直大模型的技术门槛正在下降,在大模型的三要素中,数据要素的门槛更加凸显。
2、广东拟将数据要素纳入GDP核算
4月13日,“2023数字经济峰会”在香港会展中心举行。会上,广东省政务服务数据管理局局长杨鹏飞在主题发言中透露,《广东省数据条例》即将出台,广东正研究推动将数据生产要素纳入国民经济核算体系。会上,杨鹏飞还重点提及“数字湾区”建设。
慧辰股份,AI+数据标的,利用AIGC等技术实现数据报表生成,满足政企客户,叠加消费、烟草、文娱领域数据分析23年重回高增,业绩拐点可期,目前仅24亿市值,弹性大。
新致软件,银行、保险数据龙头