人工智能领域朋友分享,传音控股3.28日在北森italent平台放出社招内推岗位:音视频生成工程师-AIGC text2video。
岗位职责如下:
1. 开展AIGC音视频生成前沿算法研究,了解或者熟悉CLIP, Make-A-Video和Gen-1等工作;
2. 复现和优化主流相关的生成模型,在文本->视频/图片的生成任务上进行探索和研究。
招聘岗位明确要求开展AIGC音视频生成算法研究,明确CLIP多模态技术,CLIP技术使得图像标注可以被机器学习实现,从而解放AI训练基础人工工作。1)海量多维度的数据将被自动化标注,甚至包括无法被人眼察觉的数据。2)创造了更多的人与深度视觉数据互动的方式,如可通过文字输入关键特征直接锁定视频特定内容。3)通过机器学习训练不断提升识别精度,带来更多应用场景爆发!传音控股是A股稀缺的具有CLIP多模态大模型技术积累的公司。
岗位明确要求复现和优化主流生成模型,探索由文本生成视频/图片的任务。这就是图片、视频级别的AIGC,对标Midjourney、万兴科技等。我们认为,这是公司在自研大模型/垂直领域小模型的征途上开始的第一步!
对标昆仑万维来看,传音具有海外浏览器Phoenix对应Opera,用户数量浏览器+阵营APP合计2.5亿远高于Opera浏览器用户数量,互联网收入与昆仑万维同等量级。市场尚未认识到传音自研模型方向上的多模态探索,目前昆仑万维已经600亿市值45倍PE,而传音仅900亿市值20倍PE,显著低估!