然而周五美股算力方向超微大跌20个点,如何解读?
DiT架构论文的原作者认为Sora参数量可能也就3B,算力消耗不大:使用了DiT,DiT = [VAE encoder + ViT + DDPM + VAE decoder]。关于训练数据来源,可能的确有来自UE5等游戏引擎的合成数据,从效果风格猜测还有电影纪录片电影长镜头。DiT算力消耗可能并不像大家想的那么高
这次创新的关键,可能在于找到了表达视频信息最合适的representation,即spaceTime latent patch
Jim Fan今天凌晨的分析:Sora的软物理仿真是一种涌现。GPT-4必须学习语法、语义和数据结构,才能生成Python,而不是存储Python语法树;与之类似,Sora必须学习一些隐含的文本到3D、3D转换、光线追踪渲染和物理规则的形式、才能准确地模拟视频像素。
而a股视觉系渲染龙头,当仁不让的就是丝路视觉。
在同花shun官方给出的概念股依兰中可以看到,丝路视觉的解读即为渲染技术龙头。
概念中明确表明了3dcat等渲染技术的掌握。
从丝路视觉官网的公司简介中也能看出,公司一直致力于视觉方向技术发展,收入占比也可以清晰的看到收入几乎全部来自数字视觉方向。正逢ai时代大浪潮推进,Sora的横空出世代表着未来会有更多类Sora式的现象级产品出现,从蒸汽时代到电力时代,再到现在的信息化时代,进步是日新月异级别的进步,而人工智能的出现快速加大了这一进程,处在时代的风口浪尖上,市场是参与人工智能门槛最低的方式。
逻辑整理不易,新概念出现,寸秒寸金,欢迎讨论转发。
部分内容参考Jason内容,如有侵权请告知。