前些天,我从业内朋友那里得到消息,超讯通信要在3月5日于广州天河希尔顿开发布会。刚好我这些天也一直待在广州,反正闲着也是闲着,就想着去现场看看呗。于是我托关系辗转拿到了邀请函,毕竟,作为一个AI个人开发者和股市的资深韭菜,多了解一些人工智能市场的新动态,获取到第一手消息,对于投资决策而言总是有益无害的。
来之前我大概看了下会议流程,主讲人是来自一家名不见经传的公司七火山,所以一开始我对这场发布会并没有太多期待。但这次的发布会却给了我很多惊喜,人生可能有时候就是如此,有心栽花花不开,无心逛逛发布会,却发现超讯早年在算力和人工智能领域种下的小树苗,已经渐渐长成了苍天大树。今天有幸瞻仰各行业大佬分享国内前沿的算力与人工智能技术,便以此篇为记,希望这篇文章能给同样对该方向感兴趣的朋友,带来一点点启发与感触。
会议一开始,超讯通信股份有限公司董事长就向在场的嘉宾娓娓道来,超讯未来三年的战略规划。超讯的布局主要是围绕算力、数据和AI(人工智能)来构成整个超讯通信的生态。这里简单说下超讯的背景,这是一家创立于1998年的公司,是国内领先的全生态智能硬件制造商、全行业物联网提供商、全专业通信技术服务商。早在2016年,超讯通信就已经于上海交易所主板上市。
超讯董事长表示做算力并不是简单地买个服务器来卖或者租赁,硬件的选择与优化、网络架构、能源效率、安全性……等等问题都是服务器厂商需要考虑的。换句话说,想做好服务器厂商,必须有技术的加持。超讯这么多年在通信软硬件开发等领域保有优势,这才让董事长有底气说,超讯自有的软硬件技术实力,能在既安全经济、性价比又高的前提下,给各企业提供优质的算力资源。董事长还特别提到,超讯通信将和国家信息中心合作,进一步提升算力安全性。值得一提的是,超讯在硬件资源获取方面有自己的渠道,除了来源于境外的一些装备以外,董事长明确表示在未来沐曦将会成为超讯通信的主要乃至唯一的硬件提供商。至于购买算力设备资金的来源,董事长表示除了一部分自有资金以外,超讯将通过与国有企业的合作伙伴关系,共同进军算力市场,以实现资源的最优化分配和高效使用。硬件供应渠道打通、资金到位之余,超讯还需要打开市场,整个链路才算完整。这点董事长也明确说了,超讯已经和多个长期合作伙伴,包括人建、中交等重量级企业,建立了牢固的合作基础,拥有持续且稳定的客户流。
而在数据层面,董事长表示超讯早在92年的时候,就开始在做大数据方向的工作了,为相关部门提供了很多重要的数据支撑。超讯一直在跟进、优化数据,甚至在现有数据的基础上去产生新的数据。董事长认为在将来,超讯能成为一家以数据要素形成收购或者利润的公司。
最后,在人工智能这一领域上,超讯在中国本土市场上开发了手机应用灵犀妙笔AI,而在境内也有成熟的产品SUPERLALA AI。这两款产品在下载量和客户体验上,都达到了一个比较高的水准(这两款产品目前都可以直接搜到,我下载来试用了,体验感是OK的~)。
董事长在会上慷慨激昂地说,超讯通信必然要长久地深挖算力和人工智能领域,如果出现什么机会,超讯会毫不犹豫地冲进去,紧紧抓住时代给予的机遇。超讯的布局是算力、数据和人工智能三位一体的,去年被定义为超讯的人工智能元年。从2024年开始,超讯将把包含2024年在内的未来三年定义为技术爆发和快速发展的“井喷年”,四至六年为积累过后爆发的“雪球年”。
七火山是超讯投资的一家新兴的人工智能科技公司,这次发布会七火山科技CTO将展示七火山科技最新研发成果Etna模型的成果。Etna模型的发布是此次发布会的重点,加之我一直是比较关注人工智能领域这块,对该模型也有所耳闻,所以就重点讲讲。
七火山CTO一上台就为大家展示了一段由Etna生成的为时两分钟的视频,里面呈现了各种各样的片段,有漫步的火烈鸟、海上冲浪的青年、穿着羽绒服的小白鼠……我当时在现场看了之后,非常惊讶于文生视频居然能达到如此精美绝伦、以假乱真的地步,更惊讶于这个视频模型竟然是出自一家国内的公司。后面散会之后,我还特意去向七火山的工作人员要了这个视频,我会随文附几张视频截图,大家可以自己看看效果~
说到文生视频,必须提到的就是OPEN AI在2月16号展示的sora模型,尽管这个模型目前还在内测,但从多方整合的信息来看,其功能非常非常非常强大。七火山科技的CTO在发布会上坦言,他曾赴美与OPEN AI的华裔工程师进行深入交流,了解Sora模型为什么能够展现出如此强大的文字生成视频能力。究其原因,表示具体可以归结为以下三点:其一是在语义理解方面,得益于ChatGPT的高级语言处理能力,Sora模型在理解语义方面表现出色。其二是在架构创新方面,Sora模型融合了经典的diffusion模型和transformer模型,打造出一个既高效又前沿的新型模型。其三是训练数据方面,与依赖静态图像不同,Sora模型使用视频数据作为训练基础,并采用patches来提升训练效率。
七火山这个团队是从2023年上半年,就开始在文生视频进行探索和自研。七火山科技CTO通过和业内顶尖企业的工程师交流过后,把握到了其中的关键点,把更多更新的技术应用到七火山自研的文生视频模型Etna上。我之前看过很多用Sora生成的内测视频,今天又观摩了用Etna生成的视频。客观来说,我认为Sora是业界大佬,七火山的文生视频模型虽然让我大感震撼,但在对语义的理解以及视频的细节丰富度等方面还是要略逊色于sora的。尽管如此,Sora仍是我在国内看到的第一个真正意义上的文生视频模型,在视频表现力方面也已处于行业领先。这是发布会时展示的文生视频模型技术能力对比图,我照搬过来的,以后有机会再进一步考证。
七火山CTO表示,他们自研的Etna模型在视频时长上能达到8-15秒,高于市面上除Sora以外的其他文生视频模型。同时,Etna模型的帧数能达到60每秒,保证了视频的流畅性。清晰度方面,Etna最高可以达到3840*2160,确保用户的观看体验。
介绍完七火山文生视频模型Etna,七火山CTO继续展示了七火山在人工智能方面的落地应用。第一个展示的产品是一个用AI翻译和辅佐制作短剧的系统Lava,可以利用AI实现的功能包括角色换脸、对白配音和字幕翻译。短剧大概是从去年开始在国内爆火并席卷到海外的,甚至有调研指出国内短剧的市场规模已经超过了电影。可想而知,短剧这块蛋糕有多大。七火山团队通过AI工具,将海量的国内短剧,通过AI换脸、翻译的方式,高效率且低成本地将视频进行本土化处理,并发行到海外。这个项目应该已经比较成熟了,因为包括快手、字节和小米在内的短视频和互联网巨头都纷纷对这个项目进行投资,这些大厂的投资人都是千年的狐狸精得很,如果不是有些真材实料在里面,也不能吸引到这么多重量级的企业来给项目输血。
另外七火山CTO还提到了另一个自研配套的短剧出海分发平台miniTV,其实就是把七火山产出的所有视频,聚集到该应用下进行分发。Bromo则是七火山自研的另一AI产品,是一款图片超分工具,用来处理图片可达到最高10K的超高分辨率,经过处理的图片其清晰度是能够达到满足商业海报的水准。
我听下来的一个感受是,七火山和市场上很多AIGC公司的区别是,七火山有一条非常清晰的产品链路。可以说,七火山一开始更多地是深耕于人工智能的应用,即怎么运用人工智能技术尽可能压缩繁琐的人工流程,在保证质量的同时,对海内视频进行高效处理,并出口到海外。这条路走通了,有可以稳定盈利的项目,在由此撬动各方大佬的投资,筹集资金来进行模型层面的研究,从而实现应用层面到技术层面的升级。我认为这个思路才是对的,市面上不乏有公司看到人工智能这个热点,就不顾之前的业务想着All in AI。业界普遍认为2023年是人工智能的元年,这意味着在人工智能的赛道上,虽然充满了机遇但却从未有前人走过,大家都是摸着石头过河。我见过很多企业一上来就冲着要在人工智能领域“做大做强”,投入了一堆的资源,却迟迟找不到一个落脚点。导致后续资金跟不上,形成债务危机,项目也早早夭折。而七火山这种模式,则是用人工智能技术服务于自身的业务,再在这个过程中在技术层面进行深入探索,并最终将开发出的模型应用回业务中,以此实现技术与业务的相互促进。如此才能生生不息,源源不绝。
圆桌会议上邀请的大佬实在太多了,我挑几个有代表性的嘉宾阐述下他们的观点。
国家信息中心电子数据司法经济中心项目主任苟先生:国家数据局自去年成立,表明了国家对数据发展的重视及其战略方向已显著。他提到,国家数据中心拥有广泛的数据库资源,其工作重点围绕三大核心领域展开:首先,强调数据与每个个体及主题的不可分割性,说明数据元素是在市场行为中由个人、企业和机构生成的数据集,对每个人都极其重要。其次,数据元素的价值需在其流动和互动中实现,以便形成其资产价值的市场能力。最后,确保数据的安全、客观和可控性是至关重要的。因此,为确保人工智能技术的安全应用,国家数据局等相关机构已经开始提前进行相关工作的布局。
中能建代表发言人:在东数西算战略下,央企从传统IDC业务向国家算力节点进行转型,表明了央企正在向数字化转型。中国能建等央企通过数能融合和交能融合,特别是在数字化领域显示出其相对优势,强调了稳定且较低的电力成本对数据中心或算力核心的重要性。国资委召集的97家央企会议及形成的10个央企联盟凸显了国家对算力发展、人工智能领域的高度重视和投入。这揭示了未来人工智能发展将不仅看到国家队的积极参与,还将包括民企在内的广泛市场力量的贡献。
沐熙公司副总裁王总:沐熙致力于开发包括计算和渲染在内的全栈GPU产品,专注于智能计算和图形渲染领域。王总强调,沐曦旨在向市场提供安全、可靠的GPU芯片与行业方案,全部GPU产品基于公司独立研发的GPU IP,并专注于高效能算力的需求,保证了产品指令集和架构的完全自主可控性。
人工智能的研究从很早就开始了,但是之前的人工智能要给每个场景训练对应训练一个模型,简单点说,就好比你要切菜需要菜刀,削水果则需要削皮刀……但是自从2023年Chatgpt泛化模型问世以来,人工智能领域被颠覆了。这种泛化模型的出现,意味着不再需要为每个具体的场景单独训练一个模型,就像拥有了一把"瑞士军刀",能够在多种任务中进行切换和应用,极大地提高了效率和适用性。而我,作为一个人工智能领域的从业者,看着学术界被Chatgpt模型碾压到大部分学术组织没有继续研究的必要,又旁观工业界的狂欢,多少公司争相涌入AI领域,想成为那只被吹上风口的“猪”。站在时代的分岔路,是一种很神奇的感觉,今天超讯的发布会,看到七火山这样的人工智能团队在文生视频领域带来的震撼,又恍然有种“江山代有才人出,各领风骚数百年”的感觉。
且看,且行,
愿与同道中人共饮此杯,共襄盛世。
记于2024年3月6日凌晨。