要谈本质的变革,是对生产力10倍以上的提升,比移动互联网更大十倍的创业机会。公司拥抱技术、个人职业选择、创业的机会等角度来说都是有史以来最大的机会。AI在各方面的领域会创造很大的价值,互联网到大数据到视觉听觉到机器人、无人驾驶等。
Al1.0收集数据,精准清洗标注,单一领域的使用,要比较大的算力、和AI专家,五因素成立后AI才能创造大价值。互联网AI做得好,因为数据最大最广泛,可以自动得到海量精准数据。其他的领域问题较大,瓶颈在于大量的数据要基于特定应用领域。例如银行用AI做贷款降低坏账概率,必须收海量数据,花几千万上亿成本收集数据,这是不现实的。
Al1.0的问题是每一个应用领域都是孤岛,AI落地成本高,难赚钱。
最近的突破是GPT3.0-4.0,带来的作用是形成了真正的平台。GPT用了全世界的数据,跨时间段,跨空间。学术角度称为基础模型。训练了基础模型后,再有新应用,大大降低应用开发成本。平台的定义之一必须要大大降低开发成本。A12.0大模型,迁移学习到每个领域,可以在未来三五年大大降低研发成本。
基础模型特点:一次性训练全世界数据不需要人工标注,需要非常大的数据量、非常多的GPU,需要5000张A100,或2000张H100,刚开始文本为主,未来可以是多模态。
数据如何标注,训练:不需要标注,有算法,生成式算法。读书时,第一本第1到9章,猜第10章;猜错之后,深度学习训练提升模型,再猜。缺陷:不可能每句话都才对,有对有错的过程中不断提升。乱猜会猜错的AI仍能改变是世界的原因:一是有些应用是(humun in the loop)人类干预,包括所有Product activity application都会被颠覆, AI把效率提升十倍百倍,代替重复性工作;二是很多领域可以容错的,比如广告,可以做千人千面的广告,针对性部署,整体的 conversion rate大大提高,还有电子商务、金融等。
A12.0可以进入真的工作,机器人的动作学习视频,实现服务。
例子:搜索引擎,到问一个问题得到答案;电商广告,化妆品,东方女孩、美国健身女孩,针对部署不同的广告;抖音颠覆,抖音收集UGC,针对定向AI推荐引擎,每个人看到想看的内容,毕竟内容是人拍的,不一定真的能 match到个人喜好,当AI可以生产内容的时候,可以专门生成符合用户喜好的视频内容;游戏,图像、3D引擎、文本脚本剧本,敌人模型、音效,都可以AI来做;AI领域自身,值得注意的,GPT5.0是人和GPT4.0写的,代表可以看到指数增长的可能性,AI可以写代码;教育,针对性, Lingo,基于GPT4做Lingo的绘画版。
《AI未来进行时》第三章的内容可以参考。
算力需要巨大:只有最有钱的公司才能做得起大模型。需要解决被坏人利用的问题。
投资应用:一是投资最好被颠覆的领域;二是投资大模型大平台;三是算力,芯片,运维。
我们正在筹划AI2.0的公司,已经有想法,主要目的是做全球A12.0公司,中国作为最重要的第一个语言环境。AI2.0全方面美国领跑,提供了非常好的技术环境,过去几年 5000张A100。中国是很好的切入点,如果能有一些在美国大厂做过的顶级专家带领团队,可以做出来。也可以在除了使用英语的国家切入。中国的软件工程师做APP、做infrastructure、做middle ware完全超过美国,缺的只是大模型技术。公司目标世界第三,中国第一。
方向:模型;打造巨大的平台,把所有开发者需要的功能纳入,包括降低模型的规模、做迁移学习、并行训练、多国家的训练但是不移动数据,法律法规文化价值观的迁移等的功能,自己开发少数的一些应用帮助自己生产中间件,降低未来应用的开发成本;做多语言,很多应用本身是跨语言产品,需要筛选优化过滤,ChatGPT把英文数据读完后映射为中文。
创新奇智在A11.0做的很好,行业最好。每个客户是孤岛,如何赚钱,打发是八个工业领域,第一个客户赔钱,第5到10个打平,第20个开始转钱,然后开始做下一个领域,很好平衡打进各个领域。根据一个行业, 10年时间打下100个客户,收入一年16亿,亏损在大大缩窄,要达到80%营业额的增长,就需要不断大幅扩张。Al2.0也一直在打造,有Demo可以看。创新工厂打造大模型平台,不需要创新奇智自己掏一分钱为了GPU和平台。可以开放底层API,创新奇智开发了迁移学习引擎,快速开发针对行业的应用,几个月内成为产品。Google机器人Demo,得到一些软硬件结合的机器人视觉等。创新奇智一方面打磨商业模式,另一方面布局A12.0,同时有母公司的合作机会。
创新奇智A12.0应用,用于饮料公司,已经落地。能够让管理知道公司运营的状态,有图文回答,比如本月生产的瓶颈在哪。
问答:
1. Project2.0平台级应用,启动资金量的水平,是否考虑和互联网巨头合作,和政府合作。
几亿美金,不排除和公司合作,在中国合法合规落地。
2. 以后模型的方向,参数越来越大,通过合成方式,还是压缩参数。
AI领域做机器学习说,more data thanno data。一定是大数据,一定是大模型。但是大模型不可落地,成本太 高,所以压缩还是必要的。相较于事先压缩数据训练小模型,一定是先用全世界大数据训练大模型,然后大模型再自我压缩更好。
3. 大模型角度来看,除了算力外,其他壁垒是否大,比如 Google、Amazon,是否能迅速追上OpenAI
美国大厂第一梯队,OpenAl、 Mcirosoft和Google,其他无法接近。微软本身两个阵营,投降给OpenAI,和自己做。自己做能进第二阵营。第三阵营 Apple, Amazon, Salesforce,都不是特别透明,起步晚,但是都有大资源和算力,善于应用而非原创。都领先中国。
中国公司AI科学家接机美国水平,做应用AI部署能力很 强。落后在于过去4、5年没有公司提供足够算力让科研人员探索。中国公司可以做小模型,读美国论文,可以赶得上;或者在美国大厂带几个人回来。还需要考虑中国非美国源的CPU、GPU是否足够好用。现在的阶段,H100还是最合适的芯片,因为做了transformer的优化,而A100没有这个功能,如果一个H能有一个A3、4倍的提升,一定能更好管理集群。
4∙如果中国赶不上,有可能Gap越来越大,美国的一些行业变化快,这样的情况下对中国的影响。
乐观看中国可以赶上,未来5、6年有机会赶上。创新奇智,等一点不比美国差。如果真的赶不上,国家垄断技术,带来 GDP的提升,科技领跑全球的地位不可撼动。但是可能从美国国家治理的角度来说可能难以处理贫富差距和普通人民工作被AI代替的问题。
5.创业者对中国政府的建议。
任何有足够经济能力的政府都需要设计特别巨大的算力中心;设计特别巨大的适合大模型训练的芯片和系统和超级计算等;把算力提供给最能够应用算力的公司和学校。