异动
登录注册
超级助手”会带来下一代交互终端的机会吗?—“超级助理”领域的长期竞争格局猜想
贝叶斯韭黄
2023-04-11 15:27:29

1) 超级助手与用户的交互一定非常高频很可能不在 PC 上而是手机或下一

代的终端上这里面会涉及到几个很大的博弈

a)iOS /安卓是否允许有这样的东西出现除非他们自己做会不会出现很大

的限制或博弈关系比如前面提到的不允许调用等

b)如果发生在手机上Foundation Model 可以做很多信息层面的整合和娱乐

但一旦涉及到服务层面比如国内的美团淘宝拼多多京东滴滴

微信肯定不会跟三方合作海外的 AmazongoogleUber 也类似他们

可能也会推出自己的类似产品推演下来是很长的周期

c)有猜测说 OpenAI 和微软可能会发布 AI Native 的手机模型是软件形态

未来要做到设备上今年年底前有可能会有消息现在更自然的方式是

Apple 把 iphone 的屏和里面的内容结合语音聊天来做复杂的应用交互可

以用快捷指令编排再用 Siri 唤醒快捷指令

2) 如果 Apple 的 Siri 变成 GPT对格局有怎样的影响

GPT 目前不到两亿用户Siri 约有 15-20 亿用户iPhone 活跃用户为 15 亿

Google 有 43 亿用户如果他们的超级助理效果达到一定水平促使用户快速

adopt规模效应后发优势是很强的Apple 是值得认真想的场景

而且 Apple 现在有很多硬件组合包括 AirPodApple Watch 和手机Apple 的

屏幕是视觉AirPods 做语音沟通只要 Apple 把 GPT 接到 Siri 上很快就可

以实现更高级的助理

 

 

 

从 C 端体验看超级助理和 App/SaaS 之间的关系

Plugin VS LangChainLangChain 价值是所有 App /SaaS 依然是面向 B 端和 C

端的前端底层是大语言模型 Plugin 则是 OpenAI 把自己放在最前端下面

长出小的应用这和站在用户视角上是相反的超级助理对 App / SaaS 有什么

影响可以多考虑站在用户视角的体验

ToC 的应用追求体验感聊天是否体验最好不同场景答案不一样明确的需

聊天体验感也许是最好的如果需求无法描述清楚比如订酒店涉及到周

边环境用户评价价格早餐用传统的交互方式比如点选浏览看似

浪费时间其实是选择的过程谁站在离用户最近的界面核心在于谁能给用

户带来最好的体验感

SaaS 产品很可能重塑SaaS 很复杂产品定义决定日常使用习惯是匹配的

关系比如 BI 有非常多的形态是因为没有一个软件能够非常好地把这两件事情

结合起来chat 是一种交互方式但通过 Excel 的 UI 界面去点选可能更快

但产品重塑就要更好地把什么用聊天去解决什么用点选的方式去交互的

两个事情更好地结合起来个人倾向还是有 UI 界面承载熟悉的操作方式

些任务通过聊天的方式进行

核心是一定是因为它是让 c 端和 b 端的体验感最好的c 端的体验感是用得更

b 端的体验感是如何能够让我和工作耦合得更顺滑

长期来看超级助理应该真的像秘书一样吸收了用户的多维信息用户模

糊的需求可以根据工作生活的经历理解然后操作Inflection 和 Adept 做的都

是自动 Action只不过现在还没有主动做的能力因为主动做给的权限太高了

终极形态到底长什么样

可能有两种

1Jarvis (漫威电影里钢铁侠跟 Jarvis 交互的形态多模态脱离屏

无所不知能操控所有系统

2Her对你充分了解对你的行为模式/沟通方式了如指掌终极形态有

可能是这两个结合起来

多模态肯定是一个终极形态人类通过纯语言交互获得信息的比例很低

不超过 20%视觉和图像获得信息的比例很高纯语音交互可能是因为手

干不了事情点不了屏幕多模态肯定是一个终极形态

 

超级助理领域的长期竞争格局猜想

1) 类比硬件端可以看看苹果是如何打败诺基亚

2) 类比到自动驾驶的终极形态是共享运营电动车还是自动驾驶大脑结构

目前存在三类竞争对手

滴滴

整车厂特斯拉/蔚来传统主机厂

百度等自动驾驶公司

这三类谁能够成为自动驾驶的终极形态目前来看车厂越来越强势和两个核

心问题相关

1既有的玩家 & 新出现的颠覆性玩家谁更有能力构建别人的生态传统车

厂做自动驾驶的算法没有那么难但自动驾驶算法去造车就比较难面对

Google/苹果这样拥有完整生态的竞争对手OpenAI 或者微软如果想把这些

东西都包含进来自己干或与传统竞争对手里排名后位的人合作还是苹

Google 自己研发大模型哪个更容易

2第二留了多少时间自动驾驶时间太长了刚开始百度算法模型很好

车厂没有能力获取短时间内技术上有极大优势但是如果算法不上车

就没有办法获取数据算法和模型永远都是 3 岁小孩只有当激光雷达成

本降下来能大规模获取数据时才是正式比拼的时候现在 LLM 离终极

形态有多长时间如果时间很短那传统的对手反应的速度有没有那么

如果时间周期非常长那竞争格局就会非常复杂

3) 在终极形态的驱动下到底谁能有机会在竞争的过程中很多时候是通

过钱来换时间如果有这个机会那 OpenAI 形成的壁垒就不太存在如果

没有先发优势就比较明显

4) 在整个周期中假设以 2 年为一个代际GPT6/7 如果能够操作所有软件

并且能看你所看想你所想听你所听个人助理这个词是不是不恰当

个人没有能力可以拥有生物/物理/法律博士的能力也不会把销售工程

产品 VP 叫做助理如果 LLM 能掌握所有软件相当于拥有了产品/销售团

5) 跳出传统软件思维回到大场景其实有很多的机会助理的体验不在于自

然语言UI并存多模态而是一种类似管家的逻辑可以帮助用户做

很多的事情用五星级酒店类比酒店里客户一般直接加大堂经理微信

有任何问题直接微信交流不需要研究酒店什么服务所有的事情找工作

人员就可以了然后工作人员拿着东西来跟客户交互这个过程就像

CopilotCopilot 等同于拿着 iPad 跟用户交互的助理当然了交互方面未

必所有的功能都齐全但这更核心的事情是他了解你的上下文以及外部的

上下文是全联通的在场景上面实际上是有很多东西的



作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
苹果公司
工分
1.20
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(1)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-04-11 16:55
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往