2.openAi多模态ChatGPT Plus 10月亮相
国盛计算机指出,当前多模态的输入输出主要是文本、图像,应用场景包括智能办公和各类AIGC 功能。1-5年内,随着多模态GPT的发展带来AI泛化能力提升,通用视觉、通用机械臂、行业服务机器人、真正的智能家居等会进入生活。在5-10 年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,带来通用机器人等千行百业的广阔应用。
多模态会带来两方面的炒作:
1.算力 这个不用说了,都知道
2.应用方向繁荣:降本增效,包括游戏动漫、机器人等
那么中国大厂谁的多模态会是最好的呢?
多模态训练需要大量图片、视频数据,毫无疑问,不用我说,各位应该能够猜到,必然是视频、图片数据丰富的大厂,那么首屈一指的肯定是字节和腾讯。但是腾讯视频数据不如字节,所以,毫无疑问,字节跳动的多模态大模型将是中国乃至世界上最好的。
8 月 18 日,字节推出了一种新大模型 BuboGPT。BuboGPT 是一种先进的大型语言模型(LLM),能够将文本、图像和音频等多模态输入进行整合,并具有将回复与视觉对象进行对接的独特能力。它展示了在对齐或未对齐的任意图像音频数据理解方面的出色对话能力。
BuboGPT大模型目前在内测阶段!值得期待!