异动
登录注册
套娃要回避了:百度回应文心一言文生图“套壳”质疑
李老哥
关灯吃面的老韭菜
2023-03-23 12:44:42

《科创板日报》3月23日讯(记者 黄心怡) 百度今日在微博表示,已注意到对文心一言文生图功能的相关反馈,并回应说明如下:

1、文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。

2、在大模型训练中,我们使用的是互联网公开数据,符合行业惯例。大家也会从接下来文生图能力的快速调优迭代,看到百度的自研实力。

百度方面还称,文心一言正在大家的使用过程中不断学习和成长,请大家给自研技术和产品一点信心和时间,不传谣信谣。

早前,有自媒体博主在社交平台发文称,“百度最近推出的那个会画图的人工智能“文心一言”,有套壳、画皮、造假的嫌疑。

上述博主尝试了让文心一言画了许多会产生“中英歧义”词组短语。他发现,输入“鼠标和总线”,文心一言会自动生成“老鼠和公共汽车”。博主认为,这是由于“鼠标”和“总线”的英文是“mouse”和“bus”,文心一言显然对输入的中文进行了机器翻译。

image

同样的例子还有“一可以豆子”,这并非正常的汉语词组。但文心一言自动生成了“一罐头豆子”的图画。该博主指出,这是由于“一可以豆子”机翻成英语,正是“one can bean”,即一罐头豆子的含义。

image

经过多次测试后,该博主推断,百度的所谓人工智能,其实是把中文句子机翻成英语单词,然后用国外刚刚开源的人工智能“Stable Diffusion”生成了图画。

对此,有IT业内人士认为,文心一言确实把输入的中文句子,通过机器翻译生成了英语单词。“但这是因为开源的图文数据大部分为英文内容。目前还没有上亿规模中文图文数据集。即使有,也噪声很大,基本不可以用。行业内都是用国外数据集,做中文映射,才导致这样的生成效果。”

亚洲视觉科技研发总监陈经也表示,百度的画图AI采用了英文标注的开源图片素材进行训练,因此需要中翻英来当prompt(提示词)

“目前,全球AI研发有开源的传统,特别是训练数据库,不然大家自己收集图片效率太低了。而且图片是要标注的,这更加大了收集整理图片的难度。所以,百度拿英语标注的图片库进行训练,这也是开源的意义。当前也有中文标准的训练数据,但是少很多。”

陈经分析称,“由于发布时间仓促,百度对于画图AI的中文输入词还没完全搞定,才弄了个简单的中翻英来应对。后续应该会根据用户反馈,把中文的提示词与英文的训练素材更好对应上。”

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
三六零
工分
13.95
转发
收藏
投诉
复制链接
分享到微信
有用 17
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(5)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-03-23 17:13
    谢谢
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-03-23 12:58
    谢谢
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-03-23 12:53
    利好海天数据训练
    0
    0
    打赏
    回复
    投诉
  • 韭菜园丁丁
    明天一定赚的萌新
    只看TA
    2023-03-23 12:50
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往