ChatGPT以火箭般的速度爆红,沉静许久的中国科技圈和创投界的终于再次引发热潮。
近日,百度基于新一代大语言模型的生成式AI产品“文心一言”正式开启邀请测试。作为对标ChatGPT的产品,“文心一言”迅速火出圈,吸引了大量用户参与试用。
随着ChatGPT、文心一言的发布,AI绘画再度火出圈。过去一周,百度文心一言生成的绘画作品在网上遭遇“群嘲”,原因在于其绘画功能对中文成语的理解仅停留在字面意思,如网友输入“夫妻肺片”后文心一言生成了一对露出肺部结构的夫妻,输入“鱼香肉丝”,文心一言画出了一条由肉丝做成的鱼,输入“胸有成竹的男人”则画出一个胸部长出竹子的人……
玩坏了的文心一言,如今的确有些尴尬。在AI绘画之前,对话式问答也被很多人玩坏了。测试发现,文心一言面对单次、简单问题时,能够直接给出答案,表现较好,这可能主要因为类似的问题在百度搜索上就能搜到答案。比如让它评价一部电影,或者写个小故事,答案基本让人满意。不过一旦提出复杂一点或者逻辑性强一些的问题,文心一言就有些招架不住。比如有网友提出这样的问题:树上有10只鸟,开枪打死一只,还剩几只?文心一言的回答是9只。类似现象还有很多,面对脑筋急转弯式的问题,文心一言基本给不出人们预期的答案。
百度创始人李彦宏他说道,“要对标 ChatGPT、甚至 GPT-4,门槛还是很高的”、“自己测试还是感觉有很多不完美的地方”。
文心一言确实还不如ChatGPT,但总要客观认识到我们今天所说的 ChatGPT,或者其背后的 GPT-4 语言模型,是一个花了 5 年时间、经历了 4 次迭代,完成了从量变到质变过程。想让文心一言在几个月这么短的时间内实现赶超,几乎是不可能的事情。
此外,大模型训练的三要素包括大算力、大数据和大模型。有从业者指出,影响最后训练结果的因素有很多,包括清洗、标注、模型结构设计、训练推理的技术积累等。每一个因素的变化都影响着最后的结果。
目前来看,百度做大模型并不是毫无优势,技术面上,百度在中文NLP领域,无疑拥有先天优势。首先是对国内技术政策的熟悉,令它比ChatGPT 更能满足国内市场需求。其次,作为最大的中文搜索引擎,百度拥有的高质量数据集及中文数据收集能力,其他家难以比拟。