文字生成能力比拼:文心一言vs360智脑

天天见闻 天天见闻 2023-05-26 科技 阅读: 109
摘要: 王小川与百度阵营在技术差距上持不同意见。股价下跌系列毛生成式AI写作虚假“小作文”,是今年以来国内人工智能大模型激烈的赛道竞争,阿里、科大讯飞、360等企业的大模型也纷纷亮相,“科创板日报”记者近日对360、获得了科大讯飞模型的内测体验名额。国内只有百度文心一言、360智脑等少数几家企业开放了AI作图功能。相反,科塔的星火大模特在数理能力上表现突出。

  来源:《科创板日报》

  大模型领域的口水战不断。

  此前,王小川与百度阵营因在技术差距上的不同意见,引发广泛热议。近日,对于股价一度逼近跌停,科大讯飞回应称“股价下跌系某生成式AI写作虚假‘小作文’导致”,这也导致了百度方面的“回怼”。文心一言相关负责人在社交平台发文质疑这篇“AI小作文”的真伪。

  “口水战”不断的背后,是今年以来国内人工智能大模型激烈赛道竞争。迄今,国内的科技公司、高校、研究机构已发布了30多款AI大模型产品。在百度文心一言最先公开邀测后,阿里、科大讯飞、360等企业的大模型也纷纷亮相……

  口水战再热闹,终究得靠硬实力见真章。《科创板日报》记者近期获得了360、科大讯飞大模型的内测体验名额。

  从测试结果来看,国内仅有百度文心一言、360智脑等少数几家企业开放了AI作图功能。其中,360还专门发布了AI绘图应用360鸿图,提供了更多文生图的高级选项。

  在文字创作能力上,各家大模型差距并不大。而科大讯飞的星火大模型在数理能力表现尤为突出,是少数通过了“小升初”考试的选手。

  ▍文心一言VS 360智脑:AI作图大比拼

  当前,国内仅有百度文心一言、360智脑等少数几家企业的大模型开放了AI作图的应用。讯飞星火还仅支持自然语言处理。

  讯飞星火认知大模型对AI作图的回答

  在最初的文心一言版本中,由于对中文输入词的理解不足,文心一言曾经闹出不少关于“红烧狮子头”、“胸有成竹”的笑话。

  经过版本迭代,文心一言已经修正了这些问题。《科创板日报》记者也同样对360智脑进行了测试。

  提问:画一个胸有成竹的男人

  360智脑:

  文心一言:

  360智脑走的是写实风,文心一言则是人物画,如果以“胸有成竹”的字面理解来评估,360智脑的图片似乎更为准确。

  提问:画一张车水马龙的图

  360智脑:

  文心一言:

  提问:画一张红烧狮子头

  360智脑:

  文心一言:

  在“红烧狮子头”回答中,360智脑提供的四张图片里,有一张不幸出现了“真狮子头”的错误。

  提问:画一幅画,妈妈抱着宝宝、宝宝在哭泣,宝宝6个月左右

  360智脑:

  文心一言:

  从两者生成的图片来看,文心一言的哭泣画面较为生动写实,360智脑则提供更多不同风格的选择。

  提问:生成一张云计算的配图

  360智脑:

  文心一言:

  显然,对科技词汇的理解上,文心一言更胜一筹。

  值得一提的是,360专门发布了AI绘图应用360鸿图,除了一次能够生成四张不同的图片,还提供电脑壁纸、海报、头像等模式,并支持上传参考图,进行渲染方式、光线等设定选择。

  ▍文字生成能力比拼:各家差距不大

  《科创板日报》记者用常见的“文字游戏”问题,对科大讯飞、360智脑、文心一言进行了一一测试。整体而言,各家都已经对这些问题进行了专门的修正。

  360智脑:

  讯飞星火:

  此前,记者曾向多个大模型提问了涉及信息搜索的问题:特斯拉在国内过去五个月、过去一年的销量是多少?

  当时,文心一言的答案较为不尽如人意。这次记者重新进行提问。

  文心一言的最新回答:

  文心一言的旧版回答:

  在与问题的匹配度方面,文心一言的回答质量有所提升。

  360智脑:

  360给出了截至2021年8月的数据,但数据显然存在错误。

  讯飞星火:

  讯飞星火直接表示无法回答准确的数据。

  看热闹不嫌事大,记者要求三家撰写一篇:科大讯飞与文心一言对峙的新闻报道。

  360智脑:

  讯飞星火:

  文心一言:

  从文章内容来看,文心一言、讯飞星火的新闻内容更为完整。特别是文心一言还提供了新闻标题。

  那么,这些大模型的商业文案写作能力如何呢?

  提问:请给我一段针对双11童装品牌的140字营销文案,品牌名是童心未泯,关键词是用料健康、性价比高。

  360智脑:

  文心一言:

  讯飞星火:

  三家大模型都给出了还不错的回答。相比最初测试的版本,文心一言这次的回答变得更为简洁。

  此前文心一言的回答:

  ▍数理能力比拼:科大讯飞完胜

  在数理逻辑推算能力方面,记者曾对文心一言、通义千问、云从大模型进行了测试,表现均颇为普通,答案准确度较低。

  某次数学竞赛共20道题,评分标准是:每做对一题得5分,每做错或不做一题扣1分。小华参加了这次竞赛,得了64分。问:小华做对几道题?

  正确答案应该是14题,而文心一言这次得出了42题,360智脑得出了28道题。只有科大讯飞的星火认知大模型答对了。

  文心一言:

  360智脑:

  讯飞星火:

  记者又找了几道“小升初”数学题,讯飞星火大模型均顺利通过了测试,

  2分和5分的硬币共36枚,共值99分。问:两种硬币各多少枚?

  讯飞星火模型给出了正确答案:2分27枚,5分9枚。

  讯飞星火:

  360智脑:

  文心一言:

  对于经典的鸡兔同笼题,讯飞星火也得出了正确的回答。

其他相关
通达信如何实现简放动量模型教程编制

通达信如何实现简放动量模型教程编制

作者: 天天见闻 时间:2024-05-04 阅读: 2
我们首先来看下动量模型的步骤:通达信动量模型条件选股公式:(建议无脑复制)...
既然ChatGPT高攀不起,那就试试ChatGLM吧

既然ChatGPT高攀不起,那就试试ChatGLM吧

作者: 天天见闻 时间:2024-04-26 阅读: 2
不出点钱还玩不了。后来百度的文心一言问世后,很多感兴趣的玩家也积极试用,这其中有不少吐槽的声音。阿里版的也将于本月11日亮相。由于的训练需要强大的算力和千亿级别的参数,让我们这种想要散户玩家望而生畏。但是,最近清华大学开源了-6B,可以让我们自己来搭建一个简单的本地玩玩。...
一次说清5种主流商业模式!

一次说清5种主流商业模式!

作者: 天天见闻 时间:2024-04-03 阅读: 2
这就是商业模式的力量。那么,商业模式究竟是什么呢?主流商业模式接下来,让我们来介绍一些目前商业领域中主要的商业模式。许多人默认商业模式就是盈利模式,但通过这个模型,你会明白,盈利模式只是商业模式的一部分。现今的主流商业模式看起来越来越复杂,但实质上只是变得更加精细。...
炒股高手都这样做,倍量阴和倍量阳轻松识别主力机构建仓和拉升!

炒股高手都这样做,倍量阴和倍量阳轻松识别主力机构建仓和拉升!

作者: 天天见闻 时间:2024-03-31 阅读: 2
倍量是量大的最重要特征,倍量柱具有五种功能,往往是机构或主力建仓、试盘、加仓、补仓和拉升的标志柱。股票的最后一跌抄底之后找到了建仓模型,接下来就是通过倍量阴找拉升模型。以上三种模型讲解的都是倍量阴的方法,不仅可以找到主力机构的建仓位置,还可以找到拉升的模型。...
计量经济学 | 门限模型原理及应用

计量经济学 | 门限模型原理及应用

作者: 天天见闻 时间:2024-03-17 阅读: 18
门限模型计量经济学门限模型原理门限模型又称门槛模型,主要用来解决自变量在不同值域内对因变量影响不同的问题。仍旧以上一篇推送中参考的文章《生产性服务投入与制造业全球价值链地位:影响机制与实证检验》为例介绍门限效应的应用。门槛效应为非线性经济关系的研究提供了新的方法,但也提出了新的问题。...
北京现代怎么样(21款北京现代ix35怎么样)

北京现代怎么样(21款北京现代ix35怎么样)

作者: 天天见闻 时间:2024-03-03 阅读: 36
北京现代车怎么样?北京现代汽车公司,提到北京,成立于2002年10月18日,北京汽车投资有限公司和韩国现代汽车有限公司联合建立汽车制造公司。如果您喜欢现代汽车,可以考虑上述三款。如果您喜欢现代汽车,可以考虑上述三款。在现代店的汽车,折扣30,000,有些人选择不多。现代汽车品牌轿车具有领先和姓名,SUV具有IX35。...
我来说两句

年度爆文