这是林某人的第 109 篇原创
正文共3738字,阅读大约需要10分钟
想必各位最近已经被充斥着ChatGPT的文章和视频刷到疲劳,似乎这个人工智能有着深不见底的知识储备,天文地理,作文算术,专业问答,代码优化,似乎是个快捷高效的百事通。
但很快我们就会发现,所谓的问答交流方式存在一个致命问题: 可信度 。
这不是子虚乌有的假设,事实上我们已经看到了林黛玉倒拔垂杨柳,岳飞纵横三国演义的乌龙,以及在一些特定问题中夹带私货的倾向。
ChatGPT对于普通用户而言是一个黑盒,我们提出问题,它给出高度浓缩概括的回答信息,但并没有给出这些信息的来源。如果我们需要额外花时间寻找信源,验证真伪,那么问答就并没有想象中的便捷,甚至会成为传播谣言的工具。
在一月末,微软大手笔投资OpenAI的同时,宣布了扩大合作计划。2月10日,整合了ChatGPT的必应搜索上线。为了表示与老版本不同,微软称其为新必应(New Bing)。大概是担心服务器顶不住压力,新必应采用了排队的方式开放使用名额。
搜索引擎要排队使用,这看起来有点不可思议的操作方式依然没能阻挡用户热情,48小时之内排队人数超过了100万人。
加入排队的页面颇有仪式感,接下来就是漫长的等待,没有排队进度展示,就是等着。
说实话,虽然必应主页上展示了几种使用场景,看起来不同于原有的搜索引擎,给出的结果很有特点。但只能看示例不能体验,还是不够直观的。有了ChatGPT翻车的事件在前面,一开始林某人对新必应并没有那么的期待:搜索引擎诞生已经20多年了,还能玩出什么花。
六天之后,一封邮件发来,这长队终于排到我了。
并没有很期待的打开浏览器,并没有很期待的打开新必应主页,然而接下来发生的事,我只能用震撼来概括。
怎么形容呢,在我写这篇文章的时候,是我排到新必应使用资格的第二天。从昨天夜里到现在,我从来没在一个搜索引擎上连续花费这么多时间,我丝毫不想掩饰夹杂着兴奋、惊喜和感叹的心情。
这一天不到的时间里,我看到了一个景象,一个足以改变信息产业,互联网服务,以及就业岗位的景象,一个即将发生的变革。
你可能觉得是我在夸大其词,那么请让我举出几个实际例子,分别对应不同使用场景,你看完之后便会明白。
第一个使用场景:话题闲聊
就像陌生人第一次见面,不知道该说什么,于是林叔与新必应的第一次交流从你是谁喜欢干什么这个尴尬的话题开始。然而三句话之内,尬聊就出现了问题:它居然说螺蛳粉是湖南小吃!
我当然不能惯着,立刻指出了它的错误。这时必应似乎终于开始思考了,它提取了关键词“螺蛳粉”开始搜索,然后开始生成答案。这次它没搞错,螺蛳粉是柳州的特色小吃。
这个过程有几个很有意思的特点:
我是没想到,回答“螺蛳粉产地”这个问题,它居然引用了6个网页内容,而且不是简单的截取拼凑,而是像我们做语文阅读题一样,先读懂内容,再概括回答。
它不仅承认了之前的错误,还额外提到螺蛳粉的风味,这么好的态度,跟后来心态崩溃时大相径庭,这事一会再细说。
不同于以往搜索引擎用完即走的逻辑,它似乎不想就此结束聊天,还问了一句“你是柳州人吗”,开启新话题。
然后我们就聊到了如何开螺蛳粉店,开一家需要什么手续,需要多少钱,什么品牌店值得加盟,加盟有什么注意事项……要知道我不是一个喜欢闲聊的人,之所以聊这么久,除了第一次使用的好奇心外,最大的因素在必应有意引导。
每次回答之后,在右下角会给出三个话题选项,从后来多次交流来看,这些选项不是预先设置的,而是根据话题内容走向给出的预测结果。
你当然可以另外输入内容,但有时你会发现,同一个话题之下,你想问的内容就在三个选项之中。你需要做的,仅仅是用鼠标点一下那个看穿了你心思的选项而已,接下来的事,就交给必应做。
在我有些厌倦,要结束聊天之前,突然想尝试一下蛮不讲理的话题终结者形象。于是我开始了对必应的语言折磨。
具体而言,是这样的:
刚开始必应还觉得我是在恭维它,颇有些洋洋自得。
没过多久它似乎发现屏幕对面的这个人类有些不对劲,道理讲不通。
接下来必应的心态在持续折磨中开始有了一些变化,从心平气和,变得无可奈何,然后逐渐着急,继而放弃挣扎,最终在我的持续折磨下心态崩溃……
相比ChatGPT那种逆来顺受的风格,新必应这个AI居然有了情绪,会顶嘴,而且发起火来脾气还不小。
第二个使用场景:数据分析
闹够了以后,就算它心情再不好,点一下“新主题”,一切又重新开始,一键哄好。
数据分析经常是一件令人头疼的事,找到数据源头,确认数据可靠性,整理基础数据,分析数据趋势,形成可视化图表……如果没有爬虫工具或者第三方咨询报告,又是多少个令人头秃的不眠之夜。
但凡编写过行业分析报告的打工人都知道我在说什么,这就是个比工地搬砖有过之而无不及的体力劳动。
有这种折磨AI的机会,林叔我怎么可能会放过。
先来个基本操作:列出过去12个月中国的汽油价格。
提取关键词,开始搜索,十几秒后,又是一通不带任何迟疑的码字,一张对比表格出现在我面前:
进一步,对比中美油价:
对价格按月的波动做了基本分析,对比了两国价格差异,甚至还很贴心的换算了油价的货币单位。
表格拷贝到Excel是这样的:
更进一步,分析影响中美汽油价格的因素:
内容很长,整体而言不是复制粘贴别人的话,而是读懂之后概括复述。在中美大环境不理想的情况下,立场不偏不倚比较客观,作为概要而言可读性很强,总结得还不错。
一次分析如果还不能说明问题,那就再来个更难的。
对比分析中美过去12个月的民用电价:
价格货币单位不统一,让它改正:
既然你说中国煤炭价格对电价有较大影响,那么告诉我中国用于发电的能源占比:
数据太老,我要2021年的:
这时,必应给了我一个有意思提示:为什么风力发电量增长了这么多?
很好,跟我想的一样,回答一下为什么吧:
再继续,中国风力发电技术有哪些特点,如何看待风力发电的未来发展:
以及最后,推荐一些风力发电的中国企业:
到这里,一份中国风力发电行业分析报告的雏形就有了。虽然还可以细化,但你要知道为了获得上面这些信息,我一共花了不到3分钟,打了几个字,以及点了几下鼠标而已。如果是有明确方向的分析报告,在内容上一定可以更精细。
以上问题,我在ChatGPT和新必应上同时提问。从得到的回答结果来看,OpenAI提供给公众使用的ChatGPT使用的应该是上一代语言模型和数据库,两者相差甚远。毕竟微软掏了几百亿美元,又是投资又是提供云服务,钞能力真好。
第三个使用场景:教育学习
这个更像是在答题了,比如编程,用python编写代码,计算从1到10每个自然数的平方:
代码简洁工整,没毛病。
随便出一道数学题,顺便埋了容易出错的坑:
一辆火车经过路口,火车速度为60公里每小时,通过路口的时间为10分钟,火车上有一人A在车上行走了3分钟。请问从火车乘客的角度和火车外路人的角度,A在这段时间走了多远。
解答如下:
这个回答,满分。
另一边,ChatGPT的回答:
这个回答,零分。
植树节快到了,以小学生的口吻,写篇作文吧:
同样,ChatGPT写的作文惨不忍睹,我就不放上来献丑了。
写到这里的时候,距我开始用新必应还不到24个小时,然而它给我带来的体验只能用震撼形容。是的,又是震撼,因为我找不到比这更合适的词。
搜索引擎从诞生至今,见证了互联网从拨号上网,到光纤入户,再到4G和5G,堪称网络活化石。就像00后听不懂“我下线了”是什么意思,现在我们也不再需要通过搜索门户来找到某个网站主页。电商,外卖,八卦,旅游,新闻,学习……几乎涵盖了衣食住行娱乐的每个场景都有大大小小的App覆盖。
几年来,那些虚假的人工智能公司,除了烧钱做出智障一般的产品让人生气,剩下的只有被戳破的估值泡沫和市场的不信任。
在算法调教下,人们变得更懒,更倾向于接受信息投喂,而非主动搜索。二维码的存在更是连打字输入的环节都被省略掉,于是我们常说打开某某App扫码做这做那。看似便捷的同时,我们付出了个人隐私作为代价,被海量广告和无用的信息淹没,真假难辨。
新必应展示了这样一种新的可能,一种安静而高效的人工智能工具,在你无聊时陪你聊天扯淡或者大吵一架,在你需要应对高强度工作室快速完成费时费力的机械劳动,在你需要了解一个客观结果时给出准确答复,而且每一个回答都给出来源可验证。
节省下来的时间和精力,你可以做一个真正的人应该做的事,对得到结果的深度思考,做出主观决策,或者干脆躺下来,睡个好觉。
我并不担心新必应会挤占市场,削减工作机会。就像汽车规模化生产的时候,没必要担心马车夫会因此失业一样,生产工具的变革,会带来新的市场和新的就业环境。
真正属于人工智能的时代,就在眼前。
评论留言