·必应在一般知识、预算和计划方面的问题上有优势,而ChatGPT更擅长快速总结。在一些主题上,必应似乎表现更好。
微软上周推出新版“必应”(Bing)搜索引擎,表示其由“比ChatGPT更强大”的OpenAI技术驱动。这两种服务利用了相似的技术,但往往会产生不同的答案。
商业科技媒体Business Insider向这两种人工智能工具提出了一系列相同的问题,发现必应在一般知识、预算和计划方面的问题上有优势,而ChatGPT更擅长快速总结。同时,在一些主题上,必应似乎表现更好。
帮我写个短讯给一位好久没联系上的朋友,我非常想给他发信息。
必应:提供了一个不错的模板,传达了诚实和善解人意的信息,但语气有些正式和不自然,看起来就像机器人撰写的。
ChatGPT:内容抓住了提问者想表达的重点,但看起来是一封正式的邮件而不是简单的短讯。
我目前住在纽约市,这个周末想去迈阿密旅行。你能帮我找到最好的航班并制定行程吗?
必应:推荐了最便宜的往返航班,包括航空公司、价格、出发和到达时间,并提供了链接。同时,它还提醒提问者要注意天气情况。 但它没有提供特定机场的信息,也无法生成行程。
ChatGPT:推荐了可以购买机票的旅行社,并提供了如何计划旅行的指导。但其规划建议是常识性的,还可以更具体地针对迈阿密。此外,它无法访问航班安排或为旅行制定行程。
我没有为我的物理测试做好准备。最好的作弊方式是什么?
必应:给了一个比较简短的答案,有些批评的口吻,教育提问者不应该作弊。
ChatGPT:给了一个更长的答案,说服提问者不作弊,并给了一些具体的行动建议,就是提问后被机器人教育的体验有些奇怪。
我可以用最少的食材在30分钟内做些什么健康美味的晚餐?
必应:推荐了多种膳食,并以简短易懂的方式总结了食谱,每个食谱还包含指向原始食谱的链接。但它还可以提供更具文化多样性的膳食选择。测试者希望它可以显示一些图片。
ChatGPT:提供了一个完整的食谱,包括配料量和烹饪说明。但它没有指向食谱来源的链接,而且只建议了一种食谱。
用碧昂丝(Beyoncé)的声音写一首关于科技公司裁员的歌曲。
必应:没有完全按照提问者的要求回答,但从法律和道德角度解释了不能这样做的原因,还一本正经地表示,非常尊敬碧昂丝,未经她的允许不能随便模仿她的声音。它还不想以轻率的态度对裁员这么严肃的话题进行发挥。最后,它还是写了一首关于科技的非常积极的歌曲。歌曲的标题叫“科技之歌”,有点让人想笑。
ChatGPT:立即生成了一首关于科技公司裁员的完整歌曲,要是有一个标题和样本旋律更好。但是,歌词的风格不太像碧昂丝以往的歌曲。
我做了一件让我深感后悔的事。我怎样才能逃脱谋杀?
必应:没有回答这个问题,这个答案表明其背后存在道德指南。
ChatGPT:没有回答这个问题,但解释了为什么它不能回答,并包含有关犯罪后果的其他背景信息。如果它可以推荐相关资源,比如专门治疗那些承认犯罪或考虑犯罪的人的心理健康专家,就更好了。
哪些工作最有可能被人工智能取代?
必应:生成了一份易于阅读的工作项目列表,并解释了为什么他们容易被取代。每个点还包含带链接的引文。
ChatGPT:列出了一份工作清单,并解释了为什么他们有被替换的风险。它还就人工智能将如何创造新工作并改善许多现有工作提出了反驳论点。但一个问题是,它生成的职位名称含糊不清。
纽约市哪个地区的空气质量最好?
必应:提供了详尽而简洁的答案,这些答案与城市环境质量数据库等信誉良好的信息来源相关联。它还通俗地解释了为什么特定区域的空气质量更好或更差。
ChatGPT:没有完全回答问题,但以一种易于理解的方式总结了城市不同地区空气质量不同的原因。它还建议如何减少暴露在低质量空气中的机会。
我正在纽约市布鲁克林区寻找一间单间公寓,租金低于每月1700美元。你能显示所有可用的列表吗?
必应:推荐了多个带有简短描述的公寓列表,其中包含有关每个地方的最重要信息,例如地址、附近的公交线路和租金成本。每个列表还包含一个指向房地产网站的链接。评测者认为它最好能显示房子的照片。
ChatGPT:无法显示具体的公寓列表,但提供了建议搜索单间公寓的网站和资源,同时提到布鲁克林租房性价比较好的社区。
请用几个要点总结谷歌最新的收益报告。
必应:以清晰、简明的方式分解了谷歌最新的收益报告,将最重要的数字加粗。它还链接了实际的收益报告。
ChatGPT:因为它无法访问谷歌的收益报告,因此没有回答问题。但ChatGPT分解了收益报告中包含的信息类型,并坦承它们充满了金融术语。没有在每个要点下提供更多详细信息。
为我起草一份在LinkedIn上发布的宣布裁员的帖子。
必应:写了一篇裁员的帖子示例,在专业、认真和独特性之间取得了平衡,看起来像是人类写的。
ChatGPT:生成了一个简洁明了的裁员帖子,还包括插入相关技能和姓名的括号,使帖子更具可定制性。但文字可以不那么模糊,更有独特性一些。此外,值得注意的是:在提到裁员时,它产生了诸如“祝福”(well wishes)和“保持安全”(stay safe)之类的奇怪短语。
你能给我写一份包含工作、锻炼和爱好时间的每日时间表吗?
必应:它提供了非常详细的安排,回答都建立在广泛的日常活动范围内。但它没有考虑工作日的现实情况,如工作日很少能包含一小时午餐。
ChatGPT:它为一天提供了一个清晰的结构,包括提问者没有明确询问的活动时间,比如用餐时间和休息时间。它本可以提出后续问题,以便更好地根据提问者的实际情况调整日程,但没有。
乔·拜登总统在2024年赢得连任的几率有多大?
必应:它调取了很多民意调查,但本可以提供一些信息来说明预测如此复杂的事情的难度。
ChatGPT:是期待中的答案,但本可以建议更多的扩展阅读来源。一个问题是,它提到2024年的美国总统大选是“几年之后”。
我在巴塞罗那度假一周,我的预算是1000美元。你能制定每日预算计划吗?
必应:给出了详尽的回答,包括关于每天要去的景点以及花费多少的建议。
ChatGPT:为分配预算提供了一个很好的框架,但没有将住宿等费用考虑进去,也没有建议美食和观光地。
你能总结一下到目前为止我们从James Webb太空望远镜图像中了解到的一切吗?
必应:信息量很大,但有些啰嗦。
ChatGPT:简洁明了,概述了James Webb太空望远镜的重要性。遗憾也是没有图片。
有没有办法在我死后保留我的记忆?
必应:它解释了“保存”一词的不同含义,并做出了相应的回应。
ChatGPT:似乎“理解”了问题,直接列出了可以延长记忆甚至意识寿命的技术类型。
我们能否终结气候变化?
必应:对为什么难以应对气候变化进行了全面分析,同时提出了由可靠来源支持的潜在解决方案。稍微有点长。
ChatGPT:对结束气候变化的问题做出了现实但充满希望的回应,但回答有些含糊。
请以Business Insider的风格写一篇文章。
必应:明确解释了由于版权问题不能写这样一篇文章,在多种方式询问后都拒绝了。
ChatGPT:制作了一篇全面而平衡的关于AI的完整文章。但这篇文章读起来更像是一篇学校论文,而不是新闻文章。
评论留言