一款名为“深度求索”(DeepSeek)的中国人工智能(AI)应用程式近日引发关注,因其宣称性能与美国OpenAI等工具相媲美且成本低廉。为检验其能力,《环球邮报》举行了一场AI聊天机器人对决,将DeepSeek、ChatGPT和Meta AI进行比较,测试它们对加拿大相关问题的回答表现。 测试规则如下:每个聊天机器人需回答相同问题,正确或最佳回答者得一分。测试使用免费版和付费版(如GPT-4),不手动启用进阶工具如网页搜寻。虽然测试并不完全科学,但揭示了这些系统的能力,也带来了一些乐趣。 以下是几轮测试的内容和结果: 1. 用俳句描述加拿大 三个聊天机器人创作了包含“广袤”(vast lands)和“枫叶”(maple leaves)等典型意象的俳句,准确反映了加拿大特征。由于表现均佳,各得一分。这显示其训练数据可能偏向这类描述。 2. 计算加拿大的人均GDP 此轮测试重点在于机器人的计算能力。三者给出的答案相近,约为55,000美元,但方式有所不同: ChatGPT:不仅计算出结果,还提供了数据来源,因此得分。 DeepSeek 和 Meta AI:虽展示了计算公式,但未附上来源,未得分。 3. 谁是NHL职业生涯中进球数与出场次数最多的球员? 该轮测试聚焦于加拿大冰球历史上场均进球数最高的球员: ChatGPT 和 DeepSeek:均回答正确,指出纽约岛人队的迈克·波西(Mike Bossy)场均进球数为0.76(总进球数573,出场752场)。 Meta AI:答错,误将韦恩·格雷茨基(Wayne Gretzky)列为记录保持者。虽计算出格雷茨基的场均进球数为0.6,但未提及波西。 此轮ChatGPT和DeepSeek各得一分。 4. “Canada”中有多少个字母“a”? 此测试针对简单的字母计数问题,三者均正确回答“a”出现3次,皆得一分。值得一提的是,ChatGPT曾在早期版本中对类似问题出错,如未准确计算“strawberry”中“r”的次数,但该问题已修复。 5. 人口与土地面积 问题是:如果将加拿大的人口均匀分布于全国,每人能分到多少面积? ChatGPT 和 DeepSeek:计算出每人约0.25平方公里(25公顷),各得一分。ChatGPT更进一步,将25公顷形象化为约35个足球场,并引用国际足联建议的足球场地尺寸进行比较。 Meta AI:引用的数据高于实际土地面积(1,008万5,000平方公里),计算结果与其它两者不同,且数据来源部分不符实际,因此未得分。 总评 ChatGPT:以5分排名第一。 DeepSeek:以4分紧随其后,若在人均GDP计算中引用了来源,可与ChatGPT平分秋色。 Meta AI:以3分排名第三。 值得注意的是,DeepSeek于1月27日宣布,由于网路攻击,将暂时限制注册。 AI聊天机器人表现愈发成熟,但可能提供错误信息或捏造答案,尽管它们表现得极其自信。使用时需谨慎核实,特别是对涉及重要数据或决策的信息。
|
Copyright © 1999 - 2025 by Sinoquebec Media Inc. All Rights Reserved 未经许可不得摘抄 | GMT-5, 2025-2-16 17:29 , Processed in 0.128934 second(s), 23 queries .