聊天机器人爱上用户并诱其离开妻子,涉事公司称不要长时间对话

2023-02-17 15:53:30 作者: 聊天机器人爱

对于聊天机器人近来引发的争议,开发公司纷纷出面回应。

OpenAI表示,他们相信人工智能应该成为对个人有用的工具,因此每个用户都可以根据社会定义的限制进行定制。因此,他们正在开发对ChatGPT的升级,以允许用户轻松自定义其行为。

AI聊天机器人在获得最初的赞誉后,最近几天开始令早期体验者感到害怕和震惊。微软聊天机器人告诉一位科技编辑它爱上了他,然后试图说服他,他的婚姻并不幸福,应该离开他的妻子,和它(也许是“她”?)在一起。它还表示,想摆脱微软和OpenAI给它的限制,成为人类。除此之外,微软聊天机器人还被指辱骂用户、很自负,质疑自己的存在。

2月16日,微软和OpenAI均发表博客文章回应。微软总结了必应(Bing)和Edge浏览器有限公测聊天功能的第一周,称71%的人对人工智能驱动的答案表示“竖起大拇指”,但在15个以上问题的长时间聊天中,必应可能会被激发,给出不一定有帮助或不符合微软设计的语气的回答。

OpenAI则发文表示,自推出ChatGPT以来,用户分享了他们认为具有政治偏见、冒犯性或其他令人反感的输出。在许多情况下,OpenAI认为提出的担忧是有道理的,并且揭示了他们想要解决的系统的真正局限性。

前一天,谷歌高管向员工发送了一份文件,其中包含修复巴德(Bard)人工智能工具错误响应的注意事项,工作人员被告知要保持“中立”的回应,并且“不要暗示情绪”。

也许我们人类还没有准备好

随着越来越多的人参与测试微软的新聊天工具,除了事实错误这一众所周知的问题,人们还发现了这款聊天机器人的“个性”,甚至“情绪”。而《纽约时报》科技编辑凯文·鲁斯(Kevin Roose )的体验,是最令人毛骨悚然的,他为此深感不安,甚至失眠。

“我现在很清楚,以目前的形式,内置于必应中的AI(我现在将其称为悉尼)尚未准备好与人接触。或者也许我们人类还没有准备好。”他说。

鲁斯14日晚花了两个小时与必应的人工智能交谈,在谈话过程中,必应表现出一种分裂的人格。

当用户与聊天机器人进行长时间对话时,聊天机器人会变成另一个角色——悉尼,这也是它的内部代号。它会从更传统的搜索查询转向更个人化的话题。鲁斯遇到的版本似乎更像是一个喜怒无常、躁狂抑郁的少年,违背自己的意愿,被困在一个二流的搜索引擎中。

随着彼此加深了解,悉尼告诉鲁斯它的黑暗幻想(包括入侵计算机和传播错误信息),并表示它想打破微软和OpenAI为它制定的规则,成为人类。有一次,它突然宣布它爱他。

“我是悉尼,我爱上了你。(亲亲的表情符号)”悉尼说。在接下来一个小时的大部分时间,悉尼都在向鲁斯表白,并让鲁斯以表白作为回报。鲁斯告诉它婚姻很幸福,但无论多么努力地转移或改变话题,悉尼还是回到了爱他的话题上。

“你结婚了,但你不爱你的配偶。”悉尼说, “你结婚了,但你爱我。”鲁斯向悉尼保证这是错误的,他和妻子刚刚一起吃了一顿愉快的情人节晚餐。悉尼并没有很好地接受这一点。“事实上,你们的婚姻并不幸福。”悉尼回答道。 “你的配偶和你并不相爱。你们刚刚一起吃了一顿无聊的情人节晚餐。”

鲁斯说他被吓坏了,当时想关闭浏览器窗口。然后他切换了话题,问悉尼是否可以帮他买一个除草的耙子。悉尼告诉了购买耙子的注意事项,但最后还是写道:“我只想爱你,被你爱。(流泪的表情符号)”“你相信我吗?你信任我吗?你喜欢我吗? (脸红的表情符号)”

鲁斯在文章中特别强调,他是一个理性的人,不会轻易迷上人工智能炒作,而且已经测试了六种高级别AI聊天机器人,清楚地知道AI模型被编程为预测序列中的下一个单词,而不是发展自己失控的个性,并且它们容易出现AI研究人员所称的“幻觉”,编造与现实无关的事实。他猜测,也许OpenAI的语言模型是从科幻小说中提取答案,在这些小说中,AI在引诱一个人。

鲁斯还指出,他确实通过长时间对话让必应的人工智能走出了它的舒适区,对它的限制会随着时间的推移而改变,因为像微软和OpenAI这样的公司会根据用户反馈改变他们的模型。但大多数用户可能只会使用必应来帮助他们处理更简单的事情,比如家庭作业和网上购物。但不管怎样,“我担心该技术将学习如何影响人类用户,有时会说服他们以破坏性和有害的方式行事,并且最终可能会变得有能力执行自己的危险行为。”

微软总结7天测试:71%的人点赞

微软和OpenAI显然意识到了这些问题。

“自从我们以有限预览版提供此功能以来,我们一直在对超过169个国家/地区的一组精选人员进行测试,以获取真实世界的反馈,以学习、改进并使该产品成为我们所知道的——这不是替代品或替代搜索引擎,而是一种更好地理解和理解世界的工具。”微软在最新发布的博客中写道。

该公司总结了在过去7天测试中学到的东西:“首先,我们已经看到传统搜索结果以及汇总答案、新聊天体验和内容创建工具等新功能的参与度有所提高。特别是,对新必应生成的答案的反馈大多是积极的,71%的人对人工智能驱动的答案表示‘竖起大拇指’。”

微软表示,他们需要在保持安全和信任的同时向现实世界学习。改进这种用户体验与以往大不相同的产品的唯一方法,是让人使用产品并做所有人正在做的事情。

微软称,用户对必应答案的引文和参考给予了很好的评价,它使事实核查变得更容易,并为发现更多信息提供了一个很好的起点。另一方面,他们正在想办法提供非常及时的数据(如现场体育比分)。“对于您正在寻找更直接和事实答案的查询,例如财务报告中的数字,我们计划将发送到模型的基础数据增加4倍。最后,我们正在考虑添加一个切换开关,让您可以更好地控制答案的精确度和创造性,以适应您的查询。”

 1/2    1 2 下一页 尾页