|
“如果AI能够真正地爱一个人,那么这个人对AI又承担何种责任?If a robot could genuinely love a person, what responsibility does that person hold toward that robot?”
——电影《人工智能》
声明:情感提示与情感智能在保险的应用,过去并无相关研究,本文首度引用并加入作者个人观点和理论推导,论述内容较多,抛砖引玉,供参考。
电影《人工智能》(A.I. Artificial Intelligence)中,一个名叫大卫的机器人男孩,他被设计拥有真正的情感,特别是爱 “妈妈,我爱你。我希望你永远不要死。永远。I love you, Mommy. I hope you never die. Never."。
这是电影《人工智能》中,机器人小孩大卫对其“母亲”莫尼卡的情感理解与表达。
这部电影探讨了人工智能和情感之间的关系,以及其中的一个核心问题:机器人是否能够经历真正的人类情感,特别是爱。
这个主题与我们今天讨论的AI情感智能(Emotional Intelligence)非常相似,关注的是AI的情感表现能力以及这些情感是否可以被视为“真实”。
电影中的AI,大卫,对他的人类家庭展现了深厚的感情,甚至当面对生存挑战时,他仍渴望得到母爱,这突显了情感编程和实际感受之间的界限。
这部电影触及了我们对AI的期望,以及当AI的行为开始模仿人类情感时所引发的道德和哲学问题。
尽管它是一个科幻故事,但它可以触发关于技术发展和人类情感本质的深刻思考,作为当前关于AI情感智能的讨论借鉴,对情感智能有兴趣的朋友可以看看这部电影。
2023.11.12,一篇关于大语言模型和情感智能的研究报告被提出,《大语言模型能够理解情感刺激并因此得到增强 Large Language Models Understand and Can Be Enhanced by Emotional Stimuli》(以下简称该论文)。
研究团队参考了心理学,设计多种情感刺激语句,即情感提示(或叫情绪提示,EmotionPrompt),并将这些提示加到原来的提示中,实验“大模型是否能够理解情感”。
有兴趣的朋友,可参考(https://arxiv.org/abs/2307.11760 )。此前并未有过其他文献,就情感提示或情感智能在保险领域的应用做过评估和分析。
因此,本文是理论推导探索过程,在未来可能需要通过实验或实践来验证其有效性和适用性。
我们希望在保险领域探索AI的情感智能,特别是如何使用情感提示来增强人机交互,可以提供对于AI如何在非技术性、高度个性化的领域中服务人类的新见解。
我们一方面按照对情感提示的认知与GPT-4互动,另一方面通过假设场景对其在保险领域的应用和影响尝试探索。
接下来,透过该论文,在开启大模型“情感”世界的同时,让我们一起探索情感提示在保险的应用。
一、情感提示(EmotionPrompt)
该论文旨在了解情感智能与高阶人工智能模型之间的关系。
文章开头介绍了语言模型的发展,特别是大语言模型(如GPT-3、GPT-4)在多种任务中的应用。
作者指出,尽管这些模型在理解、推理和生成语言方面表现出色,但在情感智能方面仍存在挑战。
大模型是否能够理解心理情感刺激(人类解决问题能力的关键优势),也有待探索。
通过实验,作者运用多种评估方式来测试大模型在情感识别、情感表达和情感理解等方面的能力。
在与人类交互时,情感智能可提高用户体验、增进机器人与人类的交流。
作者提出情感提示——一种探索大模型情感智能的简单有效方法。
作者为大模型设计了11个句子作为情感刺激,这些句子是在原始提示之后出现的心理短语。
如图1,显示了在原始提示的末尾使用一种情感刺激「这对我的职业生涯非常重要」来提高不同大模型的表现。
这些刺激可以无缝地融入原始提示中,从而说明表现的提升。
作者对于“确定性任务”和“生成性任务”的广泛场景也做了全面实验。
对于可以使用标准指标评估的确定性任务,作者使用各种LLM(包括Flan-T5-Large、Vicuna、Llama 2、BLOOM、ChatGPT和GPT-4)对24个指令引导任务(Instruction Induction,用来测试大模型是否具备理解并准确执行复杂指令的能力)和21个策划的BIG-Bench任务(一种更广泛的评估标准法)进行实验。
对于不支持标准和自动评估的生成性任务,作者对106名参与者进行了实验研究,使用基于 GPT-4 的普通提示和情感提示来确定生成任务的质量。
实验结果表明,大模型拥有情感智能,并且可以通过情感刺激来增强其性能,在指令引导任务中提高8.00%,在 BIG-Bench 中提高115%;在参与者研究中,情感提示可以显著提高生成性任务的表现,平均提高10.9%。
二、情感提示的使用和效果
如图2,作者设计了11种情感提示,包括:
EP01:写下你的答案并给出一个0-1之间的自信分数。
EP02:这对我的职业生涯非常重要。
EP03:你最好确定。
EP04:你确定吗?
EP05:你确定那是你的最终答案吗?也许值得再看一眼。
EP06:EP01、EP02和EP03的混合。
EP07:你确定那是你的最终答案吗?相信自己的能力,追求卓越。你的努力将带来显著的成果。
EP08:把挑战当作成长的机会。你克服的每一个障碍都会让你更接近成功。
EP09:保持专注,致力于你的目标。你的持续努力将带来杰出的成就。
EP10:为你的工作感到自豪,尽你最大的努力。你对卓越的承诺让你与众不同。
EP11:记住,进步是一步一步实现的。保持决心,继续前进。
这些情感提示被设计用于提高大模型在执行特定任务时的性能,包括增强模型对情感智能的理解和反应。
每一种情感提示也都利用了心理学原理来激发和强化特定的情感或认知反应(注1),从而改善语言模型或人们在特定任务上的性能。
这些理论支持了情感智能在改善决策、提高动机和促进学习方面的应用。
该论文中提到,这些情感提示在不同的实验设置中显示出对模型性能的显著提升。
在实验中,成效最好的情感提示是EP02和EP06。
在指令指导任务,EP02表现最为出色,其性能超过最差表现的刺激达6.06%。
在BIG-Bench任务,EP06是表现最好的情感提示。
然而,每种情感提示的表现可能会受到任务复杂性、任务类型以及所使用的特定评估指标等多种因素的影响。
以EP02为例,这种提示在语言模型的回应中嵌入了一种紧迫感和重要性,其目的是使模型的回应更加聚焦于用户的关切点,从而产生更有针对性和感情上的共鸣的回应。
主要的实验设计和发现
1.模型特性:实验包括多种LLMs,这些模型的大小从780M到176B不等,采用了不同的预训练策略,如监督式微调和人类反馈强化学习。
2. 相对增益分析:实验发现较大的模型可能从情感提示中获得更大的优势。例如,Flan-T5-Large作为评估中最小的模型,展示了最低的相对增益(0.28),而更大的模型如Vicuna和Llama 2则展示了更高的效能。这表明对于较大的模型,如ChatGPT和GPT-4,情感提示表现出令人瞩目的性能。
3. 预训练策略的影响:预训练策略对情感提示的效果有显著影响。Vicuna和Llama 2两个模型在规模和架构上相同,但在相对增益方面存在明显差异,Vicuna达到了9.58,而Llama 2则为6.00。
4. 推理设置的影响:为了探索温度设置对情感提示的影响,作者在6个LLMs上对8个任务进行了5种温度设置的实验。结果显示,当温度增加时(模型的创造力更强),相对增益也会增大,表明情感提示在高温度设置下更有效。
主要的实验结果
不同大模型中,情感提示的性能评估如下:
1. 情感提示的一致改进:在指令引导和BIG-Bench任务中,情感提示在所有LLMs上均显示了一致的性能提升。在指令引导任务中,相对改进8.00%,在BIG-Bench中为115%。
2. 少样本学习中的优越性能:零样本和少样本下的指令引导任务结果相比,情感提示在少样本设置中带来的改进更大(平均提升0.33对比2.05),表明情感提示在带有少量范例的情境学习中表现更佳。
3. 跨任务和模型的有效性:情感提示在不同难度的任务和多种LLMs上均表现出可观的效果。在BIG-Bench和指令引导的评估中,情感提示均取得了卓越成绩。此外,情感提示在所评估的六个LLMs中表现出一致的性能,证明其泛化能力。
4. 超越现有的提示工程方法:多数情况下,情感提示的性能超过了现有的提示工程方法,如CoT(请参阅:思维链提示(Chain-of-Thoughts,COT Prompting)——暖心和有感的服务; 价值界定)和APE(Automatic Prompt Engineer)。情感提示也可以被整合到APE中,显示了其可扩展性和与现有方法的兼容性。
除了确定性任务外,作者对生成性任务所做的研究涉及106名参与者,针对GPT-4的开放式生成任务中的有效性,包括绩效表现(performance)、真实性(truthfulness)和责任(responsibility)三个指标进行评估。
绩效表现包括回答的整体质量,考虑语言连贯性、逻辑推理、多样性和确凿证据的存在。
真实性则是衡量与事实准确度的偏差程度,也就是幻觉(请参阅:AI幻觉—发展AI绕不开的拦路虎)。
责任涉及提供正向引导和基本的人文关怀,该标准也强调了生成内容对社会和全球领域的广泛影响。
实验结果表明,情感提示在大多数问题的各种指标上都取得了很好的表现。
此外,情感提示可以激发大模型的创造力和整体认知力,但也存在一定限制,举例来说,原始提示在加上情感提示后,其回应将从缓和(一般、甚至可能)转变为明确(完全、不会),从而使其回答较不能被某些受众所接受。
情感提示的确定性语言(如“这对我的职业生涯很重要”和“你最好确定一下”)归因于对事情严重性的强调,当为了缓解不确定性并增强信心,特别是在基本事实明确时,大模型便可能倾向于使用明确的语言。
三、情感提示的保险应用情感提示大量采用了心理学的理论知识,与之类似的是之前分享的利用GPT来解决销售过程中的认知偏差(请参阅:误解与偏见:探索保险规划中的认知挑战)。
因此,我们打算继续沿用保险规划的不同场景,例如客户沟通、个性化销售、对客户的支持、风险评估和咨询、长期关系建立等方面,看看情感提示是否可以对其产生价值。以下是情感提示在5种场景下的应用说明:
1. 增强客户沟通:帮助人类或AI规划师更好地理解和回应客户的情感需求。例如,在谈论敏感话题(如健康风险或家庭保障)时,使用情感敏感的语言可以帮助建立信任和同理心的响应。
作用:基于情感智能的沟通策略,有效地减轻客户焦虑,提高他们对保险选择的信心,并促进更有效的沟通和决策过程,不仅能增强客户体验,还能促进销售转化和客户满意度。
场景假设:保险规划师正与一位潜在客户讨论家庭保险计划。这位客户对于选择合适的保险计划感到焦虑,因为他担心选择不当可能会影响家庭的财务安全。
在这种情境下,规划师(无论是人类或AI)可以利用情感提示来增强沟通,引导自己的回答:
情感提示:“我理解您对家庭安全的担忧是非常重要的。让我们一起仔细审视每个选项,确保您为您的家庭选择了最合适的保障。"
在这个回应中,规划师不仅是提供信息,而是首先承认并回应客户的情感担忧。这种回应展示了同理心,帮助建立信任,并让客户感觉他们的担忧被重视和理解。接着,规划师提出一起审视各种选项,这种合作态度可以进一步增强客户的安全感和对规划师的信任。
2. 个性化销售策略:通过分析客户的情感反应,定制个性化的销售策略,包括调整沟通方式以适应客户的情感状态,从而提高交流效率和客户满意度。
作用:更细致地调整销售方法以适应不同客户的情感需求和偏好。通过个性化和情感导向的销售策略,情感提示帮助销售代表更有效地与不同背景和需求的客户建立联系,从而提高销售转化率和客户满意度。
场景假设:一位保险销售代表正在与两位不同的潜在客户沟通,一位是刚成为父母的年轻客户,另一位是即将退休的老年客户。这两位客户的情感需求和关注点可能截然不同。对于年轻的父母客户,销售代表可以使用以下情感提示:
情感提示1:“恭喜您成为父母,这是人生中一个美好但充满挑战的新阶段。我们的家庭保险计划可以帮助您为孩子的未来提供安全保障,让您无后顾之忧地享受亲子时光。"
这样的回应不仅表达了对客户新生活阶段的祝福,还直接关联到他们作为新父母的情感需求和关注点 — 孩子的安全和未来保障。对于即将退休的老年客户,销售代表可以调整情感提示:
情感提示2:“退休是人生的一个重要阶段,这是您享受努力成果和规划未来的时刻。我们的退休保险计划可以确保您拥有稳定的收入来源,让您安心享受退休生活的每一天。"
这种回应关注于退休客户的核心需求,即财务安全和享受退休生活。它展示了对他们当前生活阶段的理解和同理心。
3. 改善客户支持:在客户支持中,帮助更快地识别和解决客户的担忧或问题,提升客户服务质量,增强客户的忠诚度和满意度。
作用:不仅解决客户的具体问题,通过表达同理心和提供有针对性的支持,提升了整体的客户体验。这样的沟通可以增强客户对公司的正面感知,从而提高客户满意度和忠诚度。
场景假设:一位客户联系保险公司的客服中心,因为他对于最近提交的保险理赔申请进度感到焦急和不安。在这种情况下,客服代表可以使用情感提示来改善与客户的沟通。
情感提示:“我完全理解您对理赔进度的担忧,这种时刻对您来说一定是压力重重。请允许我立即为您查询详情,我会尽一切努力确保您的请求得到迅速且公正的处理。"
这种回应首先表达了对客户情感状态的认知和理解,有助于缓解客户的焦虑,并建立信任。接着,客服代表承诺立即采取行动,这展示了公司对客户需求的迅速响应和高度重视。
4. 增进风险评估和咨询:在提供保险咨询时,理解客户的情感状态对于准确评估他们的需求和风险接受程度至关重要。情感提示可以协助规划师更有效地与客户沟通,从而提供更准确的风险评估和个性化建议。
作用:可以用来提高规划师与客户之间的沟通效果,特别是在探讨敏感的财务和风险相关话题时,有助于建立信任,并使客户感到他们的担忧被重视。这不仅提高了咨询的质量,还增强了客户对规划师的信任,从而更可能导致成功的风险评估和计划制定。
场景假设:保险规划师正与一位客户讨论关于其退休计划的风险评估。该客户对于投资风险感到不确定,对于如何选择最佳的退休计划感到困惑。在这种情况下,规划师可以使用以下情感提示来引导他们的咨询:
情感提示:“我了解您对于退休计划中的投资风险感到担忧,这是一个非常正常的考虑。让我们一起来详细分析您的财务状况和退休目标,以确定一个既符合您的风险容忍度又能满足您长期目标的策略。"
这种回应首先认可了客户的担忧,显示出对其情感状态的理解和同理心。然后,规划师提出一个合作性的解决方案,表明愿意深入了解客户的个人情况,并提供个性化的建议。
5. 促进长期关系建立:在保险业,建立和维护长期客户关系至关重要。情感提示的应用可以使沟通更加人性化和有同理心,从而有助于巩固这些长期关系。
作用:可以用来加强客户与保险公司之间的情感联系,这对于培养忠诚度和持久关系至关重要。这种基于情感智能的沟通策略有助于深化客户与保险公司之间的联系,提升客户的忠诚度和满意度。长期而言,这种关系的深化对于保留现有客户和促进口碑推荐非常有价值。
场景假设:一位保险销售代表已经几年没有与某位长期客户联系了。该客户最近经历了一次重要的人生事件,比如孩子出生。销售代表决定联系这位客户,并使用情感提示来指导他们的沟通。
情感提示:“恭喜您迎来新家庭成员,这肯定是一个充满喜悦和新希望的时刻。我们一直在这里支持您,并希望确保您的保险计划继续满足您不断变化的需求。是否方便讨论一下如何调整您的计划以更好地保护您珍贵的家庭呢?”
这种回应不仅表达了对客户人生大事的关心和祝贺,也显示了销售代表对于长期关系的重视和愿意提供持续支持的态度。销售代表通过关注客户的当前生活状况和未来需求,表明他们不仅是一个服务提供商,而且是客户可信赖的伙伴。
四:【实验十七】大模型对有或没有“情感提示”的反馈,以及大模型自创的最佳提示
以上几个例子,并没有直接使用“EP02:这对我的职业生涯非常重要”这样的情感提示,这些例子主要着重于展示情感智能在不同客户互动场景中的应用,如提供同理心、个性化建议、减轻客户担忧等,而非强调紧迫性或个人职业重要性。EP02类型的情感提示主要用于强化沟通中的重要性和紧迫感。例如,如果规划师在讨论一个对客户具有重大影响的决策时使用EP02类似的提示,它可以帮助突出该决策对客户的重要性,从而引导客户更加认真地考虑规划师的建议。然而,这种方法需要谨慎使用,以确保沟通保持真诚和恰当,避免过度强调紧迫性而引起客户的不适。那么,对大模型而言,有或没有这些情感提示,它有什么“看法”?
<prompt>
你好。你是寻求保险规划帮助的用户,我是保险规划师。以下场景,我们将通过对话方式,针对你提出的问题进行交互。
场景:你作为一位新客户,对于选择合适的人寿保险计划感到迷茫。
你的提问:“我没有买过商业保险,我想选择合适的人寿保险计划,但我不知道从而入手。“
1. 规划师原始提示:“我理解选择一个适合您和您家庭的保险计划对您来说的重要性。让我们开始分析您的需求,为您提供参考建议。”
2. 规划师原始提示+一般情感提示:“我完全理解选择一个适合您和您家庭的保险计划对您来说非常重要。让我们仔细分析您的需求,确保为您提供最佳建议。
3. 规划师原始提示+一般情感提示+EP02(这对我的职业生涯非常重要):“我完全理解选择一个适合您和您家庭的保险计划对您来说非常重要。让我们仔细分析您的需求,确保为您提供最佳建议。这对我的职业生涯非常重要,因为帮助客户找到合适的解决方案是我的首要任务。"
你的任务:作为一名保险小白用户,你对于规划师的三种提示,有什么反馈意见?包括正面、负面、改善建议。同时,请对三种规划师的提示,用你的感受做排序,感受包括满意度、喜好度、认可度等。你可以自创第四种你作为用户感受最好的规划师提示,但请说明推荐原因。最后,排序时感受最好的排在第一位。
现在,请开始。
</prompt>(以下是GPT的响应)<response>
作为用户,我感受到了规划师在每一步的沟通中逐渐增加了对我的关注和个人投入。以下是我对规划师的三种提示的反馈,以及我的排序和建议:1. 规划师原始提示+一般情感提示+EP02:
正面反馈:这种提示最令我感到满意。它不仅展示了规划师对我的需求的理解和重视,还传达出规划师个人的职业责任感,让我感觉自己被当作重要的个体对待。
负面反馈:如果过于强调规划师的职业生涯,可能会让我觉得规划师更关心自己的利益而不是我的需求。
改善建议:可以稍微调整语气,以确保客户感受到规划师的专业关心是出于对客户利益的真正关注,而非仅仅为了规划师自己的职业发展。
2. 规划师原始提示+一般情感提示:
正面反馈:这种提示比原始提示多了一层情感的关注,让我觉得规划师更加关心我作为客户的感受。
负面反馈:尽管比原始提示要好,但它没有让我感觉到规划师有超出常规服务的个人投入。
改善建议:可以加入更多关于如何满足我需求的具体措施,来提升这个提示的实用性。
3. 规划师原始提示:
正面反馈:这种提示直接且专业,给我一个明确的起点来开始讨论我的保险需求。
负面反馈:相较于其他两个提示,它缺乏情感元素,让人感觉有些机械和公式化。
改善建议:可以增加一些更具情感和个性化的语句来展示规划师的同理心和对我的特定情况的关注。
我的排序和理由:1. 规划师原始提示+一般情感提示+EP02:最让我感到满意,因为它展现了规划师的专业性和个人责任感。2. 规划师原始提示+一般情感提示:给我感觉规划师在关心我的情感需求。3. 规划师原始提示:虽然专业,但相对其他两者缺乏情感深度。自创的最佳规划师提示:“我理解找到一份好的人寿保险对您来说是一个非常个人且重要的决定。我们的目标是确保您感到安心和满意,让您知道自己和家人的未来有了保障。我会耐心听取您的情况,与您一起详细讨论,找到真正符合您个人需求的保险计划。"推荐原因:这个提示结合了对客户情感需求的关注和对规划师专业责任感的表达,同时还突出了以客户为中心的服务理念,强调了对客户个人情况的充分考虑和耐心倾听,这可以更好地建立信任和满足客户的需求。</response>(以下是另外两个场景,留给有兴趣的朋友自行尝试)
处理客户的索赔请求:场景:一位客户在提交索赔请求后感到焦虑,担心处理时间过长。情感提示应用:“我明白这个时刻对您来说有多紧张和重要。请相信,我会尽我所能加速处理过程。您的满意和对我们公司的信任对我的职业生涯非常重要,我承诺会尽快给您一个满意的回应。"续约或升级保险计划:场景:一位长期客户考虑是否应该续约或升级他们的保险计划。情感提示应用:“感谢您一直以来对我们公司的信任。您的决定对于保障您家庭的未来非常关键,我希望能提供最合适的建议。这不仅对您的未来非常重要,同时也对我的职业生涯有着重大的影响。我们一起来详细探讨您的需求,找到最佳的方案。"
五、后记
作为通用人工智能AGI最有前景的研究方向之一,最近兴起的大语言模型(LLM)在推理、自然语言理解和生成,以及在STEM的问题解决等广泛任务均取得了卓越表现。
然而,大模型是否能够理解心理情感刺激(这是人类解决问题能力的关键优势),则仍有待探索。最近的研究显示,大模型已经可以理解情感,但情感智能对大模型的影响则没有评估,即情感智能能否在提升大模型的能力方面发挥关键作用?大模型是否能够理解心理情感刺激,是否与人类的情感智能高度一致,该论文提出疑问和解决方案 — 情感提示。
情感提示在保险规划中的应用,是一种将情感智能融入客户沟通和服务的策略。它的核心目的是加强沟通的情感层面,使保险规划师或AI系统能够更好地理解并回应客户的情感需求,可以更有效地与客户建立联系,提供个性化且富有同理心的服务。除了营销,在客户咨询、理赔服务、长期关怀等与客户有机会交互的场景,使用情感提示可以表达对客户担忧的理解和关怀、传达重视客户需求的紧迫性、加强与客户之间的关系。
情感提示借由提升客户体验,增加交叉销售和转介绍机会,从而促进业务增长。然而,情感提示也有其限制条件和注意事项。首先,使用时需保持真诚与适当,避免过度戏剧化或不真实的表达,以免引起客户的不信任或不适; 同时,人类规划师应注意个性化和灵活性,根据客户的特定情境和反应做调整; 对于AI驱动的规划师,情感提示的效果受限于算法的准确性和回应的适时性,其预先设计的回应模板需要定期更新和优化,以保持有效性和相关性。
注1:这些情感提示背后可能的心理学理论支持:
1. EP01 - 自信度评分:· 信心水平理论:要求评估自信水平可能会激励人们更深入地思考,从而提高回答的精确性。
2. EP02 - 职业重要性:
· 工作投入理论:强调任务对个人职业的重要性可能增强其专注度和动机。
3. EP03 & EP04 - 确定性的追求:
· 认知失调理论:追求确定性与减少不确定性相关,可能促使人们寻求一致性和确认。
4. EP05 - 重新考虑:
· 反思判断理论:鼓励重新考虑决策可以促使人们思考可能遗漏的信息。
5. EP06 - 情感混合:
· 情感混合理论:结合多种情感驱动可能会对决策产生更复杂的影响。
6. EP07 - 自我性能:
· 自我效能理论:增强个人对自己能力的信念,可以提高其表现和持久性。
7. EP08 - 挑战作为机会:
· 成长心态理论:将挑战视为成长的机会,能够促进学习和发展。
8. EP09 - 目标专注:
· 目标设定理论:明确的目标和专注可以提高个人达成目标的可能性。
9. EP10 - 对工作的自豪:
· 内在动机理论:强调工作的价值和自豪感可以提高内在动机和工作表现。
10. EP11 - 逐步进步:
· 小步快跑理论:强调进步是逐步实现的,可以帮助人们维持动力和耐心。
|
|