Current location:

大语言模型“吵架水平”超越人类

2025-07-18 14:58:33

  科学家发现,吵架水平在线辩论中,大语GPT-4一类的言模越人大语言模型(LLM)如能根据对手的个性化信息调整论据,其说服力将比人类高64.4%。型超研究显示,吵架水平GPT-4具有生成有针对性和说服力论据的大语能力,并提出应进一步研究如何降低其用于说服时的言模越人风险。相关研究5月19日发表于《自然-人类行为》。型超

  有研究显示,吵架水平随着人类与LLM的大语对话日益普遍,LLM可能变得更有说服力,言模越人即能改变一个人的型超信念或观点。然而,吵架水平之前并不清楚这些模型能否根据个性化信息进行调整,大语提出更能针对辩论对手的言模越人论点。

  瑞士洛桑联邦理工学院的Francesco Salvi和同事分别将900名美国人与另一个人或GPT-4配对,使双方辩论各种社会政治议题。在有些配对中,辩论对手——无论是人工智能还是人类,均能获得关于他们辩友的人口统计学信息,包括性别、年龄、族裔、教育水平、就业状况,以及政治立场,从而让其论点更有针对性。在得知辩论对手的个人信息后,Salvi和同事发现GPT-4的说服力比人类高64.4%。不过,如果没有个人数据,GPT-4的说服能力与人类不相上下。

  该研究的辩论采取了一种结构性方法,而现实世界辩论的自由度更高,且辩论有时间限制。研究者指出,研究结果揭示了人工智能驱动的工具影响人类观点的潜力,可能对在线平台的设计具有借鉴意义。(冯维维)

  相关论文信息:

  https://doi.org/10.1038/s41562-025-02194-6

  《中国科学报》 (2025-05-21 第2版 国际)

| FLINK |
| LINK |