白麒鈺? 鄺清華? 夏雪? 訚姝言? 張石靜怡
【摘要】為探討大語言模型是否可以準確識別人類語言中的偏見,以及能否說服人類改變偏見,本研究基于啟發式和系統式模型,通過 3 個實驗予以考察。結果顯示,大語言模型識別和分析人類描述性文本中偏見的能力較強,與人類評價一致性較高;其次,大語言模型基于事實性、糾正性信息的個性化干預能夠有效說服人們減少對老年人的年齡偏見;最后,大語言模型基于人類不同認知風格調試的干預策略可以有效降低人們對老年人的年齡偏見。研究不僅證明了大語言模型識別偏見的能力,驗證了傳統的啟發式和系統式模型在大語言模型上的應用效果,為發展說服理論提供了新的視角,也對訓練大語言模型成為推動公平性和可持續發展的重要工具提供了可行性。
【關鍵詞】大語言模型;說服;偏見;認知風格
一、引言
大語言模型(Large Language Model,簡稱 LLM)的快速發展正在深刻改變人類社會的各個層面。其影響已從工具性應用層面逐漸滲透至態度、觀念乃至認知層面。隨著人們對 LLM 的使用日益深入,人們與 LLM 的互動已從單純的信息獲取或任務執行拓展至內容創作、建議咨詢和情感陪伴,進而演化為一種深層次的認知交互。在這一背景下,LLM 是否具備改變固有想法和觀念的潛能,成為社會廣泛關注的重要議題。偏見,作為深植于人類認知中的固有傾向,長久以來被認為是難以察覺且難以改變的。它不僅影響人類的判斷、決策和行為,甚至潛移默化地塑造著社會結構和文化規范。因此,本研究旨在探索LLM 在減少人類偏見方面的潛在作用,并進一步分析其深刻影響人類認知結構的可能性。
LLM 技術的快速發展使其在文本理解和語義分析方面展現出顯著優勢,特別是經過提示詞工程調試過的大語言模型,能夠有效識別用戶生成內容中的語義特征、情感與態度傾向。基于這些分析結果,LLM 能夠主動調整回應方式,以適應不同的交互需求。具體而言,已有研究指出,ChatGPT-4 僅通過簡單提示即可生成與人類判斷高度一致的典型性評分,精確衡量文本與概念之間的語義相似度,且無須額外訓練便可取得優于傳統方法的準確率。此外,LLM還能通過分析用戶的語言風格、詞匯偏好及上下文語境,準確辨別出用戶的政治立場或陰謀論傾向,并自適應地調整回應內容和策略。這些能力為 LLM在偏見檢測及干預領域的深入應用奠定了重要基礎。
綜上所述,提出假設 1:LLM 能夠準確識別用戶文本內容中的偏見傾向。
LLM 憑借其大規模生成上下文關聯和超個性化消息的能力,能夠執行復雜且陌生的任務,在各種情境下的內容生成中取得了顯著成功。因此,LLM 在說服效果方面與其他傳播媒介相比具有以下幾個特性。一是 LLM 能夠接觸到比任何單個人類作者所能處理的更廣泛、更多樣化的語言表達,并且能夠獲取涵蓋眾多主體的海量信息,將其龐大的相關“知識”整合到生成的個性化信息中。二是 LLM 具備前所未有的個性化特性和適應性,擅長根據個體信息、個人偏好和心理特征定制信息,創建能夠與目標群體甚至特定個體產生共鳴的針對性內容。三是人類在創作說服性信息時容易受到自我中心偏見的影響,即提出的論點往往對自己有說服力,而非對他人有說服力,而算法則不受此類限制。總體而言,LLM 能通過模仿人類說服框架生成定制化說服文本,并結合用戶認知風格調整提示詞以增強輸出信息的說服力。
LLM 的特點和優勢為改變固有認知和態度提供了新的可能性。以往研究指出,LLM 已被用于政治、廣告營銷、公共衛生19、電子商務20和慈善捐贈等方面的說服,其生成的文本能靈活運用類比、權威引用、情感共鳴等說服策略。以麻省理工為代表的研究團隊招募了 2000 多名相信陰謀論的被試進行說服實驗,結果表明,與 GPT-4 Turbo 進行三輪簡短但基于事實的、個性化的對話后,被試在各類陰謀論中的錯誤信念平均減少了 20%,且效果能夠持續兩個月以上。這些結果挑戰了關于陰謀論信念的傳統觀念,表明即使是最根深蒂固的觀點,也能通過基于事實和糾正性信息的大語言模型進行個性化干預,從而有效減少與陰謀論相關的錯誤信念。另有學者對比了人們對 GPT-3 生成的信息與疾病控制與預防中心(CDC)發布的人工撰寫信息的看法,發現經過篩選的生成信息被認為比 CDC 的信息更有效、更具說服力,且能激發更積極的態度。類似的,來自洛桑聯邦理工學院和布魯諾·凱斯勒基金會的研究團隊設計了一項隨機對照實驗,以探究 LLM 在對話中的說服能力。結果顯示,個性化的 GPT-4 辯手在多個領域的一對一對話中展現出強大的說服能力,甚至超過了人類被試,個性化的說服能夠顯著增加被試在辯論后的立場轉變,提升同意對方觀點的幾率達 81.2%......(本文為文章截選,完整版請搜索公眾號:“教育傳媒研究雜志社”。)
本文系國家自然科學基金項目“互聯網中恐慌情緒下的信息傳播與社會治理”(項目編號:72304018)、青年人才托舉工程項目(項目編號:2023QNRC001)的階段性成果。