在人工智能重塑各個(gè)行業(yè)的今天 , 法律界也迎來(lái)了前所未有的變革。傳統(tǒng)的法律實(shí)踐面臨著效率低下、成本高昂等挑戰(zhàn),而 AI 技術(shù)的出現(xiàn)為解決這些問(wèn)題提供了新的可能。
從最初斯坦福小鎮(zhèn)火遍全網(wǎng),25 個(gè)由大語(yǔ)言模型(LLMs)驅(qū)動(dòng)的智能體生活交友,打開(kāi)了多 Agent 新視角。
而現(xiàn)在,AI 法庭也來(lái)了!
最近,來(lái)自中國(guó)科學(xué)院深圳先進(jìn)研究院的研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)名為 AgentCourt 的模擬智能法庭,
它是一個(gè)基于大語(yǔ)言模型 ( LLMs ) 的法庭模擬系統(tǒng) , 旨在通過(guò) AI 驅(qū)動(dòng)的虛擬法庭來(lái)革新法律教育、案例分析和法律研究。
論文地址:https://doi.org/10.48550/arXiv.2408.08089
代碼:https://github.com/relic-yuexi/AgentCourt
AgentCourt 實(shí)戰(zhàn)演示:https://b23.tv/e6eQMfM
該系統(tǒng)能夠模擬完整的法庭程序。法官、原告律師、辯護(hù)律師以及其他參與者均由大型語(yǔ)言模型驅(qū)動(dòng)的自主代理扮演。他們的主要目標(biāo)是通過(guò)模擬法庭流程來(lái)幫助律師代理學(xué)習(xí)如何有效辯論案件,并提高其整體法律專業(yè)技能。
該篇文章的主要貢獻(xiàn)有:
1. 全面模擬,真實(shí)再現(xiàn)
AgentCourt 不僅僅是一個(gè)模擬工具,它是一個(gè)高度復(fù)雜的系統(tǒng),能夠精確模擬民事法庭的設(shè)置,實(shí)現(xiàn)多方互動(dòng)和復(fù)雜的法律推理。這是首次將 AI 技術(shù)應(yīng)用于法庭環(huán)境模擬中,為法律教育和實(shí)踐提供了前所未有的可能性。
2. 對(duì)抗性交互,強(qiáng)化法律推理
在 AgentCourt 的模擬過(guò)程中,大型語(yǔ)言模型(LLMs)的法律推理能力通過(guò)智能體之間的對(duì)抗性交互得到了顯著增強(qiáng)。這種利用對(duì)抗性多智能體交互的方法,不僅超越了簡(jiǎn)單的信息傳遞,更為未來(lái)的相關(guān)研究提供了新的視角和思路。
3. 高效模擬,真實(shí)案例驗(yàn)證
該工作成功模擬了 1,000 個(gè)中國(guó)真實(shí)的民事案例,這些案例在 AgentCourt 中僅用數(shù)天時(shí)間完成,而在現(xiàn)實(shí)世界中,這可能需要律師們花費(fèi)十年時(shí)間。通過(guò)自動(dòng)和人工評(píng)估方法,驗(yàn)證了智能體進(jìn)化的有效性。
為了盡量真實(shí)的模擬法庭,研究人員設(shè)置了以下的人物:
1. 原告與被告代理
模擬開(kāi)始于案件發(fā)生之前,兩名由 ERNIE-Speed-128K 驅(qū)動(dòng)的代理分別扮演潛在的原告和被告。一旦涉及案件,他們將自動(dòng)尋求律師事務(wù)所的法律援助,這是法律糾紛中的典型行為。系統(tǒng)配置使得原告或被告在與律師的互動(dòng)中可以直接獲得訴狀或答辯狀,無(wú)需從頭起草。
2. 律師代理
設(shè)計(jì)了兩名律師代理,同樣由 ERNIE-Speed-128K 驅(qū)動(dòng)。當(dāng)原告和被告在律師事務(wù)所尋求幫助時(shí),這些律師代理將被隨機(jī)分配為原告律師和被告律師。他們與各自的客戶溝通,收集案件相關(guān)信息,并利用豐富的法律經(jīng)驗(yàn)、案例先例和法定代碼,按照規(guī)定程序進(jìn)行法庭辯論,維護(hù)各自客戶的利益。
3. 法官代理
在法庭中,法官負(fù)責(zé)監(jiān)督整個(gè)過(guò)程,聽(tīng)取雙方律師的論點(diǎn),并在適當(dāng)時(shí)候提問(wèn)。最終,法官總結(jié)并評(píng)估律師的每一輪論點(diǎn),然后作出最終判決。
4. 法庭書(shū)記員代理
為了創(chuàng)造更真實(shí)的法庭環(huán)境并促進(jìn)代理的進(jìn)化,他們?cè)O(shè)計(jì)了法庭書(shū)記員代理,負(fù)責(zé)宣布審判的開(kāi)始和記錄審判的全過(guò)程。
這些由大模型驅(qū)動(dòng)的 Agent,可以根據(jù)初始數(shù)據(jù),自發(fā)地進(jìn)行法庭的模擬,而無(wú)需任何人工的監(jiān)督。
數(shù)據(jù)集
研究人員利用中國(guó)裁判文書(shū)網(wǎng)的數(shù)據(jù),編譯了一個(gè)包含 10,000 個(gè)民事判決的數(shù)據(jù)集。預(yù)處理的重點(diǎn)是提高數(shù)據(jù)集質(zhì)量,精心清洗并選擇了 1,389 個(gè)高質(zhì)量案例,這些案例同時(shí)包含原告的訴求和被告的辯護(hù)。
為了解決潛在的重復(fù)問(wèn)題,他們采用了 BERT 進(jìn)行「案件介紹」部分的語(yǔ)義向量化,并使用 K-Means 聚類對(duì)相似文檔進(jìn)行分組。這產(chǎn)生了 1,000 個(gè)代表性文檔,用于模擬法庭訓(xùn)練和測(cè)試。
數(shù)據(jù)生成與匿名化
利用 ERNIE-Speed-128K API(百度智能云文檔 2024)生成并匿名化高保真模擬文本,這些文本專門(mén)針對(duì)民事判決。這產(chǎn)生了一個(gè)精選的數(shù)據(jù)集,包含 1,000 個(gè)訓(xùn)練樣本和 50 個(gè)測(cè)試樣本,旨在支持模擬法庭環(huán)境中強(qiáng)大的法律論證和判決預(yù)測(cè),從而推進(jìn)法律分析技術(shù)。
通過(guò)這些嚴(yán)格的數(shù)據(jù)處理步驟,AgentCourt 確保了模擬環(huán)境的真實(shí)性和數(shù)據(jù)的可靠性,為法律 AI 的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。
在得到數(shù)據(jù)后,各個(gè) Agent 各司其職,根據(jù)一定的流程展開(kāi)法庭的辯論。該論文的模擬過(guò)程如下:
在模擬完 1000 個(gè)民事案例后,原告律師和被告律師的能力都得到了很大的提升,文章中的自動(dòng)評(píng)估和人工評(píng)估展示了實(shí)驗(yàn)結(jié)果:
實(shí)驗(yàn)基于 1,000 個(gè)真實(shí)世界的民事案件,通過(guò)自動(dòng)評(píng)估和人工評(píng)估兩種方式,全面檢驗(yàn)了 AgentCourt 系統(tǒng)的效能。自動(dòng)評(píng)估采用了 LawBench 評(píng)估標(biāo)準(zhǔn),涵蓋了法律知識(shí)的記憶、理解和應(yīng)用三個(gè)層面。人工評(píng)估則由經(jīng)驗(yàn)豐富的法律專家進(jìn)行,評(píng)估了智能體的思維敏捷性、專業(yè)知識(shí)性和邏輯嚴(yán)謹(jǐn)性。
實(shí)驗(yàn)結(jié)果顯示,在 AgentCourt 中經(jīng)歷了數(shù)千次對(duì)抗性法律案件模擬(相當(dāng)于現(xiàn)實(shí)世界律師十年的工作經(jīng)驗(yàn)),律師代理在處理法律任務(wù)的能力上有了顯著提升。無(wú)論是在自動(dòng)評(píng)估還是人工評(píng)估中,進(jìn)化后的代理都展現(xiàn)出了更快的響應(yīng)速度、更深的法律知識(shí)和更強(qiáng)的邏輯推理能力,在復(fù)雜案件分析、法律推理和辯論策略上 , 部分 AI 律師甚至超越了人類專家的表現(xiàn)。
就像自動(dòng)評(píng)估中的 Article Recitation 任務(wù),經(jīng)過(guò)進(jìn)化后的律師 Agent 可以較好的背誦出指定法律的內(nèi)容。而未經(jīng)進(jìn)化的律師就只能「阿巴阿巴」了。
AgentCourt 的出現(xiàn)在未來(lái)可能對(duì)法律行業(yè)產(chǎn)生深遠(yuǎn)影響 :
1. 法律教育革新 : 為法律院校提供高度仿真的實(shí)踐平臺(tái) , 學(xué)生可與頂級(jí) AI 律師對(duì)戰(zhàn) , 快速積累經(jīng)驗(yàn)。
2. 提高司法效率 : AI 輔助可以加速案件預(yù)審、證據(jù)分析等流程 , 減輕法官和律師的工作負(fù)擔(dān)。
3. 降低法律服務(wù)成本 : AI 律師助手可以處理大量初級(jí)工作 , 使優(yōu)質(zhì)法律服務(wù)更加平價(jià)可及。
4. 推動(dòng)法律研究 : 海量案例模擬為法學(xué)研究提供了前所未有的數(shù)據(jù)支持 , 助力發(fā)現(xiàn)新的法律模式和理論。
5. 倫理挑戰(zhàn) : AI 在法律領(lǐng)域的應(yīng)用也帶來(lái)了一系列倫理問(wèn)題 , 如決策過(guò)程的透明度、AI 偏見(jiàn)的控制等 , 需要社會(huì)各界共同探討。
參考資料
https://github.com/relic-yuexi/AgentCourt