《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 設(shè)計(jì)應(yīng)用 > 基于Word2Vec和LDA主題模型的中國(guó)省級(jí)五年規(guī)劃“文化政策”文本研究
基于Word2Vec和LDA主題模型的中國(guó)省級(jí)五年規(guī)劃“文化政策”文本研究
網(wǎng)絡(luò)安全與數(shù)據(jù)治理
高娜1,東梅2
1.寧夏大學(xué)農(nóng)學(xué)院; 2.寧夏大學(xué)經(jīng)濟(jì)管理學(xué)院
摘要: 運(yùn)用Word2Vec和LDA相結(jié)合的主題模型分析技術(shù),對(duì)我國(guó)31個(gè)省份三個(gè)時(shí)期五年規(guī)劃文本中文化政策部分進(jìn)行主題識(shí)別,從時(shí)間和空間兩個(gè)維度進(jìn)行“文化政策”主題挖掘和演化分析。研究發(fā)現(xiàn),“文化政策”主題在發(fā)展趨勢(shì)、重點(diǎn)轉(zhuǎn)移、政策導(dǎo)向、技術(shù)應(yīng)用等方面隨時(shí)間推移呈現(xiàn)不同演化趨勢(shì);四大區(qū)域受經(jīng)濟(jì)發(fā)展水平、文化資源稟賦、政策導(dǎo)向影響,在企業(yè)角色強(qiáng)調(diào)程度、地區(qū)特色旅游發(fā)展以及國(guó)家級(jí)項(xiàng)目和競(jìng)爭(zhēng)力方面存在地域差異。
中圖分類(lèi)號(hào):G120;D601文獻(xiàn)標(biāo)識(shí)碼:ADOI:10.19358/j.issn.2097-1788.2024.07.008
引用格式:高娜,東梅.基于Word2Vec和LDA主題模型的中國(guó)省級(jí)五年規(guī)劃“文化政策”文本研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2024,43(7):47-55.
A textual study of cultural policies in Chinese provincial five-year plans based on Word2Vec and LDA topic model
Gao Na1, Dong Mei2
1. College of Agriculture, Ningxia University; 2. College of Economics and Management, Ningxia University
Abstract: This paper use the theme model analysis technique combining Word2Vec and LDA to identify the themes of cultural policies in the texts of the five-year plans of 31 provinces in China in three periods, and carry out the mining and evolution analysis of the themes of "cultural policies" in two dimensions: time and space.The paper found that the theme of "cultural policy" has shown different evolution trends over time in terms of development trends, shifting focus, policy orientation, and technology application, etc. The four regions are influenced by the level of economic development, cultural resource endowment, and policy orientation, and there are geographical differences in the degree of emphasis on the role of enterprises, the development of regional tourism with special characteristics, and the development of nationallevel projects and competitiveness.
Key words : LDA topic model;Word2Vec;five-year plan;cultural policy;text analysis

引言

政策指政黨或國(guó)家為實(shí)現(xiàn)一定歷史時(shí)期的任務(wù)而制定的行動(dòng)綱領(lǐng)、方針和準(zhǔn)則[1]。政策文本是在政策制定與實(shí)施中所產(chǎn)生的過(guò)程性文件,包括法律法規(guī)、行政規(guī)章、辦法、通知等。省級(jí)政府頒布的五年規(guī)劃文本為地方經(jīng)濟(jì)發(fā)展遠(yuǎn)景規(guī)定目標(biāo)和方向,具有戰(zhàn)略性和規(guī)劃性的特點(diǎn),成為政策文本研究的重要工具和載體。隨著文化產(chǎn)業(yè)的興起及其在經(jīng)濟(jì)發(fā)展中的作用日益凸顯,文化發(fā)展也成為推動(dòng)地方繁榮與創(chuàng)新的關(guān)鍵?!?a class="innerlink" href="http://theprogrammingfactory.com/tags/文化政策" target="_blank">文化政策”是國(guó)家干預(yù)文化的工具,是影響文化生產(chǎn)的政府行為[2]。通過(guò)五年規(guī)劃中“文化政策”文本進(jìn)行主題抽取分析,可以掌握政府的政策傾向與關(guān)注焦點(diǎn),助力區(qū)域高質(zhì)量發(fā)展。政策文本分析被廣泛應(yīng)用于氣候變化協(xié)議(Lipschutz & McKendry,2014)、環(huán)境政策(Lester et al.,2016)以及公共衛(wèi)生政策(Gruening et al.,2017)等領(lǐng)域?,F(xiàn)有研究有文本內(nèi)容分析、政策文獻(xiàn)計(jì)量、社會(huì)網(wǎng)絡(luò)分析和政策文本挖掘等,其中政策文本挖掘又涵蓋政策文本分類(lèi)、情感分析及主題挖掘等諸多方法[3]。潛在狄利克雷分布模型(Latent Dirichlet Allocation,LDA),通過(guò)對(duì)文本語(yǔ)義降維處理,使其結(jié)果具有更好的可解釋性,被廣泛應(yīng)用于政策文本主題挖掘,該模型最早由Blei等人提出,但其不考慮單詞之間的關(guān)聯(lián)以及使用onehot形式進(jìn)行編碼,導(dǎo)致詞間的語(yǔ)義關(guān)系缺失和雙重稀疏性,后來(lái)Nguyen等提出將LDA與Word2Vec結(jié)合,創(chuàng)建LDA2Vec模型以克服傳統(tǒng)模型的缺點(diǎn)[4]?!拔幕摺敝黝}研究聚焦于政策制定、政策實(shí)施、政策評(píng)價(jià)方面。國(guó)內(nèi)學(xué)者專(zhuān)注于“文化事業(yè)”和“文化產(chǎn)業(yè)”兩大領(lǐng)域,一部分學(xué)者研究文化事業(yè)的公共文化服務(wù)領(lǐng)域[5]、公共治理[6]等問(wèn)題;另一部分學(xué)者從理論層面關(guān)注文化產(chǎn)業(yè)概念辨析[7]、發(fā)展戰(zhàn)略研究[8]以及文化高質(zhì)量發(fā)展[9]等問(wèn)題,在實(shí)踐層面聚焦文化產(chǎn)業(yè)的園區(qū)建設(shè)[10]、發(fā)展方式轉(zhuǎn)變[11]、數(shù)字文化產(chǎn)業(yè)設(shè)計(jì)[12]。國(guó)外學(xué)者對(duì)于文化政策研究主要聚焦于文化消費(fèi)[13]、文化認(rèn)同[14]、文化產(chǎn)業(yè)政策與產(chǎn)業(yè)能力的研究[15]、文化產(chǎn)業(yè)政策與全球化研究[16]??傮w而言,目前政策文本挖掘集中于信息抽取、聚類(lèi)、分類(lèi)等方向,缺乏語(yǔ)義相關(guān)的視角,基于政策特征的“文化政策”文本挖掘欠缺,難以揭示政策文本隱含語(yǔ)義和關(guān)系,不利于政策文本主旨內(nèi)涵的準(zhǔn)確把握等問(wèn)題。本文在內(nèi)涵挖掘與差異化比較分析需求的驅(qū)動(dòng)下,基于LDA2Vec構(gòu)建政策文本主題挖掘模型,對(duì)比分析不同區(qū)域、不同時(shí)間的主題特征,以期實(shí)現(xiàn)“文化政策”文本核心重點(diǎn)的挖掘和差異分析,據(jù)此提出對(duì)策建議,推動(dòng)政府對(duì)已有工作的準(zhǔn)確梳理以及政策布局的優(yōu)化調(diào)整,進(jìn)而為我國(guó)文化領(lǐng)域發(fā)展決策提供參考。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://theprogrammingfactory.com/resource/share/2000006091


作者信息:

高娜1,東梅2

(1.寧夏大學(xué)農(nóng)學(xué)院,寧夏銀川750000; 

2.寧夏大學(xué)經(jīng)濟(jì)管理學(xué)院, 寧夏銀川750000)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。