《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 融合多特征TFIDF文本分析的汽車造型需求提取方法
融合多特征TFIDF文本分析的汽車造型需求提取方法
2021年電子技術(shù)應(yīng)用第2期
季曹婷,馬偉鋒,樓 姣,馬來賓
浙江科技學(xué)院 信息與電子工程學(xué)院,浙江 杭州310023
摘要: 針對汽車造型智能設(shè)計領(lǐng)域中如何有效提取用戶需求的問題,提出一種融合多特征TFIDF(詞頻-逆向文件頻率)文本分析的汽車造型需求提取方法。首先,通過基于互信息與邊界自由度獲取大量未登錄的專業(yè)詞匯,優(yōu)化和修正簡單分詞后的詞匯;然后針對經(jīng)典TFIDF算法的局限性,引入詞匯特征因素與情感特征因素,獲取用戶需求特征候選集;最后根據(jù)設(shè)定的閾值得到有效的用戶需求。實驗結(jié)果表明,融合多特征TFIDF文本分析算法在特征提取方面有一定優(yōu)勢,能有效提取文本中關(guān)于汽車造型的用戶需求。
中圖分類號: TN02;TP391
文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.200488
中文引用格式: 季曹婷,馬偉鋒,樓姣,等. 融合多特征TFIDF文本分析的汽車造型需求提取方法[J].電子技術(shù)應(yīng)用,2021,47(2):16-19,27.
英文引用格式: Ji Caoting,Ma Weifeng,Lou Jiao,et al. An extraction method of car styling requirements by integrating multifeature TFIDF text analysis[J]. Application of Electronic Technique,2021,47(2):16-19,27.
An extraction method of car styling requirements by integrating multi-feature TFIDF text analysis
Ji Caoting,Ma Weifeng,Lou Jiao,Ma Laibin
School of Information and Electronic Engineering, Zhejiang University of Science and Technology, Hangzhou 310023,China
Abstract: In order to extract user requirements effectively in the field of car styling intelligent design, a method for extracting car styling requirements based on multi-feature TFIDF(word frequency-inverse file frequency) text analysis is proposed. Firstly, a large number of unregistered professional vocabularies is obtained through mutual information and boundary degrees of freedom to optimize the vocabulary after simple word segmentation. Next, in order to solve the problem of the limitations of the classic TFIDF algorithm, vocabulary and emotional feature factors are introduced to get user demand feature candidates set. Finally, effective user needs are obtained according to the threshold. The experimental results show that the multi-feature TFIDF text analysis algorithm has certain advantages in feature extraction, and can effectively extract user needs of the car styling in the text.
Key words : car styling;user needs analysis;keyword extraction;TFIDF

0 引言

    在智能制造的背景下,個性化生產(chǎn)是未來制造業(yè)發(fā)展的必然趨勢,用戶除了對商品基本功能的要求之外,個性化定制的需求正不斷地增加[1]。汽車制造業(yè)是智能制造的典型應(yīng)用行業(yè),根據(jù)調(diào)查,我國超過七成的消費者認(rèn)為汽車造型是決定購買汽車時的首要考慮因素[2],因此汽車造型能否符合用戶需求是個性化汽車造型設(shè)計成敗的關(guān)鍵[3]。目前,汽車造型的用戶需求描述主要以文本數(shù)據(jù)形式存在[4]。自然語言處理技術(shù)是當(dāng)前文本分析的主流方法,通常采用無監(jiān)督方法進行自動關(guān)鍵詞提取。但是該算法完全基于詞頻,忽略了詞語其他特征對關(guān)鍵詞提取影響的問題[5-7]。許多研究人員對此展開研究,趙曉平[8]等人提出文本結(jié)構(gòu)特征與經(jīng)典的TFIDF方法進行融合,應(yīng)用于科技項目文本的相似度度量計算中;牛永潔[9]等人不僅考慮到詞頻、詞跨度和位置權(quán)重特征,還考慮到詞性、詞長與語義關(guān)聯(lián)度因素,相比經(jīng)典的TFIDF算法有所改進;然而在實際應(yīng)用中,不僅要考慮到詞匯本身的特征信息,而且還需要考慮應(yīng)用場景的問題。所以余本功[10]等人在解決問答社區(qū)關(guān)鍵詞提取的問題時融合了詞匯特征與社會化問答社區(qū)文本的用戶關(guān)注屬性來綜合度量詞語權(quán)重,提升了社區(qū)問答關(guān)鍵詞提取的效果。

    雖然上述研究均取得了一些成果,但是無法有效地對汽車造型的用戶需求文本進行提取。本文利用融合多特征TFIDF算法對用戶需求文本數(shù)據(jù)進行分析,獲取有效的用戶需求特征,為汽車造型設(shè)計的需求確定提供支撐。




本文詳細(xì)內(nèi)容請下載:http://theprogrammingfactory.com/resource/share/2000003364




作者信息:

季曹婷,馬偉鋒,樓  姣,馬來賓

(浙江科技學(xué)院 信息與電子工程學(xué)院,浙江 杭州310023)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。