摘要:隨著社交網(wǎng)絡(luò)的快速發(fā)展,人們?cè)谏缃痪W(wǎng)絡(luò)中擁有越來(lái)越多的虛擬身份,識(shí)別同一自然人不同網(wǎng)絡(luò)虛擬身份的網(wǎng)絡(luò)用戶身份鏈接問(wèn)題變得越來(lái)越重要。用戶身份鏈接有助于挖掘網(wǎng)絡(luò)用戶的隱信息,構(gòu)建全面的網(wǎng)絡(luò)用戶畫(huà)像,進(jìn)而促進(jìn)跨網(wǎng)絡(luò)的推薦、鏈接預(yù)測(cè)、信息傳播等多個(gè)研究領(lǐng)域發(fā)展?,F(xiàn)有的基于用戶屬性和基于網(wǎng)絡(luò)結(jié)構(gòu)的用戶身份鏈接方法,沒(méi)有考慮不同用戶之間影響力差異因素,收斂速度較慢?;谏疃扔巫叩挠脩羯矸萱溄臃椒ǎ谌攵囝^注意力機(jī)制,對(duì)用戶間影響力進(jìn)行建模,實(shí)驗(yàn)結(jié)果表明,該方法可以很好地改進(jìn)算法有效性,提高訓(xùn)練效率。
摘要:為了實(shí)現(xiàn)多種水果在采摘后自動(dòng)化篩選和分揀中腐敗水果識(shí)別的問(wèn)題,提出了改進(jìn)的YOLOv5n模型,命名為mobile-YOLO。首先將YOLOv5n的主干網(wǎng)絡(luò)替換為MobileNetV3并引入深度可分離卷積,相較于原模型,這種改進(jìn)在計(jì)算效率和速度上都有所提升,并且準(zhǔn)確率也得到了提高。為了進(jìn)一步提升速度,將C3模塊替換為C2f模塊,實(shí)現(xiàn)輕量化的同時(shí)獲得了更豐富的梯度流信息。最后將原有的CIoU替換為α-CIoU,以加快收斂速度并保證圖像框位置的準(zhǔn)確性。mobile-YOLO相較于原始的YOLOv5n,mAP@.5(mean Average Precision)達(dá)到了98.1%,mAP@.5:.95達(dá)到了94.2%,同時(shí)在P(Precision)值為97.1%和R(Recall)值為96.8%的情況下,參數(shù)量幾乎與YOLOv5n保持一致。
摘要:由于漢語(yǔ)和越南語(yǔ)之間存在顯著的語(yǔ)法差異及語(yǔ)料稀缺,漢越神經(jīng)機(jī)器翻譯任務(wù)面臨名詞翻譯不準(zhǔn)確的挑戰(zhàn)。提出了一種新穎的多模態(tài)神經(jīng)機(jī)器翻譯方法,該方法融合了文本預(yù)訓(xùn)練模型和視覺(jué)語(yǔ)言聯(lián)合預(yù)訓(xùn)練模型。通過(guò)文本預(yù)訓(xùn)練模型,能夠捕獲深層的語(yǔ)言結(jié)構(gòu)和語(yǔ)義;而視覺(jué)語(yǔ)言聯(lián)合訓(xùn)練模型則提供了與文本相關(guān)聯(lián)的視覺(jué)上下文,這有助于模型更準(zhǔn)確地理解和翻譯名詞。兩種模型通過(guò)一個(gè)簡(jiǎn)潔高效的映射網(wǎng)絡(luò)結(jié)合,并通過(guò)Gumbel門(mén)控模塊動(dòng)態(tài)地整合多模態(tài)信息,以優(yōu)化翻譯輸出。在漢越及越漢翻譯任務(wù)中,該方法相比傳統(tǒng)Transformer模型分別提升了7.13和4.27的BLEU值。
摘要:近期,人臉識(shí)別技術(shù)在社會(huì)上廣受關(guān)注,其非接觸式的識(shí)別特性相較于指紋等傳統(tǒng)接觸式識(shí)別方法展現(xiàn)出明顯優(yōu)勢(shì)。在深度學(xué)習(xí)領(lǐng)域,由于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別任務(wù)上的準(zhǔn)確性和速度尚有提升空間,因此提出采用改進(jìn)的AlexNet卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識(shí)別。通過(guò)實(shí)驗(yàn)驗(yàn)證,與傳統(tǒng)卷積網(wǎng)絡(luò)相比,改進(jìn)后的AlexNet在人臉識(shí)別上不僅準(zhǔn)確度更高,而且識(shí)別過(guò)程更為穩(wěn)定。
摘要:目前,可再生能源大量接入配電網(wǎng),但是太陽(yáng)能、風(fēng)能、光伏及風(fēng)電等可再生能源的間歇性和隨機(jī)性不可避免地會(huì)造成配電網(wǎng)的波動(dòng)。考慮電網(wǎng)內(nèi)可再生能源發(fā)電功率與用電負(fù)荷隨時(shí)間變化的特點(diǎn),提出一種基于小波變換和神經(jīng)網(wǎng)絡(luò)的可再生能源接入配電網(wǎng)的負(fù)荷預(yù)測(cè)和優(yōu)化方法。首先采集配電網(wǎng)的發(fā)電與負(fù)荷數(shù)據(jù),利用小波變換處理收集到的數(shù)據(jù),得到局部尺度和頻率分解的特征參數(shù),建立神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型;然后,對(duì)經(jīng)過(guò)小波變換后得到的特征參數(shù)進(jìn)行訓(xùn)練,根據(jù)預(yù)測(cè)負(fù)荷對(duì)可再生能源的發(fā)電量進(jìn)行調(diào)節(jié),保持配電網(wǎng)供需側(cè)的動(dòng)態(tài)平衡。結(jié)果表明,所提方法能夠?qū)ω?fù)荷進(jìn)行有效預(yù)測(cè),通過(guò)提前預(yù)測(cè)負(fù)荷量,保證配電網(wǎng)用電穩(wěn)定性的同時(shí),最大化利用可再生能源。
摘要:目前的人工視覺(jué)系統(tǒng)仍然無(wú)法處理一些涉及高速運(yùn)動(dòng)場(chǎng)景和高動(dòng)態(tài)范圍的真實(shí)世界場(chǎng)景。事件相機(jī)因其低延遲和高動(dòng)態(tài)范圍捕捉高速運(yùn)動(dòng)的優(yōu)勢(shì)具有消除上述問(wèn)題的能力。然而,由于事件數(shù)據(jù)的高度稀疏和變化性質(zhì),在保證其快速性的同時(shí)將事件重建為視頻仍然具有挑戰(zhàn)性。因此提出了一種基于Transformer殘差網(wǎng)絡(luò)和光流估計(jì)的事件流重建算法,通過(guò)光流估計(jì)和事件重建的聯(lián)合訓(xùn)練,實(shí)現(xiàn)自監(jiān)督的重建過(guò)程,并引入去模糊預(yù)處理和亞像素上采樣模塊來(lái)提高重建質(zhì)量。實(shí)驗(yàn)結(jié)果表明,在公開(kāi)數(shù)據(jù)集上,提出的方法可以有效提高事件流的重建效果。
摘要:miRNA的突變和異常表達(dá)可能導(dǎo)致各種疾病,因此預(yù)測(cè)miRNA與疾病的潛在相關(guān)性對(duì)于臨床醫(yī)學(xué)和藥物研究的發(fā)展具有重要意義。拓?fù)浣Y(jié)構(gòu)是miRNA-疾病預(yù)測(cè)算法的重要組成部分,然而當(dāng)前算法并未有效利用拓?fù)浣Y(jié)構(gòu)導(dǎo)致預(yù)測(cè)結(jié)果并不理想。與此同時(shí),如何有效地融合多源數(shù)據(jù)也是當(dāng)前的研究趨勢(shì)。針對(duì)上述問(wèn)題,提出一種自適應(yīng)融合異質(zhì)節(jié)點(diǎn)結(jié)構(gòu)信息算法(MMTP),通過(guò)利用節(jié)點(diǎn)的一階鄰居和元路徑誘導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)結(jié)構(gòu)特征,并利用度量學(xué)習(xí)和拓?fù)鋫鞑プ赃m應(yīng)地融合異質(zhì)節(jié)點(diǎn)結(jié)構(gòu)信息,以提升miRNA-疾病預(yù)測(cè)精度。5折交叉驗(yàn)證實(shí)驗(yàn)結(jié)果表明,MMTP在HMDD v3.2數(shù)據(jù)集上的受試者操作曲線下面積(AUC)為94.81,高于其他模型。并且在基于腎癌的案例研究中,該模型所預(yù)測(cè)的前30個(gè)miRNAs全部得到證實(shí)。上述研究證明,所提的MMTP模型可有效預(yù)測(cè)miRNA-疾病相關(guān)性。
摘要:全球老齡化時(shí)代的到來(lái)引發(fā)的老年人健康監(jiān)護(hù)問(wèn)題不可忽視,而室內(nèi)跌倒對(duì)獨(dú)居的老年人有非常大的安全隱患。因此,為準(zhǔn)確檢測(cè)到跌倒動(dòng)作,使用毫米波雷達(dá)三維點(diǎn)云信息進(jìn)行室內(nèi)跌倒檢測(cè),并提出一種基于外部注意力機(jī)制的PointLSTM網(wǎng)絡(luò)實(shí)現(xiàn)三維點(diǎn)云在時(shí)序的分類。通過(guò)MIMO體制的毫米波雷達(dá)芯片采集人體動(dòng)作的回波信號(hào),利用集成雷達(dá)基帶處理器的微控制器實(shí)現(xiàn)信號(hào)處理的部分,可將原始數(shù)據(jù)實(shí)時(shí)轉(zhuǎn)換成三維點(diǎn)云,并提高點(diǎn)云處理中的計(jì)算速度及雷達(dá)硬件的整體性能?;谕獠孔⒁饬C(jī)制的PointLSTM網(wǎng)絡(luò)可實(shí)現(xiàn)點(diǎn)云在時(shí)空中的提取特征和分類識(shí)別,網(wǎng)絡(luò)改進(jìn)了PointLSTM幀間點(diǎn)信息的流失問(wèn)題,并在信息提取中對(duì)所有數(shù)據(jù)實(shí)現(xiàn)特征聯(lián)系,外部注意力機(jī)制通過(guò)獨(dú)立的可學(xué)習(xí)參數(shù)優(yōu)化了網(wǎng)絡(luò)復(fù)雜度和識(shí)別精確率。實(shí)驗(yàn)結(jié)果表明,所提出的方法在室內(nèi)環(huán)境下檢測(cè)準(zhǔn)確率可以達(dá)到98.3%,可以有效區(qū)分動(dòng)作的類別,并驗(yàn)證了使用毫米波雷達(dá)三維點(diǎn)云檢測(cè)人體跌倒的可行性。
摘要:構(gòu)建基于云計(jì)算的蛋白質(zhì)折疊空間結(jié)構(gòu)預(yù)測(cè)框架,通過(guò)數(shù)據(jù)云存儲(chǔ)設(shè)備獲取蛋白質(zhì)序列原始數(shù)據(jù),采用HDFS(Hadoop Distributed File System)分布式存儲(chǔ)方式保存于云端。資源和隊(duì)列管理器RQM(Resource Queue Management)開(kāi)啟云端虛擬機(jī)后,以之作為掃描節(jié)點(diǎn)(Sensor Node, SN),SN基于二維AB非格點(diǎn)模型建立最小蛋白質(zhì)分子能量?jī)?yōu)化函數(shù),采用局部搜索機(jī)制改進(jìn)的量子遺傳算法對(duì)其作優(yōu)化求解。利用云端GPU設(shè)備處理模型訓(xùn)練數(shù)據(jù),即可實(shí)現(xiàn)蛋白質(zhì)折疊空間結(jié)構(gòu)的自動(dòng)化預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明:蛋白質(zhì)序列能量勢(shì)函數(shù)計(jì)算結(jié)果更小、執(zhí)行效率更高、GDT-TS(Geothermal Development and Testing Tool Suite)評(píng)價(jià)指標(biāo)值更大。
摘要:喬木在維持生態(tài)平衡、保護(hù)生物多樣性以及調(diào)節(jié)氣候和改善空氣質(zhì)量等方面發(fā)揮著至關(guān)重要的作用。針對(duì)復(fù)雜背景下喬木識(shí)別準(zhǔn)確率較低的問(wèn)題,提出了一種基于樹(shù)木多特征融合和知識(shí)蒸餾的亞熱帶常見(jiàn)喬木識(shí)別模型MFFMN-KD-TA。該模型采用3個(gè)并行的MobileNetV3_Small主干網(wǎng)絡(luò)分別提取樹(shù)葉、樹(shù)干和樹(shù)木整體特征;并通過(guò)知識(shí)蒸餾和嵌入Triplet Attention模塊的方法優(yōu)化訓(xùn)練。試驗(yàn)結(jié)果表明,MFFMN-KD-TA模型在自建樹(shù)木測(cè)試集上的準(zhǔn)確率、精確率和F1分?jǐn)?shù)分別為0.960 9、0.962 1和0.960 8,較MFFMN模型分別提升了3.05%、2.83%和3.07%。與三分支融合模型3-ShuffleNetV2和3-MobileNetV2相比,提出的多特征融合模型MFFMN-KD-TA參數(shù)量較小且能夠較準(zhǔn)確地識(shí)別喬木種類,為亞熱帶和其他地區(qū)的樹(shù)種識(shí)別提供了新思路和新方法。
摘要:通過(guò)主動(dòng)學(xué)習(xí)模型來(lái)選取最有價(jià)值的數(shù)據(jù)點(diǎn)進(jìn)行標(biāo)注是深度學(xué)習(xí)減少標(biāo)注數(shù)據(jù)量的一種方式。預(yù)測(cè)損失模型是一類與任務(wù)無(wú)關(guān)的主動(dòng)學(xué)習(xí)模型,該類模型在多個(gè)任務(wù)中都有不錯(cuò)的表現(xiàn)。但是這類模型均不是端到端的模型,不斷變化的輸入特征會(huì)導(dǎo)致?lián)p失預(yù)測(cè)網(wǎng)絡(luò)在訓(xùn)練時(shí)出現(xiàn)輸入偏差。提出了時(shí)序特征融合預(yù)測(cè)損失模型用于解決該模型的輸入偏差問(wèn)題。實(shí)驗(yàn)證明,提出的算法在各個(gè)任務(wù)中的性能與以往最先進(jìn)的算法相比,平均提升約1.5%,與原預(yù)測(cè)損失模型相比,平均提升5%。
摘要:針對(duì)當(dāng)前心音信號(hào)識(shí)別算法檢測(cè)精度不佳問(wèn)題,提出了一種混合卷積神經(jīng)網(wǎng)絡(luò)-支持向量機(jī)模型 (CNN-SVM) 的心音信號(hào)分類方法。通過(guò)PASCAL挑戰(zhàn)實(shí)驗(yàn)數(shù)據(jù),整理出正常與不正常兩類心音信號(hào)數(shù)據(jù)庫(kù),通過(guò)預(yù)處理濾波及MFCC、一二階差分特征提取、PCA降維,輸入CNN-SVM模型進(jìn)行訓(xùn)練。并從準(zhǔn)確率、召回率、特異性、精確率和F分?jǐn)?shù)5個(gè)方面進(jìn)行性能評(píng)估。為了驗(yàn)證此算法的有效性,將混合CNN-SVM模型與單一SVM、CNN模型分別進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明,該方法能夠以較高識(shí)別率將兩種心音信號(hào)區(qū)分開(kāi),其平均識(shí)別準(zhǔn)確率接近于99%,相較于單一CNN方法提高了2.48%,同樣高于單一SVM算法。
摘要:預(yù)測(cè)植物中的蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)具有重要的生物學(xué)意義。同時(shí)采用了4種編碼方法及深度神經(jīng)網(wǎng)絡(luò)構(gòu)建了蛋白質(zhì)相互作用預(yù)測(cè)模型。結(jié)果表明,提出的融合蛋白質(zhì)語(yǔ)言模型Ankh與深度神經(jīng)網(wǎng)絡(luò)的方法構(gòu)建的PPI預(yù)測(cè)模型性能在3種植物數(shù)據(jù)集上均獲得了最優(yōu)的AUPR和AUC值,Sen及MCC值也均優(yōu)于其他4種蛋白質(zhì)相互作用預(yù)測(cè)模型。當(dāng)模型在水稻、大豆的植物PPI數(shù)據(jù)集上進(jìn)行測(cè)試時(shí),所提出的模型AUPR值分別為0.802 5、0.730 1,AUC值分別為0.956 2、0.950 7。這些優(yōu)異的結(jié)果表明,融合蛋白質(zhì)語(yǔ)言模型Ankh的PPI模型可以作為植物蛋白質(zhì)相互作用預(yù)測(cè)的一個(gè)有前途的工具。
摘要:針對(duì)主動(dòng)毫米波圖像中目標(biāo)與背景紋理區(qū)分度較低導(dǎo)致隱匿目標(biāo)漏檢問(wèn)題,并根據(jù)安檢實(shí)時(shí)性要求,提出一種基于全局通道注意力增強(qiáng)的主動(dòng)毫米波圖像目標(biāo)檢測(cè)方法。該方法以YOLOv5s為載體,在坐標(biāo)注意力位置方向上引入全局通道注意模塊,增強(qiáng)對(duì)隱匿目標(biāo)全局通道信息的關(guān)注,從而提升在隱匿目標(biāo)與背景紋理區(qū)分度較低時(shí)的檢測(cè)能力;再利用K-means++聚類算法重新生成適合毫米波圖像目標(biāo)檢測(cè)的錨框。實(shí)驗(yàn)結(jié)果表明,無(wú)論是陣列圖像數(shù)據(jù)集還是線掃圖像數(shù)據(jù)集,該方法增強(qiáng)了對(duì)隱匿目標(biāo)的特征注意,提高了召回率,在滿足安檢實(shí)時(shí)性的前提下,提升了檢測(cè)性能。通過(guò)增加少量參數(shù),在陣列圖像數(shù)據(jù)集上,精度、召回率和mAP@.5達(dá)到了92.0%、90.93%和95.32%;在線掃圖像數(shù)據(jù)集上,精度、召回率和mAP@.5達(dá)到了94.65%、92.67%和97.73%。平均單張圖像推理時(shí)間在兩個(gè)數(shù)據(jù)集上均達(dá)到1 ms,滿足實(shí)時(shí)性要求。
摘要:開(kāi)展了一種基于貝塞爾曲線的智能汽車避障局部軌跡規(guī)劃,即路徑規(guī)劃和速度規(guī)劃方法研究。路徑規(guī)劃時(shí),為了適應(yīng)各種形狀道路,將道路笛卡爾坐標(biāo)轉(zhuǎn)換為Frénet坐標(biāo),以路徑的長(zhǎng)度、曲率和連續(xù)性,以及車輛碰撞風(fēng)險(xiǎn)為代價(jià)函數(shù),其中引入危險(xiǎn)勢(shì)場(chǎng)理論,描述車輛碰撞風(fēng)險(xiǎn),并采用序列二次規(guī)劃方法來(lái)求解路徑規(guī)劃這一非線性優(yōu)化問(wèn)題;速度規(guī)劃時(shí),以行車效率和舒適性為目標(biāo),實(shí)現(xiàn)速度規(guī)劃,該方法可以通過(guò)調(diào)整各子目標(biāo)函數(shù)的權(quán)重來(lái)滿足不同駕駛需求。為了驗(yàn)證基于貝塞爾曲線軌跡規(guī)劃算法的有效性,設(shè)計(jì)了直道和彎道上靜態(tài)和動(dòng)態(tài)避障場(chǎng)景的仿真實(shí)驗(yàn),結(jié)果表明,提出的軌跡規(guī)劃方法能夠在各種形狀道路上完成避障任務(wù),且避障過(guò)程中車輛狀態(tài)變化平穩(wěn),能夠保證乘坐舒適性。
摘要:中文命名實(shí)體識(shí)別主要包括中文平面命名實(shí)體識(shí)別和中文嵌套命名實(shí)體識(shí)別兩個(gè)任務(wù),其中中文嵌套命名實(shí)體識(shí)別任務(wù)難度更大。提出了一個(gè)基于詞匯增強(qiáng)和表格填充的統(tǒng)一模型TLEXNER,該模型能夠同時(shí)處理上述任務(wù)。該模型首先針對(duì)中文語(yǔ)料分詞困難的問(wèn)題,使用詞典適配器將詞匯信息融合到BERT預(yù)訓(xùn)練模型,并且將字符與詞匯組的相對(duì)位置信息集成到BERT的嵌入層中;然后通過(guò)條件層歸一化和雙仿射模型構(gòu)造并預(yù)測(cè)字符對(duì)表格,使用表格建模字符與字符之間的關(guān)系,得到平面實(shí)體與嵌套實(shí)體的統(tǒng)一表示;最后根據(jù)字符對(duì)表格上三角區(qū)域的數(shù)值判斷實(shí)體類別。提出的模型在平面實(shí)體的公開(kāi)數(shù)據(jù)集Resume和自行標(biāo)注的軍事領(lǐng)域嵌套實(shí)體數(shù)據(jù)集上F1分別是97.35%和91.96%,證明了TLEXNER模型的有效性。
摘要:任務(wù)型問(wèn)答系統(tǒng)一旦構(gòu)建好,通常是固定不變的,能回答的問(wèn)題非常有限,難以滿足用戶的需求。對(duì)此,提出一種自動(dòng)實(shí)時(shí)更新知識(shí)庫(kù)的方法,當(dāng)用戶提了一個(gè)問(wèn)答系統(tǒng)回答不了的問(wèn)題,系統(tǒng)會(huì)把該問(wèn)題自動(dòng)發(fā)送給人工客服,人工客服利用專業(yè)知識(shí)回復(fù)后,系統(tǒng)能夠自動(dòng)實(shí)時(shí)獲取用戶提的問(wèn)題和人工客服回復(fù)的答案,并把這個(gè)問(wèn)答對(duì)自動(dòng)實(shí)時(shí)更新到知識(shí)庫(kù),之后如果其他用戶提了類似的問(wèn)題,問(wèn)答系統(tǒng)就能夠快速給出對(duì)應(yīng)的答案。以政務(wù)領(lǐng)域的問(wèn)答系統(tǒng)為例,應(yīng)用文本向量化方法ERNIE構(gòu)建知識(shí)庫(kù)自動(dòng)實(shí)時(shí)更新的問(wèn)答系統(tǒng)。經(jīng)過(guò)計(jì)算機(jī)實(shí)驗(yàn)證明,提出的方法能夠?qū)崿F(xiàn)知識(shí)庫(kù)自動(dòng)實(shí)時(shí)更新,構(gòu)建的問(wèn)答系統(tǒng)具有自主學(xué)習(xí)與記憶功能,提高了任務(wù)型問(wèn)答系統(tǒng)的智能化水平。
摘要:垃圾分類是建設(shè)生態(tài)文明的重要一環(huán),為解決重量級(jí)模型難以部署移動(dòng)端設(shè)備的問(wèn)題,提出基于YOLOv5網(wǎng)絡(luò)改進(jìn)的垃圾圖像分類方法。采用融合GhostNet的主干網(wǎng)絡(luò),用線性運(yùn)算代替?zhèn)鹘y(tǒng)卷積運(yùn)算,降低了模型的參數(shù)量,提高了模型推理速度;通過(guò)在網(wǎng)絡(luò)中加入改進(jìn)版通道注意力模塊,強(qiáng)化重要的通道特征,獲取更多深層次的特征信息;采用加權(quán)邊界融合方法,提升檢測(cè)框的定位精度。經(jīng)實(shí)驗(yàn)證明,該方法在自制數(shù)據(jù)集中較原模型的精度提高了8.5%,參數(shù)量減少了46.7%,平均推理速度提高了1.22 ms,實(shí)現(xiàn)了精度和推理速度的綜合提升。
摘要:針對(duì)中文事件抽取中語(yǔ)義表征不充分、特征提取不全面等問(wèn)題,提出一種基于RoBERTa和多層次特征的中文事件抽取方法。通過(guò)RoBERTa預(yù)訓(xùn)練模型構(gòu)建字向量,并基于詞性標(biāo)注和觸發(fā)詞語(yǔ)義信息融入進(jìn)行字向量擴(kuò)展;其次使用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)抽取全局特征和局部特征,并通過(guò)自注意力機(jī)制捕捉不同特征之間的關(guān)聯(lián),加強(qiáng)對(duì)重要特征的利用;最后通過(guò)條件隨機(jī)場(chǎng)實(shí)現(xiàn)BIO序列標(biāo)注,完成事件抽取。在DuEE1.0數(shù)據(jù)集上,觸發(fā)詞抽取和事件論元抽取的F1值達(dá)到86.9%和68.0%,優(yōu)于現(xiàn)有常用事件抽取模型,驗(yàn)證了該方法的有效性。
摘要:針對(duì)簡(jiǎn)單文本分類模型精度不高,預(yù)訓(xùn)練模型結(jié)構(gòu)復(fù)雜,在實(shí)際環(huán)境中難以直接使用的問(wèn)題,提出多教師知識(shí)蒸餾的文本分類方法。該模型使用“教師-學(xué)生網(wǎng)絡(luò)”的訓(xùn)練方法,教師模型為BERT-wwm-ext和XLNet預(yù)訓(xùn)練模型,將兩個(gè)模型輸出的概率矩陣通過(guò)權(quán)重系數(shù)融合為軟標(biāo)簽。學(xué)生模型為BiGRU-CNN網(wǎng)絡(luò),使用均方差函數(shù)計(jì)算軟標(biāo)簽誤差,使用交叉熵?fù)p失函數(shù)計(jì)算硬標(biāo)簽誤差,通過(guò)硬標(biāo)簽和軟標(biāo)簽訓(xùn)練學(xué)生模型使損失函數(shù)值達(dá)到最小。實(shí)驗(yàn)結(jié)果表明,提出的方法精度較學(xué)生模型有較大的改進(jìn),接近預(yù)訓(xùn)練模型,在保證分類精度的前提下減少了運(yùn)行時(shí)間,提高了效率。
摘要:輸電巡檢圖像的背景復(fù)雜,目標(biāo)檢測(cè)易受干擾,基于YOLOX神經(jīng)網(wǎng)絡(luò)模型,提出一種輸電線路山火檢測(cè)方法。首先采用YOLOX的主干特征提取網(wǎng)絡(luò)框架,并將其中多尺度特征提取模塊的常規(guī)卷積替換為可變形卷積;其次在加強(qiáng)特征提取階段增加了通道注意力和空間注意力模塊的融合,能夠自適應(yīng)火焰的外形多變特點(diǎn),更加有效地提取到山火特征,從而提高目標(biāo)檢測(cè)的準(zhǔn)確率。經(jīng)實(shí)驗(yàn)驗(yàn)證,所提方法能夠較為準(zhǔn)確地檢測(cè)到山火,滿足日常巡檢的需求。
摘要:人體關(guān)鍵點(diǎn)檢測(cè)在智能視頻監(jiān)控、人機(jī)交互等領(lǐng)域有重要應(yīng)用。針對(duì)基于熱圖的人體關(guān)鍵點(diǎn)檢測(cè)算法依賴高分辨率熱圖、計(jì)算資源消耗大的問(wèn)題,提出一種結(jié)合不確定性估計(jì)的輕量級(jí)算法。使用低分辨率熱圖,結(jié)合不確定性估計(jì)預(yù)測(cè)誤差分布的尺度參數(shù),提高了預(yù)測(cè)結(jié)果的可信度;利用尺度參數(shù)監(jiān)督和約束熱圖,緩解梯度消失,增強(qiáng)了網(wǎng)絡(luò)的魯棒性。COCO數(shù)據(jù)集上實(shí)驗(yàn)結(jié)果表明,與積分姿態(tài)回歸算法相比,改進(jìn)后算法的平均精度提高了3.3%,降低了資源占用。
摘要:近年來(lái),隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于編解碼的圖像分割方法在病理圖像自動(dòng)化分析上的研究與應(yīng)用也逐漸廣泛,但由于胃癌病灶復(fù)雜多變、尺度變化大,加上數(shù)字化染色圖像時(shí)易導(dǎo)致的邊界模糊,目前僅從單一尺度設(shè)計(jì)的分割算法往往無(wú)法獲得更精準(zhǔn)的病灶邊界。為優(yōu)化胃癌病灶圖像分割準(zhǔn)確度,基于編解碼網(wǎng)絡(luò)結(jié)構(gòu),提出一種基于多尺度注意力融合網(wǎng)絡(luò)的胃癌病灶圖像分割算法。編碼結(jié)構(gòu)以EfficientNet作為特征提取器,在解碼器中通過(guò)對(duì)多路徑不同層級(jí)的特征進(jìn)行提取和融合,實(shí)現(xiàn)了網(wǎng)絡(luò)的深監(jiān)督,在輸出時(shí)采用空間和通道注意力對(duì)多尺度的特征圖進(jìn)行注意力篩選,同時(shí)在訓(xùn)練過(guò)程中應(yīng)用綜合損失函數(shù)來(lái)優(yōu)化模型。實(shí)驗(yàn)結(jié)果表明,該方法在SEED數(shù)據(jù)集上Dice系數(shù)得分達(dá)到0.806 9,相比FCN和UNet系列網(wǎng)絡(luò)一定程度上實(shí)現(xiàn)了更精細(xì)化的胃癌病灶分割。
摘要:面向法律領(lǐng)域的神經(jīng)機(jī)器翻譯對(duì)于合同文本翻譯等應(yīng)用場(chǎng)景具有重要價(jià)值。由于法律領(lǐng)域雙語(yǔ)對(duì)齊語(yǔ)料稀缺,翻譯效果還不理想。針對(duì)該問(wèn)題,目前有效的方法是融入翻譯記憶或翻譯模版等外部信息,但法律領(lǐng)域的文本多具有固定的表達(dá)結(jié)構(gòu)且用詞準(zhǔn)確規(guī)范,在翻譯記憶庫(kù)中同時(shí)利用翻譯結(jié)構(gòu)信息和語(yǔ)義信息能夠進(jìn)一步提升法律領(lǐng)域翻譯性能。基于此,提出一種融入翻譯記憶庫(kù)的法律領(lǐng)域機(jī)器翻譯方法。提出了一種新的法律領(lǐng)域翻譯記憶庫(kù),首先基于語(yǔ)義和結(jié)構(gòu)信息的相似性訓(xùn)練跨語(yǔ)言檢索模型以充分利用單語(yǔ)數(shù)據(jù),然后從翻譯記憶庫(kù)中檢索與輸入源句相關(guān)的一組翻譯記憶和翻譯模版,進(jìn)而引導(dǎo)翻譯模型生成目標(biāo)句子。實(shí)驗(yàn)表明,在MHLAW數(shù)據(jù)集上,提出的方法可以使譯文較基線模型提升1.28個(gè)BLEU點(diǎn)。
摘要:隨著電力用戶信息采集系統(tǒng)的發(fā)展,更豐富的用戶用電信息被用于用戶用電信息異常的識(shí)別?;贔DI攻擊進(jìn)行虛假數(shù)據(jù)注入,構(gòu)造用戶用電信息異常數(shù)據(jù)集,并提出了一種基于召回率的改進(jìn)Stacking集成分類算法。該算法采用K-近鄰算法(k-Nearest Neighbors,KNN)、隨機(jī)森林模型(Random Forests,RF)、支持向量機(jī)(Support Vector Machine,SVM)以及梯度決策樹(shù)(Gradient Boosting Decision Tree,GBDT)作為Stacking結(jié)構(gòu)的基分類模型;采用邏輯回歸(Logistic Regression,LR)作為Stacking結(jié)構(gòu)的元分類模型。并基于召回率為基分類模型的輸出結(jié)果進(jìn)行權(quán)值賦值,從而作為元分類模型的輸入數(shù)據(jù)集。通過(guò)實(shí)驗(yàn)驗(yàn)證,所提的基于召回率的改進(jìn)Stacking集成分類算法相比于傳統(tǒng)Stacking集成分類算法擁有更高效的分類性能。
摘要:為了能將龐大的深度學(xué)習(xí)模型壓縮后部署到算力和存儲(chǔ)能力有限的設(shè)備中時(shí)盡可能減小精度損失,對(duì)知識(shí)蒸餾模型壓縮方法進(jìn)行研究,提出了一種改進(jìn)后帶篩選的多教師模型知識(shí)蒸餾壓縮算法。利用多教師模型的集成優(yōu)勢(shì),以各教師模型的預(yù)測(cè)交叉熵為篩選的量化標(biāo)準(zhǔn)篩選出表現(xiàn)更好的教師模型對(duì)學(xué)生進(jìn)行指導(dǎo),并讓學(xué)生模型從教師模型的特征層開(kāi)始提取信息,同時(shí)讓表現(xiàn)更好的教師模型在指導(dǎo)中更具有話語(yǔ)權(quán)。在CIFAR100數(shù)據(jù)集上的VGG13等分類模型實(shí)驗(yàn)結(jié)果表明,與其他壓縮算法相比在最終得到的學(xué)生模型大小相同的情況下,精度上有著更好的表現(xiàn)。
摘要:LiDAR技術(shù)的發(fā)展為自動(dòng)駕駛提供了豐富的3D數(shù)據(jù)。然而,由于遮擋和某些反射材料的原因引起信號(hào)丟失,LiDAR點(diǎn)云實(shí)際上是不完整的2.5D數(shù)據(jù),這對(duì) 3D 感知提出了根本性挑戰(zhàn)。針對(duì)這一問(wèn)題,提出對(duì)原始數(shù)據(jù)進(jìn)行三維補(bǔ)全的方法。根據(jù)大多數(shù)物體形狀對(duì)稱且重復(fù)率高的特點(diǎn),通過(guò)學(xué)習(xí)先驗(yàn)對(duì)象形狀的方法估計(jì)點(diǎn)云中遮擋部分的完整形狀。該方法首先識(shí)別被遮擋和信號(hào)缺失影響的區(qū)域,在這些區(qū)域中預(yù)測(cè)區(qū)域所包含對(duì)象形狀的占用概率。針對(duì)物體間遮擋的情況,通過(guò)形狀的占用概率和共享同類形狀形態(tài)進(jìn)行三維補(bǔ)全。對(duì)自身遮擋的物體,通過(guò)自身鏡像進(jìn)行恢復(fù)。最后通過(guò)點(diǎn)云目標(biāo)檢測(cè)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。結(jié)果表明,通過(guò)該方法能有效地提高生成點(diǎn)云3D邊框的mAP(mean Average Precision)。
摘要:針對(duì)在單視圖的乳腺腫塊檢測(cè)算法中漏檢率和假陽(yáng)性率較高的問(wèn)題,提出了一種改進(jìn)的自動(dòng)檢測(cè)算法。將擴(kuò)張殘留網(wǎng)絡(luò)(Dilated Residual Network,DRN)結(jié)合重新設(shè)計(jì)的特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network,F(xiàn)PN)用于對(duì)乳腺腫塊的檢測(cè)。首先利用DRN中的膨脹卷積,減少對(duì)圖像的下采樣次數(shù);再擴(kuò)充網(wǎng)絡(luò)的深度,使其輸出滿足FPN所需的輸入;在FPN結(jié)構(gòu)中,采用注意力機(jī)制降低不同特征圖直接融合所造成的信息損失,同時(shí)采用密集連接代替原有的橫向連接,充分融合淺層特征中目標(biāo)的位置和細(xì)節(jié)信息。仿真實(shí)驗(yàn)顯示,所設(shè)計(jì)的模型在CBSI-DDSM數(shù)據(jù)集上的檢測(cè)精度相比于基準(zhǔn)模型提升了7.1%。
摘要:針對(duì)化工過(guò)程中廣泛應(yīng)用的連續(xù)攪拌反應(yīng)釜(CSTR)反應(yīng)器,提出一種新的基于極限學(xué)習(xí)機(jī)的Hammerstein-Wiener模型的辨識(shí)建模方法。其中,Hammerstein-Wiener模型的兩個(gè)非線性環(huán)節(jié)采用兩個(gè)不同的極限學(xué)習(xí)機(jī)逼近,線性環(huán)節(jié)采用自回歸ARX模型。因極限學(xué)習(xí)機(jī)的特殊結(jié)構(gòu),此模型可以表示成線性回歸的形式,最終利用廣義最小二乘法求解模型的參數(shù)。此方法辨識(shí)過(guò)程簡(jiǎn)單,辨識(shí)過(guò)程的計(jì)算量較小。最后對(duì)CSTR的辨識(shí)結(jié)果表明,在相同條件下與基于多項(xiàng)式的Hammerstein 模型和ARX-LSSVM Hammerstein 模型相比,該方法具有較高辨識(shí)精度,表明了該方法的有效性。
摘要:為了解決城市中共享單車亂停亂放的問(wèn)題,提出了一種基于OpenMV的共享單車規(guī)范停車系統(tǒng)。系統(tǒng)主要由OpenMV開(kāi)發(fā)板、BC20通信定位模塊以及OneNET云服務(wù)器等組成。其中OpenMV完成對(duì)停車狀態(tài)的檢測(cè)與識(shí)別,借助BC20內(nèi)置的網(wǎng)絡(luò)模塊與OneNET云服務(wù)器進(jìn)行數(shù)據(jù)交互,并將檢測(cè)結(jié)果反饋至小程序客戶端,從而實(shí)現(xiàn)對(duì)共享單車的停車檢測(cè)和控制。系統(tǒng)通過(guò)大量的測(cè)試,實(shí)驗(yàn)結(jié)果表明系統(tǒng)運(yùn)行穩(wěn)定,識(shí)別準(zhǔn)確率為94.1%,可以實(shí)現(xiàn)共享單車的規(guī)范停車自動(dòng)檢測(cè),具有良好的市場(chǎng)應(yīng)用前景與價(jià)值。
摘要:為解決垃圾網(wǎng)頁(yè)檢測(cè)中特征提取難度高、計(jì)算量大的問(wèn)題,提出一種僅基于當(dāng)前網(wǎng)頁(yè)的HTML腳本提取語(yǔ)義特征的方法。首先使用深度優(yōu)先搜索和動(dòng)態(tài)規(guī)劃相結(jié)合的記憶化搜索算法對(duì)域名進(jìn)行單詞切割,采用隱含狄利克雷分布提取主題詞,基于Word2Vec詞向量和詞移距離計(jì)算3個(gè)單頁(yè)語(yǔ)義相似度特征;然后將單頁(yè)語(yǔ)義相似度特征融合單頁(yè)統(tǒng)計(jì)特征,使用隨機(jī)森林等分類算法構(gòu)建分類模型進(jìn)行垃圾網(wǎng)頁(yè)檢測(cè)。實(shí)驗(yàn)結(jié)果表明,基于單頁(yè)內(nèi)容提取語(yǔ)義特征融合單頁(yè)統(tǒng)計(jì)特征進(jìn)行分類的AUC值達(dá)到88.0%,比對(duì)照方法提高4%左右。
摘要:大多數(shù)傳統(tǒng)的深度學(xué)習(xí)點(diǎn)云補(bǔ)全學(xué)習(xí)方法僅僅使用了全局特征而忽略了局部特征,為了更好地提取和使用點(diǎn)云的局部特征,提出了一個(gè)基于深度學(xué)習(xí)的端到端點(diǎn)云補(bǔ)全網(wǎng)絡(luò)。在點(diǎn)云補(bǔ)全網(wǎng)絡(luò)(PCN)的基礎(chǔ)上,編碼部分引入針對(duì)局部特征改進(jìn)的動(dòng)態(tài)圖卷積(DGCNN),使用多個(gè)不同維度的邊卷積提取較為豐富的局部特征,并按照距離弱化遠(yuǎn)點(diǎn)的特征;然后用深度殘差網(wǎng)絡(luò)連接的思想優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)以實(shí)現(xiàn)多尺度特征的融合,并加入平均池化彌補(bǔ)全局池化造成的信息損失;在解碼部分引入折疊網(wǎng)絡(luò)(FoldingNet),使輸出的點(diǎn)云更加完整。實(shí)驗(yàn)結(jié)果表明,該點(diǎn)云補(bǔ)全網(wǎng)絡(luò)相對(duì)PCN等點(diǎn)云補(bǔ)全網(wǎng)絡(luò)有部分提升,驗(yàn)證了新方法的有效性。
摘要:醫(yī)療文本的特征提取及分析在建設(shè)臨床決策支持系統(tǒng)方面具有較大的實(shí)用價(jià)值。針對(duì)包含各種術(shù)語(yǔ)和縮寫(xiě)的原始醫(yī)療文本難以提取特征的情況,提出了一種基于BERT與Word2vec的醫(yī)療文本分析模型。該模型對(duì)醫(yī)療病歷中關(guān)鍵醫(yī)療實(shí)體進(jìn)行識(shí)別,基于知識(shí)建立權(quán)重評(píng)分機(jī)制,對(duì)醫(yī)學(xué)文本進(jìn)行語(yǔ)義分析。實(shí)驗(yàn)數(shù)據(jù)表明,模型在醫(yī)療文本特征提取方面具有一定優(yōu)勢(shì),對(duì)高血壓性腦出血病歷的分析診斷性能良好,能有效應(yīng)用于臨床決策支持系統(tǒng)。
摘要:場(chǎng)景圖生成(SGG)任務(wù)旨在檢測(cè)圖像中的視覺(jué)關(guān)系三元組,即主語(yǔ)、謂語(yǔ)、賓語(yǔ),為場(chǎng)景理解提供結(jié)構(gòu)視覺(jué)布局。然而,現(xiàn)有的場(chǎng)景圖生成方法忽略了預(yù)測(cè)的謂詞頻率高但卻無(wú)信息性的問(wèn)題,從而阻礙了該領(lǐng)域進(jìn)步。為了解決上述問(wèn)題,提出一種基于增強(qiáng)語(yǔ)義信息理解的場(chǎng)景圖生成算法。整個(gè)模型由特征提取模塊、圖像裁剪模塊、語(yǔ)義轉(zhuǎn)化模塊、拓展信息謂詞模塊四部分組成。特征提取模塊和圖像裁剪模塊負(fù)責(zé)提取視覺(jué)特征并使其具有全局性和多樣性。語(yǔ)義轉(zhuǎn)化模塊負(fù)責(zé)將謂詞之間的語(yǔ)義關(guān)系從常見(jiàn)的預(yù)測(cè)中恢復(fù)信息預(yù)測(cè)。拓展信息謂詞模塊負(fù)責(zé)擴(kuò)展信息謂詞的采樣空間。在數(shù)據(jù)集VG和VG-MSDN上與其他方法進(jìn)行比較,平均召回率分別達(dá)到59.5%和40.9%。該算法可改善預(yù)測(cè)出來(lái)的謂詞信息性不足問(wèn)題,進(jìn)而提升場(chǎng)景圖生成算法的性能。
摘要:為解決新疆兵團(tuán)農(nóng)業(yè)現(xiàn)代化建設(shè)中有感知無(wú)決策的問(wèn)題,提出一種基于注意力機(jī)制模塊(SENet)與卷積神經(jīng)網(wǎng)絡(luò)混合模型遷移學(xué)習(xí)的圖像分類方法(TL-DA-SE-CNN)。該方法選擇4種不同的CNN模型進(jìn)行權(quán)重采集,包括VGGNet、ResNet、InceptionNet和MobileNet。模型使用SENet分類器代替卷積神經(jīng)網(wǎng)絡(luò)的全連接層,提取圖像的結(jié)構(gòu)性高階統(tǒng)計(jì)特征進(jìn)行主題分類,并使用BP算法進(jìn)行參數(shù)調(diào)整,分類準(zhǔn)確度達(dá)98.20%。實(shí)驗(yàn)結(jié)果表明,將CNN與遷移學(xué)習(xí)、數(shù)據(jù)增強(qiáng)和SENet相結(jié)合的技術(shù)提高了牲畜圖像分類的性能,是卷積神經(jīng)網(wǎng)絡(luò)在農(nóng)場(chǎng)自動(dòng)化分群中的有效應(yīng)用。
摘要:以降低出租車運(yùn)營(yíng)損失為目標(biāo),分別利用排隊(duì)論對(duì)司機(jī)等待的平均時(shí)間成本進(jìn)行量化,以及通過(guò)熵值法改進(jìn)的TOPSIS模型對(duì)不同時(shí)段載客可能性進(jìn)行量化,進(jìn)而完成空載潛在損失參數(shù)的量化,通過(guò)量化指標(biāo)構(gòu)建出出租車運(yùn)營(yíng)損失模型,并基于此模型給出了降低損失的運(yùn)營(yíng)決策方法。引用洛陽(yáng)北郊機(jī)場(chǎng)航班及出租車數(shù)據(jù)的驗(yàn)證,證明了該決策方法能夠有效降低出租車的運(yùn)營(yíng)損失。
摘要:隨著目前目標(biāo)檢測(cè)任務(wù)輸入圖像分辨率的不斷增大,在特征提取網(wǎng)絡(luò)的感受野不變的情況下,網(wǎng)絡(luò)提取的特征信息會(huì)越來(lái)越局限,相鄰特征點(diǎn)之間的信息重合度也會(huì)越來(lái)越高。提出一種FSA(Fusion Self-Attention)-FPN,設(shè)計(jì)SAU(Self-Attention Upsample)模塊,SAU內(nèi)部結(jié)構(gòu)通過(guò)CNN與自注意力機(jī)制(Self-Attention)進(jìn)行交叉計(jì)算以進(jìn)一步進(jìn)行特征融合,并通過(guò)重構(gòu)FCU(Feature Coupling Unit)消除二者之間的特征錯(cuò)位,彌補(bǔ)語(yǔ)義差距。以YOLOX-Darknet53為主干網(wǎng)絡(luò),在Pascal VOC2007數(shù)據(jù)集上進(jìn)行了對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,對(duì)比原網(wǎng)絡(luò)的FPN,替換FSA-FPN后的平均精度值mAP@[.5:.95]提升了1.5%,預(yù)測(cè)框的位置也更為精準(zhǔn),在需要更高精度的檢測(cè)場(chǎng)景下有更為出色的使用價(jià)值。
摘要:針對(duì)變壓器結(jié)構(gòu)復(fù)雜、維護(hù)成本高等特點(diǎn),提出一種基于深度學(xué)習(xí)的變壓器故障信號(hào)識(shí)別算法。首先分析變壓器工作狀態(tài)下的聲紋信號(hào)并進(jìn)行二維圖像信號(hào)的轉(zhuǎn)換,利用VGG16神經(jīng)網(wǎng)絡(luò)在圖像中的優(yōu)勢(shì),并在此基礎(chǔ)上提出一種MCA注意力機(jī)制,該注意力機(jī)制能夠同時(shí)保留背景信息和細(xì)節(jié)信息;其次對(duì)VGG16中的最大池化下采樣進(jìn)行優(yōu)化,采用一種軟池化的采樣方法,減少圖像中最大池化下采樣帶來(lái)的特征損失;最后為避免過(guò)擬合現(xiàn)象的發(fā)生,將VGG16頂層結(jié)構(gòu)中的激活函數(shù)進(jìn)行優(yōu)化,引用可以自歸一化的SELU激活函數(shù)。實(shí)驗(yàn)證明,廣義S變換是將一維時(shí)域信號(hào)轉(zhuǎn)換為二維圖像信號(hào)的最佳選擇,所提算法對(duì)于6類故障信號(hào)的平均識(shí)別率達(dá)到99.15%。
摘要:深度神經(jīng)網(wǎng)絡(luò)在高維數(shù)據(jù)的分類和預(yù)測(cè)中取得了巨大成功。訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)是數(shù)據(jù)密集型的任務(wù),需從多個(gè)數(shù)據(jù)源收集大規(guī)模的數(shù)據(jù)。這些數(shù)據(jù)中通常包含敏感信息時(shí),使得深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程容易泄露數(shù)據(jù)隱私。針對(duì)訓(xùn)練過(guò)程中的數(shù)據(jù)隱私和通信代價(jià)問(wèn)題,提出了一種深度神經(jīng)網(wǎng)絡(luò)的分布式訓(xùn)練方法,允許基于多個(gè)數(shù)據(jù)源共同訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)。首先,提出了分布式訓(xùn)練架構(gòu),由1個(gè)計(jì)算中心和多個(gè)代理組成。其次,提出了基于多代理的分布式訓(xùn)練算法,允許代理在數(shù)據(jù)不出本地和減少通信代價(jià)的情況下,通過(guò)切割深度神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)分布式地共同訓(xùn)練模型。然后,分析了算法的正確性。最后,實(shí)驗(yàn)結(jié)果表明該方法是有效的。
摘要:為提升普鐵接觸網(wǎng)檢修作業(yè)時(shí)的安全性以及傳輸信息的抗干擾性,設(shè)計(jì)了一套基于人工智能機(jī)器人技術(shù)加LoRa通信技術(shù)的普鐵接觸網(wǎng)狀態(tài)監(jiān)測(cè)系統(tǒng)。該系統(tǒng)主要由在作業(yè)現(xiàn)場(chǎng)內(nèi)具有驗(yàn)電、掛接地線與回流線功能的機(jī)器人作為數(shù)據(jù)采集裝置和作業(yè)現(xiàn)場(chǎng)外對(duì)狀態(tài)信息的傳遞、處理以及在終端實(shí)現(xiàn)可視化監(jiān)測(cè)的模式構(gòu)成。經(jīng)過(guò)監(jiān)測(cè)模擬測(cè)試,機(jī)器人數(shù)據(jù)采集抗干擾結(jié)果符合預(yù)期,同時(shí)LoRa網(wǎng)關(guān)與云服務(wù)器數(shù)據(jù)傳輸正常,PC端可實(shí)現(xiàn)監(jiān)測(cè)狀態(tài)信息可視化查看。
摘要:針對(duì)目前網(wǎng)絡(luò)評(píng)論文本情感分類準(zhǔn)確性不高的問(wèn)題,提出一種基于BERT和雙向門(mén)控循環(huán)單元(BiGRU)的改進(jìn)模型,使用能夠表征文本豐富語(yǔ)義特征的BERT模型進(jìn)行詞向量表示,結(jié)合能夠長(zhǎng)期保留文本上下文關(guān)聯(lián)信息的BiGRU神經(jīng)網(wǎng)絡(luò)提高模型的分類效果,并在此基礎(chǔ)上引入注意力機(jī)制,突出文本中更能表達(dá)分類結(jié)果的情感詞權(quán)重,提高情感分類的準(zhǔn)確率。將上述模型分別在Acllmdb_v1和酒店評(píng)論兩個(gè)公開(kāi)數(shù)據(jù)集上進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明,該模型在中、英文文本情感分類任務(wù)中都獲得了良好的性能。
摘要:道路交通標(biāo)志檢測(cè)是智能交通的重要環(huán)節(jié)之一,針對(duì)交通標(biāo)志檢測(cè)存在背景復(fù)雜、目標(biāo)較小、檢測(cè)速度慢等問(wèn)題,選取工業(yè)界青睞的YOLOv3模型提出一種改進(jìn)的檢測(cè)方法。利用雙向特征金字塔結(jié)構(gòu)實(shí)現(xiàn)圖像低、中、高層特征語(yǔ)意信息的雙向融合,提升低層預(yù)測(cè)目標(biāo)的分類和高層預(yù)測(cè)目標(biāo)的定位能力;將原模型的主干特征提取網(wǎng)絡(luò)進(jìn)行改進(jìn),提出Darknet23網(wǎng)絡(luò),以提高網(wǎng)絡(luò)的提取能力和減少計(jì)算量;根據(jù)目標(biāo)形狀的特點(diǎn),使用K-means聚類算法得到用于訓(xùn)練合適的錨點(diǎn)框,并在邊框回歸中引入靈活性更強(qiáng)的L_(α-CIOU)損失函數(shù),使網(wǎng)絡(luò)朝著預(yù)測(cè)框與真實(shí)框重疊度較高的方向去優(yōu)化。實(shí)驗(yàn)結(jié)果表明,該方法在CCTSDB數(shù)據(jù)集上mAP@0.75達(dá)到86.10%、mAP@0.5:0.05:0.95達(dá)到70.017%,相比原網(wǎng)絡(luò)分別提升10.17%和5.656%,參數(shù)量減少3 622 091,速度提升8.27 f/s,且優(yōu)于SSD和Faster RCNN等主流的檢測(cè)網(wǎng)絡(luò)。
摘要:近年來(lái),隨著大數(shù)據(jù)時(shí)代進(jìn)入人類的生活之后,人們的生活中出現(xiàn)很多無(wú)法識(shí)別的文本、語(yǔ)義等其他數(shù)據(jù),這些數(shù)據(jù)的量十分龐大,語(yǔ)義也錯(cuò)綜復(fù)雜,這使得分類任務(wù)更加困難。如何讓計(jì)算機(jī)對(duì)這些信息進(jìn)行準(zhǔn)確的分類,已成為當(dāng)前研究的重要任務(wù)。在此過(guò)程中,中文新聞文本分類成為這個(gè)領(lǐng)域的一個(gè)分支,這對(duì)國(guó)家輿論的控制、用戶日常行為了解、用戶未來(lái)言行的預(yù)判都有著至關(guān)重要的作用。針對(duì)新聞文本分類模型參數(shù)量多和訓(xùn)練時(shí)間過(guò)長(zhǎng)的不足,在最大限度保留模型性能的情況下壓縮訓(xùn)練時(shí)間,力求二者折中,故提出基于BERT-CNN的知識(shí)蒸餾。根據(jù)模型壓縮的技術(shù)特點(diǎn),將BERT作為教師模型,CNN作為學(xué)生模型,先將BERT進(jìn)行預(yù)訓(xùn)練后再讓學(xué)生模型泛化教師模型的能力。實(shí)驗(yàn)結(jié)果表明,在模型性能損失約2.09%的情況下,模型參數(shù)量壓縮約為原來(lái)的1/82,且時(shí)間縮短約為原來(lái)的1/670。
摘要:在無(wú)聲或噪聲干擾嚴(yán)重的環(huán)境下,或?qū)τ诖嬖诼?tīng)覺(jué)障礙的人群,唇語(yǔ)識(shí)別至關(guān)重要。針對(duì)詞語(yǔ)級(jí)中文唇語(yǔ)識(shí)別的問(wèn)題,提出了SinoLipReadingNet模型,前端采用Conv3D+ResNet34結(jié)構(gòu)用于時(shí)空特征提取,后端分別采用Conv1D結(jié)構(gòu)和Bi-LSTM結(jié)構(gòu)用于分類預(yù)測(cè),并引入Self-Attention、CTCLoss對(duì)Bi-LSTM后端進(jìn)行改進(jìn)。最終在新網(wǎng)銀行唇語(yǔ)識(shí)別數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明,SinoLipReadingNet模型在識(shí)別準(zhǔn)確率上明顯優(yōu)于中科院D3D模型,多模型融合的預(yù)測(cè)準(zhǔn)確率達(dá)到了77.64%,平均字錯(cuò)率為21.68%。
摘要:為了解決常見(jiàn)目標(biāo)檢測(cè)算法在課堂場(chǎng)景中難以有效應(yīng)用的問(wèn)題,提出了一種融合輕量化與梯形結(jié)構(gòu)的學(xué)生行為檢測(cè)算法。該算法基于YOLOv4架構(gòu),針對(duì)目標(biāo)分類和分布空間的特點(diǎn),提出一種新的“梯”形特征融合結(jié)構(gòu),并結(jié)合MobileNetv2思想,優(yōu)化模型參數(shù)得到梯形-MobileDarknet19特征提取網(wǎng)絡(luò),既減少了網(wǎng)絡(luò)的計(jì)算量,提高了工作效率,同時(shí)加強(qiáng)了目標(biāo)特征的信息傳輸,提升了模型學(xué)習(xí)能力;在尺度檢測(cè)階段引入5層的DenseNet網(wǎng)絡(luò),增強(qiáng)網(wǎng)絡(luò)對(duì)小目標(biāo)的檢測(cè)能力。實(shí)驗(yàn)結(jié)果表明,提出的YOLOv4-ST算法相比于原YOLOv4算法mAP提高了5.5%,相比于其他主流算法,在學(xué)生課堂行為檢測(cè)任務(wù)中具有較好的實(shí)用性。
摘要:在復(fù)雜的靶場(chǎng)試驗(yàn)場(chǎng)景中,試驗(yàn)現(xiàn)場(chǎng)常常涉及揚(yáng)塵、強(qiáng)光、遮擋等多變的自然環(huán)境。針對(duì)這種情況下快速運(yùn)動(dòng)的目標(biāo)物體跟蹤,提出了一種關(guān)聯(lián)動(dòng)態(tài)特征的單目標(biāo)跟蹤算法。首先使用門(mén)控循環(huán)單元(Gated Recurrent Unit,GRU)提取待跟蹤目標(biāo)的時(shí)序動(dòng)態(tài)特征,獲得候選處理目標(biāo)框集合;然后利用卷積網(wǎng)絡(luò)(Convolutional Neural Network,CNN)提取候選目標(biāo)框的深度卷積特征并確定目標(biāo)位置,同時(shí)分離出背景卷積特征;在跟蹤過(guò)程中,使用分離出的背景卷積特征圖對(duì)網(wǎng)絡(luò)進(jìn)行參數(shù)更新,增強(qiáng)網(wǎng)絡(luò)的魯棒性與自適應(yīng)性。實(shí)驗(yàn)結(jié)果表明,所提出的算法可以對(duì)靶場(chǎng)圖像采集系統(tǒng)中的被試移動(dòng)目標(biāo)進(jìn)行自適應(yīng)跟蹤,并且在復(fù)雜環(huán)境背景下算法仍能保持優(yōu)異的魯棒性與適應(yīng)性。
摘要:實(shí)體對(duì)齊是實(shí)現(xiàn)對(duì)不同來(lái)源知識(shí)庫(kù)進(jìn)行融合的重要技術(shù)方法,在知識(shí)圖譜、知識(shí)補(bǔ)全領(lǐng)域具有廣泛應(yīng)用?,F(xiàn)有基于圖注意力的實(shí)體對(duì)齊模型多使用靜態(tài)圖注意力網(wǎng)絡(luò)且忽略了實(shí)體屬性中的語(yǔ)義信息,導(dǎo)致模型存在有限注意、難以擬合、表達(dá)能力不足等問(wèn)題。針對(duì)這些問(wèn)題,開(kāi)展基于動(dòng)態(tài)圖注意力結(jié)構(gòu)建模實(shí)體對(duì)齊方法研究,首先使用圖卷積層建模目標(biāo)實(shí)體的單跳節(jié)點(diǎn)表示,其次應(yīng)用動(dòng)態(tài)圖注意力網(wǎng)絡(luò)獲得多跳節(jié)點(diǎn)注意力系數(shù)并建模,再次利用逐層門(mén)控網(wǎng)絡(luò)聚合圖卷積層與動(dòng)態(tài)圖注意力層輸出的單跳、多跳節(jié)點(diǎn)信息,最后拼接通過(guò)外部知識(shí)預(yù)訓(xùn)練自然語(yǔ)言模型提取的實(shí)體名稱屬性嵌入并進(jìn)行相似度計(jì)算。該方法在DBP15K的三類跨語(yǔ)言數(shù)據(jù)集中都獲得了一定的提高,證明了應(yīng)用動(dòng)態(tài)圖注意力網(wǎng)絡(luò)與融入實(shí)體屬性語(yǔ)義在提高實(shí)體表示能力上的有效性。
摘要:隨著各工業(yè)領(lǐng)域的快速發(fā)展,市場(chǎng)對(duì)薄規(guī)格、高強(qiáng)度板帶產(chǎn)品的需求快速增加。而熱軋板帶橫斷面形狀是熱軋板帶產(chǎn)品質(zhì)量的主要評(píng)價(jià)指標(biāo)。基于數(shù)據(jù)挖掘技術(shù),對(duì)軋機(jī)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分析與處理,其中數(shù)據(jù)挖掘技術(shù)采用深度置信網(wǎng)絡(luò)(Deep Belief Neural,DBN)和BP(Back Propagation)算法相結(jié)合,構(gòu)建板帶橫向厚度分布的預(yù)測(cè)模型。DBN-BP算法由多個(gè)限制玻爾茲曼網(wǎng)絡(luò)(Restricted Botlzmann Machine,RBM)逐層堆疊而成,并使用無(wú)監(jiān)督的逐層訓(xùn)練的方式得到網(wǎng)絡(luò)的權(quán)值矩陣和偏置供BP算法使用,而B(niǎo)P算法通過(guò)誤差反向傳播的方式對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行微調(diào)。該方法克服了BP算法因隨機(jī)初始化權(quán)值參數(shù)而陷入局部最優(yōu)和訓(xùn)練時(shí)間長(zhǎng)的缺點(diǎn)。通過(guò)與BP算法相比較可知,采用DBN-BP方法預(yù)測(cè)終軋道次穩(wěn)定軋制時(shí)板帶中點(diǎn)厚度誤差在±5.6 μm范圍內(nèi)的概率可達(dá)95%;而B(niǎo)P算法的預(yù)測(cè)誤差范圍為±11 μm。并且通過(guò)對(duì)板帶橫斷面形狀的預(yù)測(cè)結(jié)果分析可知,相比于BP算法,DBN-BP深度學(xué)習(xí)方法對(duì)于板帶邊部厚度的預(yù)測(cè)更具有優(yōu)勢(shì)。
摘要:情緒與人類的行為、家庭及社會(huì)密切相關(guān)。情緒不僅能反映人類的各種感覺(jué)、思想和行為,而且也是各種外部刺激所產(chǎn)生的心理和生理反應(yīng),所以在很多領(lǐng)域中對(duì)情緒的正確識(shí)別十分重要。情緒的變化會(huì)導(dǎo)致腦電圖(EEG)信號(hào)發(fā)生變化,反之,這些變化也反映了情緒狀態(tài)?;贒EAP數(shù)據(jù)庫(kù),對(duì)EEG信號(hào)進(jìn)行時(shí)域特征和頻域特征提取,通過(guò)PCA主成分分析法對(duì)特征進(jìn)行降維處理。利用加權(quán)KNN算法進(jìn)行5折交叉驗(yàn)證訓(xùn)練,最終對(duì)興奮(excited)、放松(relaxed)、沮喪(depressed)、憤怒(angry)4種情緒狀態(tài)的識(shí)別準(zhǔn)確率達(dá)到80%。
摘要:在信息化戰(zhàn)爭(zhēng)中,人機(jī)交互在指揮控制裝備中的應(yīng)用日益廣泛。采用語(yǔ)音識(shí)別方式代替鍵盤(pán)、旋鈕、按鍵等方式更改電臺(tái)參數(shù),使其操作更智能化、更便捷。本系統(tǒng)將LD3320語(yǔ)音識(shí)別芯片采集到的語(yǔ)音進(jìn)行處理,通過(guò)主控芯片STM32F407發(fā)送相關(guān)協(xié)議控制電臺(tái)的系列操作。通過(guò)實(shí)驗(yàn)表明,該系統(tǒng)在語(yǔ)音識(shí)別識(shí)別率達(dá)到95%左右,能實(shí)現(xiàn)對(duì)電臺(tái)的改頻、開(kāi)關(guān)等操作。
摘要:局部放電是設(shè)備處于高電場(chǎng)強(qiáng)下,由于電場(chǎng)分布不均而導(dǎo)致的絕緣介質(zhì)放電現(xiàn)象,設(shè)備產(chǎn)生局部放電對(duì)于絕緣層的危害很大,迅速檢測(cè)識(shí)別設(shè)備的放電類型是工業(yè)正常運(yùn)作的保障。針對(duì)電氣設(shè)備局部放電類型識(shí)別問(wèn)題,考慮到電氣設(shè)備監(jiān)測(cè)系統(tǒng)在診斷識(shí)別方面的時(shí)效性及精度,提出了基于邊緣計(jì)算的局部放電模式識(shí)別方法,利用邊緣計(jì)算架構(gòu)的優(yōu)勢(shì),基于云層訓(xùn)練、邊緣推理思路,將復(fù)雜的識(shí)別算法訓(xùn)練優(yōu)化過(guò)程部署在云層,將計(jì)算量大的識(shí)別算法卸載到邊緣層,而計(jì)算量小的特征提取保留在終端設(shè)備層處理。通過(guò)構(gòu)造局部放電相位分布譜圖提取局部放電的統(tǒng)計(jì)特征參數(shù),采用粒子群優(yōu)化算法對(duì)廣義回歸神經(jīng)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化,最后將統(tǒng)計(jì)特征參數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入量,對(duì)放電類型進(jìn)行識(shí)別。結(jié)果表明,所提模式識(shí)別方法識(shí)別準(zhǔn)確率高,識(shí)別效率高。
摘要:現(xiàn)有的基于圖神經(jīng)網(wǎng)絡(luò)的推薦算法能夠利用圖結(jié)構(gòu)信息使得推薦效果得到較好的提升,但主要的圖結(jié)構(gòu)都是圍繞著用戶和項(xiàng)目的一種交互,卻忽略了用戶的多種行為,如點(diǎn)擊、收藏、分享、加入購(gòu)物車等都表達(dá)著用戶不同的語(yǔ)義;又如評(píng)論信息,可能影響著該類型物品的下一次購(gòu)買(mǎi)意圖。為此提出一種基于用戶行為和評(píng)論信息的圖神經(jīng)網(wǎng)絡(luò)推薦算法,算法通過(guò)圖卷積網(wǎng)絡(luò)學(xué)習(xí)用戶行為的強(qiáng)度及語(yǔ)義,再利用評(píng)論文本圖表示學(xué)習(xí)評(píng)論中用戶和商品的偏好,最后進(jìn)行融合提升推薦效果。實(shí)驗(yàn)結(jié)果表明,該算法對(duì)于推薦效果有一定的提升。
摘要:隨著電動(dòng)汽車規(guī)?;l(fā)展,充電站負(fù)荷對(duì)電網(wǎng)造成一定影響,為保障電網(wǎng)平穩(wěn)運(yùn)行,提出一種基于極端梯度提升(eXtreme Gradient Boosting,XGBoost)與輕量級(jí)梯度提升機(jī)(Light Gradient Boosting Machine,LightGBM)融合的電動(dòng)汽車充電負(fù)荷預(yù)測(cè)模型。該方法運(yùn)用Stacking集成學(xué)習(xí)的策略:首先根據(jù)時(shí)間特征與歷史負(fù)荷數(shù)據(jù)采用XGBoost與LightGBM算法構(gòu)建負(fù)荷預(yù)測(cè)的基學(xué)習(xí)器,然后采用嶺回歸(Ridge Regression,RR)算法將基學(xué)習(xí)器的輸出結(jié)果進(jìn)行融合之后輸出負(fù)荷預(yù)測(cè)值。為了對(duì)比多種不同的負(fù)荷預(yù)測(cè)模型,采用上海市嘉定區(qū)的充電站訂單數(shù)據(jù)進(jìn)行試驗(yàn),結(jié)果表明,該方法所構(gòu)建的負(fù)荷預(yù)測(cè)模型相比單一算法模型具有更高的預(yù)測(cè)準(zhǔn)確度,對(duì)電網(wǎng)平穩(wěn)運(yùn)行有一定理論及實(shí)用價(jià)值。
摘要:對(duì)基于極化SAR影像的地物分類技術(shù)發(fā)展進(jìn)行歸納與總結(jié)。首先提出地物分類技術(shù)的價(jià)值需求和應(yīng)用特點(diǎn),對(duì)其所要解決的科學(xué)問(wèn)題進(jìn)行歸納;其次總結(jié)分析極化SAR影像分類的一般技術(shù)流程;進(jìn)一步對(duì)國(guó)內(nèi)外研究現(xiàn)狀與技術(shù)算法特點(diǎn)進(jìn)行分類梳理,提出其在理論方法與地物分類應(yīng)用中的技術(shù)優(yōu)缺點(diǎn),尤其對(duì)基于人工智能理論的極化SAR影像地物分類技術(shù)進(jìn)行探討;最后結(jié)合SAR遙感的發(fā)展趨勢(shì),指出未來(lái)極化SAR影像地物智能分類技術(shù)的研究方向。
摘要:隨著車聯(lián)網(wǎng)的快速發(fā)展,車載應(yīng)用大多是計(jì)算密集和延遲敏感的。車輛是資源受限的設(shè)備,無(wú)法為這些應(yīng)用提供所需的計(jì)算和存儲(chǔ)資源。邊緣計(jì)算通過(guò)將計(jì)算和存儲(chǔ)資源提供給網(wǎng)絡(luò)邊緣的車輛,有望成為滿足低延遲需求的有效解決方案。這種將任務(wù)卸載到邊緣服務(wù)器的計(jì)算模式不僅可以克服車輛資源的不足,還可以避免將任務(wù)卸載到云可能導(dǎo)致的高延遲。提出了一種基于深度強(qiáng)化學(xué)習(xí)的任務(wù)卸載方法,以最小化任務(wù)的平均完成時(shí)間。首先,把多任務(wù)卸載決策問(wèn)題規(guī)約為優(yōu)化問(wèn)題。其次,使用深度強(qiáng)化學(xué)習(xí)對(duì)優(yōu)化問(wèn)題進(jìn)行求解,以獲得具有最小完成時(shí)間的優(yōu)化卸載策略。最后,實(shí)驗(yàn)結(jié)果表明,該方法的性能優(yōu)于其他基準(zhǔn)方法。
摘要:目標(biāo)檢測(cè)算法在視頻監(jiān)控領(lǐng)域有著較大的實(shí)用價(jià)值。針對(duì)當(dāng)前在資源受限的視頻監(jiān)控系統(tǒng)中實(shí)現(xiàn)實(shí)時(shí)目標(biāo)檢測(cè)較為困難的情況,提出了一種基于YOLOv3-tiny改進(jìn)的目標(biāo)檢測(cè)算法。該算法在YOLOv3-tiny架構(gòu)的基礎(chǔ)之上,通過(guò)添加特征重用來(lái)優(yōu)化骨干網(wǎng)絡(luò)結(jié)構(gòu),并提出全連接注意力混合模塊來(lái)學(xué)習(xí)到更豐富的空間信息,更適合資源約束條件下的目標(biāo)檢測(cè)。實(shí)驗(yàn)數(shù)據(jù)表明,該算法相比于YOLOv3-tiny在模型體積降低39.2%,參數(shù)量降低39.8%,且在VOC數(shù)據(jù)集上提高了2.7%的mAP,在提高檢測(cè)精度的同時(shí)顯著降低了模型資源占用。
摘要:針對(duì)臨床醫(yī)生在診斷肝包蟲(chóng)病時(shí)需要通過(guò)個(gè)人經(jīng)驗(yàn)判斷囊型肝包蟲(chóng)病分型,研究基于目標(biāo)檢測(cè)算法的肝包蟲(chóng)病灶自動(dòng)檢測(cè)與分類模型,實(shí)現(xiàn)對(duì)肝包蟲(chóng)病超聲影像的自動(dòng)識(shí)別與分類。使用YOLOv5l模型作為囊型肝包蟲(chóng)病病灶目標(biāo)檢測(cè)的模型,利用本地肝包蟲(chóng)病超聲影像數(shù)據(jù)集對(duì)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。基于YOLOv5l模型與隨機(jī)梯度下降算法(SGD)優(yōu)化算法的肝包蟲(chóng)病病灶自動(dòng)檢測(cè)分類模型可以很好地對(duì)5種類型的病灶進(jìn)行有效的檢測(cè),平均精度均值(mAP)為88.1%,經(jīng)過(guò)測(cè)試,該模型的測(cè)試速度可達(dá)40 f/s。實(shí)驗(yàn)結(jié)果表明,基于YOLOv5l與SGD算法的肝包蟲(chóng)病病灶自動(dòng)檢測(cè)分類模型能夠較好地識(shí)別病灶的具體位置,可以很好地輔助醫(yī)生診斷肝包蟲(chóng)病。
摘要:車輛屬性檢測(cè)是一個(gè)基礎(chǔ)任務(wù),其屬性檢測(cè)結(jié)果可以被應(yīng)用到很多下游的交通視覺(jué)任務(wù)。提出了一種基于YOLOv5的車輛屬性檢測(cè)改進(jìn)算法。針對(duì)檢測(cè)目標(biāo)較小的問(wèn)題,加入了卷積注意力模塊,讓網(wǎng)絡(luò)模型把更多的注意力放在小目標(biāo)對(duì)象上;針對(duì)數(shù)據(jù)集樣本種類較少的問(wèn)題,改進(jìn)了YOLOv5的馬賽克數(shù)據(jù)增強(qiáng)方式;使用自門(mén)控激活函數(shù)Swish,起到抑制噪聲、加快收斂速度并提升模型魯棒性的作用。此外,還在公開(kāi)車輛數(shù)據(jù)集VeRi-776的基礎(chǔ)上進(jìn)行了詳細(xì)的車輛屬性標(biāo)注,構(gòu)建了一個(gè)車輛屬性數(shù)據(jù)集。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法比原始YOLOv5的平均精確率提升了4.6%,能夠準(zhǔn)確地檢測(cè)到車輛圖像的通用屬性,可以供下游任務(wù)使用。
摘要:癌癥患者的激增引起了全世界的關(guān)注,許多研究者將目光放在了對(duì)化合物致癌性的評(píng)估上,但這是一項(xiàng)極其具有挑戰(zhàn)性的任務(wù)。本實(shí)驗(yàn)獲取了341種實(shí)驗(yàn)數(shù)據(jù),利用三維圖卷積網(wǎng)絡(luò)(SGCN),建立了對(duì)化合物致癌性的預(yù)測(cè)模型。結(jié)果表明:對(duì)化合物進(jìn)行致癌性預(yù)測(cè)的SGCN分類模型準(zhǔn)確率高達(dá)96.9%,比其余模型效果更好,這表明SGCN模型能夠準(zhǔn)確地對(duì)化學(xué)品進(jìn)行分類,并且在實(shí)際應(yīng)用中具有相當(dāng)大的潛力。
摘要:現(xiàn)有的空氣質(zhì)量預(yù)測(cè)方法很少考慮季節(jié)性因素,且預(yù)測(cè)的效果不佳,因此提出一種基于改進(jìn)二元混沌烏鴉搜索算法(Binary Chaotic Crow Search Algorithm,BCCSA)和深層長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory,LSTM)的空氣質(zhì)量預(yù)測(cè)方法。首先提出季節(jié)調(diào)整的方法對(duì)收集的原始空氣質(zhì)量數(shù)據(jù)進(jìn)行預(yù)處理,以消除季節(jié)對(duì)預(yù)測(cè)的影響;然后提出改進(jìn)BCCSA,對(duì)空氣質(zhì)量數(shù)據(jù)進(jìn)行優(yōu)化處理;最后,將自注意力機(jī)制加入到深層LSTM中,對(duì)空氣質(zhì)量數(shù)據(jù)進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,該方法能有效地提高空氣質(zhì)量的預(yù)測(cè)精度。
摘要:針對(duì)腦電信號(hào)(EEG)運(yùn)動(dòng)想象分類過(guò)程中弱相關(guān)特征量影響分類準(zhǔn)確度的問(wèn)題,提出一種篩選方法,該方法是基于α波和主成分分析(PCA)算法的?;谀X機(jī)接口(BCI)系統(tǒng),通過(guò)聽(tīng)覺(jué)誘發(fā)刺激產(chǎn)生向左和向右兩種運(yùn)動(dòng)想象任務(wù)對(duì)應(yīng)的腦電信號(hào),并對(duì)其做小波包分解處理,然后進(jìn)行腦電α頻段信號(hào)的重構(gòu),從而提取出α波形并對(duì)其進(jìn)行統(tǒng)計(jì)特征提取。再結(jié)合PCA技術(shù)和支持向量機(jī)(SVM)方法,實(shí)現(xiàn)弱相關(guān)特征的剔除和特征分類。根據(jù)篩選后的數(shù)據(jù)進(jìn)行分類,所得結(jié)果準(zhǔn)確率更高,信號(hào)分類的準(zhǔn)確度由90.1%提高至94.0%。
摘要:隨著近年來(lái)人機(jī)語(yǔ)音交互場(chǎng)景不斷增加,利用麥克風(fēng)陣列語(yǔ)音增強(qiáng)提高語(yǔ)音質(zhì)量成為研究熱點(diǎn)之一。與環(huán)境噪聲不同,多說(shuō)話人分離場(chǎng)景下干擾說(shuō)話人語(yǔ)音與目標(biāo)說(shuō)話人同為語(yǔ)音信號(hào),呈現(xiàn)類似的時(shí)、頻特性,對(duì)傳統(tǒng)麥克風(fēng)陣列語(yǔ)音增強(qiáng)技術(shù)提出更高的挑戰(zhàn)。針對(duì)多說(shuō)話人分離場(chǎng)景,基于深度學(xué)習(xí)網(wǎng)絡(luò)構(gòu)建麥陣空間響應(yīng)代價(jià)函數(shù)并進(jìn)行優(yōu)化,通過(guò)深度學(xué)習(xí)模型訓(xùn)練設(shè)計(jì)麥克風(fēng)陣列期望空間傳輸特性,從而通過(guò)改善波束指向性能提高分離效果。仿真和實(shí)驗(yàn)結(jié)果表明,該方法有效提高了多說(shuō)話人分離性能。
摘要:城市交通日益擁堵的今天,為用戶推薦最快行駛路線成為一個(gè)研究熱點(diǎn)。行駛路線推薦的核心問(wèn)題是對(duì)路線將來(lái)某段時(shí)間(途徑這段線路時(shí))交通狀況的預(yù)測(cè)。交通狀況受到路線本身狀況、行駛時(shí)間、天氣狀況、駕駛員習(xí)慣等多種因素影響,其變化快、變化方式復(fù)雜,難以準(zhǔn)確預(yù)測(cè)。對(duì)多階馬爾可夫鏈模型進(jìn)行了改進(jìn),提高了運(yùn)算效率和響應(yīng)速度,建立一種高效的交通狀況預(yù)測(cè)模型,經(jīng)北京市實(shí)際交通數(shù)據(jù)的檢驗(yàn),得到了比較好的預(yù)測(cè)效果。
摘要:佩戴口罩可以有效預(yù)防病毒的傳播,為減少通過(guò)人工方式檢查口罩佩戴情況所消耗的大量人力資源,提出一種基于深度學(xué)習(xí)的口罩佩戴檢測(cè)與跟蹤方法,該方法分為檢測(cè)和跟蹤兩個(gè)模塊。檢測(cè)模塊在YOLOv3網(wǎng)絡(luò)的基礎(chǔ)上引入空間金字塔池化結(jié)構(gòu),實(shí)現(xiàn)不同尺度的特征融合;然后將損失函數(shù)改為CIoU損失,減少回歸誤差,提升檢測(cè)精度,為后續(xù)跟蹤模塊提供良好的條件。跟蹤模塊采用多目標(biāo)跟蹤算法Deep SORT,對(duì)檢測(cè)到的目標(biāo)進(jìn)行實(shí)時(shí)跟蹤,有效防止重復(fù)檢測(cè),改善被遮擋目標(biāo)的跟蹤效果。測(cè)試結(jié)果表明,該方法的檢測(cè)速度為38 f/s,平均精度值達(dá)到為85.23%,相比原始YOLOv3算法提高了4%,能達(dá)到實(shí)時(shí)檢測(cè)口罩佩戴情況的效果。
摘要:針對(duì)水下機(jī)器人對(duì)于探測(cè)海洋具有的高靈敏度、低成本、易攜帶特點(diǎn)的要求,設(shè)計(jì)和實(shí)現(xiàn)面向水下目標(biāo)的雙目視覺(jué)測(cè)距檢測(cè)方法。采用張正友標(biāo)定算法,通過(guò)使用9×9棋盤(pán)獲取水下雙目相機(jī)的內(nèi)外矩陣模型的參數(shù),采用SGBM(Semi-Global Block Matching)立體匹配算法,增強(qiáng)了圖像的對(duì)比度,削弱了圖像色斑的影響,保證了算法的魯棒性,提升了匹配搜索速度。將視差圖通過(guò)矩陣運(yùn)算轉(zhuǎn)化成深度圖,并將其映射成可視化點(diǎn)云,構(gòu)建目標(biāo)物體的三維立體信息。
摘要:推薦效率低、推薦質(zhì)量有待提高等問(wèn)題普遍存在于傳統(tǒng)協(xié)同過(guò)濾推薦算法中,為了改善并解決這些問(wèn)題,在協(xié)同過(guò)濾推薦算法中將混合聚類與用戶興趣偏好融合,經(jīng)過(guò)驗(yàn)證推薦質(zhì)量有顯著提升。首先根據(jù)用戶的個(gè)人相關(guān)信息構(gòu)建Canopy+bi-Kmeans的一種多重混合聚類模型,采用提出的混合聚類模型把所有用戶劃分成多個(gè)聚類簇,將每個(gè)用戶的興趣偏好融合到生成的聚類簇中,形成新的相似度計(jì)算模型;其次利用基于TF-IDF算法的權(quán)重歸類方法計(jì)算用戶對(duì)標(biāo)簽的權(quán)重,并使融入時(shí)間系數(shù)的指數(shù)衰減函數(shù)捕捉用戶興趣偏好隨時(shí)間的變化;最后使用加權(quán)融合將用戶偏好和混合聚類模型相結(jié)合,匹配到更相似的鄰居用戶,計(jì)算出項(xiàng)目評(píng)分并進(jìn)行推薦。利用公開(kāi)數(shù)據(jù)集對(duì)比實(shí)驗(yàn)證明,提出的方法能夠提高推薦質(zhì)量和推薦可靠性。
摘要:隨著船舶智能化水平提高,船載遠(yuǎn)程會(huì)議系統(tǒng)對(duì)提高應(yīng)急處理能力、推進(jìn)船岸一體化網(wǎng)絡(luò)建設(shè)有重要意義,麥克風(fēng)陣列是保證遠(yuǎn)程會(huì)議系統(tǒng)語(yǔ)音效果和支持多模態(tài)交互的重要語(yǔ)音前端。但船舶艙室狹小尺寸一方面導(dǎo)致只能采用小尺寸麥陣,另一方面小艙室導(dǎo)致的強(qiáng)混響以及嘈雜艙室噪聲也使傳統(tǒng)麥克風(fēng)陣列算法性能嚴(yán)重下降。考慮船舶艙室復(fù)雜環(huán)境下小尺寸麥陣DOA估計(jì)場(chǎng)景,提出了一種輕量級(jí)Mask-DOA估計(jì)神經(jīng)網(wǎng)絡(luò)模型。該方法在DOA估計(jì)神經(jīng)網(wǎng)絡(luò)引入Mask算法降低噪聲和混響的干擾,并提取增強(qiáng)后的GCC-PHAT作為網(wǎng)絡(luò)特征,從而在小尺寸麥陣上實(shí)現(xiàn)高精度DOA估計(jì)。仿真和實(shí)驗(yàn)結(jié)果表明,所提出的Mask-DOA模型面對(duì)復(fù)雜的船舶艙室環(huán)境更魯棒,泛化能力更強(qiáng)。
摘要:交通標(biāo)志在車輛的安全行駛和自動(dòng)駕駛中都有著大量的研究。由于交通標(biāo)志的種類繁多且受各種因素的影響,交通標(biāo)志的分類檢測(cè)也是一個(gè)具有挑戰(zhàn)的難題。為此,提出了一種標(biāo)簽結(jié)合現(xiàn)實(shí)道路場(chǎng)景的交通標(biāo)志分類檢測(cè)方法,該方法分為數(shù)據(jù)生成部分和目標(biāo)檢測(cè)部分。實(shí)驗(yàn)結(jié)果表明,利用該方法生成訓(xùn)練數(shù)據(jù),能夠有效地訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)現(xiàn)實(shí)場(chǎng)景交通標(biāo)志的分類檢測(cè),并且優(yōu)化的檢測(cè)模型相比文中提到的模型具有更小的體積和更快的速度。
摘要:電磁導(dǎo)引是一種車輛自動(dòng)導(dǎo)引方案,廣泛應(yīng)用于工業(yè)、物流等領(lǐng)域。為解決現(xiàn)有電磁導(dǎo)引方案對(duì)車輛機(jī)械結(jié)構(gòu)要求較高、易受傳感器預(yù)瞄距離短的限制、難以應(yīng)用于小型自動(dòng)導(dǎo)引車輛的問(wèn)題,提出了一種基于全連接神經(jīng)網(wǎng)絡(luò)的導(dǎo)引方案。通過(guò)數(shù)據(jù)分析尋找有限預(yù)瞄距離內(nèi)的最優(yōu)傳感器排布方案,設(shè)計(jì)和訓(xùn)練全連接神經(jīng)網(wǎng)絡(luò)模型,對(duì)車身姿態(tài)及車后道路的信息進(jìn)行全面預(yù)測(cè),以彌補(bǔ)傳感器短預(yù)瞄所造成的前向道路探測(cè)能力的不足。經(jīng)模擬和實(shí)際測(cè)試,該方案能極大改善較小體積車輛的短預(yù)瞄電磁導(dǎo)引系統(tǒng)的控制效果,實(shí)現(xiàn)車輛的穩(wěn)定快速運(yùn)行。
摘要:當(dāng)前使用門(mén)控循環(huán)單元(Gated Recurrent Units,GRU)神經(jīng)網(wǎng)絡(luò)進(jìn)行流量預(yù)測(cè)時(shí),普遍存在滯后性以及預(yù)測(cè)準(zhǔn)確性不高的問(wèn)題,因此提出一種改進(jìn)的GRU模型進(jìn)行流量預(yù)測(cè)的方法。首先基于GRU神經(jīng)網(wǎng)絡(luò)提出一種雙向GRU神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)堆疊的網(wǎng)絡(luò)模型,適用于流量特征、時(shí)間特征、事件特征等多維向量的輸入;同時(shí)為解決部分時(shí)間段準(zhǔn)確度不高的問(wèn)題,將訓(xùn)練樣本進(jìn)行日期分類,針對(duì)每一類日期生成單獨(dú)的網(wǎng)絡(luò)模型,能大幅提升預(yù)測(cè)的準(zhǔn)確度以及改善預(yù)測(cè)的滯后性。最后,為了提升流量峰值的預(yù)測(cè)準(zhǔn)確度,采用樣本的再平衡手段以及自定義損失函數(shù),實(shí)驗(yàn)結(jié)果表明,能較好地達(dá)成預(yù)期目標(biāo)。
摘要:互聯(lián)網(wǎng)對(duì)人民群眾的生活和工作產(chǎn)生了重要影響,然而網(wǎng)絡(luò)空間中隱藏著大量有害的博彩網(wǎng)站或賭博網(wǎng)站,很容易給網(wǎng)民造成損失和困擾,甚至可能擾亂社會(huì)秩序,因而研究對(duì)此類網(wǎng)站進(jìn)行高效識(shí)別的方法具有重要意義。提出利用深度殘差神經(jīng)網(wǎng)絡(luò)解決博彩類網(wǎng)頁(yè)識(shí)別問(wèn)題,基于深度殘差網(wǎng)絡(luò)的原理設(shè)計(jì)了算法GamblingRec。經(jīng)驗(yàn)證,算法準(zhǔn)確率達(dá)到了95.16%,正樣本召回率為93.21%,表明基于深度殘差神經(jīng)網(wǎng)絡(luò)的方法能夠用于博彩類網(wǎng)頁(yè)識(shí)別,并能達(dá)到較高的識(shí)別性能。
摘要:針對(duì)當(dāng)下球類陪練機(jī)器人人機(jī)交互能力不足的問(wèn)題,提出一種基于樹(shù)莓派和YOLOv5目標(biāo)檢測(cè)算法的新型人機(jī)交互模式,使機(jī)器人實(shí)現(xiàn)前進(jìn)、后退、左移、右移、拋球、踢球6種不同的動(dòng)作;通過(guò)對(duì)在3種不同環(huán)境(室內(nèi)、室外晴天、室外陰天)下搜集的人體姿態(tài)數(shù)據(jù)集進(jìn)行標(biāo)定、訓(xùn)練后,得到6種姿態(tài)在3種環(huán)境中測(cè)試集上的識(shí)別準(zhǔn)確率分別為:室內(nèi)96.33%、室外晴天95%、室外陰天94.3%。相比基于特征匹配和其他利用手勢(shì)等小目標(biāo)檢測(cè)的算法,基于該算法的機(jī)器人具有更高的檢測(cè)速度和準(zhǔn)確性,使機(jī)器人更加智能化。
摘要:針對(duì)生活垃圾的高效分類及搬運(yùn)處理,設(shè)計(jì)了一款以邊緣嵌入式AI設(shè)備Jetson Nano為控制器的光電智能小車系統(tǒng),該系統(tǒng)設(shè)計(jì)以YOLOv5為目標(biāo)檢測(cè)算法,以Pytorch1.8.1為深度學(xué)習(xí)框架。使智能小車從指定區(qū)域出發(fā),通過(guò)自身的光電傳感器在指定范圍內(nèi)搜尋垃圾,利用六軸機(jī)械臂對(duì)垃圾進(jìn)行分揀并送到指定分類地點(diǎn)。對(duì)采集到的5 048張圖片(包括5種垃圾類別)進(jìn)行300次的迭代訓(xùn)練,實(shí)驗(yàn)測(cè)試結(jié)果表明:平均精確度達(dá)到91.8%,準(zhǔn)確率達(dá)到94.5%,召回率達(dá)到89.03%。
摘要:近年來(lái),如何通過(guò)人工智能對(duì)人的面部表情進(jìn)行識(shí)別分析成為一個(gè)研究熱點(diǎn),利用人工智能可以快速地分析人的面部情緒,并以此為基礎(chǔ)進(jìn)行進(jìn)一步研究。在深度學(xué)習(xí)中,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)存在對(duì)面部表情特征的提取不充分以及計(jì)算機(jī)參數(shù)量較大的問(wèn)題,導(dǎo)致分類準(zhǔn)確率較低。因此,提出了基于VGG16網(wǎng)絡(luò)的人臉表情識(shí)別算法,通過(guò)與InceptionV3、InceptionResNetV2、ResNet50等模型實(shí)驗(yàn)對(duì)比,結(jié)果表明,VGG16神經(jīng)網(wǎng)絡(luò)在FER2013PLUS測(cè)試數(shù)據(jù)集上的識(shí)別準(zhǔn)確率為79%,準(zhǔn)確率比傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)高。
摘要:在自動(dòng)檢測(cè)中,由于道路損傷數(shù)據(jù)集存在小目標(biāo)損傷難檢測(cè)與類別不平衡問(wèn)題,導(dǎo)致道路損傷檢測(cè)的準(zhǔn)確率低、虛假率高。為此,在DSSD(Deconvolutional Single Shot Detector)網(wǎng)絡(luò)模型的基礎(chǔ)上,提出一種結(jié)合注意力機(jī)制和Focal loss的道路損傷檢測(cè)算法。首先,采用識(shí)別精度更高的ResNet-101作為DSSD模型的基礎(chǔ)網(wǎng)絡(luò);其次,在ResNet-101主干網(wǎng)絡(luò)中添加注意力機(jī)制,采用通道域注意力和空間域注意力結(jié)合的方式,實(shí)現(xiàn)特征在通道維度上的加權(quán)與空間維度上的聚焦,提升對(duì)小目標(biāo)道路損傷的檢測(cè)效果;最后,為了減少簡(jiǎn)單樣本的權(quán)重,增大難分類樣本的權(quán)重,使用Focal loss來(lái)提高整體的檢測(cè)效果。在Global Road Damage Detection Challenge比賽所提供的數(shù)據(jù)集上進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,該模型的平均精度均值為83.95%,比基于SSD和YOLO網(wǎng)絡(luò)的道路損傷檢測(cè)方法的準(zhǔn)確率更高。
摘要:針對(duì)公共政策的語(yǔ)義分析對(duì)比是行政管理重要的研究方向,隨著深度學(xué)習(xí)、知識(shí)圖譜應(yīng)用越來(lái)越廣泛,任何在這一領(lǐng)域改進(jìn)技術(shù)方法的嘗試都可能帶來(lái)較大的進(jìn)步。將自然語(yǔ)言理解相關(guān)技術(shù)應(yīng)用于產(chǎn)業(yè)政策研究有利于政策的制定與管理。針對(duì)軟件產(chǎn)業(yè)政策提出一套基于自然語(yǔ)言理解的技術(shù)分析方法,旨在構(gòu)建政策之間的關(guān)聯(lián)關(guān)系網(wǎng)絡(luò),以期輔助政府決策。
摘要:由于多源傳感數(shù)據(jù)及其噪聲構(gòu)成復(fù)雜的非線性可分空間,數(shù)據(jù)融合是目前在資源受限的傳感網(wǎng)絡(luò)中安全、準(zhǔn)確和高效地消除冗余數(shù)據(jù)的重要方法。結(jié)合SVM泛化能力強(qiáng)、凸優(yōu)化的特點(diǎn),側(cè)重分析了非線性可分多源數(shù)據(jù)集轉(zhuǎn)化為高維線性可分空間的可行性方法。仿真實(shí)驗(yàn)結(jié)果表明,寬度參數(shù)范圍預(yù)估方法可以加速高斯核寬度參數(shù)的確定。針對(duì)多分類情形,仿真實(shí)驗(yàn)結(jié)果表明,通過(guò)控制誤差積累,更能確保分類的有效性。
摘要:介紹了中國(guó)移動(dòng)IT云針對(duì)IaaS層的智能運(yùn)維場(chǎng)景體系規(guī)劃,選擇了數(shù)據(jù)基礎(chǔ)較好的兩個(gè)典型應(yīng)用場(chǎng)景“智能化指標(biāo)異常檢測(cè)”和“智能化告警關(guān)聯(lián)與溯源”進(jìn)行了研究和論證,分別分析了兩個(gè)場(chǎng)景適用的算法和實(shí)現(xiàn)過(guò)程,論述了兩個(gè)場(chǎng)景實(shí)施后的效果評(píng)估方法,并經(jīng)實(shí)際生產(chǎn)驗(yàn)證了場(chǎng)景實(shí)施的效果。
摘要:基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法因其模型復(fù)雜度和對(duì)計(jì)算能力的要求,難以部署在移動(dòng)設(shè)備等低算力平臺(tái)上。為了降低模型的規(guī)模,提出一種輕量級(jí)目標(biāo)檢測(cè)算法。該算法在自頂向下的特征融合的基礎(chǔ)之上,通過(guò)添加注意力機(jī)制構(gòu)建特征金字塔網(wǎng)絡(luò),以達(dá)到更細(xì)粒度的特征表達(dá)能力。該模型以分辨率為320×320的圖像作為輸入,浮點(diǎn)運(yùn)算量只有0.72 B,并在VOC數(shù)據(jù)集上取得了74.2%的mAP,達(dá)到了與傳統(tǒng)單階段目標(biāo)檢測(cè)算法相似的精度。實(shí)驗(yàn)數(shù)據(jù)表明,該算法在保持了檢測(cè)精度的同時(shí)顯著降低了模型運(yùn)算量,更適合低算力條件下的目標(biāo)檢測(cè)。
摘要:考慮到當(dāng)前電力行業(yè)仍缺少有效的領(lǐng)域詞發(fā)現(xiàn)方法,以電力行業(yè)科技項(xiàng)目文本為原始語(yǔ)料庫(kù),將基于互信息與左右熵的統(tǒng)計(jì)特征與傳統(tǒng)語(yǔ)言構(gòu)詞規(guī)則特征相融合,提出了電力文本成詞率的概念。所提方法首先利用成詞率對(duì)電力文本進(jìn)行無(wú)監(jiān)督篩選得到初始候選詞集,然后對(duì)候選詞集進(jìn)行文本切片算法和常用詞過(guò)濾操作,最后進(jìn)行詞嵌入和譜聚類得到最終所需的電力文本領(lǐng)域詞。實(shí)驗(yàn)結(jié)果表明,所提出的方法準(zhǔn)確有效,為電力文本的領(lǐng)域詞發(fā)現(xiàn)提供了一種新方法。
摘要:針對(duì)Staple算法在由于相機(jī)運(yùn)動(dòng)出現(xiàn)模糊情況下跟蹤精度下降的問(wèn)題,提出一種基于背景權(quán)重直方圖的改進(jìn)Staple目標(biāo)跟蹤算法。首先,針對(duì)傳統(tǒng)顏色直方圖忽略空間性的問(wèn)題,提出對(duì)直方圖引入位置權(quán)重;其次,利用背景區(qū)域顏色直方圖抑制背景信息對(duì)目標(biāo)區(qū)域直方圖的影響,提出引入背景權(quán)重直方圖,并完成直方圖分類器的構(gòu)建。該算法在OTB2015測(cè)試集上與其他5個(gè)先進(jìn)算法進(jìn)行實(shí)驗(yàn)比較,結(jié)果表明在距離精度和成功率上總體效果相對(duì)Staple分別提升了3.7%和2%。
摘要:實(shí)時(shí)監(jiān)測(cè)功率變流器中支撐電容的老化狀態(tài),及時(shí)發(fā)現(xiàn)并更換存在缺陷的電容,對(duì)提高功率變換器的可靠性具有重要意義?;谙嚓P(guān)電壓電流數(shù)據(jù),通過(guò)建立數(shù)據(jù)集,確定網(wǎng)絡(luò)模型參數(shù)和模型訓(xùn)練,最終得到基于CNN-LSTM的神經(jīng)網(wǎng)絡(luò)模型,并通過(guò)不同工況下的數(shù)據(jù)集對(duì)神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性進(jìn)行了驗(yàn)證。結(jié)果表明,該模型可對(duì)電容容值進(jìn)行可靠預(yù)測(cè)。
摘要:為了滿足人們對(duì)更好解鎖方式的需求,提出了一種基于語(yǔ)音指令的電子門(mén)鎖解鎖方法及系統(tǒng)。該方法的設(shè)計(jì)理念是:利用手機(jī)號(hào)碼的唯一性識(shí)別用戶身份;利用語(yǔ)音識(shí)別技術(shù),實(shí)現(xiàn)利用不同的語(yǔ)音指令打開(kāi)不同門(mén)鎖。該系統(tǒng)由電子門(mén)鎖、手機(jī)和互聯(lián)網(wǎng)服務(wù)器組成。對(duì)該方法及系統(tǒng)進(jìn)行了詳細(xì)設(shè)計(jì)和說(shuō)明,據(jù)此即可進(jìn)行代碼編寫(xiě)、電路設(shè)計(jì)等產(chǎn)品化設(shè)計(jì)工作?;诒痉椒跋到y(tǒng)的電子門(mén)鎖適用范圍寬、解鎖便捷,并具有更好的安全性、更高的性價(jià)比,對(duì)電子門(mén)鎖或智能門(mén)鎖行業(yè)的發(fā)展將會(huì)產(chǎn)生重要影響。
摘要:基于上交所主板市場(chǎng)A股企業(yè)的財(cái)務(wù)指標(biāo)數(shù)據(jù)來(lái)預(yù)測(cè)企業(yè)的財(cái)務(wù)風(fēng)險(xiǎn),樣本數(shù)據(jù)包括1 227家正常上市企業(yè)和42家被財(cái)務(wù)預(yù)警的企業(yè),數(shù)據(jù)嚴(yán)重不平衡,通過(guò)重采樣技術(shù)解決了分類器在不平衡樣本中失效的問(wèn)題,運(yùn)用Bagging思想的集成機(jī)器學(xué)習(xí)對(duì)預(yù)測(cè)模型進(jìn)行提升與優(yōu)化。正確挑選出有財(cái)務(wù)危機(jī)企業(yè)的概率最高達(dá)到92.86%,在此基礎(chǔ)上,樣本的整體準(zhǔn)確率在經(jīng)過(guò)模型的集成之后提高了5.4%。集成模型提高了對(duì)上市企業(yè)的財(cái)務(wù)預(yù)警能力,能為企業(yè)的正常經(jīng)營(yíng)和投資者的安全投資提供一定的借鑒。
摘要:針對(duì)人工閱片工作量大、閱片質(zhì)量不佳且容易出現(xiàn)漏檢、錯(cuò)判等問(wèn)題,將Faster RCNN目標(biāo)檢測(cè)模型應(yīng)用于肝包蟲(chóng)病CT圖像的檢測(cè),并對(duì)目標(biāo)檢測(cè)模型進(jìn)行改進(jìn):基于圖片分辨率低、病灶大小不同的特點(diǎn),使用網(wǎng)絡(luò)深度更深的殘差網(wǎng)絡(luò)(ResNet101)代替原來(lái)的VGG16網(wǎng)絡(luò),用以提取更豐富的圖像特征;根據(jù)目標(biāo)檢測(cè)模型得出的病灶坐標(biāo)信息引入LGDF模型進(jìn)一步對(duì)病灶進(jìn)行分割,從而輔助醫(yī)生更高效的診斷疾病。實(shí)驗(yàn)結(jié)果表明,基于ResNet101特征提取網(wǎng)絡(luò)的目標(biāo)檢測(cè)模型能夠有效提取目標(biāo)的特征,檢測(cè)準(zhǔn)確率相比原始檢測(cè)模型提高2.1%,具有較好的檢測(cè)精度。同時(shí),將病灶坐標(biāo)信息引入LGDF模型,相比于原始的LGDF模型更好地完成了對(duì)肝包蟲(chóng)病病灶的分割,Dice系數(shù)提高了5%,尤其對(duì)多囊型肝包蟲(chóng)病CT圖像的分割效果較好。
摘要:特征工程可以自動(dòng)地處理和生成那些判別性高的特征,而無(wú)需人為的操作。特征工程在機(jī)器學(xué)習(xí)中是不可避免的一環(huán),也是至關(guān)重要的一環(huán)。提出一種基于強(qiáng)化學(xué)習(xí)(RL)的方法,將特征工程作為一個(gè)馬爾可夫決策過(guò)程(MDP),在上限置信區(qū)間算法(UCT)的基礎(chǔ)上提出一個(gè)近似的方法求解二分類數(shù)值數(shù)據(jù)的特征工程問(wèn)題,來(lái)自動(dòng)獲得最佳的變換策略。在5個(gè)公開(kāi)的數(shù)據(jù)集上驗(yàn)證所提出方法的有效性,F(xiàn)Score平均提高了9.032%,同時(shí)與其他用有限元變換進(jìn)行特征工程的方法進(jìn)行比較。該方法確實(shí)可以得到判別性高的特征,提高模型的學(xué)習(xí)能力,得到更高的精度。
摘要:隨著信息技術(shù)的發(fā)展,人臉識(shí)別在支付、工作和安防系統(tǒng)中應(yīng)用的越來(lái)越多。在邊緣計(jì)算系統(tǒng)中,為了處理的速度,通常選擇較小的神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識(shí)別,這樣會(huì)導(dǎo)致識(shí)別率低。并且在實(shí)際應(yīng)用中大多都是對(duì)于圖片質(zhì)量較高的人臉可以很好地識(shí)別,但對(duì)于受光照影響較大、表情和姿態(tài)變化大的圖片識(shí)別率不是很高。因此,選擇SqueezeNet輕量級(jí)網(wǎng)絡(luò),該網(wǎng)絡(luò)層數(shù)小,可以很好地運(yùn)用于邊緣計(jì)算系統(tǒng)中。采用了預(yù)處理的方法來(lái)對(duì)圖片進(jìn)行預(yù)處理,然后改進(jìn)了SqueezeNet網(wǎng)絡(luò)的損失函數(shù)以及加入了ResNet網(wǎng)絡(luò)中的殘差學(xué)習(xí)方法。最后通過(guò)對(duì)LFW和IJB-A數(shù)據(jù)集進(jìn)行測(cè)試,該研究方法明顯提高了識(shí)別率。
摘要:通信技術(shù)的普及給人們帶來(lái)便捷的同時(shí),電信欺詐行為也急劇增加。由于詐騙行為特征、號(hào)碼類型等與正常業(yè)務(wù)具有極高相似性,傳統(tǒng)基于統(tǒng)計(jì)的電信欺詐檢測(cè)方法難于篩選。提出將用戶通信關(guān)系轉(zhuǎn)換為一組拓?fù)涮卣鳎⑼ㄐ派缃挥邢驁D,將具有統(tǒng)計(jì)特征的頂點(diǎn)表示用戶,具有關(guān)系特征的邊表示他們之間的活動(dòng)。在通信社交圖基礎(chǔ)上,通過(guò)圖卷積模塊捕獲用戶的通信行為規(guī)律和通信社交關(guān)系特征,通過(guò)池化讀出機(jī)制聚合通信社交網(wǎng)絡(luò)的潛在特征,以識(shí)別電信欺詐行為。真實(shí)通信歷史數(shù)據(jù)驗(yàn)證表明了該方法的有效性。
摘要:邊緣設(shè)備的快速發(fā)展和深度學(xué)習(xí)的落地應(yīng)用越來(lái)越多,兩者結(jié)合的趨勢(shì)越發(fā)明顯。而針對(duì)低功耗邊緣設(shè)備AI應(yīng)用的潛力還未完全開(kāi)發(fā)出來(lái),大量設(shè)備隱藏著大量計(jì)算能力,釋放其潛力所帶來(lái)的社會(huì)效益和經(jīng)濟(jì)效益是非常明顯的。因此,以目標(biāo)檢測(cè)任務(wù)中較為常見(jiàn)的人臉檢測(cè)為例,將MTCNN人臉檢測(cè)算法改進(jìn)并移植到資源極其緊張的低功耗嵌入式平臺(tái),在一定環(huán)境條件下,最終成功地檢測(cè)到人臉,并繪制出人臉候選框,結(jié)合舵機(jī)云臺(tái)具備了一定的人臉跟蹤能力。
摘要:計(jì)算機(jī)通信網(wǎng)絡(luò)技術(shù)高速發(fā)展,日新月異,隨之涌現(xiàn)的網(wǎng)絡(luò)攻擊、破壞現(xiàn)象形態(tài)各異、層出不窮。態(tài)勢(shì)感知系統(tǒng)為網(wǎng)絡(luò)安全提供了全面保障,提高態(tài)勢(shì)評(píng)估和態(tài)勢(shì)預(yù)測(cè)建模的穩(wěn)定性、精準(zhǔn)性和快速性是態(tài)勢(shì)感知系統(tǒng)研究的重要方向。深度信念網(wǎng)作為一種深度學(xué)習(xí)智能算法,為網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估和態(tài)勢(shì)預(yù)測(cè)的精確性、理論化帶來(lái)新方向。考慮深度信念網(wǎng)算法采用受限玻爾茲曼機(jī)作為基礎(chǔ)網(wǎng)絡(luò),逐層預(yù)訓(xùn)練和微調(diào)為網(wǎng)絡(luò)核心部分。構(gòu)建廣義網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估指標(biāo)體系,并建立計(jì)算機(jī)通信網(wǎng)絡(luò)安全的態(tài)勢(shì)評(píng)估和態(tài)勢(shì)預(yù)測(cè)數(shù)據(jù)驅(qū)動(dòng)模型。通過(guò)入侵檢測(cè)數(shù)據(jù)集CIC-IDS2017進(jìn)行實(shí)驗(yàn)仿真,驗(yàn)證了該模型的精準(zhǔn)性和有效性。
摘要:針對(duì)微博網(wǎng)絡(luò)輿情信息量大、無(wú)規(guī)則、隨機(jī)變化的特點(diǎn),提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,設(shè)計(jì)與實(shí)現(xiàn)了一個(gè)基于Scrapy框架的微博評(píng)論爬蟲(chóng),將某熱點(diǎn)事件的若干條微博評(píng)論進(jìn)行爬取并存進(jìn)數(shù)據(jù)庫(kù),然后進(jìn)行文本分割、LDA(Latent Dirichlet Allocation)主題聚類,最后使用TFIDF-NB算法進(jìn)行情感分類。實(shí)驗(yàn)結(jié)果表明,TFIDF-NB算法平均準(zhǔn)確率高于線性支持向量機(jī)算法和K近鄰算法,在精確率和召回率方面高于K近鄰算法,具有較好的情感分類效果。
摘要:Tor是一種基于洋蔥路由通信協(xié)議建立的隱蔽加密通信系統(tǒng)。該系統(tǒng)基于互聯(lián)網(wǎng)現(xiàn)有路由、數(shù)據(jù)加密等協(xié)議,構(gòu)建了一套保護(hù)通信實(shí)體的身份隱匿機(jī)制,使得經(jīng)過(guò)Tor網(wǎng)絡(luò)傳播的數(shù)據(jù)難以被有效追蹤和分析。然而近年來(lái)這項(xiàng)隱蔽通信技術(shù)被罪犯大量使用,已成為網(wǎng)絡(luò)犯罪和非法交易的溫床。為有效應(yīng)對(duì)該問(wèn)題,提出一項(xiàng)基于機(jī)器學(xué)習(xí)的Tor網(wǎng)絡(luò)識(shí)別檢測(cè)技術(shù),通過(guò)主動(dòng)生成Tor網(wǎng)絡(luò)流量,基于機(jī)器學(xué)習(xí)技術(shù)實(shí)施流特征提取與檢測(cè),從而發(fā)現(xiàn)參與Tor通信的網(wǎng)絡(luò)實(shí)體及其通信類型,進(jìn)而檢出潛在的惡意暗網(wǎng)用戶。實(shí)驗(yàn)表明,該方法可有效識(shí)別Tor通信實(shí)體以及通信行為,如電子郵件和FTP應(yīng)用等。
摘要:卷積神經(jīng)網(wǎng)絡(luò)在各個(gè)領(lǐng)域都發(fā)揮著重要的作用,尤其是在計(jì)算機(jī)視覺(jué)領(lǐng)域,但過(guò)多的參數(shù)數(shù)量和計(jì)算量限制了它在移動(dòng)設(shè)備上的應(yīng)用。針對(duì)上述問(wèn)題,結(jié)合分組卷積方法和參數(shù)共享、密集連接的思想,提出了一種新的卷積算法Group-Shard-Dense-Channle-Wise。利用該卷積算法,在PeleeNet網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上,改進(jìn)出一種高效的輕量化卷積神經(jīng)網(wǎng)絡(luò)——GSDCPeleeNet。與其他卷積神經(jīng)網(wǎng)絡(luò)相比,該網(wǎng)絡(luò)在具有更少參數(shù)的情況下,幾乎不損失識(shí)別精度甚至識(shí)別精度更高。該網(wǎng)絡(luò)選取1×1卷積層中卷積核信道方向上的步長(zhǎng)s作為超參數(shù),調(diào)整并適當(dāng)?shù)剡x取該超參數(shù),可以在網(wǎng)絡(luò)參數(shù)量更小的情況下,擁有更好的圖像分類效果。
摘要:基于軟硬件協(xié)同設(shè)計(jì)的思想,利用HLS工具,在PYNQ-Z2平臺(tái)上設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)加速器,對(duì)卷積運(yùn)算采用矩陣切割的優(yōu)化方法,均衡了資源消耗和計(jì)算資源,使得加速器的性能達(dá)到了最優(yōu)。利用MNIST數(shù)據(jù)集對(duì)加速器IP核進(jìn)行性能測(cè)試,實(shí)驗(yàn)結(jié)果表明:對(duì)單張圖片的測(cè)試,該加速器相對(duì)于ARM平臺(tái)實(shí)現(xiàn)了5.785的加速效果,對(duì)于1 000張圖片的測(cè)試則可達(dá)到9.72的加速效果,隨著測(cè)試圖片數(shù)量的不斷增加,加速器的性能也將越來(lái)越優(yōu)。
摘要:針對(duì)汽車造型智能設(shè)計(jì)領(lǐng)域中如何有效提取用戶需求的問(wèn)題,提出一種融合多特征TFIDF(詞頻-逆向文件頻率)文本分析的汽車造型需求提取方法。首先,通過(guò)基于互信息與邊界自由度獲取大量未登錄的專業(yè)詞匯,優(yōu)化和修正簡(jiǎn)單分詞后的詞匯;然后針對(duì)經(jīng)典TFIDF算法的局限性,引入詞匯特征因素與情感特征因素,獲取用戶需求特征候選集;最后根據(jù)設(shè)定的閾值得到有效的用戶需求。實(shí)驗(yàn)結(jié)果表明,融合多特征TFIDF文本分析算法在特征提取方面有一定優(yōu)勢(shì),能有效提取文本中關(guān)于汽車造型的用戶需求。
摘要:群體智能在解決非確定性多項(xiàng)式(NP)問(wèn)題或搜索空間過(guò)大的問(wèn)題時(shí)有著顯著優(yōu)勢(shì)。將鴿群優(yōu)化(Pigeon Inspired Optimization,PIO)算法應(yīng)用于入侵檢測(cè)系統(tǒng)的特征選擇中。提出基于Sigmoid的PIO(SPIO)和基于Cosine余弦相似度的PIO(CPIO)算法對(duì)入侵檢測(cè)數(shù)據(jù)集KDDCUP99進(jìn)行特征選擇,并用機(jī)器學(xué)習(xí)的方法進(jìn)行實(shí)驗(yàn),建立模型并評(píng)估結(jié)果。
摘要:缺陷檢測(cè)對(duì)于古建筑的保護(hù)和修繕具有重要的意義,傳統(tǒng)的地磚缺陷檢測(cè)通過(guò)目視檢查,存在受人力影響大、耗時(shí)長(zhǎng)等限制?;谏疃葘W(xué)習(xí)的良好應(yīng)用前景,建立故宮地磚缺陷的數(shù)據(jù)集,提出改進(jìn)型Faster R-CNN的網(wǎng)絡(luò)。首先,構(gòu)建可變形卷積,通過(guò)網(wǎng)絡(luò)學(xué)習(xí)并提取地磚中的缺陷特征;然后,將特征圖輸入?yún)^(qū)域生成網(wǎng)絡(luò)中生成候選區(qū)域框,將生成的特征圖和候選區(qū)域框進(jìn)行池化操作;最后,輸出缺陷檢測(cè)結(jié)果。在故宮地磚圖片數(shù)據(jù)集的測(cè)試下,改進(jìn)后的模型平均準(zhǔn)確率均值到達(dá)92.49%,與Faster R-CNN模型相比提高了2.99%,更適用于地磚缺陷檢測(cè)。
摘要:深入分析了當(dāng)前倒車影像系統(tǒng)在實(shí)際使用場(chǎng)景上的不足,介紹了雷達(dá)存在的輻射面有限、角度盲區(qū)、物體識(shí)別方面的缺陷,以及毫米波雷達(dá)的高成本難以普及應(yīng)用。提出了基于ADAS的汽車倒車防碰撞系統(tǒng)設(shè)計(jì),對(duì)系統(tǒng)倒車功能做了深入的原理分析,針對(duì)基于倒車攝像頭圖像分析的ADAS算法詳細(xì)介紹了其技術(shù)關(guān)鍵點(diǎn)和基于倒車場(chǎng)景融合特征的創(chuàng)新應(yīng)用,算法識(shí)別效果精準(zhǔn)有效。針對(duì)不同車輛攝像頭安裝位置和朝向的差異創(chuàng)新設(shè)計(jì)了靈活的預(yù)警和報(bào)警區(qū)域的調(diào)節(jié)功能,結(jié)合TTS語(yǔ)音提醒和圖文顯示提醒司機(jī)采取合適的操作保障行車安全,極大地改善了該倒車防碰撞系統(tǒng)的用戶體驗(yàn)和實(shí)際作用,為司機(jī)的安全行車提供了有力保障。
摘要:提出基于分塊LBP-TOP(Local Binary Patterns from Three Orthogonal Planes)特征和改進(jìn)的加權(quán)稀疏表示分類解決微表情識(shí)別與專用線車輛狀態(tài)檢測(cè)問(wèn)題。首先利用LBP-TOP特征描述符對(duì)從分塊圖像中選擇出的有效塊進(jìn)行提取特征,將提取的特征作為字典,采取加權(quán)稀疏表示(Weighted Sparse Representation,WSRC)和對(duì)偶增廣拉格朗日乘子法(Dual Augmented Lagrange Multiplier,DALM)相結(jié)合的算法(WSRC_DALM)進(jìn)行稀疏表示分類;然后利用不同尺寸的塊劃分圖像,選擇有效塊提取特征,特征融合后參與分類。在CASME Ⅱ與SAMM表情數(shù)據(jù)庫(kù)上采用“留一人交叉驗(yàn)證”(Leave One Subject Out, LOSO)的分類方法進(jìn)行5分類,得到的識(shí)別率分別達(dá)到了77.30%與58.82%,在車輛狀態(tài)檢測(cè)檢測(cè)數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)達(dá)到了84.60%的檢測(cè)率。實(shí)驗(yàn)結(jié)果表明了所提出算法的有效性。
摘要:雨線造成的圖像質(zhì)量退化嚴(yán)重影響圖像有效應(yīng)用及計(jì)算機(jī)視覺(jué)算法,因此圖像去雨十分必要。目前主流的深度學(xué)習(xí)去雨方法僅對(duì)單一尺寸的雨線有效,并且存在雨線去除不完全、模糊背景等問(wèn)題。針對(duì)以上難點(diǎn),提出了基于深度密集連接控制網(wǎng)絡(luò)的單幅圖像去雨算法。通過(guò)引入多尺度特征網(wǎng)絡(luò)加強(qiáng)對(duì)不同尺寸雨線的提取能力,引入注意力機(jī)制模塊提升對(duì)有雨區(qū)域的關(guān)注度,引入密集連接控制網(wǎng)絡(luò)以完整表示雨線特征。實(shí)驗(yàn)表明,該方法在合成數(shù)據(jù)集以及真實(shí)數(shù)據(jù)集對(duì)比主流去雨方法效果均有提升。
摘要:皮膚病是醫(yī)學(xué)上的常見(jiàn)的、多發(fā)性疾病,因此皮膚檢測(cè)技術(shù)越來(lái)越受關(guān)注。卷積神經(jīng)網(wǎng)絡(luò)是常見(jiàn)的皮膚檢測(cè)方法,其模型結(jié)構(gòu)會(huì)丟失很多信息。CapsNet(膠囊網(wǎng)絡(luò))是在卷積神經(jīng)網(wǎng)絡(luò)之后的一種新的神經(jīng)網(wǎng)絡(luò)。CapsNet的矢量化特征能夠較好地表達(dá)空間關(guān)聯(lián)性,每一個(gè)capsule(膠囊)獨(dú)立地服務(wù)各自的任務(wù)。分析了CapsNet的基本結(jié)構(gòu)和主要算法,改進(jìn)了網(wǎng)絡(luò)模型從而避免過(guò)擬合現(xiàn)象發(fā)生,試圖基于改進(jìn)CapsNet針對(duì)預(yù)處理之后的皮膚圖像進(jìn)行識(shí)別,并與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的模型作對(duì)比。實(shí)驗(yàn)結(jié)果表明,使用改進(jìn)CapsNet對(duì)色素性皮膚病進(jìn)行識(shí)別可以有較好的識(shí)別效果,并且準(zhǔn)確率比傳統(tǒng)方法高出8%~10%。
摘要:在語(yǔ)音增強(qiáng)領(lǐng)域,深度神經(jīng)網(wǎng)絡(luò)通過(guò)對(duì)大量含有不同噪聲的語(yǔ)音以監(jiān)督學(xué)習(xí)方式進(jìn)行訓(xùn)練建模,從而提升網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)能力。然而不同類型噪聲的獲取成本較大,噪聲類型難以全面采集,影響了模型的泛化能力。針對(duì)這個(gè)問(wèn)題,提出一種基于生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)的噪聲數(shù)據(jù)樣本增強(qiáng)方法,該方法對(duì)真實(shí)噪聲數(shù)據(jù)進(jìn)行學(xué)習(xí),根據(jù)數(shù)據(jù)特征合成虛擬噪聲,以此擴(kuò)充訓(xùn)練集中噪聲數(shù)據(jù)的數(shù)量和類型。通過(guò)實(shí)驗(yàn)驗(yàn)證,所采用的噪聲合成方法能夠有效擴(kuò)展訓(xùn)練集中噪聲來(lái)源,增強(qiáng)模型的泛化能力,有效提高語(yǔ)音信號(hào)去噪處理后的信噪比和可理解性。
摘要:隨著科學(xué)技術(shù)的不斷進(jìn)步,不法分子竊電手段日趨專業(yè)化多樣化,而傳統(tǒng)的防竊電技術(shù)實(shí)時(shí)性及可行性較低。研究對(duì)運(yùn)行中智能電能表用電信息的數(shù)據(jù)采集及特征提取,分析異常用電數(shù)據(jù),應(yīng)用機(jī)器學(xué)習(xí)的方法對(duì)特征值進(jìn)行學(xué)習(xí),并推導(dǎo)出用電異常的判斷閾值,采用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法對(duì)獨(dú)立檢測(cè)的結(jié)果進(jìn)行融合,從而實(shí)現(xiàn)竊電數(shù)據(jù)的挖掘。最后驗(yàn)證了模型建立的準(zhǔn)確性,并推導(dǎo)出用電異常案例的甄別方法。
摘要:在數(shù)字化礦山中,行人檢測(cè)系統(tǒng)能夠大幅減少事故傷亡,是保護(hù)工人安全的重要手段。為了構(gòu)建高性能的行人檢測(cè)系統(tǒng),提出了一種基于邊窗濾波和擴(kuò)張卷積的礦井行人檢測(cè)模型。具體來(lái)說(shuō),針對(duì)復(fù)雜惡劣的礦井環(huán)境,采用邊窗濾波抑制視頻圖像中的干擾信號(hào),提升圖像質(zhì)量。此外,考慮到行人目標(biāo)的多尺度特性,在模型中引入擴(kuò)張卷積增加特征的感受野,進(jìn)而提升檢測(cè)性能。大量的對(duì)比實(shí)驗(yàn)證明了邊窗濾波和擴(kuò)張卷積的有效性,模型在礦井?dāng)?shù)據(jù)集上獲得94.3 mAP和99.1%檢測(cè)率的優(yōu)異性能。
摘要:傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)量化算法廣泛使用對(duì)稱均勻量化操作對(duì)模型權(quán)值進(jìn)行量化,沒(méi)有考慮到相鄰權(quán)值量化之間的相互關(guān)系,即上一個(gè)權(quán)值的量化操作產(chǎn)生的量化噪聲可以通過(guò)調(diào)整之后權(quán)值的量化方向加以彌補(bǔ)。針對(duì)上述問(wèn)題,提出了一種基于權(quán)值交互思想的三值卷積神經(jīng)網(wǎng)絡(luò)量化算法,達(dá)到了16倍的模型壓縮比,以ImageNet作為數(shù)據(jù)集,量化后的AlexNet和ResNet-18網(wǎng)絡(luò)上模型預(yù)測(cè)準(zhǔn)確率只下降了不到3%。該方法達(dá)到了較高的模型壓縮比,具有較高的精度,可以用于將卷積神經(jīng)網(wǎng)絡(luò)移植到計(jì)算資源有限的移動(dòng)端平臺(tái)上。
摘要:對(duì)比于單張圖像超分辨,視頻圖像超分辨率技術(shù)需要對(duì)輸入的連續(xù)時(shí)間序列圖像進(jìn)行融合、對(duì)齊等處理?;趲h(huán)的視頻超分辨率網(wǎng)絡(luò)共分為三部分:(1)幀序列對(duì)齊網(wǎng)絡(luò)提取圖像特征,并將鄰居幀對(duì)齊到中心幀;(2)幀融合網(wǎng)絡(luò)將對(duì)齊完成的幀進(jìn)行融合,使用鄰居幀的信息補(bǔ)充中心幀信息;(3)超分辨網(wǎng)絡(luò)將融合完成的圖像放大,得到最終的高清圖像。實(shí)驗(yàn)表明,與現(xiàn)有算法相比,基于幀循環(huán)網(wǎng)絡(luò)的視頻超分辨率技術(shù)產(chǎn)生圖像更為銳利,質(zhì)量更高。
摘要:在煤礦生產(chǎn)中,工人由于未佩戴安全帽而受傷的事故時(shí)有發(fā)生。為了構(gòu)建數(shù)字化安全帽監(jiān)測(cè)系統(tǒng),提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的安全帽佩戴檢測(cè)模型。采用先進(jìn)的Darknet53網(wǎng)絡(luò)作為模型主干,用于提取圖片的特征信息。此外,在模型中引入注意力機(jī)制用于豐富特征之間的信息傳播,增強(qiáng)模型的泛化能力。最后,制作了安全帽佩戴預(yù)訓(xùn)練數(shù)據(jù)集和實(shí)際礦井場(chǎng)景數(shù)據(jù)集,并在PyTorch平臺(tái)進(jìn)行全面的對(duì)比實(shí)驗(yàn)驗(yàn)證了模型設(shè)計(jì)的有效性,模型在實(shí)際礦井場(chǎng)景數(shù)據(jù)集上獲得92.5 mAP的優(yōu)異性能。
摘要:針對(duì)車標(biāo)檢測(cè)存在檢測(cè)時(shí)間長(zhǎng)、檢測(cè)率低、可識(shí)別類型少的問(wèn)題,提出一種采用You Only Look Once(YOLOv3)網(wǎng)絡(luò)的方法。為了使該網(wǎng)絡(luò)適用于小目標(biāo)的車標(biāo)檢測(cè),將目標(biāo)特征提取結(jié)構(gòu)Darknet-53換成Darknet-19,并且將多尺度預(yù)測(cè)層數(shù)減少為兩層以減少網(wǎng)絡(luò)參數(shù)數(shù)量。同時(shí),為了增大車標(biāo)在圖像中所占比例,讓卷積神經(jīng)網(wǎng)絡(luò)能學(xué)習(xí)更多的車標(biāo)特征,采用將車輛從圖像中裁剪后進(jìn)行人工標(biāo)注的方法,構(gòu)建了一個(gè)包含46類車標(biāo)的數(shù)據(jù)集(VLDS-46)。實(shí)驗(yàn)結(jié)果表明,采用該模型進(jìn)行車標(biāo)檢測(cè)時(shí)能在實(shí)現(xiàn)高檢測(cè)率的同時(shí)達(dá)到實(shí)時(shí)性要求,檢測(cè)平均耗時(shí)為9 ms。
摘要:提出一種基于音視頻匹配層自適應(yīng)加權(quán)融合的身份識(shí)別方法。在不同程度的噪聲情況下,圖像與聲音的識(shí)別率會(huì)隨噪聲的增強(qiáng)而降低,憑借單個(gè)生物模態(tài)的識(shí)別,難以達(dá)到很好的預(yù)測(cè)結(jié)果;而且兩種模態(tài)融合時(shí)的權(quán)值不同,融合系統(tǒng)的穩(wěn)定性效果也不同。采用雙模態(tài)的自適應(yīng)加權(quán)融合不僅可以有效地彌補(bǔ)不同生物模態(tài)識(shí)別之間的優(yōu)缺點(diǎn),而且可以自適應(yīng)選擇最優(yōu)的權(quán)值進(jìn)行決策。實(shí)驗(yàn)表明,該方法的理論推測(cè)成立,比單模態(tài)的身份識(shí)別具有更高的識(shí)別率與魯棒性。
摘要:傳統(tǒng)的道路裂縫識(shí)別方法有基于R-CNN、SPPnet、HOG+SVM等多種方法,但識(shí)別精度低、檢測(cè)速度慢。針對(duì)這些缺點(diǎn),提出一種基于Faster R-CNN的道路裂縫識(shí)別方法。首先,采集道路裂縫圖像,建立Pascal VOC數(shù)據(jù)集;其次,基于谷歌開(kāi)發(fā)的TensorFlow深度學(xué)習(xí)框架,用數(shù)據(jù)集對(duì)Faster R-CNN進(jìn)行訓(xùn)練并分析各項(xiàng)性能參數(shù)指標(biāo)。實(shí)驗(yàn)結(jié)果表明,在迭代20 000次的情況下,可將訓(xùn)練損失降到0.188 5,AP值達(dá)到0.780 2,取得了良好效果。
摘要:非法入侵者通過(guò)偽裝人臉欺騙識(shí)別系統(tǒng), 給人臉識(shí)別應(yīng)用帶來(lái)嚴(yán)重威脅?,F(xiàn)有人臉活體檢測(cè)方法多為在同一數(shù)據(jù)集內(nèi)進(jìn)行訓(xùn)練和測(cè)試,當(dāng)應(yīng)用在跨數(shù)據(jù)集場(chǎng)景中時(shí)效果并不理想。針對(duì)這一問(wèn)題,提出了利用HOG等算法對(duì)上下文環(huán)境中的線索信息進(jìn)行提取,提取出來(lái)的特征送入單類支持向量機(jī)進(jìn)行訓(xùn)練、分類。將分類結(jié)果與上下文環(huán)境中異常線索的探測(cè)結(jié)果相結(jié)合。算法在公開(kāi)的數(shù)據(jù)集NUAA和CASIA-FASD上進(jìn)行了驗(yàn)證,實(shí)驗(yàn)結(jié)果表明在跨數(shù)據(jù)集檢測(cè)時(shí)該算法的泛化能力及檢測(cè)準(zhǔn)確率較已存在算法有所提高。
摘要:為了提高文本相似度檢測(cè)算法的準(zhǔn)確度,提出一種結(jié)合潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)與Doc2Vec模型的文本相似度檢測(cè)方法,并把該算法得到的模型命名為HybridDL模型。該算法通過(guò)Doc2Vec對(duì)文檔訓(xùn)練得到文檔向量,再利用LDA模型得到文檔主題與各個(gè)主題下特征詞出現(xiàn)的概率,對(duì)文檔中各主題及特征詞計(jì)算概率加權(quán)和,映射到Doc2Vec文檔向量中。實(shí)驗(yàn)結(jié)果表明,新算法模型比傳統(tǒng)的Doc2Vec模型對(duì)相似文本的判斷更加敏感,在文本相似度檢測(cè)上具有更高的準(zhǔn)確度。
摘要:現(xiàn)有的文本相似度度量方法主要采用TF-IDF方法,把文本建模為詞頻向量,但未考慮文本的結(jié)構(gòu)特征。現(xiàn)將文本的結(jié)構(gòu)特征和TF-IDF方法進(jìn)行融合,提出了一種面向科技項(xiàng)目文本的相似度度量方法。該方法首先對(duì)文本進(jìn)行預(yù)處理,其次根據(jù)文本的結(jié)構(gòu)特征提取模塊文本,然后使用TF-IDF方法提取每個(gè)模塊文本的TOP-N關(guān)鍵詞, 作為模塊文本的特征向量表示,最后使用余弦聚類計(jì)算文本的相似度。實(shí)驗(yàn)結(jié)果表明,在電力行業(yè)的科技項(xiàng)目文檔數(shù)據(jù)集上,所提方法優(yōu)于TF-IDF方法。
摘要:偽裝人臉識(shí)別在刑偵安防領(lǐng)域有著巨大的應(yīng)用價(jià)值。針對(duì)現(xiàn)階段對(duì)偽裝人臉識(shí)別的研究較少、算法魯棒性不強(qiáng)等缺點(diǎn),提出了基于深度神經(jīng)網(wǎng)絡(luò)的偽裝人臉識(shí)別算法。改進(jìn)了SqueezeNet網(wǎng)絡(luò)模型,并將其與FaceNet網(wǎng)絡(luò)架構(gòu)進(jìn)行結(jié)合,用于人臉圖像的身份識(shí)別。通過(guò)在訓(xùn)練數(shù)據(jù)集中引入偽裝人臉圖像,讓網(wǎng)絡(luò)學(xué)習(xí)到偽裝的特征。實(shí)驗(yàn)結(jié)果表明,該算法識(shí)別準(zhǔn)確率接近90%,相較于其他網(wǎng)絡(luò)模型,具有更好的識(shí)別效果。
摘要:傳統(tǒng)的道岔故障檢測(cè)方式不僅會(huì)耗費(fèi)大量人力、物力、財(cái)力,而且檢測(cè)結(jié)果完全依賴于個(gè)人工作經(jīng)驗(yàn)。 隨著人工智能的飛速發(fā)展,研究鐵路道岔的智能診斷器是亟待解決的問(wèn)題。提出一種智能檢測(cè)系統(tǒng),該系統(tǒng)從預(yù)處理數(shù)據(jù)、特征提取、構(gòu)建不均衡數(shù)據(jù)的智能識(shí)別器以及設(shè)計(jì)更符合要求的評(píng)價(jià)標(biāo)準(zhǔn)方面進(jìn)行了具體而深入的研究。 最后,通過(guò)MATLAB軟件對(duì)廣州鐘村站W(wǎng)1902#和W1904#型號(hào)的道岔動(dòng)作電流數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示,智能檢測(cè)系統(tǒng)不僅具有非常高的識(shí)別性能和泛化能力,而且識(shí)別時(shí)間僅為0.04 s, 滿足鐵路實(shí)時(shí)性要求。
摘要:針對(duì)傳統(tǒng)話題檢測(cè)方法在微博短文本上存在高維稀疏的缺陷,提出了一種基于特征融合的K-means微博話題發(fā)現(xiàn)模型。為了更好地表達(dá)微博話題的語(yǔ)義信息,使用在句子中共現(xiàn)的詞對(duì)向量模型(Biterm_VSM)代替?zhèn)鹘y(tǒng)的向量空間模型(Vector Space Model,VSM),并結(jié)合主題模型(Latent Dirichlet Allocation,LDA)挖掘出微博短文本中的潛在語(yǔ)義,把兩個(gè)模型得到的特征進(jìn)行特征融合,并應(yīng)用K-means聚類算法進(jìn)行話題的發(fā)現(xiàn)。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的話題檢測(cè)方法相比,該模型的調(diào)整蘭德系數(shù)(Adjusted Rand index,ARI)為0.80,比傳統(tǒng)的話題檢測(cè)方法提高了3%~6%。
摘要:研究了利用人工神經(jīng)網(wǎng)絡(luò)對(duì)不同頻帶、柵寬的砷化鎵高電子遷移率晶體管進(jìn)行散射參數(shù)和噪聲參數(shù)提取,基于兩個(gè)神經(jīng)網(wǎng)絡(luò)分別對(duì)兩組散射參數(shù)和噪聲參數(shù)進(jìn)行訓(xùn)練學(xué)習(xí),比較不同隱含層和神經(jīng)元數(shù)目得出平均相對(duì)誤差和均方誤差,找到對(duì)應(yīng)散射參數(shù)和噪聲參數(shù)神經(jīng)網(wǎng)絡(luò)的最佳的隱含層數(shù)和神經(jīng)元數(shù)目是8-8-6和6-4。測(cè)試結(jié)果表明,散射參數(shù)平均相對(duì)誤差的平均值為2.79%,噪聲參數(shù)平均相對(duì)誤差的平均值為2.05%,與常規(guī)單個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相比,在平均相對(duì)誤差方面提高了31.3%,表明該模型具備更好的精度和可靠性,十分適用于寬禁帶、強(qiáng)非線性特征的射頻晶體管參數(shù)提取。
摘要:針對(duì)中文文本自動(dòng)校對(duì)提出了一種新的基于Seq2Seq和Bi-LSTM結(jié)合的深度學(xué)習(xí)模型。與傳統(tǒng)的基于規(guī)則和概率統(tǒng)計(jì)的方法不同,基于Seq2Seq基礎(chǔ)結(jié)構(gòu)改進(jìn),加入了Bi-LSTM單元和注意力機(jī)制,實(shí)現(xiàn)了一個(gè)中文文本自動(dòng)校對(duì)模型。采用F0.5與GLEU指標(biāo)評(píng)價(jià),通過(guò)公開(kāi)的數(shù)據(jù)集進(jìn)行不同模型的對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,新模型能有效地處理長(zhǎng)距離的文本錯(cuò)誤以及語(yǔ)義錯(cuò)誤,Bi-RNN以及注意力機(jī)制的加入對(duì)中文文本校對(duì)模型的性能有顯著提升。
摘要:針對(duì)傳統(tǒng)的淺層特征所提取特征的判別性有限、深度特征需要大量帶標(biāo)記樣本且訓(xùn)練過(guò)程耗時(shí)長(zhǎng)的問(wèn)題,提出一種深度及淺層特征融合算法用于人臉識(shí)別。首先提取人臉的HOG特征并進(jìn)行判別性降維;同時(shí),提取人臉圖像的PCANet特征并降維;其次,將降維后的深淺特征進(jìn)行融合,并進(jìn)一步提取判別性特征;最后,采用SVM分類器進(jìn)行分類并在AR和Yale B數(shù)據(jù)庫(kù)上對(duì)算法進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果證明,該算法能夠比單獨(dú)選用深度特征和淺層特征進(jìn)行分類達(dá)到更高的識(shí)別率,且對(duì)特征維數(shù)具有更強(qiáng)的魯棒性。
摘要:針對(duì)卷積神經(jīng)網(wǎng)絡(luò)(CNN)在通用CPU以及GPU平臺(tái)上推斷速度慢、功耗大的問(wèn)題,采用FPGA平臺(tái)設(shè)計(jì)了并行化的卷積神經(jīng)網(wǎng)絡(luò)推斷系統(tǒng)。通過(guò)運(yùn)算資源重用、并行處理數(shù)據(jù)和流水線設(shè)計(jì),并利用全連接層的稀疏性設(shè)計(jì)稀疏矩陣乘法器,大大提高運(yùn)算速度,減少資源的使用。系統(tǒng)測(cè)試使用ORL人臉數(shù)據(jù)庫(kù),實(shí)驗(yàn)結(jié)果表明,在100 MHz工作頻率下,模型推斷性能分別是CPU的10.24倍,是GPU的3.08倍,是基準(zhǔn)版本的1.56倍,而功率還不到2 W。最終在模型壓縮了4倍的情況下,系統(tǒng)識(shí)別準(zhǔn)確率為95%。
摘要:傳統(tǒng)人臉檢測(cè)算法往往不能自動(dòng)地從原始圖像中提取有用的檢測(cè)特征,而卷積神經(jīng)網(wǎng)絡(luò)可以輕易地提取高維度的特征信息,廣泛用于圖像處理領(lǐng)域。針對(duì)上述缺點(diǎn),采用簡(jiǎn)單高效的深度學(xué)習(xí)Caffe框架并通過(guò)AlexNet網(wǎng)絡(luò)訓(xùn)練,數(shù)據(jù)集為L(zhǎng)FW人臉數(shù)據(jù)集,得出一個(gè)模型分類器,對(duì)原始圖像數(shù)據(jù)進(jìn)行圖像金字塔變換,并通過(guò)前向傳播得到特征圖,反變換得出人臉坐標(biāo),采用非極大值抑制算法得出最優(yōu)位置,最后達(dá)到一個(gè)二分類的人臉檢測(cè)結(jié)果。該方法可以實(shí)現(xiàn)不同尺度的人臉檢測(cè),具有較高的精度,可用于構(gòu)建人臉檢測(cè)系統(tǒng)。
摘要:提出將Transformer模型應(yīng)用于中文文本自動(dòng)校對(duì)領(lǐng)域。Transformer模型與傳統(tǒng)的基于概率、統(tǒng)計(jì)、規(guī)則或引入BiLSTM的Seq2Seq模型不同,該深度學(xué)習(xí)模型通過(guò)對(duì)Seq2Seq模型進(jìn)行整體結(jié)構(gòu)改進(jìn),從而實(shí)現(xiàn)中文文本自動(dòng)校對(duì)。通過(guò)使用公開(kāi)數(shù)據(jù)集對(duì)不同模型進(jìn)行對(duì)比實(shí)驗(yàn),采用準(zhǔn)確率、召回率與F1值作為評(píng)價(jià)指標(biāo),實(shí)驗(yàn)結(jié)果表明,Transformer模型相比較于其他模型,在中文文本自動(dòng)校對(duì)的性能上有了大幅提升。
摘要:圖像分類是根據(jù)圖像的信息將不同類別的圖像區(qū)分開(kāi)來(lái),是計(jì)算機(jī)視覺(jué)中重要的基本問(wèn)題,也是圖像檢測(cè)、圖像分割、物體跟蹤、行為分析等其他高層視覺(jué)任務(wù)的基礎(chǔ)。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù),例如圖像、聲音和文本。該系統(tǒng)基于Caffe深度學(xué)習(xí)框架,首先對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練分析構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò),提取數(shù)據(jù)集圖像特征信息,得到數(shù)據(jù)對(duì)應(yīng)的分類模型,然后以bvlc-imagenet訓(xùn)練集模型為基礎(chǔ),對(duì)目標(biāo)圖像進(jìn)行擴(kuò)展應(yīng)用,實(shí)現(xiàn)“以圖搜圖”Web應(yīng)用。
摘要:為建設(shè)國(guó)家電網(wǎng)客戶服務(wù)中心的智能對(duì)話系統(tǒng),需要從大量文檔、知識(shí)庫(kù)、對(duì)話等數(shù)據(jù)中提煉知識(shí)形成知識(shí)圖譜,提出一種融合事實(shí)圖譜和事理圖譜的新型知識(shí)圖譜框架,能夠基于多源異構(gòu)數(shù)據(jù)共建新型知識(shí)圖譜,在國(guó)網(wǎng)領(lǐng)域精準(zhǔn)問(wèn)答、客服系統(tǒng)知識(shí)支撐、對(duì)話管理引導(dǎo)、知識(shí)推理等方面均有較好性能。融合后的圖譜及應(yīng)用系統(tǒng)在國(guó)網(wǎng)客服中心問(wèn)答平臺(tái)中投入使用,大幅提升了客服人員工作效率和服務(wù)質(zhì)量。
摘要:針對(duì)目前齒輪箱系統(tǒng)在利用神經(jīng)網(wǎng)絡(luò)故障診斷時(shí)存在正確識(shí)別率低和依靠經(jīng)驗(yàn)選擇參數(shù)的問(wèn)題,提出了基于粒子群優(yōu)化BP網(wǎng)絡(luò)的齒輪箱故障診斷方法。簡(jiǎn)要介紹利用齒輪振動(dòng)原理提取特征參數(shù)建立故障模型,該模型以齒輪箱特征向量為輸入、故障類型為輸出,詳細(xì)分析了通過(guò)BP神經(jīng)網(wǎng)絡(luò)、概率神經(jīng)網(wǎng)絡(luò)和粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)齒輪箱故障診斷。仿真結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)對(duì)齒輪箱故障診斷收斂速度慢,故障識(shí)別率為82%;概率神經(jīng)網(wǎng)絡(luò)的模型故障診斷識(shí)別率依據(jù)經(jīng)驗(yàn)選取spread值決定,故障識(shí)別率最大為98%;粒子群優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)故障診斷分類識(shí)別率為100%且自適應(yīng)能力強(qiáng)。
摘要:探討卷積神經(jīng)網(wǎng)絡(luò)(Convonlutional Neural Network,CNN)在肝包蟲(chóng)病CT圖像診斷中的應(yīng)用。選取兩種類型的肝包蟲(chóng)病CT圖像進(jìn)行歸一化、改進(jìn)的中值濾波去噪和數(shù)據(jù)增強(qiáng)等預(yù)處理。以LeNet-5模型為基礎(chǔ)提出改進(jìn)的CNN模型CTLeNet,采用正則化策略減少過(guò)擬合問(wèn)題,加入Dropout層減少參數(shù)個(gè)數(shù),對(duì)二分類肝包蟲(chóng)圖像進(jìn)行分類實(shí)驗(yàn),同時(shí)通過(guò)反卷積實(shí)現(xiàn)特征可視化,挖掘疾病潛在特征。結(jié)果表明,CTLeNet模型在分類任務(wù)中取得了較好的效果,有望通過(guò)深度學(xué)習(xí)方法對(duì)肝包蟲(chóng)病提供輔助診斷和決策支持。
摘要:設(shè)計(jì)并實(shí)現(xiàn)了NVIDIA嵌入式平臺(tái)Jetson TX2上的車輛跟蹤系統(tǒng)。從攝像頭采集YUV420格式的視頻數(shù)據(jù),然后將數(shù)據(jù)送到Tegra Parker硬件HEVC編碼器進(jìn)行編碼,輸出碼流經(jīng)過(guò)RTP封裝后通過(guò)UDP廣播發(fā)送,利用Gstreamer多媒體框架開(kāi)發(fā)接收及解碼程序,最后,針對(duì)獲取的視頻動(dòng)態(tài)進(jìn)行車輛的跟蹤與顯示。運(yùn)行Yolo V2檢測(cè)算法,對(duì)車輛進(jìn)行檢測(cè),從而為跟蹤系統(tǒng)提供跟蹤對(duì)象。利用Kalman濾波算法對(duì)車輛的位置進(jìn)行預(yù)測(cè),再經(jīng)過(guò)Meanshift算法進(jìn)行車輛跟蹤。系統(tǒng)能夠?qū)崿F(xiàn)幀率為60 f/s的超高清4K視頻實(shí)時(shí)編碼和傳輸,此系統(tǒng)中的HEVC 硬件編碼器編碼速率比PC端x265編碼器大3個(gè)數(shù)量級(jí),PSNR比PC端x265編碼器高6 dB,更加適用于智能交通中。
摘要:神經(jīng)網(wǎng)絡(luò)的存儲(chǔ)能力一直是一個(gè)重大的缺陷,其存儲(chǔ)主要體現(xiàn)在權(quán)重系數(shù)上,因此參數(shù)量一多,訓(xùn)練起來(lái)就十分困難。給神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)一個(gè)外部關(guān)聯(lián)存儲(chǔ)器,能有效對(duì)神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行關(guān)聯(lián)查詢,并將查詢的結(jié)果作為輔助輸入傳入到神經(jīng)網(wǎng)絡(luò)中去。此外,設(shè)計(jì)了自然語(yǔ)言語(yǔ)句的向量嵌入模型,并將模型和關(guān)聯(lián)存儲(chǔ)器集合起來(lái)形成一個(gè)自動(dòng)關(guān)聯(lián)語(yǔ)句語(yǔ)義向量的關(guān)聯(lián)存儲(chǔ)系統(tǒng),其性能指標(biāo)達(dá)到了設(shè)計(jì)要求。
摘要:針對(duì)視頻序列中運(yùn)動(dòng)目標(biāo)跟蹤過(guò)程中可能出現(xiàn)的目標(biāo)旋轉(zhuǎn)、遮擋、形變等原因造成的跟蹤失敗問(wèn)題,提出了一種基于目標(biāo)多區(qū)域分割的跟蹤方法。主要通過(guò)將目標(biāo)劃分為多個(gè)部分相互重疊的區(qū)域,然后選擇跟蹤過(guò)程中相對(duì)穩(wěn)定的多個(gè)區(qū)域進(jìn)行定位,進(jìn)而對(duì)跟蹤的目標(biāo)采用不同目標(biāo)區(qū)域權(quán)重更新不同的模板更新策略,這樣選擇主要可以增加算法的抗遮擋、抗旋轉(zhuǎn)能力。實(shí)驗(yàn)結(jié)果表明,該方法對(duì)目標(biāo)遮擋、旋轉(zhuǎn)等具有一定的適應(yīng)能力。
摘要:對(duì)絕緣柵雙極型晶體管進(jìn)行參數(shù)預(yù)測(cè)可以有效地避免因其失效帶來(lái)的經(jīng)濟(jì)損失和安全問(wèn)題。對(duì)絕緣柵雙極型晶體管參數(shù)進(jìn)行分析,設(shè)計(jì)了一個(gè)基于LSTM網(wǎng)絡(luò)的絕緣柵雙極型晶體管參數(shù)預(yù)測(cè)SoC硬件系統(tǒng)。該系統(tǒng)使用ARM處理器作為總控制器,控制各個(gè)子模塊的調(diào)用和數(shù)據(jù)的傳輸,F(xiàn)PGA內(nèi)通過(guò)對(duì)矩陣向量?jī)?nèi)積算法進(jìn)行優(yōu)化提高LSTM網(wǎng)絡(luò)內(nèi)部的數(shù)據(jù)運(yùn)算速度,并且采用多項(xiàng)式近似的方法降低了激活函數(shù)所占用的資源。實(shí)驗(yàn)結(jié)果表明,系統(tǒng)的預(yù)測(cè)平均準(zhǔn)確率為92.6%,計(jì)算速度相比于CPU快了3.74倍,同時(shí)具有低功耗的特點(diǎn)。
摘要:近年來(lái)卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)在文本分類領(lǐng)域得到了越來(lái)越廣泛的的應(yīng)用。提出一種卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)特征融合的模型,通過(guò)長(zhǎng)短期記憶網(wǎng)絡(luò)作為池化層的替代來(lái)獲得長(zhǎng)期依賴性,從而構(gòu)建一個(gè)聯(lián)合CNN和RNN的框架來(lái)克服單卷積神經(jīng)網(wǎng)絡(luò)忽略詞語(yǔ)在上下文中語(yǔ)義和語(yǔ)法信息的問(wèn)題。所提出的方法在減少參數(shù)數(shù)量和兼顧文本序列全局特征方面起著重要作用,實(shí)驗(yàn)結(jié)果表明,可以通過(guò)更小的框架來(lái)實(shí)現(xiàn)相同級(jí)別的分類性能,并且在準(zhǔn)確率方面超越了同類型的其他幾種方法。
摘要:使用財(cái)務(wù)數(shù)據(jù)構(gòu)建一個(gè)多因子選股模型,在支持向量機(jī)分類上進(jìn)行預(yù)測(cè)優(yōu)化。選股上使用排序法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,再使用支持向量機(jī)對(duì)股票收益進(jìn)行分類預(yù)測(cè),最后使用數(shù)據(jù)到分離超平面的距離進(jìn)行排序,優(yōu)化支持向量機(jī)的分類預(yù)測(cè)。實(shí)證中,從中證500成分股中選出股票組合,在2016年四季度到2018年一季度獲得累計(jì)收益88.96%。擇時(shí)策略的均線策略和通道突破策略均能有效降低波動(dòng)率和回撤。還使用高頻數(shù)據(jù)來(lái)降低均線策略的滯后性,波動(dòng)率又得到進(jìn)一步降低。本模型利用支持向量機(jī)性質(zhì)提高預(yù)測(cè)精度,結(jié)合技術(shù)分析優(yōu)化了策略的收益,為多因子選股和交易提供了新的研究視角。
摘要:在當(dāng)前人工智能技術(shù)發(fā)展的熱潮中,對(duì)話系統(tǒng)已經(jīng)越來(lái)越實(shí)用化。與一般的閑聊對(duì)話系統(tǒng)不同,特定領(lǐng)域的對(duì)話系統(tǒng)是基于知識(shí),帶有上下文推理的實(shí)用性對(duì)話系統(tǒng)。保險(xiǎn)領(lǐng)域是典型的特定領(lǐng)域,介紹了一種保險(xiǎn)相關(guān)領(lǐng)域?qū)υ捪到y(tǒng)的基本構(gòu)建方法,可以幫助用戶快速、實(shí)用地在某特定領(lǐng)域和場(chǎng)景下構(gòu)建對(duì)話系統(tǒng),且具有一定的推廣性和拓展性。
摘要:身份認(rèn)證技術(shù)有了很大的發(fā)展,隨之不斷出現(xiàn)的是各種偽造合法用戶信息的欺詐手段。針對(duì)這一問(wèn)題,提出一種基于深度學(xué)習(xí)人臉活體檢測(cè)算法,分析了真實(shí)人臉和欺詐人臉之間的區(qū)別,將真實(shí)人臉和照片進(jìn)行數(shù)據(jù)去中心化、zca白化去噪聲、隨機(jī)旋轉(zhuǎn)等處理;同時(shí),利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)照片的面部特征進(jìn)行提取,提取出來(lái)的特征送入神經(jīng)網(wǎng)絡(luò)訓(xùn)練、分類。算法在公開(kāi)的數(shù)據(jù)庫(kù)NUAA上進(jìn)行了驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該方法降低了計(jì)算的復(fù)雜度,提高了識(shí)別準(zhǔn)確率。
摘要:針對(duì)當(dāng)前深度學(xué)習(xí)目標(biāo)檢測(cè)算法計(jì)算復(fù)雜度高和內(nèi)存需求大等問(wèn)題,設(shè)計(jì)并實(shí)現(xiàn)了一種基于FPGA的深度學(xué)習(xí)目標(biāo)檢測(cè)系統(tǒng)。設(shè)計(jì)對(duì)應(yīng)YOLOv2-Tiny目標(biāo)檢測(cè)算法的硬件加速器,對(duì)加速器各模塊的處理時(shí)延建模,給出卷積計(jì)算模塊的詳細(xì)設(shè)計(jì)。實(shí)驗(yàn)結(jié)果表明,與CPU相比,CPU+FPGA的異構(gòu)系統(tǒng)是雙核ARM-A9能效的67.5倍,Xeon的94.6倍;速度是雙核ARM-A9的84.4倍,Xeon的5.5倍左右。并且,當(dāng)前設(shè)計(jì)在性能上超過(guò)之前的工作。
摘要:針對(duì)車站、商場(chǎng)等大型場(chǎng)所中客流量大、背景復(fù)雜等原因?qū)е露喑叨热四槞z測(cè)精度低的問(wèn)題,建立了一種基于RefineDet多層特征圖融合的多尺度人臉檢測(cè)方法。首先利用第一級(jí)網(wǎng)絡(luò)進(jìn)行特征提取并在不同尺度的特征圖上粗略預(yù)估人臉位置;然后在第二級(jí)中通過(guò)特征金字塔網(wǎng)絡(luò)將低層特征與高層特征融合,進(jìn)一步增強(qiáng)小尺寸人臉的語(yǔ)義信息;最后,通過(guò)置信度和焦點(diǎn)損失函數(shù)對(duì)檢測(cè)框進(jìn)行二次抑制,達(dá)到邊框的精確回歸。實(shí)驗(yàn)中將人臉候選區(qū)域的寬高比只設(shè)置為1:1,以此來(lái)降低運(yùn)算量并提高人臉檢測(cè)精度。在Wider Face數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該方法能有效檢測(cè)不同尺度的人臉,在Easy、Medium、Hard 3個(gè)子數(shù)據(jù)集上測(cè)試結(jié)果分別為93.4%、92%、84.4%的MAP,尤其對(duì)小尺寸人臉的檢測(cè)精度有明顯提高。
摘要:多示例多標(biāo)簽學(xué)習(xí)框架是一種針對(duì)解決多義性問(wèn)題而提出的新型機(jī)器學(xué)習(xí)框架,在多示例多標(biāo)簽學(xué)習(xí)框架中,一個(gè)對(duì)象是用一組示例集合來(lái)表示,并且和一組類別標(biāo)簽相關(guān)聯(lián)。E-MIMLSVM+算法是多示例多標(biāo)簽學(xué)習(xí)框架中利用退化思想的經(jīng)典分類算法,針對(duì)其無(wú)法利用無(wú)標(biāo)簽樣本進(jìn)行學(xué)習(xí)從而造成泛化能力差等問(wèn)題,使用半監(jiān)督支持向量機(jī)對(duì)該算法進(jìn)行改進(jìn)。改進(jìn)后的算法可以利用少量有標(biāo)簽樣本和大量沒(méi)有標(biāo)簽的樣本進(jìn)行學(xué)習(xí),有助于發(fā)現(xiàn)樣本集內(nèi)部隱藏的結(jié)構(gòu)信息,了解樣本集的真實(shí)分布情況。通過(guò)對(duì)比實(shí)驗(yàn)可以看出,改進(jìn)后的算法有效提高了分類器的泛化性能。
摘要:時(shí)間序列預(yù)測(cè)是數(shù)據(jù)中心關(guān)鍵性能指標(biāo)異常檢測(cè)的重要環(huán)節(jié)。針對(duì)時(shí)間序列,利用小波基函數(shù)作為隱含層節(jié)點(diǎn)傳遞函數(shù)來(lái)構(gòu)造小波神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè);同時(shí)選取動(dòng)量梯度下降法提高神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)效率;再根據(jù)粒子群算法訓(xùn)練得到最優(yōu)解作為神經(jīng)網(wǎng)絡(luò)參數(shù)初始值;最后使用MATLAB進(jìn)行仿真,以較高準(zhǔn)確性對(duì)關(guān)鍵性能指標(biāo)時(shí)間序列進(jìn)行了預(yù)測(cè)。
摘要:長(zhǎng)期以來(lái),各類交通事故嚴(yán)重影響了人們生命財(cái)產(chǎn)安全和社會(huì)經(jīng)濟(jì)發(fā)展。交通事故分析是對(duì)交通事故資料進(jìn)行調(diào)查研究,發(fā)現(xiàn)事故動(dòng)向和各種影響因素對(duì)事故總體的作用和相互關(guān)系,以便定量地認(rèn)識(shí)事故現(xiàn)象的本質(zhì)和內(nèi)在規(guī)律。通過(guò)對(duì)交通事故中記錄駕駛員違法行為的文本數(shù)據(jù)進(jìn)行分析,提出了一種文本主題提取模型和技術(shù),來(lái)挖掘交通事故中駕駛員風(fēng)險(xiǎn)駕駛因素,解決以往交通事故統(tǒng)計(jì)中交通違法行為難以挖掘的問(wèn)題,計(jì)算出影響交通事故的最大支配因素。最后以北京地區(qū)一般程序處理的交通事故為例,結(jié)合北京市交通管理專家經(jīng)驗(yàn),驗(yàn)證該模型可應(yīng)用于交通事故中違法行為的主題提取,結(jié)論與長(zhǎng)期治理經(jīng)驗(yàn)相吻合。
摘要:針對(duì)圖像質(zhì)量客觀評(píng)價(jià)方法在實(shí)際應(yīng)用場(chǎng)景下性能退化的問(wèn)題,將人眼視覺(jué)特性融入圖像特征處理的多個(gè)環(huán)節(jié),提出一種融合視覺(jué)結(jié)構(gòu)顯著和視覺(jué)能量顯著特征互補(bǔ)的方法。首先,根據(jù)人眼特性對(duì)圖像的灰度能量、對(duì)比度能量和梯度結(jié)構(gòu)三層互補(bǔ)特征進(jìn)行空域-頻域聯(lián)合變換處理;其次,分別提取前述三層視覺(jué)特征的多通道信息并進(jìn)行評(píng)價(jià);最后,基于視覺(jué)特性和圖像失真度將各層視覺(jué)特征評(píng)價(jià)從內(nèi)層至外層逐步自適應(yīng)綜合。實(shí)驗(yàn)表明,本方法具有較高的水平和更好的穩(wěn)定性,提高了實(shí)際應(yīng)用場(chǎng)景下的評(píng)價(jià)性能。
摘要:為了驗(yàn)證股票的價(jià)格運(yùn)動(dòng)與過(guò)去應(yīng)該是相似的這一假設(shè),運(yùn)用K近鄰算法,將價(jià)格運(yùn)動(dòng)簡(jiǎn)單劃分為漲跌兩類進(jìn)行預(yù)測(cè),進(jìn)行假設(shè)驗(yàn)證。使用滑窗方法比較現(xiàn)在的價(jià)格運(yùn)動(dòng)與何時(shí)的歷史價(jià)格更為相似,將多個(gè)K近鄰模型組合成集成模型,實(shí)現(xiàn)模型的泛化和策略收益的調(diào)整。使用中證500指數(shù)的歷史價(jià)格數(shù)據(jù)進(jìn)行預(yù)測(cè)實(shí)證,2017年~2018年9月的預(yù)測(cè)結(jié)果顯示單個(gè)K近鄰模型策略獲得76.72%的收益,現(xiàn)在的價(jià)格運(yùn)動(dòng)與遙遠(yuǎn)的過(guò)去更為相似,集成模型能更好地控制風(fēng)險(xiǎn)。該模型利用K近鄰模型的含義驗(yàn)證了股票價(jià)格運(yùn)動(dòng)具有相似性,可以作為證券交易的擇時(shí)策略。
摘要:人臉識(shí)別技術(shù)是深度學(xué)習(xí)的重要研究領(lǐng)域。為了克服傳統(tǒng)開(kāi)環(huán)人臉認(rèn)知模式以及深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的缺陷,模仿人類實(shí)時(shí)評(píng)測(cè)認(rèn)知結(jié)果自尋優(yōu)調(diào)節(jié)特征空間和分類認(rèn)知準(zhǔn)則的認(rèn)知模式,借鑒閉環(huán)控制理論思想,探索了一種基于深度集成學(xué)習(xí)的人臉智能反饋認(rèn)知方法。首先,基于DEEPID網(wǎng)絡(luò)建立人臉圖像由全局到局部具有確定映射關(guān)系的非結(jié)構(gòu)化特征空間;其次,基于特征可分性評(píng)測(cè)和變精度粗糙集理論,從信息論角度建立非結(jié)構(gòu)化動(dòng)態(tài)特征表征的人臉認(rèn)知決策信息系統(tǒng)模型,以約減非結(jié)構(gòu)化特征空間;再次,采用集成隨機(jī)權(quán)向量函數(shù)連接網(wǎng)絡(luò),構(gòu)建簡(jiǎn)約非結(jié)構(gòu)化特征空間的分類認(rèn)知準(zhǔn)則;最后,構(gòu)建人臉認(rèn)知結(jié)果熵測(cè)度指標(biāo),為人臉特征空間和分類認(rèn)知準(zhǔn)則的自尋優(yōu)調(diào)節(jié)機(jī)制提供量化依據(jù)。實(shí)驗(yàn)結(jié)果表明,較已有方法,該方法有效地提高了人臉圖像的識(shí)別率。
摘要:隨著計(jì)算機(jī)技術(shù)的發(fā)展,融合計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)的火災(zāi)圖像處理技術(shù)得到了廣泛的研究和應(yīng)用。針對(duì)傳統(tǒng)圖像處理方法預(yù)處理過(guò)程復(fù)雜且誤報(bào)率高等問(wèn)題,提出一種基于深度卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行火災(zāi)檢測(cè)的方法,其減少了復(fù)雜的預(yù)處理環(huán)節(jié),將整個(gè)火災(zāi)識(shí)別過(guò)程整合成一個(gè)單深度神經(jīng)網(wǎng)絡(luò),便于訓(xùn)練與優(yōu)化。針對(duì)識(shí)別過(guò)程中類似火災(zāi)場(chǎng)景對(duì)火災(zāi)檢測(cè)產(chǎn)生干擾的問(wèn)題,利用火災(zāi)的運(yùn)動(dòng)特性,創(chuàng)新性地提出利用火災(zāi)視頻前后幀火災(zāi)坐標(biāo)位置變化來(lái)排除燈光等類似火災(zāi)場(chǎng)景對(duì)檢測(cè)的干擾。對(duì)比了眾多深度學(xué)習(xí)開(kāi)源框架后,選擇Caffe框架進(jìn)行訓(xùn)練及測(cè)試,實(shí)驗(yàn)結(jié)果表明,該方法實(shí)現(xiàn)了對(duì)火災(zāi)圖像的識(shí)別和定位,適應(yīng)于不同的火災(zāi)場(chǎng)景,具有很好的泛化能力和抗干擾能力。
摘要:針對(duì)在進(jìn)近著陸的過(guò)程中,儀表著陸系統(tǒng)(ILS)易受到外界環(huán)境及空域的干擾,導(dǎo)致導(dǎo)航精度降低的問(wèn)題,提出一種利用慣性導(dǎo)航系統(tǒng)(INS)與GBAS著陸系統(tǒng)(GLS)進(jìn)行改進(jìn)的組合導(dǎo)航算法,將組合導(dǎo)航系統(tǒng)輸出位置信息之間的差值作為BP神經(jīng)網(wǎng)絡(luò)改進(jìn)的無(wú)跡卡爾曼濾波器(UKF)的量測(cè)值,通過(guò)最優(yōu)加權(quán)的方法得到系統(tǒng)的全局最優(yōu)估計(jì)值。相比于傳統(tǒng)的聯(lián)邦濾波算法,該算法能有效降低測(cè)量噪聲,減小飛機(jī)進(jìn)近著陸時(shí)的誤差,提高導(dǎo)航精度。
摘要:隨著互聯(lián)網(wǎng)應(yīng)用的飛速發(fā)展和用戶人數(shù)的急劇增長(zhǎng),股市評(píng)論與觀點(diǎn)在很大程度上反映了股市行情,也影響著股市漲跌。因此,如何快速高效地分析到網(wǎng)民對(duì)股市的態(tài)度和觀點(diǎn),對(duì)股市預(yù)測(cè)具有很大指導(dǎo)意義。論文研究通過(guò)分析不同專業(yè)人士發(fā)布股評(píng)的情感極性來(lái)預(yù)測(cè)股票上漲與下跌趨勢(shì)。提出了一種綜合金融詞組詞典和結(jié)尾段加權(quán)的情感分析方法,能解決情感字典分析方法對(duì)領(lǐng)域依賴性問(wèn)題,有效地提高了情感分析準(zhǔn)確度。另外,論文還提出了一種加窗的股票預(yù)測(cè)模型,可用于分析預(yù)測(cè)事件窗口的最佳值。實(shí)驗(yàn)結(jié)果表明,基于股評(píng)情感分析來(lái)預(yù)測(cè)特定股票上漲或下跌趨勢(shì)具有較好效果。
摘要:基于特征提取和模式識(shí)別的多體制通信信號(hào)自動(dòng)調(diào)制識(shí)別技術(shù)是軟件無(wú)線電領(lǐng)域中的重要研究課題,是復(fù)雜電磁環(huán)境下頻譜管理、頻譜檢測(cè)等非協(xié)作通信領(lǐng)域的關(guān)鍵技術(shù)之一。提出一種基于深度學(xué)習(xí)的通信信號(hào)調(diào)制模式識(shí)別算法,應(yīng)用自編碼技術(shù)進(jìn)行特征提取,獲得具有較好的抗干擾能力的特征集,然后使用 BP神經(jīng)網(wǎng)絡(luò)對(duì)經(jīng)過(guò)篩選的特征進(jìn)行分類識(shí)別,實(shí)現(xiàn)了MQAM通信信號(hào)調(diào)制模式自動(dòng)識(shí)別。仿真實(shí)驗(yàn)結(jié)果表明,所提出的方法分類識(shí)別效果好,有效提高了數(shù)字調(diào)制信號(hào)自動(dòng)識(shí)別的抗干擾能力。
摘要:針對(duì)國(guó)網(wǎng)客服電話語(yǔ)音識(shí)別在特定領(lǐng)域核心詞識(shí)別效果差的問(wèn)題,提出一種基于HCLG領(lǐng)域詞權(quán)重增強(qiáng)和領(lǐng)域詞糾正的方法,能夠?qū)崟r(shí)并快速地添加領(lǐng)域詞,從而動(dòng)態(tài)地優(yōu)化語(yǔ)言模型,提升語(yǔ)音識(shí)別效果。將該模型和算法優(yōu)化應(yīng)用在國(guó)網(wǎng)客服中心電話語(yǔ)音的咨詢、維修、投訴等各種領(lǐng)域場(chǎng)景中,其語(yǔ)音識(shí)別結(jié)果都得到大幅改善。
摘要:4G網(wǎng)絡(luò)技術(shù)的成熟使得用戶對(duì)運(yùn)營(yíng)商的業(yè)務(wù)需求越來(lái)越高,如何維系用戶和通過(guò)對(duì)用戶屬性的研究來(lái)迎合用戶對(duì)業(yè)務(wù)的需求,建立方便快捷的體驗(yàn)服務(wù)手段,建設(shè)維系挽留系統(tǒng)是我國(guó)通信運(yùn)營(yíng)商未來(lái)發(fā)展的重中之重。首先分析移動(dòng)用戶維系發(fā)展現(xiàn)狀,提出用戶維系發(fā)展屬性。其次,采用數(shù)據(jù)挖掘方法建立以用戶穩(wěn)定度和用戶價(jià)值評(píng)價(jià)為基礎(chǔ)的數(shù)據(jù)挖掘分析模型,并通過(guò)用戶數(shù)據(jù)進(jìn)行驗(yàn)證。最后,針對(duì)存量維系如何進(jìn)行多渠道精準(zhǔn)推送提出進(jìn)一步展望。
摘要:由于圖像中的雨線條紋具有不同形狀、尺寸且分布不均勻,單一神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)分布不均勻的雨密度能力弱,去雨效果不顯著,對(duì)此提出雨密度感知引導(dǎo)擴(kuò)張網(wǎng)絡(luò)對(duì)單張圖片去除雨的方法。網(wǎng)絡(luò)分為兩部分:(1)雨密度感知網(wǎng)絡(luò)對(duì)不同密度雨的圖片進(jìn)行分類(大雨、中雨、小雨);(2)聯(lián)合雨密度感知分類信息引導(dǎo)擴(kuò)張網(wǎng)絡(luò)學(xué)習(xí)不同的雨密度特征細(xì)節(jié),用于檢測(cè)雨線和去雨。實(shí)驗(yàn)證明了該方法在合成和真實(shí)數(shù)據(jù)集上去雨的有效性。
摘要:深度神經(jīng)網(wǎng)絡(luò)由于結(jié)構(gòu)類似于生物神經(jīng)網(wǎng)絡(luò),因此擁有高效、精準(zhǔn)抽取信息深層隱含特征的能力和能夠?qū)W習(xí)多層的抽象特征表示,且能夠?qū)缬?、多源、異質(zhì)的內(nèi)容信息進(jìn)行學(xué)習(xí)等優(yōu)勢(shì)。提出了一種基于多用戶-項(xiàng)目結(jié)合深度神經(jīng)網(wǎng)絡(luò)抽取特征、自學(xué)習(xí)等優(yōu)勢(shì)實(shí)現(xiàn)信息個(gè)性化推薦的模型,該模型通過(guò)對(duì)輸入多源異構(gòu)數(shù)據(jù)特征進(jìn)行深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、抽取,再融合協(xié)同過(guò)濾中的廣泛個(gè)性化產(chǎn)生候選集,然后通過(guò)二次模型學(xué)習(xí)產(chǎn)生排序集,實(shí)現(xiàn)精準(zhǔn)、實(shí)時(shí)、個(gè)性化推薦。通過(guò)真實(shí)數(shù)據(jù)集對(duì)模型評(píng)估實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,該模型能夠很好地學(xué)習(xí)、抽取用戶隱特征,并且能夠一定程度上解決傳統(tǒng)推薦系統(tǒng)稀疏性、新物品等問(wèn)題,同時(shí)實(shí)現(xiàn)了更加精準(zhǔn)、實(shí)時(shí)、個(gè)性化的推薦。
摘要:以移動(dòng)機(jī)器人視覺(jué)導(dǎo)航為應(yīng)用背景,針對(duì)傳統(tǒng)ORB算法在視覺(jué)SLAM中存在特征點(diǎn)分布不均勻、重疊特征點(diǎn)較多的問(wèn)題,提出一種改進(jìn)ORB算法。首先,對(duì)每層圖像的尺度空間金字塔進(jìn)行網(wǎng)格劃分,增加空間尺度信息;其次,在特征點(diǎn)檢測(cè)時(shí),采用改進(jìn)FAST角點(diǎn)自適應(yīng)閾值提取,設(shè)置感興趣區(qū)域;然后,采用非極大值抑制的方法,抑制低閾值特征點(diǎn)的輸出;最后,使用基于區(qū)域圖像特征點(diǎn)分布的方差數(shù)值評(píng)價(jià)待檢測(cè)圖像中特征點(diǎn)的分布情況。實(shí)驗(yàn)結(jié)果表明,改進(jìn)ORB算法特征點(diǎn)的分布較為均勻,輸出特征點(diǎn)重疊數(shù)量較少,執(zhí)行時(shí)間較短。
摘要:針對(duì)單獨(dú)機(jī)器人難以執(zhí)行復(fù)雜環(huán)境中任務(wù)的問(wèn)題,Unmanned Air/Ground Vehicle(UAV/UGV)協(xié)同系統(tǒng)近年來(lái)受到了廣泛關(guān)注。為了提高執(zhí)行任務(wù)的工作效率,提出一種基于視覺(jué)傳感器下UAV/UGV協(xié)同系統(tǒng)中UAV目標(biāo)識(shí)別下UGV全局路徑規(guī)劃的方法,無(wú)人機(jī)利用高空視野優(yōu)勢(shì)獲取目標(biāo)物與環(huán)境信息, SURF算法和圖像分割實(shí)現(xiàn)環(huán)境建模。無(wú)人車根據(jù)無(wú)人機(jī)獲取的信息,利用優(yōu)化的A*算法完成全局路徑規(guī)劃,并且在典型搜救場(chǎng)景中進(jìn)行了仿真驗(yàn)證。實(shí)驗(yàn)表明,SURF算法能滿足目標(biāo)識(shí)別的精確度、實(shí)時(shí)性和魯棒性;并且利用優(yōu)化的A*算法實(shí)現(xiàn)了UGV快速準(zhǔn)確的全局路徑規(guī)劃。
摘要:圖像著色的目標(biāo)是為灰度圖像的每一個(gè)像素分配顏色,它是圖像處理領(lǐng)域的熱點(diǎn)問(wèn)題。以U-Net為主線網(wǎng)絡(luò),結(jié)合深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了一個(gè)全自動(dòng)的著色網(wǎng)絡(luò)模型。在該模型中,支線使用卷積神經(jīng)網(wǎng)絡(luò)SE-Inception-ResNet-v2作為高水平的特征提取器,提取圖像的全局信息,同時(shí)在網(wǎng)絡(luò)中使用PoLU(Power Linear Unit)函數(shù)替代線性整流函數(shù)(ReLU)。實(shí)驗(yàn)結(jié)果證明此著色網(wǎng)絡(luò)模型能夠?qū)叶葓D像進(jìn)行有效的著色。
摘要:針對(duì)卷積神經(jīng)網(wǎng)絡(luò)(CNN)中空間上的指靜脈信息丟失的問(wèn)題,提出了一種基于膠囊網(wǎng)絡(luò)(Capsule Network,CapsNets)的指靜脈識(shí)別算法。CapsNets在整個(gè)學(xué)習(xí)過(guò)程中以“膠囊”的形式從底層傳遞至高層,如此以向量的形式封裝指靜脈的多維特征,特征會(huì)在網(wǎng)絡(luò)中被保存,而不是丟失后進(jìn)行恢復(fù)。采用60 000張圖像作為訓(xùn)練集,10 000張圖為測(cè)試集,通過(guò)對(duì)圖像增強(qiáng)、裁剪后進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)。通過(guò)實(shí)驗(yàn)表明,CapsNets的網(wǎng)絡(luò)結(jié)構(gòu)特征相比CNN在處理脊線區(qū)域時(shí)效果更加明顯,對(duì)比VGG精確度增加了13.6%,loss值也收斂到0.01。
摘要:設(shè)計(jì)了一種基于深度學(xué)習(xí)的實(shí)時(shí)識(shí)別硬件系統(tǒng)框架。該系統(tǒng)框架使用Keras完成卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練并提取出網(wǎng)絡(luò)的參數(shù),利用ZYNQ器件的FPGA+ARM軟硬件協(xié)同的方式,使用ARM完成對(duì)實(shí)時(shí)圖像數(shù)據(jù)的采集、預(yù)處理及顯示,通過(guò)FPGA實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)的硬化并對(duì)圖像進(jìn)行識(shí)別,再將識(shí)別結(jié)果發(fā)送至上位機(jī)進(jìn)行實(shí)時(shí)顯示。系統(tǒng)框架采用MNIST和Fashion MNIST數(shù)據(jù)集作為網(wǎng)絡(luò)模型硬化試驗(yàn)樣本,實(shí)驗(yàn)結(jié)果表明,在一般場(chǎng)景下該系統(tǒng)框架能夠?qū)崟r(shí)、準(zhǔn)確地完成圖像數(shù)據(jù)的獲取、顯示及識(shí)別,并且具有可移植性高、處理速度快、功耗低的特點(diǎn)。
摘要:手寫(xiě)體數(shù)字的識(shí)別是人工智能識(shí)別系統(tǒng)中的重要組成部分。因個(gè)體手寫(xiě)數(shù)字的差異,現(xiàn)有識(shí)別系統(tǒng)準(zhǔn)確率較低?;赥ensorFlow深度學(xué)習(xí)框架完成手寫(xiě)體數(shù)字的識(shí)別及應(yīng)用,首先建立TensorFlow深度學(xué)習(xí)框架,并分析了Softmax、卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型結(jié)構(gòu),再對(duì)手寫(xiě)體數(shù)據(jù)集MNIST的60 000個(gè)樣本進(jìn)行深度學(xué)習(xí),然后進(jìn)行10 000個(gè)樣本的測(cè)試對(duì)比,最后移植最優(yōu)模型到Android平臺(tái)進(jìn)行應(yīng)用。實(shí)測(cè)數(shù)據(jù)驗(yàn)證,相對(duì)于傳統(tǒng)的Softmax模型,基于TensorFlow深度學(xué)習(xí)CNN模型識(shí)別率高達(dá)99.17%,提升了7.6%,為人工智能識(shí)別系統(tǒng)的發(fā)展提供了一定的科研價(jià)值。
摘要:為改善人體行為識(shí)別任務(wù)中準(zhǔn)確率低的問(wèn)題,提出了一種基于批歸一化的卷積神經(jīng)網(wǎng)絡(luò)(CNN)與長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)結(jié)合的神經(jīng)網(wǎng)絡(luò)。CNN部分引入批歸一化思想,將輸入網(wǎng)絡(luò)的訓(xùn)練樣本進(jìn)行小批量歸一化處理,經(jīng)過(guò)全連接之后,送入長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)中。該算法采用時(shí)空雙流網(wǎng)絡(luò)模型結(jié)構(gòu),視頻數(shù)據(jù)的RGB圖像作為空間流網(wǎng)絡(luò)輸入,光流場(chǎng)圖像作為時(shí)間流網(wǎng)絡(luò)輸入,再將時(shí)空雙流網(wǎng)絡(luò)各自得到的識(shí)別結(jié)果進(jìn)行加權(quán)融合得到最終的行為識(shí)別結(jié)果。實(shí)驗(yàn)結(jié)果表明,本文設(shè)計(jì)的時(shí)空雙流神經(jīng)網(wǎng)絡(luò)算法在人體行為識(shí)別任務(wù)上具有較高的識(shí)別準(zhǔn)確率。
摘要: 分析美國(guó)主流新聞媒體針對(duì)“一帶一路”倡議的關(guān)注熱點(diǎn),研究相關(guān)輿情的情感傾向。用網(wǎng)絡(luò)爬蟲(chóng)自動(dòng)采集相關(guān)新聞,篩選高頻詞獲得媒體關(guān)注熱點(diǎn)。提出一種自動(dòng)摘要-卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的集成式模型進(jìn)行文檔級(jí)情感分析。該模型首先提取摘要去除原始文檔中非重要數(shù)據(jù)的干擾,再利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行句子級(jí)情感分析,通過(guò)基于語(yǔ)義指向的方法獲得文檔級(jí)的情感分?jǐn)?shù),并對(duì)情感波動(dòng)異常文章二次分析。在真實(shí)數(shù)據(jù)上的對(duì)比實(shí)驗(yàn)表明,自動(dòng)摘要-CNN的集成式文檔級(jí)情感分析模型在情感分析方面優(yōu)于單一CNN的方法。
摘要: 為改善人體行為識(shí)別任務(wù)中準(zhǔn)確率低的問(wèn)題,提出了一種基于批歸一化的卷積神經(jīng)網(wǎng)絡(luò)(CNN)與長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)結(jié)合的神經(jīng)網(wǎng)絡(luò)。CNN部分引入批歸一化思想,將輸入網(wǎng)絡(luò)的訓(xùn)練樣本進(jìn)行小批量歸一化處理,經(jīng)過(guò)全連接之后,送入長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)中。該算法采用時(shí)空雙流網(wǎng)絡(luò)模型結(jié)構(gòu),視頻數(shù)據(jù)的RGB圖像作為空間流網(wǎng)絡(luò)輸入,光流場(chǎng)圖像作為時(shí)間流網(wǎng)絡(luò)輸入,再將時(shí)空雙流網(wǎng)絡(luò)各自得到的識(shí)別結(jié)果進(jìn)行加權(quán)融合得到最終的行為識(shí)別結(jié)果。實(shí)驗(yàn)結(jié)果表明,本文設(shè)計(jì)的時(shí)空雙流神經(jīng)網(wǎng)絡(luò)算法在人體行為識(shí)別任務(wù)上具有較高的識(shí)別準(zhǔn)確率。
摘要: 手寫(xiě)體數(shù)字的識(shí)別是人工智能識(shí)別系統(tǒng)中的重要組成部分。因個(gè)體手寫(xiě)數(shù)字的差異,現(xiàn)有識(shí)別系統(tǒng)準(zhǔn)確率較低。基于TensorFlow深度學(xué)習(xí)框架完成手寫(xiě)體數(shù)字的識(shí)別及應(yīng)用,首先建立TensorFlow深度學(xué)習(xí)框架,并分析了Softmax、卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型結(jié)構(gòu),再對(duì)手寫(xiě)體數(shù)據(jù)集MNIST的60 000個(gè)樣本進(jìn)行深度學(xué)習(xí),然后進(jìn)行10 000個(gè)樣本的測(cè)試對(duì)比,最后移植最優(yōu)模型到Android平臺(tái)進(jìn)行應(yīng)用。實(shí)測(cè)數(shù)據(jù)驗(yàn)證,相對(duì)于傳統(tǒng)的Softmax模型,基于TensorFlow深度學(xué)習(xí)CNN模型識(shí)別率高達(dá)99.17%,提升了7.6%,為人工智能識(shí)別系統(tǒng)的發(fā)展提供了一定的科研價(jià)值。
摘要: 設(shè)計(jì)了一種基于深度學(xué)習(xí)的實(shí)時(shí)識(shí)別硬件系統(tǒng)框架。該系統(tǒng)框架使用Keras完成卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練并提取出網(wǎng)絡(luò)的參數(shù),利用ZYNQ器件的FPGA+ARM軟硬件協(xié)同的方式,使用ARM完成對(duì)實(shí)時(shí)圖像數(shù)據(jù)的采集、預(yù)處理及顯示,通過(guò)FPGA實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)的硬化并對(duì)圖像進(jìn)行識(shí)別,再將識(shí)別結(jié)果發(fā)送至上位機(jī)進(jìn)行實(shí)時(shí)顯示。系統(tǒng)框架采用MNIST和Fashion MNIST數(shù)據(jù)集作為網(wǎng)絡(luò)模型硬化試驗(yàn)樣本,實(shí)驗(yàn)結(jié)果表明,在一般場(chǎng)景下該系統(tǒng)框架能夠?qū)崟r(shí)、準(zhǔn)確地完成圖像數(shù)據(jù)的獲取、顯示及識(shí)別,并且具有可移植性高、處理速度快、功耗低的特點(diǎn)。
摘要: 針對(duì)卷積神經(jīng)網(wǎng)絡(luò)(CNN)中空間上的指靜脈信息丟失的問(wèn)題,提出了一種基于膠囊網(wǎng)絡(luò)(Capsule Network,CapsNets)的指靜脈識(shí)別算法。CapsNets在整個(gè)學(xué)習(xí)過(guò)程中以“膠囊”的形式從底層傳遞至高層,如此以向量的形式封裝指靜脈的多維特征,特征會(huì)在網(wǎng)絡(luò)中被保存,而不是丟失后進(jìn)行恢復(fù)。采用60 000張圖像作為訓(xùn)練集,10 000張圖為測(cè)試集,通過(guò)對(duì)圖像增強(qiáng)、裁剪后進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)。通過(guò)實(shí)驗(yàn)表明,CapsNets的網(wǎng)絡(luò)結(jié)構(gòu)特征相比CNN在處理脊線區(qū)域時(shí)效果更加明顯,對(duì)比VGG精確度增加了13.6%,loss值也收斂到0.01。
摘要: 圖像著色的目標(biāo)是為灰度圖像的每一個(gè)像素分配顏色,它是圖像處理領(lǐng)域的熱點(diǎn)問(wèn)題。以U-Net為主線網(wǎng)絡(luò),結(jié)合深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了一個(gè)全自動(dòng)的著色網(wǎng)絡(luò)模型。在該模型中,支線使用卷積神經(jīng)網(wǎng)絡(luò)SE-Inception-ResNet-v2作為高水平的特征提取器,提取圖像的全局信息,同時(shí)在網(wǎng)絡(luò)中使用PoLU(Power Linear Unit)函數(shù)替代線性整流函數(shù)(ReLU)。實(shí)驗(yàn)結(jié)果證明此著色網(wǎng)絡(luò)模型能夠?qū)叶葓D像進(jìn)行有效的著色。
摘要: 針對(duì)目前深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)在CPU平臺(tái)下訓(xùn)練速度慢、耗時(shí)長(zhǎng)的問(wèn)題,采用現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)硬件平臺(tái)設(shè)計(jì)并實(shí)現(xiàn)了一種深度卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)。該系統(tǒng)采用修正線性單元(ReLU)作為特征輸出的激活函數(shù)并使用Softmax函數(shù)作為輸出分類器。利用流水線技術(shù)并針對(duì)每一層的特征運(yùn)算進(jìn)行了并行處理,從而能夠在1個(gè)系統(tǒng)時(shí)鐘周期內(nèi)完成整個(gè)CNN中的295次卷積運(yùn)算。系統(tǒng)最后采用MNIST數(shù)據(jù)集作為實(shí)驗(yàn)樣本,實(shí)驗(yàn)結(jié)果表明,在50 MHz的工作頻率下,F(xiàn)PGA的訓(xùn)練用時(shí)相較于通用CPU的訓(xùn)練用時(shí)提升了8.7倍,經(jīng)過(guò)2 000次迭代后系統(tǒng)識(shí)別的準(zhǔn)確率為92.42%。
摘要: 穴位的位置是否找準(zhǔn)會(huì)直接影響治療效果,因此設(shè)計(jì)了一種基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)(PSO-BP)的穴位相對(duì)坐標(biāo)預(yù)測(cè)模型,然后與ARM結(jié)合構(gòu)成一個(gè)可以用于人體穴位定位的系統(tǒng)。首先采用PC進(jìn)行MATLAB仿真訓(xùn)練學(xué)習(xí),然后將最優(yōu)權(quán)值及閾值保存下來(lái)并簡(jiǎn)化算法嵌入ARM內(nèi),將在線預(yù)測(cè)轉(zhuǎn)變?yōu)殡x線過(guò)程。實(shí)驗(yàn)結(jié)果表明:經(jīng)粒子群優(yōu)化過(guò)的BP神經(jīng)網(wǎng)絡(luò)有效地改善了局部極值缺陷,可應(yīng)用于定位端預(yù)測(cè)穴位的位置,并在LCD中顯示穴位相關(guān)信息,控制端收到位置數(shù)據(jù)后可執(zhí)行電機(jī)上的運(yùn)動(dòng)操作。
摘要: 基于Google第二代人工智能學(xué)習(xí)系統(tǒng)TensorFlow構(gòu)建神經(jīng)網(wǎng)絡(luò)對(duì)煙霧圖像進(jìn)行識(shí)別檢測(cè),通過(guò)改進(jìn)的運(yùn)動(dòng)檢測(cè)算法截取疑似煙霧區(qū)域圖像,并結(jié)合PCA降維算法和Inception Resnet v2網(wǎng)絡(luò)模型在TensorFlow平臺(tái)下進(jìn)行煙霧特征的訓(xùn)練識(shí)別。該算法實(shí)現(xiàn)了較大范圍的火災(zāi)實(shí)時(shí)檢測(cè)報(bào)警,經(jīng)過(guò)實(shí)驗(yàn)證明整個(gè)檢測(cè)過(guò)程準(zhǔn)確地識(shí)別了視頻流中的煙霧區(qū)域,相比于傳統(tǒng)煙霧識(shí)別方法具有更高的準(zhǔn)確率和自適應(yīng)性,為大范圍的火災(zāi)煙霧報(bào)警提供了一種有效方案。
摘要: 提出一種應(yīng)用嵌入式技術(shù)和深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)對(duì)胸部X光影像分析的設(shè)計(jì)方案。采用NIVIDIA公司生產(chǎn)的Jetson TX2作為核心板,配備以太網(wǎng)模塊、WiFi模塊等功能模塊搭建該分析系統(tǒng)的硬件平臺(tái)。在GPU服務(wù)器上利用MobileNets卷積神經(jīng)網(wǎng)絡(luò)對(duì)標(biāo)注的胸部X光影像數(shù)據(jù)集進(jìn)行訓(xùn)練,將訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型移植到Jetson TX2核心板,在嵌入式平臺(tái)下完成對(duì)胸腔積液、浸潤(rùn)、肺氣腫、氣胸以及肺不張癥狀的檢測(cè)。利用美國(guó)國(guó)立衛(wèi)生研究院提供的胸部X光影像數(shù)據(jù)進(jìn)行測(cè)試,通過(guò)實(shí)驗(yàn)證明,該方法在識(shí)別準(zhǔn)確率上優(yōu)于其他的檢測(cè)方法,同時(shí)識(shí)別所需時(shí)間比其他方法短。
摘要: 提出了一種用于圖像分類的卷積神經(jīng)網(wǎng)絡(luò),將不同池化方式對(duì)圖像分類的影響進(jìn)行了分析對(duì)比,采用重疊池化和dropout技術(shù),較好地解決過(guò)擬合問(wèn)題。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,該方法在CIFAR-10數(shù)據(jù)集上獲得了較好的結(jié)果,在測(cè)試集上準(zhǔn)確率比訓(xùn)練集上準(zhǔn)確率高9%左右。
摘要: 提出一種基于機(jī)器視覺(jué)的智能導(dǎo)盲眼鏡系統(tǒng)的設(shè)計(jì)方案。采用三星公司Cortex-A8架構(gòu)的 S5PV210作為中央處理器,搭載Linux系統(tǒng),配備雙目采集、GPS定位、語(yǔ)音播報(bào)、GSM短信、語(yǔ)音通話、無(wú)線傳輸六大核心功能模塊搭建智能導(dǎo)盲眼鏡系統(tǒng)的硬件平臺(tái),結(jié)合深度學(xué)習(xí)算法在遠(yuǎn)程云服務(wù)器上完成了對(duì)目標(biāo)場(chǎng)景的智能識(shí)別,最后以語(yǔ)音的形式實(shí)時(shí)對(duì)盲人的行走作出準(zhǔn)確引導(dǎo)。系統(tǒng)測(cè)試結(jié)果表明,該智能導(dǎo)盲眼鏡系統(tǒng)在測(cè)試環(huán)境下不僅能對(duì)盲人出行正確導(dǎo)航,還具有一定的目標(biāo)識(shí)別能力,能幫助盲人進(jìn)行簡(jiǎn)易物品歸類。該系統(tǒng)還兼有GPS定位、語(yǔ)音通話、GSM短信等多項(xiàng)輔助功能。
摘要: 無(wú)人機(jī)的廣泛運(yùn)用,在給人們帶來(lái)便利的同時(shí),也引發(fā)了不良影響。比如,無(wú)人機(jī)飛入禁飛區(qū)引發(fā)安全問(wèn)題,由于不正當(dāng)?shù)氖褂们址腹竦碾[私等,因此需要構(gòu)建一個(gè)無(wú)人機(jī)警察系統(tǒng),對(duì)無(wú)人機(jī)實(shí)施監(jiān)控,遏制亂飛現(xiàn)象。采用傳統(tǒng)的識(shí)別方法,靈活性不足,精度也不夠高。為此提出一種基于深度學(xué)習(xí)的無(wú)人機(jī)識(shí)別算法,通過(guò)訓(xùn)練一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)(CNNs)的學(xué)習(xí)網(wǎng)絡(luò),得出一個(gè)高效的識(shí)別模型,實(shí)現(xiàn)無(wú)人機(jī)和非無(wú)人機(jī)間的分類。模型的測(cè)試結(jié)果表明,該方法具有較高的識(shí)別率。
摘要: 現(xiàn)有生產(chǎn)線工業(yè)機(jī)器人抓取點(diǎn)固定,工件只能以固定的姿態(tài)提前擺放在固定的位置,這種裝配模式很難滿足復(fù)雜的工業(yè)生產(chǎn)要求且效率低下。設(shè)計(jì)了基于視覺(jué)引導(dǎo)的機(jī)器人裝配系統(tǒng)改進(jìn)原有系統(tǒng)。設(shè)計(jì)了機(jī)器視覺(jué)系統(tǒng),實(shí)現(xiàn)了工件的快速識(shí)別、定位以及姿態(tài)確定功能;設(shè)計(jì)了抓放系統(tǒng),實(shí)現(xiàn)了工件的精確抓取和安裝功能;采用Visual Studio的MFC開(kāi)發(fā),實(shí)現(xiàn)圖像處理算法,并利用Socket通信將坐標(biāo)和姿態(tài)數(shù)據(jù)發(fā)送給機(jī)器人。通過(guò)實(shí)驗(yàn)驗(yàn)證本系統(tǒng)具有良好的穩(wěn)定性和快速性,可以滿足生產(chǎn)的要求,大幅提高生產(chǎn)效率。