首頁(yè) > 期刊 > 中國(guó)傳媒大學(xué)學(xué)報(bào) > 基于卷積神經(jīng)網(wǎng)絡(luò)的聲學(xué)場(chǎng)景分類(lèi)算法研究 【正文】

基于卷積神經(jīng)網(wǎng)絡(luò)的聲學(xué)場(chǎng)景分類(lèi)算法研究

作者:趙薇; 黃敬雯; 靳聰; 徐陳緣 中國(guó)傳媒大學(xué)信息與通信工程學(xué)院; 北京100024

摘要:聲學(xué)場(chǎng)景中包含著很多長(zhǎng)時(shí)特征和短時(shí)特征。本文提取環(huán)境聲的能量信息,批量生成聲音場(chǎng)景的三維語(yǔ)譜圖,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入。神經(jīng)網(wǎng)絡(luò)采用卷積層和下采樣層重復(fù)交疊,整體網(wǎng)絡(luò)采用六層網(wǎng)絡(luò)結(jié)構(gòu),最終經(jīng)過(guò)softmax方法進(jìn)行多分類(lèi)。實(shí)驗(yàn)采用DCASE2017競(jìng)賽數(shù)據(jù)集作為素材,對(duì)15類(lèi)6300段音頻進(jìn)行訓(xùn)練測(cè)試,結(jié)果表明,語(yǔ)譜圖特征與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的算法能夠很好的提取長(zhǎng)時(shí)特征和短時(shí)特征,使得最終分類(lèi)準(zhǔn)確率較高,優(yōu)于網(wǎng)站基線系統(tǒng)的分類(lèi)結(jié)果。

注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社。

中國(guó)傳媒大學(xué)學(xué)報(bào)雜志

中國(guó)傳媒大學(xué)學(xué)報(bào)雜志, 雙月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:會(huì)訊、學(xué)術(shù)理論、技術(shù)應(yīng)用、技術(shù)管理、教學(xué)研究、研究通訊等。于1994年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。

  • 部級(jí)期刊
  • 1個(gè)月內(nèi)審核

服務(wù)介紹LITERATURE

正規(guī)發(fā)表流程 全程指導(dǎo)

多年專(zhuān)注期刊服務(wù),熟悉發(fā)表政策,投稿全程指導(dǎo)。因?yàn)閷?zhuān)注所以專(zhuān)業(yè)。

保障正刊 雙刊號(hào)

推薦期刊保障正刊,評(píng)職認(rèn)可,企業(yè)資質(zhì)合規(guī)可查。

用戶(hù)信息嚴(yán)格保密

誠(chéng)信服務(wù),簽訂協(xié)議,嚴(yán)格保密用戶(hù)信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管,安全放心。

学术顾问

发表咨询 加急见刊 投稿咨询 润稿咨询