欧美色网一区,欧美经典一区,91精品久久久久久久久不口人,国产成人日日夜夜

服務(wù)熱線:0755-26751199
音響網(wǎng)(Audio160.com) > 行業(yè)資訊 > (專業(yè)音頻) > 2021聲學(xué)熱點全知道——實時通信中的音頻技術(shù)
2021聲學(xué)熱點全知道——實時通信中的音頻技術(shù)
更新時間:2022-2-15 9:08:20 編輯:溫情 21dB聲學(xué)人 調(diào)整文字大小:【

2021聲學(xué)行業(yè)大總結(jié)系列文章第二期,21dB聲學(xué)人來和大家聊一聊實時通信中的音頻技術(shù)~

作者:馬文瑤

2021年實時通訊:聲場景分類

音視頻實時通訊產(chǎn)品發(fā)展至今,其產(chǎn)品功能趨于智能化、多樣化、人性化。以廣泛使用的線上會議產(chǎn)品為例,聲學(xué)場景分類作為近年大熱的技術(shù),極大地提升了線上溝通質(zhì)量。

聲學(xué)場景分類

聲學(xué)場景分類(ASC,Acoustic Sence Classifier)技術(shù)落地到線上會議,被用于自動判斷用戶所處的環(huán)境,進(jìn)而自主地做出相應(yīng)的調(diào)整,提高線上溝通質(zhì)量。具體來說,入會者所處環(huán)境場景千變?nèi)f化,而不同場景需要對音頻流進(jìn)行不同處理:如檢測到街道環(huán)境,需要對風(fēng)噪和交通噪聲進(jìn)行處理;檢測到嘈雜聲學(xué)場景,自動禁止嘈雜端麥克風(fēng);檢測到音樂場景,不啟動降噪算法以使音樂無失真?zhèn)鬏數(shù)綄Χ耍粰z測到泄漏回聲場景,開啟殘余回聲消除算法[1]。

圖1 聲學(xué)場景分類算法流程(圖片來源:網(wǎng)絡(luò))

ASC的作用是對描述場景位置的預(yù)定義標(biāo)簽中的音頻數(shù)據(jù)進(jìn)行識別和分類。傳統(tǒng)的分類特征有梅爾頻率倒譜系數(shù)MFCC(Mel-frequency Cepstrum Coefficient)、聲學(xué)事件直方圖或者基于時頻學(xué)習(xí)的梯度直方圖。傳統(tǒng)的分類模型有隱馬爾可夫模型HMM(Hidden Markov Model)、高斯混合模型GMM(Gaussian Mixture Model)、支持向量機SVM(Support Vector Machine)[2]。

當(dāng)前主流是基于深度學(xué)習(xí)的ASC,其處理流程通常包含一下幾個步驟:傳感器采集環(huán)境信息、數(shù)據(jù)準(zhǔn)備(聲學(xué)表征、預(yù)處理、數(shù)據(jù)增強)、數(shù)據(jù)建模(網(wǎng)絡(luò)架構(gòu)、學(xué)習(xí)方法)以及最終的評價部署。本文主要聚焦于數(shù)據(jù)建模部分,對以往的工作進(jìn)行了介紹,并考察了2021年度學(xué)者進(jìn)行的改進(jìn)與探索。

數(shù)據(jù)建模之——網(wǎng)格架構(gòu)

絕大多數(shù)性能優(yōu)異的ASC算法使用的是卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Network)架構(gòu)。近年來有層出不窮基于CNN的改進(jìn)算法:Ren等人使用具有全局注意力池化的空洞卷積神經(jīng)網(wǎng)絡(luò)作為分類模型,使用大感受野取代局部池化來固定特征地圖(Feature Map)的大小[3];Koutini等人通過對感受野進(jìn)行正則化改進(jìn)了ASC性能[4];Basbug等人則是從改進(jìn)聚合局部特征的方式的角度修改了CNN的級聯(lián)架構(gòu),該架構(gòu)使用的是空間金字塔池化策略[5];Suh等人通過對輸入特征進(jìn)行網(wǎng)格搜索尋找合適的感受野[6]。

數(shù)據(jù)建模之——學(xué)習(xí)方法

現(xiàn)有常用的學(xué)習(xí)方法有:閉集分類——適用于聲學(xué)場景類別固定的數(shù)據(jù)[7];開集分類——適用于實時場景,數(shù)據(jù)分布未知[8];多輸入網(wǎng)絡(luò)法——前文所提及的都是基于CNN的ASC算法,其特征輸入都是多維的,而CNN起初是由圖像處理領(lǐng)域引入近音頻處理的,音頻信號的時頻譜圖作為特征與圖像有著完全不同的意義,因此有學(xué)者從訓(xùn)練神經(jīng)網(wǎng)絡(luò)能檢測不同維度的角度出發(fā),將頻譜圖劃分子帶,稱為多輸入網(wǎng)絡(luò);注意力機制[9];遷移學(xué)習(xí)——即充分利用機器視覺領(lǐng)域使用過的的網(wǎng)絡(luò)結(jié)構(gòu);集成學(xué)習(xí)——對多個模型進(jìn)行集成,在學(xué)術(shù)領(lǐng)域的活躍程度較高,在工程領(lǐng)域由于時間和資源的限制無法落地。

2021年度難點與探索

難點一:由于同一類聲場景的不同音頻樣本所包含的聲事件并不總是相同的,而不同類場景的音頻樣本卻極有可能包含相同的聲事件,導(dǎo)致類內(nèi)間差較大,而類間間差較小。針對此技術(shù)難點,Chon等人引入兩個不同結(jié)構(gòu)的CNN進(jìn)行雙尺度深度嵌入的學(xué)習(xí),以期能夠有效地學(xué)習(xí)表征出不同聲場景的特征差異[12]。

難點二:不同聲場景的時頻尺度不一致。對此,Xie等人從時頻結(jié)構(gòu)出發(fā)提出了一種融合結(jié)構(gòu),利用短時傅里葉變換、常數(shù)Q變換、小波變換推導(dǎo)出一種融合時頻表征[13]。

難點三:CNN模型作為ASC系統(tǒng)實現(xiàn)的主流選擇,通常包含大量參數(shù),計算復(fù)雜度高,在較低的參數(shù)存儲容量水平下難以保證ASC性能。對此Shi等人提出了一種低復(fù)雜度的基于原始環(huán)境生成數(shù)據(jù)的ASC[14],其核心為主環(huán)境提取PAE(Primary Ambient Extraction)。

主環(huán)境提取

以往的工作主要集中在模型層面的優(yōu)化,Shi等人另辟蹊徑,從數(shù)據(jù)層出發(fā)進(jìn)行優(yōu)化,提出主環(huán)境提取PAE,讓人耳目一新。為了降低計算復(fù)雜度,還提出了PAE的快速實現(xiàn)Fast PAE。

PAE算法最初提出的目的是將立體聲音頻剪輯混合到任意數(shù)量的信道中,以便由多信道再現(xiàn)系統(tǒng)播放。它假設(shè)在立體聲音頻的每個通道中都有一個主分量和一個環(huán)境分量,Shi等人恰是從該應(yīng)用的逆向進(jìn)行思考。但是考慮到主成分和環(huán)境成分與原始立體聲音頻的數(shù)據(jù)分布不同,則將主成分和環(huán)境分量按照隨機權(quán)重進(jìn)行混合,得到與原始立體聲音頻樣本相關(guān)的增強樣本,從而在不改變原始數(shù)據(jù)分布的情況下有效地提高了數(shù)據(jù)的泛化程度。通過優(yōu)化搜索策略,作者還進(jìn)而得到了一種快速算法稱為Fast PAE。實驗結(jié)果證明該Fast PAE計算復(fù)雜度和其他算法相比有明顯優(yōu)勢。


圖2 使用PAE算法生成數(shù)據(jù)


圖3 處理多樣本的時間成本比較

回顧前述所有的ASC算法,現(xiàn)有的改進(jìn)角度包括但不限于:分類器設(shè)計、數(shù)據(jù)增強方案、特征提取方案、子模型數(shù)量、外部數(shù)據(jù)引用情況、嵌入層設(shè)計,模型壓縮方案。展望2022,在上述角度依然有改進(jìn)的空間,但是基于機器學(xué)習(xí)的ASC算法從機器視覺領(lǐng)域受啟發(fā)頗多,未來可以更多考慮充分利用音頻信號的譜特征。此外,挑戰(zhàn)低復(fù)雜度依然是解決工程領(lǐng)域與學(xué)術(shù)領(lǐng)域無法同步的必然方向。

參考文獻(xiàn):

(圖片來源:網(wǎng)絡(luò))

[1]Cloud.tencent.com

[2]Mesaros A, Heittola T, Benetos E, et al. Detection and classification of acoustic scenes and events: outcome of the DCASE 2016 challenge[J]. IEEE/ACM Transactions on Audio, Speech and Language Processing, 2018, 26(2): 379–393.)

[3]Ren, Z.; Kong, Q.; Han, J.; Plumbley, M.D.; Schuller, B.W. Attention based Atrous Convolutional Neural Networks: Visualisation and Understanding Perspectives of Acoustic Scenes. In Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brighton, UK, 12–17 May 2019; pp. 56–60.

[4]Koutini, K.; Eghbal-zadeh, H.; Widmer, G. Receptive-Field-Regularized CNN Variants for Acoustic Scene Classification. In Proceedings of the Detection and Classification of Acoustic Scenes and Events Workshop (DCASE), New York, NY, USA, 25–26 October 2019; pp. 124–128.

[5]Basbug, A.M.; Sert, M. Acoustic Scene Classification Using Spatial Pyramid Pooling with Convolutional Neural Networks. In Proceedings of the 13th IEEE International Conference on Semantic Computing (ICSC), Newport, CA, USA, 30 January–1 February 2019; pp. 128–131.

[6]Suh, Sangwon, Sooyoung Park, Youngho Jeong and Taejin Lee. Designing Acoustic Scene Classification Models with CNN Variants Technical Report.2020.

[7]Saki, F.; Guo, Y.; Hung, C.Y. Open-Set Evolving Acoustic Scene Classification System. In Proceedings of the Detection and Classification of Acoustic Scenes and Events Workshop (DCASE), New York, NY, USA, 25–26 October 2019; pp. 219–223.

[8]Wilkinghoff, K.; Frank Kurth. Open-Set Acoustic Scene Classification with Deep Convolutional Autoencoders. In Proceedings of the Detection and Classification of Acoustic Scenes and Events Workshop (DCASE), New York, NY, USA, 25–26 October 2019; pp. 258–262.

[9]Mcdonnell, M.D.; Gao, W. Acoustic Scene Classification Using Deep Residual Networks With Late Fusion of Separated High and Low Frequency Paths. In Proceedings of the Detection and Classification of Acoustic Scenes and Events Workshop (DCASE), New York, NY, USA, 25–26 October 2019.

[10]Phaye, S.S.R.; Benetos, E.; Wang, Y. Subspectralnet—Using Sub-Spectrogram based Convolutional Neural Networks for Acoustic Scene Classification. In Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Brighton, UK, 12–17 May 2019; pp. 825–829.

[11]Wang, C.Y.; Santoso, A.; Wang, J.C. Acoustic Scene Classification using Self-Determination Convolutional Neural Network. In Proceedings of the 9th Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA), Honolulu, HI, USA, 2–15 November 2018; pp. 19–22.

[12]H. K. Chon et al., Acoustic Scene Classification Using Aggregation of Two-Scale Deep Embeddings, 2021 IEEE 21st International Conference on Communication Technology (ICCT), 2021, pp. 1341-1345.

[13]W. Xie, Q. He, H. Yan and Y. Li, "Acoustic Scene Classification Using Deep CNNs With Time-Frequency Representations," 2021 IEEE 21st International Conference on Communication Technology (ICCT), 2021, pp. 1325-1329.

[14]C. Shi, H. Yang, Y. Liu and J. Liang, Low-Complexity Acoustic Scene Classification Using Data Generation Based On Primary Ambient Extraction,2021 IEEE International Symposium on Broadband Multimedia Systems and Broadcasting (BMSB), 2021, pp. 1-5.

 網(wǎng)友評論
 編輯推薦
  • 專題:2021視聽行業(yè)高峰論壇
  • 2021 SIAV上海國際高級HiFi演示會展會_聯(lián)合HiFi專題
  • 獨家專題:第十四屆全國運動會·專業(yè)擴(kuò)聲幕前幕后
  • 2021年廣州國際專業(yè)燈光、音響展專題報道
加載推薦品牌
  • SEEBURG acoustics line丨袖珍揚聲器 i-series :小身材,大能量
  • 加拿大XILICA(聲麗佳):專注于一流的數(shù)字音頻處理系統(tǒng)
  • 英國Wharfedale Pro(樂富豪):向世人傳遞更好的聲音
  • 厚積薄發(fā)的高級線材:意大利LA Sound銀樂聲
加載推薦品牌資訊
設(shè)為首頁 | 商務(wù)信息 | 音響資訊 | 本站動態(tài) | 付款方式 | 關(guān)于音響網(wǎng) | 網(wǎng)站地圖 | 網(wǎng)站RSS | 友情鏈接
本站網(wǎng)絡(luò)實名:音響網(wǎng) 國際域名:m.vwcmt.com 版權(quán)所有.1999-2022 深圳市中投傳媒有限公司 .
郵箱:web@audio160.com  電話:0755-26751199(十二線) 傳真:0755-86024577  粵ICP備05041759號
在線客服:點擊這里給我發(fā)消息    視聽學(xué)院-商家論壇群: 視聽學(xué)院-商家論壇
欧美色网一区,欧美经典一区,91精品久久久久久久久不口人,国产成人日日夜夜
亚洲成人av中文| 制服视频三区第一页精品| 久久新电视剧免费观看| 国产一区二区在线看| 国产欧美日韩卡一| 北条麻妃一区二区三区| 亚洲在线观看免费视频| 欧美日韩视频在线一区二区| 日韩不卡在线观看日韩不卡视频| 日韩女优av电影| 国产高清精品在线| 亚洲女同女同女同女同女同69| 欧美影视一区在线| 精品综合久久久久久8888| 国产精品视频你懂的| 欧美亚洲愉拍一区二区| 国内精品写真在线观看| 亚洲人吸女人奶水| 欧美一级日韩不卡播放免费| 粉嫩高潮美女一区二区三区 | 在线成人免费视频| 久久精品国产精品亚洲综合| 国产精品麻豆久久久| 在线观看一区二区视频| 国产麻豆精品久久一二三| 亚洲精品视频一区二区| 日韩视频免费观看高清完整版在线观看 | 欧美日韩三级一区二区| 国产一区免费电影| 亚洲电影一级黄| 久久精品亚洲乱码伦伦中文| 欧美三级资源在线| 国产a区久久久| 琪琪一区二区三区| 亚洲乱码国产乱码精品精的特点| 精品成人免费观看| 欧美无砖砖区免费| 成人小视频免费在线观看| 日韩国产精品久久| 亚洲精品中文在线观看| 国产丝袜在线精品| 欧美tickling网站挠脚心| 在线观看日韩高清av| 国产福利一区二区三区视频在线 | 欧美午夜寂寞影院| 国产91在线观看丝袜| 免费一区二区视频| 午夜欧美视频在线观看| 亚洲欧洲av在线| 国产亚洲成aⅴ人片在线观看 | 精品女同一区二区| 欧美喷水一区二区| 在线观看日韩av先锋影音电影院| 国产·精品毛片| 激情文学综合插| 美女国产一区二区三区| 亚洲h精品动漫在线观看| 亚洲素人一区二区| 国产精品色哟哟网站| 久久久不卡网国产精品二区| 精品嫩草影院久久| 精品成人免费观看| 久久综合色一综合色88| 精品日本一线二线三线不卡| 欧美一级黄色大片| 91精品国产全国免费观看 | 3d动漫精品啪啪1区2区免费| 色婷婷av一区二区| 在线视频观看一区| 欧美四级电影网| 精品视频全国免费看| 欧美片在线播放| 在线不卡免费欧美| 日韩精品一区在线观看| 精品欧美乱码久久久久久1区2区| 精品国产一区二区国模嫣然| 精品成人a区在线观看| 久久综合色婷婷| 国产欧美日韩精品一区| 国产精品久久99| 亚洲一区二区三区四区五区黄| 亚洲韩国一区二区三区| 午夜精品福利在线| 麻豆成人久久精品二区三区小说| 黄一区二区三区| 国产成人综合在线| 一本久道中文字幕精品亚洲嫩| 欧美亚洲免费在线一区| 日韩一级二级三级| 欧美国产1区2区| 一级日本不卡的影视| 男女性色大片免费观看一区二区| 韩国av一区二区三区在线观看| 国产成人高清在线| 91高清视频在线| 日韩欧美二区三区| 亚洲欧洲日韩女同| 日韩国产欧美在线视频| 国产麻豆精品视频| 欧洲人成人精品| 精品久久久网站| 成人黄色电影在线 | 国产精品一区免费视频| 97久久久精品综合88久久| 欧美日韩一区高清| 国产欧美日韩在线视频| 亚洲福利一二三区| 国产精品18久久久久久久久| 91久久线看在观草草青青| 日韩欧美第一区| 亚洲女与黑人做爰| 国产一区二区在线视频| 在线观看亚洲专区| 国产亚洲综合性久久久影院| 亚洲高清一区二区三区| 成人午夜免费电影| 欧美一区二区三区视频免费| 国产精品久久久久久亚洲伦| 美女在线观看视频一区二区| 91在线国产观看| 2022国产精品视频| 婷婷综合五月天| 91在线免费看| 国产蜜臀97一区二区三区| 五月开心婷婷久久| 色婷婷亚洲综合| 久久久高清一区二区三区| 日韩精品欧美成人高清一区二区| 丁香啪啪综合成人亚洲小说 | 亚洲六月丁香色婷婷综合久久| 国产永久精品大片wwwapp| 欧美日韩不卡视频| 亚洲免费观看高清| 丁香激情综合国产| 2023国产一二三区日本精品2022| 调教+趴+乳夹+国产+精品| 97se亚洲国产综合自在线不卡| 久久天天做天天爱综合色| 日韩高清欧美激情| 欧美日韩一区二区三区不卡| 综合久久久久综合| 成人h精品动漫一区二区三区| 欧美精品一区在线观看| 日精品一区二区三区| 欧美午夜一区二区三区| 亚洲精品老司机| 91碰在线视频| 亚洲欧美日韩人成在线播放| 国产91高潮流白浆在线麻豆| 精品第一国产综合精品aⅴ| 久久99久久精品欧美| 欧美一区二区三区在线视频| 丝袜美腿成人在线| 欧美日韩成人在线| 视频在线观看一区二区三区| 欧美色图免费看| 亚洲成a人在线观看| 欧美视频在线一区二区三区| 一区二区三区不卡视频在线观看| 99天天综合性| 综合激情成人伊人| 色综合中文字幕| 一区二区三区不卡视频 | 正在播放一区二区| 日本不卡123| 日韩精品一区在线| 国产一区二区视频在线| 国产日韩三级在线| zzijzzij亚洲日本少妇熟睡| 亚洲日本中文字幕区| 91福利精品第一导航| 午夜私人影院久久久久| 欧美一区二区三区的| 久久精品国产一区二区三| 久久网站热最新地址| 成人av网站在线观看免费| 一区二区三区日韩精品| 欧美日本在线视频| 韩日欧美一区二区三区| 国产精品久久久久久久岛一牛影视 | 午夜精品福利在线| 精品免费日韩av| 成a人片亚洲日本久久| 一级中文字幕一区二区| 欧美一级国产精品| 成人免费黄色在线| 亚洲韩国精品一区| 精品国产在天天线2019| 99国产欧美久久久精品| 天天av天天翘天天综合网 | 国产精品久久久久国产精品日日| 在线观看国产精品网站| 久久精工是国产品牌吗| 中文字幕在线一区| 欧美日韩国产天堂| 高清成人免费视频| 亚洲超碰97人人做人人爱| 久久久99精品免费观看不卡| 欧美系列在线观看| 国产福利一区二区三区视频在线|