本書系統(tǒng)地介紹了語音識別在大模型時代的新技術與新應用。全書共16章,原理部分涵蓋聲學特征、隱馬爾可夫模型(HMM)、高斯混合模型(GMM)、深度神經網絡(DNN)、語言模型和加權有限狀態(tài)轉換器(WFST)、語音大模型,重點描述了GMM-HMM、DNN-HMM和端到端(E2E)三種語音識別框架;應用部分包含Kaldi、W
"近年來人工智能技術突飛猛進,以語音識別為代表的音頻處理技術取得了大量突破,但該領域內理論結合實戰(zhàn)的入門書籍卻較為缺乏,本書旨在為有志學習音頻信號處理的讀者提供一本實用的入門書籍。本書共13章,第1章和第2章是基礎部分,包括聲學基礎知識及Python基礎等內容;第3到4章介紹了音頻信號的獲取及分析方法;第5~8章介紹了
全書共分11章,主要介紹了聲學基礎知識、音頻信號的數字化、數字音頻壓縮編碼的基本原理及相關標準、信道編碼與調制技術、光盤存儲技術、電子樂器數字接口(MIDI)、數字音頻文件格式、音頻處理與控制設備、數字音頻工作站、數字聲音廣播、音頻測量與分析等內容。每章都附有小結與習題,以指導讀者加深對本書主要內容的理解。本書可作為高
本教材結合語音信息處理的理論與實踐部分,主要內容包括語音產生與感知機理、語音信號處理、語音識別、統(tǒng)計語音合成、語音增強、聲紋識別、語音對話以及語音信息處理的前瞻技術等。全書共分8章。第1章介紹語音產生與感知機理,以及與此相關的語言基礎知識,是全書的理論基礎。第2章介紹語音信號處理的基礎,包括語音產生與感知的數學模型、語
本書是一本深入探討B(tài)BC監(jiān)聽音箱的專著。BBC在聲學領域貢獻卓著,其研發(fā)的監(jiān)聽音箱具有悠久的歷史和廣泛的影響力,對當今的聲音美學理念和音響產品產生了深遠影響。作者楊立新先生憑借多年對BBC設計理念的系統(tǒng)性研習、對BBC聲學文獻和監(jiān)聽音箱的深入研究,以及對原始設備的精心修復經驗,為讀者提供了全面而系統(tǒng)的BBC監(jiān)聽音箱知識
本書采用項目式的編寫方法,系統(tǒng)地介紹了語音識別的基本概念、基本原理和常用技術,并使用Python語言對每項技術進行了編程實現。全書共有8個項目,內容涵蓋搭建語音識別開發(fā)環(huán)境、語音特征提取、構建傳統(tǒng)聲學模型、使用深度神經網絡構建聲學模型、訓練語言模型、構建語音識別解碼器、構建端到端的語音識別模型和中文普通話語音識別。
本書介紹了語音信號處理的基礎、原理、方法和應用,以及該學科領域近年來取得的一些新的研究成果和技術。全書共分13章,內容包括:緒論、語音信號處理的基礎知識、語音信號處理的常用算法、語音信號分析、語音信號特征提取技術、語音增強、語音識別、說話人識別、語音編碼、語音合成與轉換、語音信號情感處理、聲源定位、多模態(tài)語音信號處理。
本教材緊密結合《數字音效》課程設計,以聲音概念為理論基礎、人種志方法論為研究方法,結合Audition聲音編輯軟件,以保護聲音文化遺產為目標,結合聲音研究實踐案例,最終實現把數字音效教材與交互媒體專業(yè)課程結合。該課程將理論課與實踐作業(yè)相結合,以更直接的方式接觸和理解聲音、空間和材質,使學生能夠運用這些知識進行個人創(chuàng)作。
本書系統(tǒng)介紹了聲音信號處理的背景知識、發(fā)展歷史以及研究現狀與趨勢,并詳細闡述了基礎原理、處理方法、實踐應用、新成果與新技術。全書共9章。第1章緒論,第2章聲音信號簡介,第3章短時時域處理技術,第4章短時傅里葉變換,第5章聲音信號的線性預測,第6章語音編碼,第7章聲音合成與轉換,第8章語音識別,第9章基于深度學習技術的聲
《視頻師:深入學習視音頻編輯(EDIUS實戰(zhàn)版)》通過14個經典案例,深入介紹了EDIUSX的核心視頻與音頻編輯功能,隨書贈送360多個案例素材與效果、170多分鐘的同步教學視頻,幫助讀者逐步精通EDIUS軟件,從新手成為短視頻剪輯高手!14個視音頻編輯案例,類型包括美景宣傳、門店宣傳、兒童相冊、節(jié)日影像、旅行圖集、延