以前我們做聲紋辨識,是將人的聲音訊號轉換成聲譜圖(spectrogram),從聲譜圖上觀察說話人發音的特徵,利用這些特徵進行說話人的辨識,就像是利用指紋圖形比對來認人一樣,因此我們將經由聲音來認人這樣的過程,就說成是聲紋辨識。其實現在的電腦已經有足夠的能力,利用影像處理方式進行指紋的自動辨識,同樣的,電腦也能夠以語音處理技術作說話人的辨識(speaker recognition)。
雖說每個人的說話聲音不太相同,對於熟識的朋友,通常聽到聲音就可以知道是誰,但是要做正確的辨識,卻不太容易,因為聲音的變數很多。例如一個人感冒了,這時候說話的聲音就跟平常說話的聲音不一樣。我們也常常看到一些模仿名人說話的表演,相當逼真,若不是看到表演者,還真的以為是該名人本尊在說話呢。所以相對於指紋辨識,聲紋辨識要困難多了,這也是為什麼聲紋辨識在使用上遠少於指紋辨識。目前市面上可以看到一些按指紋輸入作門禁管制的系統,但還極少看到只以聲音輸入作門禁管制的系統,在影片上看到的例子也常是配合指紋辨識或掌紋辨識一起使用,當作多一道驗證程序。
隨著電腦網路與無線通訊的廣泛使用,許多時候我們想透過手機去取得資訊,按鍵操作不是最有效率的做法,因為用語音輸入會更方便。如果要取用的資訊是機密性的個人資料,就必須經過授權才可以進入系統,因此使用者身份的確認便成為一個必要的步驟。可預期的,以聲音做身份驗證將會是未來極為需要的一項技術,但是要能克服辨識過程中可能對語音造成干擾的因素,例如說話人的變音、別人的模仿、噪音的干擾、通道造成的失真,以及編碼傳輸時對於原始聲音特徵的破壞。
...
...
使用者別 |
新聞閱讀限制 |
文章閱讀限制 |
出版品優惠 |
一般使用者 |
10則/每30天 |
0則/每30天 |
付費下載 |
VIP會員 |
無限制 |
25則/每30天 |
付費下載 |