HOME    About this site    mypage    Japanese    library    university    Feedback

University of the Ryukyus Repository >
Faculty of Engineering >
Research Report (Faculty of Engineering) >

 
Title :遺伝的アルゴリズムを用いた隠れマルコフモデルによる音声自動認識に関する研究
Title alternative :Study on Automatic Speech Recognition with the Hidden Markov Model Using the Genetic Algorithm
Authors :高良, 富夫
長山, 格
Authors alternative :Takara, Tomio
Nagayama, Itaru
Issue Date :Apr-2000
Abstract :平成9年度~平成11年度科学研究費補助金(基盤研究(C)(2))研究成果報告書
研究概要:情報処理システムと人間との間で情報の授受を行うとき、音声言語を媒介とすることは、人間にとって最も根源的かつ高速で便利な手段である。本研究では、情報処理システムが音声言語を受理する機能である音声自動認識の高性能化をめざして、遺伝的アルゴリズムを用いた認識モデルの構成方法を確立し、その有効性を実験的に明らかにすることを目的としている。音声自動認識のためのモデルとしては、音声の生成を確率過程としてとらえる隠れマルコフモデル(HMM)を用いる方法が現在のところ最も有望である。しかし、この方法では、最適なモデルの構造を決定する効果的なアルゴリズムが確立されていない。そこで本研究では、HMMの構造を自動的に決定するため、生物の進化過程をモデル化した遺伝的アルゴリズム(GA)を応用する方法を提案している。この方法では、世代を経るに従い尤度の低いモデルは淘汰され、より認識率の高いモデルが生き残るので、広域的最適な高性能のモデルを得ることができる。まず単語音声認識のための離散型HMMの構造決定にGAを適用した。認識実験の結果、クローズ実験だけでなくオープン実験においても、世代を経るに従い認識率の高い構造が得られることが示された。認識率は、通常よく使われ性能も高いLeft-Right構造よりも高くなり、GAの有効性が示された。次に、連続型HMMにGAを適用し、離散型HMMと同様に有効な結果が得られることを示した。さらに、この方法の改良法として、語彙単語をセットにした符号化、隠れ遺伝子、及び状態単位での交叉・突然変異が有効であることを示した。
要約(欧文):Spoken language is the most fundamental, fast and convenient method for human to communicate with information processing systems. An automatic speech recognition is the function of speech perception for the information processing system. The purpose of this research is to develop the model construction method for recognition systems with high performance using the genetic algorithm (GA), and to show the effectiveness of the method experimentally. The hidden Markov models (HMMs) are widely used for automatic speech recognition. However, the HMM has a problem still unresolved, i.e. how to design the optimal structure of the model. In order to search out the optimal structure of the HMM, we propose in this study the application of the GA which is the model of natural evolution process. In this algorithm, models with higher performance survive and models with lower likelihood die as the generation proceeds, then finally, the globally optimal structure is obtained. First, we applied the GA to the determination of the discrete HMM's structure for spoken word recognition. As a result of the recognition experiment, it was shown that the structures with higher recognition scores are obtained as the generation proceeds, not only in the case of closed tests but also open tests. The recognition score became higher than that of the Left-Right structure which is the most popular and with high performance, and the effectiveness of the GA was shown. Next, the GA was applied to the continuous HMM, and the effective result was obtained similarly to the discrete HMM. As the revised version of this method, the coding method of word set, the hidden gene method and the crossover and mutation in a state were shown to be effective.
未公開:P.5以降(別刷論文のため)
Type Local :研究報告書
Publisher :高良富夫
URI :http://hdl.handle.net/20.500.12000/13547
Appears in Collections:Research Report (Faculty of Engineering)

Files in This Item:

File Description SizeFormat
09680374.pdf1139KbAdobe PDFView/Open