音声認識の基礎から深層学習を用いた最新手法を解説した書籍『Pythonで学ぶ音声認識』発売

インプレスグループでIT関連メディア事業を展開する株式会社インプレスは、音声認識の基礎から深層学習を用いた最新手法を解説した書籍『Pythonで学ぶ音声認識』(高島遼一:著)を2021年5月20日(木)に発売することを発表した。価格は3,850円(税込)。

同書は「実際に動くものが作れる」ことを目指して、特定の技術のアルゴリズムと、それを実装するためのソースコードを豊富に紹介する「機械学習実践シリーズ」の2冊目。2020年8月24日刊行の同シリーズ『Pythonで学ぶ音源分離』(戸上真人著)に続く音声処理技術として、「音声認識」をテーマにしている。


音声認識の基礎から深層学習を用いた最新手法までを解説

音声認識とは音声信号から発話内容を認識することで、AIスピーカなどに利用されている技術。同書は現在までの音声認識技術の発展経緯を学びながら、深層学習を用いた最新の音声認識システムを実装できるようになることを目的とし、その手法をソースコード付きで丁寧に解説している。


1・2章では音声認識の基礎知識を紹介。3章はPythonのソースコードを交えて音声処理の基礎と、音声認識に使うための特徴抽出方法を解説している。4章では音声認識の初歩ともいうべき「DPマッチング」という手法を紹介し、5章のDPマッチングをより実用的な方法に進化させた、混合正規分布と隠れマルコフモデルによる音響モデルを解説。6・7章は2010年以降、発展してきた深層学習を用いたディープニューラルネットワークと隠れマルコフモデルによる音響モデル、そして近年、研究のトレンドとなっているEnd-to-Endモデルという最新手法を紹介している。全章を通して、最新の音声認識技術を実装レベルで学ぶことができる。




書籍情報

書名 Pythonで学ぶ音声認識 機械学習実践シリーズ
著者 高島遼一
発売日 2021年5月20日
ページ数 352ページ
サイズ B5変型版
定価 3,850円(税込)
電子版価格 3,850円(税込 ※インプレス直販価格)
ISBN 978-4-295-01138-5
著者プロフィール 高島遼一(たかしま・りょういち)
2013年神戸大学大学院システム情報学研究科博士後期課程修了(博士(工学))。2011年4月~2013年3月日本学術振興会特別研究員(DC2)。2013年4月に(株)日立製作所研究開発グループに入社し、装置の異常検知や音声認識のための雑音除去など、音声・音響信号処理に関する研究開発に従事。2016年10月~2018年9月に国立研究開発法人情報通信研究機構へ出向し、音声認識に関する研究開発に従事。2019年4月より神戸大学都市安全研究センター兼同大学院システム情報学研究科准教授に着任。現在、音声認識を始めとした音声処理・機械学習技術とその福祉分野への応用に関する研究に従事。

ABOUT THE AUTHOR / 

山田 航也

横浜出身の1998年生まれ。現在はロボットスタートでアルバイトをしながらプログラムを学んでいる。好きなロボットは、AnkiやCOZMO、Sotaなどのコミュニケーションロボット。

PR

連載・コラム