音声認識の基礎から深層学習を用いた最新手法を解説した書籍『Pythonで学ぶ音声認識』発売

インプレスグループでIT関連メディア事業を展開する株式会社インプレスは、音声認識の基礎から深層学習を用いた最新手法を解説した書籍『Pythonで学ぶ音声認識』(高島遼一:著)を2021年5月20日(木)に発売することを発表した。価格は3,850円(税込)。
同書は「実際に動くものが作れる」ことを目指して、特定の技術のアルゴリズムと、それを実装するためのソースコードを豊富に紹介する「機械学習実践シリーズ」の2冊目。2020年8月24日刊行の同シリーズ『Pythonで学ぶ音源分離』(戸上真人著)に続く音声処理技術として、「音声認識」をテーマにしている。

音声認識の基礎から深層学習を用いた最新手法までを解説

音声認識とは音声信号から発話内容を認識することで、AIスピーカなどに利用されている技術。同書は現在までの音声認識技術の発展経緯を学びながら、深層学習を用いた最新の音声認識システムを実装できるようになることを目的とし、その手法をソースコード付きで丁寧に解説している。

1・2章では音声認識の基礎知識を紹介。3章はPythonのソースコードを交えて音声処理の基礎と、音声認識に使うための特徴抽出方法を解説している。4章では音声認識の初歩ともいうべき「DPマッチング」という手法を紹介し、5章のDPマッチングをより実用的な方法に進化させた、混合正規分布と隠れマルコフモデルによる音響モデルを解説。6・7章は2010年以降、発展してきた深層学習を用いたディープニューラルネットワークと隠れマルコフモデルによる音響モデル、そして近年、研究のトレンドとなっているEnd-to-Endモデルという最新手法を紹介している。全章を通して、最新の音声認識技術を実装レベルで学ぶことができる。

書籍情報

書名	Pythonで学ぶ音声認識機械学習実践シリーズ
著者	高島遼一
発売日	2021年5月20日
ページ数	352ページ
サイズ	B5変型版
定価	3,850円(税込)
電子版価格	3,850円(税込 ※インプレス直販価格)
ISBN	978-4-295-01138-5
著者プロフィール	高島遼一（たかしま・りょういち) 2013年神戸大学大学院システム情報学研究科博士後期課程修了(博士(工学))。2011年4月~2013年3月日本学術振興会特別研究員(DC2)。2013年4月に(株)日立製作所研究開発グループに入社し、装置の異常検知や音声認識のための雑音除去など、音声・音響信号処理に関する研究開発に従事。2016年10月~2018年9月に国立研究開発法人情報通信研究機構へ出向し、音声認識に関する研究開発に従事。2019年4月より神戸大学都市安全研究センター兼同大学院システム情報学研究科准教授に着任。現在、音声認識を始めとした音声処理・機械学習技術とその福祉分野への応用に関する研究に従事。

関連サイト
Amazon書籍情報ページ
インプレス書籍情報ページ

音声認識の基礎から深層学習を用いた最新手法を解説した書籍『Pythonで学ぶ音声認識』発売

音声認識の基礎から深層学習を用いた最新手法までを解説

書籍情報

山田航也

【セミナー】中国ヒューマノイド産業の最前線 2026春～深圳から現地レポートと最新情報アップデート

【セミナー】AIロボット普及の最後のピース「ロボットハンド技術の社会実装、現状と課題」RRI/大阪大学原田教授に聞く

神崎洋治の「ロボットの衝撃」

森山和道の「ロボットの見方」

音声認識の基礎から深層学習を用いた最新手法までを解説

書籍情報

山田 航也

山田航也