コンピューターに音声を理解させることを目指した研究分野。狭義には人間の発した音声を理解させることを指す。人間が聞き手の場合は、話し手が多少間違えても、あるいは聞き手が重要でないと思われる部分を聞き飛ばしても、頭の中でうまく補って話し手の意図を正しく理解することができる。コンピューターではまず音響を処理し、単語を認識し、構文を解析して最終的に意味を理解するという過程を踏むのが普通である。アップル(Apple)の「Siri(シリ)」やグーグル(Google)の「OK Google」など、スマートフォンではもはや音声認識アシスタント機能が標準搭載されている。