3分で学ぶ 自然言語と音声認識 

機械学習 3分で学ぶ 自然言語と音声認識 

3分で学ぶ 自然言語と音声認識 
スポンサーリンク

Apple社のSiri(シリ)とは

Appleのデバイスで使える人工知能型アシスタントです。

“Hey Siri”でおなじみですね(^^)

「勝利に導く美しい女性」を意味するとのこと。

女神っぽいイメージですね!

 

Siriの女神イメージ

この技術は自然言語と音声認識が使われいますので、今回はその知識をご紹介します!

 

Siriの仕組み(概要)

Siri単体のプログラムだけでは音声を認識できません。

音声を認識した後に音声データを言語データに変換して、その言語を解釈して返答をしているのです!

ざっくりと書くと以下のような図になります。

Siriの仕組み

ではまず音声データを言語に翻訳する手順をみていきます!

 

スポンサーリンク

音声認識の流れ

では具体的な音声認識の流れをみてみましょう!

  1. 人の声を見極め ※老若男女の音声データを波形に変換
  2. ノイズ排除 ※絶音が多いと人の声を理解できませんので、不要な音声を外す処理
  3. 音波より音の特徴を抽出、数値化
  4. 数値化した音が何かを分析評価 ※どの文字の特徴と合うか計算する
  5. 特徴にあった文字を繋ぎ合わせて言語化

 

音声認識の仕組みをまとめます!

 

音声認識のポイント

  • 雑音は精度を下げる
  • 音波より1文字ずつ分析・計算する

では次に自然言語の分析を説明します。

 

スポンサーリンク

自然言語処理の流れ

流れは4ステップが基本です。

自然言語処理のステップ

  1. 形態素解析(単語を最小単位にする)
  2. 構文解析(単語の関係性を知る)
  3. 意味解析(適切な修飾語が選択されているか)
  4. 文脈解析(複数の文での指示語が解釈できるか)

 

図で書くと以下のような感じです。

自然言語の全体の流れ

自然言語処理の仕組み

まとめ

今回Siriの仕組みということでまとめてみました。

音声認識と自然言語の流れは理解できたでしょうか?

AIアプリとは複雑な計算をすることと膨大なデータから特徴をつかむこと精度がよくなる技術です。

そのため、データの使い道を考えるとAIアプリがより進化できるかもしれません。

 

それでは今日はここまで。

 

PRサイト
「ChatGPTと何か?副業に挑戦したい、資格を取得したい、悩みがある」など解決できるオンライン学習おすすめサイトはこちら

 

  

 

 

 

スポンサーリンク