whisperで遊ぶ
今回は,最近話題になっていたOpenAIの音声認識ツールwhisperを使って遊んでみたので,知見を共有します.
実行環境
- Macbook Air (M1)
- macOS Monterey: 12.6.1
- Python3.9.9
- pyenv+virtualenv
- local
セットアップ
基本的には公式に従って進めました.
-
ffmpeg
のインストールMacOS(brew)に従います.
brew install ffmpeg
-
Rustが必要とのこと.それに伴って
setuptools-rust
をpip install
する.curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh # Rustのインストール pip install setuptools-rust #setuptools-rustのインストール
-
Rustをインストールしたのち,
cargo
のパスを通す.echo export PATH="$HOME/.cargo/bin:$PATH" >> $HOME/.zshenv
-
shellを再起動するか,以下のコマンドを実行する.
source "$HOME/.cargo/bin:$PATH"
-
インストール環境が揃ったので,
whisper
をpip install
する.pip install git+https://github.com/openai/whisper.git
これでwhisper
が使えるはず.
コケたポイント
-
5.でgitコマンドの認証に関するエラーを吐く
これに関して自分も引っかかった.具体的には,
cargo
コマンドの仕様によるもので,cargo
は基本的にはssh-agent
を使用して公開鍵認証をパスしてGithubに接続するようです.もちろんssh-agent
に秘密鍵を登録しておかないと認証失敗します.従って解決方法は,ssh-agent
に秘密鍵を登録する.cargo
のオプションを指定して,ssh-agent
で認証失敗したらgit
コマンドでの取得をトライするようにする.
という二択になります.
-
ssh-agent
に秘密鍵を登録する.Githubのssh登録に関しては他のWebサイトに任せます.以下は秘密鍵が
$HOME/path/to/secret.key
にあるとします.ssh-add --apple-use-keychain $HOME/path/to/secret.key
※
ssh-add
の-K
オプションは--apple-use-keychain
に置換えられていくらしい. -
cargo
のオプションを指定して,ssh-agent
で認証失敗したらgit
コマンドでの取得をトライするようにする.$HOME/.cargo/config
に以下を加えるだけ.[net] git-fetch-with-cli = true