You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
オープンソースの音声認識モデルのWhisperを使うと、手軽に高品質な音声認識(文字起こし)が可能となる。今回は、Whisperを利用して簡単に使えるリアルタイム音声認識ツールを作ってみよう。 リアルタイム音声認識ツールを実行しているところ 音声認識モデルのWhisperとは 「Whisper」は、ChatGPTで有名なOpenAIが公開しているオープンソースの音声認識モデルだ。高精度な音声認識モデルで、英語だけでなく日本語を含めた多言語の音声をテキストに変換できる。ノイズの多い環境でも高い認識精度を誇り、議事録作成や字幕生成、自動文字起こしなどに活用されている。 Pythonから簡単に扱える点も魅力で、柔軟な応用が可能となっている。そこで、今回は、Pythonでリアルタイムの音声認識ツールを作ってみよう。 音声認識モデルのWhisperを公開しているWebサイト 音声認識に使うライブラリ
【もう語学学習は不要!?】リアルタイム文字起こし+翻訳AIツールをスマホで無料で使う方法 《オフラインでも利用可能です。》 みなさん、こんにちは。 チャエンです!(自己紹介はこちら) リアルタイム文字起こし+翻訳ができるAIツール WhisperKitがヤバいです。何より、これが無料でスマホで使えるのが半端ないです。 ドラえもんの道具「翻訳こんにゃく」が発明されたと言っても過言ではありません。 日本語の文字起こしは完璧で、英語への翻訳も即時なのでこれで英語話せなくても会話できます。 一応、英語→日本語リアルタイム表示も可能ですが精度に難ありです。 今回は、このアプリでできること技術面、使い方の解説を行います。 英語のミーティングが多いけど苦手な方や英語での情報収集を積極的にしたい方にとてもおすすめです。 ぜひ最後までご覧ください💡 1.このアプリでできること冒頭でWhisperKitとい
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く