KotobaWhisperIME
話すだけで、どこにでも入力。
Windows のあらゆるアプリに、AI音声認識をホットキー一発で。 日本語に強い Kotoba-Whisper を、GPU 加速で最速動作。
📖 詳しい使い方・スクリーンショット・ダウンロードはこちらから
特徴
- ホットキー一発で音声入力 — デフォルトは
Ctrl+Space。押しながら話して、離した瞬間にテキスト入力。 - Kotoba-Whisper をデフォルト採用 — リアルタイム音声入力ソフトウェアとして Kotoba-Whisper に対応しているのは現状本ソフトのみ。(文字起こし専用ソフトを除く)
- faster-whisper エンジンによる高速推論 — 量子化(float16/int8)により通常の Whisper より大幅に高速。
- CUDA 12 同梱 — NVIDIA ドライバのみで GPU 推論が動作。追加での環境構築不要。
- どのアプリにも入力可能 — クリップボード経由でブラウザ・エディタ・Slack など全アプリに対応。
- プライバシー重視 — 完全ローカル処理。音声データはインターネットに送信されません。一切ログにも残しません。
- ポータブル対応 — ZIP版はフォルダごとコピーするだけ。レジストリを汚しません。
- 管理者権限不要
ダウンロード
| ファイル | 説明 |
|---|---|
| KotobaWhisperIME_Setup.exe | インストーラー版(初めての方はこちら) |
| KotobaWhisperIME.zip | ZIP版(ポータブル) |
アプリ本体 約900MB(CUDAライブラリ含む)。モデルは別途アプリ内からダウンロード。
動作環境
| 項目 | 要件 |
|---|---|
| OS | Windows 10 / 11(64bit) |
| GPU | NVIDIA GPU 推奨(CPUでも動作、低速) |
| マイク | 内蔵・外付け問わず |
| 権限 | 管理者権限不要 |
クイックスタート
- インストーラー版またはZIP版を展開して起動
- モデル管理画面(初回自動起動)で Kotoba-Whisper v2.0 の「ダウンロード」を押す
- 「Windows 起動時に自動的に起動する」にチェックを入れて「設定を保存して適用」ボタンを押します。保存後は自動的に再起動します。(インストーラー版はセットアップ時に自動起動が設定済みです)
- 入力したい場所にカーソルを置いて
Ctrl+Spaceを押しながら話すだけ!
対応モデル
| モデル | サイズ | 説明 |
|---|---|---|
| Kotoba-Whisper v2.0 ⭐推奨 | 〜300MB | 日本語特化。精度・速度・サイズのバランス最高 |
| Kotoba-Whisper v1.0 | 〜150MB | 軽量版。低スペックPC・CPU専用環境向け |
| Whisper Small | 〜480MB | OpenAI公式多言語モデル |
| Whisper Large-v3 | 〜3.0GB | 最高精度。ハイエンドGPU推奨 |
CTranslate2 形式のカスタムモデルも追加可能です。
今後の予定
需要があれば実装を検討します。Discussionsにてお気軽にどうぞ。
- トグル録音モード(押して開始、もう一度押して終了)
- 自動Enter送信オプション
- 入力後に自動的に Enter / Shift+Enter を送信
- ショートカット(例: ホットキー2回押し)で Enter / Shift+Enter を送信
- ターゲットウィンドウ固定モード
- 長時間録音の分割処理(30秒超の録音対応)
- ローカルLLM後処理(句読点補完・誤認識修正)
開発者
K.Nakashin (@usf_theory) nakashin.usf@gmail.com
Powered by Kotoba-Whisper / faster-whisper
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support