KotobaWhisperIME

話すだけで、どこにでも入力。

Windows のあらゆるアプリに、AI音声認識をホットキー一発で。日本語に強い Kotoba-Whisper を、GPU 加速で最速動作。

特徴

ホットキー一発で音声入力 — デフォルトは Ctrl+Space。押しながら話して、離した瞬間にテキスト入力。
Kotoba-Whisper をデフォルト採用 — リアルタイム音声入力ソフトウェアとして Kotoba-Whisper に対応しているのは現状本ソフトのみ。（文字起こし専用ソフトを除く）
faster-whisper エンジンによる高速推論 — 量子化（float16/int8）により通常の Whisper より大幅に高速。
CUDA 12 同梱 — NVIDIA ドライバのみで GPU 推論が動作。追加での環境構築不要。
どのアプリにも入力可能 — クリップボード経由でブラウザ・エディタ・Slack など全アプリに対応。
プライバシー重視 — 完全ローカル処理。音声データはインターネットに送信されません。一切ログにも残しません。
ポータブル対応 — ZIP版はフォルダごとコピーするだけ。レジストリを汚しません。
管理者権限不要

ファイル	説明
KotobaWhisperIME_Setup.exe	インストーラー版（初めての方はこちら）
KotobaWhisperIME.zip	ZIP版（ポータブル）

アプリ本体約900MB（CUDAライブラリ含む）。モデルは別途アプリ内からダウンロード。

インストーラー版またはZIP版を展開して起動
モデル管理画面（初回自動起動）で Kotoba-Whisper v2.0 の「ダウンロード」を押す
「Windows 起動時に自動的に起動する」にチェックを入れて「設定を保存して適用」ボタンを押します。保存後は自動的に再起動します。（インストーラー版はセットアップ時に自動起動が設定済みです）
入力したい場所にカーソルを置いて Ctrl+Space を押しながら話すだけ！

CTranslate2 形式のカスタムモデルも追加可能です。

需要があれば実装を検討します。Discussionsにてお気軽にどうぞ。

トグル録音モード（押して開始、もう一度押して終了）
自動Enter送信オプション
- 入力後に自動的に Enter / Shift+Enter を送信
- ショートカット（例: ホットキー2回押し）で Enter / Shift+Enter を送信
ターゲットウィンドウ固定モード
長時間録音の分割処理（30秒超の録音対応）
ローカルLLM後処理（句読点補完・誤認識修正）

Downloads last month: -; Downloads are not tracked for this model. How to track

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support