KotobaWhisperIME

話すだけで、どこにでも入力。

Windows のあらゆるアプリに、AI音声認識をホットキー一発で。 日本語に強い Kotoba-Whisper を、GPU 加速で最速動作。

📖 詳しい使い方・スクリーンショット・ダウンロードはこちらから


特徴

  • ホットキー一発で音声入力 — デフォルトは Ctrl+Space。押しながら話して、離した瞬間にテキスト入力。
  • Kotoba-Whisper をデフォルト採用 — リアルタイム音声入力ソフトウェアとして Kotoba-Whisper に対応しているのは現状本ソフトのみ。(文字起こし専用ソフトを除く)
  • faster-whisper エンジンによる高速推論 — 量子化(float16/int8)により通常の Whisper より大幅に高速。
  • CUDA 12 同梱 — NVIDIA ドライバのみで GPU 推論が動作。追加での環境構築不要。
  • どのアプリにも入力可能 — クリップボード経由でブラウザ・エディタ・Slack など全アプリに対応。
  • プライバシー重視 — 完全ローカル処理。音声データはインターネットに送信されません。一切ログにも残しません。
  • ポータブル対応 — ZIP版はフォルダごとコピーするだけ。レジストリを汚しません。
  • 管理者権限不要

ダウンロード

ファイル 説明
KotobaWhisperIME_Setup.exe インストーラー版(初めての方はこちら)
KotobaWhisperIME.zip ZIP版(ポータブル)

アプリ本体 約900MB(CUDAライブラリ含む)。モデルは別途アプリ内からダウンロード。


動作環境

項目 要件
OS Windows 10 / 11(64bit)
GPU NVIDIA GPU 推奨(CPUでも動作、低速)
マイク 内蔵・外付け問わず
権限 管理者権限不要

クイックスタート

  1. インストーラー版またはZIP版を展開して起動
  2. モデル管理画面(初回自動起動)で Kotoba-Whisper v2.0 の「ダウンロード」を押す
  3. 「Windows 起動時に自動的に起動する」にチェックを入れて「設定を保存して適用」ボタンを押します。保存後は自動的に再起動します。(インストーラー版はセットアップ時に自動起動が設定済みです)
  4. 入力したい場所にカーソルを置いて Ctrl+Space を押しながら話すだけ!

対応モデル

モデル サイズ 説明
Kotoba-Whisper v2.0 ⭐推奨 〜300MB 日本語特化。精度・速度・サイズのバランス最高
Kotoba-Whisper v1.0 〜150MB 軽量版。低スペックPC・CPU専用環境向け
Whisper Small 〜480MB OpenAI公式多言語モデル
Whisper Large-v3 〜3.0GB 最高精度。ハイエンドGPU推奨

CTranslate2 形式のカスタムモデルも追加可能です。


今後の予定

需要があれば実装を検討します。Discussionsにてお気軽にどうぞ。

  • トグル録音モード(押して開始、もう一度押して終了)
  • 自動Enter送信オプション
    • 入力後に自動的に Enter / Shift+Enter を送信
    • ショートカット(例: ホットキー2回押し)で Enter / Shift+Enter を送信
  • ターゲットウィンドウ固定モード
  • 長時間録音の分割処理(30秒超の録音対応)
  • ローカルLLM後処理(句読点補完・誤認識修正)

開発者

K.Nakashin (@usf_theory) nakashin.usf@gmail.com

Powered by Kotoba-Whisper / faster-whisper

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support