Mac で最も速い日本語音声入力
whisper.cpp + Metal GPU — 完全ローカル処理・クラウド不要・プライバシー最優先
macOS 13+ / Apple Silicon (M1以降) / 無料・オープンソース
画面に溶け込むミニマルなオーバーレイ。作業の流れを一切止めません。
macOS標準の音声入力では満足できない。Koe は日本語の認識精度と速度を徹底的に追求しました。
ターミナルでは「git commit」「kubectl」、Xcodeでは「SwiftUI」「@State」など、使用中のアプリに合わせてWhisperへのヒントを自動切替。専門用語の認識精度が飛躍的に向上。
話し終わった瞬間にWhisperへ送信開始。0.85秒の無音確認を待たず、結果を先取りキャッシュ。体感レイテンシ500ms削減。
OpenAIのWhisper large-v3-turboモデルをローカル実行。日本語WER(単語誤り率)で業界最高水準。Metal GPUで0.5秒変換。
「メアド」→ メールアドレスに自動展開。「じゅうしょ」→ 住所に変換。よく使うフレーズをO(1)高速ルックアップ。
認識結果をLLMで自動修正。句読点の補正、敬語への変換、コードフォーマットなど、アプリごとに異なる指示を設定可能。
「ヘイこえ」で録音開始。MFCC+DTW自社エンジンで外部依存ゼロ。テンプレート登録で自分の声に最適化。
キーボードから手を離さずに、思考の速度でテキスト入力。
⌘⌥V でどのアプリからでも即起動。ホールド / トグルモード選択可。ESCでキャンセル。
話し終わると0.85秒で自動的に認識開始。長い発話はSpace長押しで延長。
Terminal、VS Code、Xcode…アプリごとに言語・プロンプト・LLM指示を自動切替。
会議中の発話をタイムスタンプ付きで自動記録。デスクトップにテキストファイル出力。
音声データは一切外部送信なし。全処理がMac上で完結。機密情報も安心。
画面上のマイクボタンをワンクリックで録音。ドラッグで好きな位置に配置。
| Koe | macOS標準 | クラウドSTT | |
|---|---|---|---|
| 日本語精度 | ◎ Whisper large-v3 | △ やや低い | ○ 高い |
| 速度 | ◎ <0.5秒 (Metal) | △ 1-3秒 | △ ネットワーク依存 |
| プライバシー | ◎ 完全ローカル | ○ 一部ローカル | ✕ クラウド送信 |
| 月額費用 | ◎ 無料 | ○ 無料 | ✕ 従量課金 |
| アプリ別最適化 | ◎ プロンプト切替 | ✕ なし | ✕ なし |
| ウェイクワード | ◎ カスタム可 | ✕ なし | ✕ なし |
| 専門用語対応 | ◎ プロンプト指定 | ✕ 不可 | △ 一部対応 |
| LLM後処理 | ◎ 内蔵 | ✕ なし | ✕ なし |
Homebrew で whisper.cpp とモデルをインストール。Metal GPU が自動で有効化。
GitHub Releases から Koe.app.zip をダウンロード。アプリケーションフォルダに移動。
マイク・アクセシビリティ権限を許可。⌘⌥V を押せば即座に音声入力開始。
コードはすべて公開。フォーク・改変・商用利用自由。
GitHub で見る