Как установить нейросеть Whisper на Mac (macOS)

OpenAI Whisper — это, пожалуй, лучшая нейросеть для распознавания речи на сегодняшний день. Она идеально понимает русский язык, расставляет знаки препинания и игнорирует шум на фоне. Но у неё есть один минус — изначально это инструмент для программистов.

Способ 1: Для программистов (Python и Терминал)

Если вы умеете работать с командной строкой, вы можете развернуть Whisper локально.

  1. Установите менеджер пакетов Homebrew.
  2. Установите FFmpeg (brew install ffmpeg), так как Whisper использует его для работы с аудио.
  3. Установите Python версии 3.9 или выше.
  4. Выполните команду pip install -U openai-whisper.

Теперь вы можете конвертировать аудио в текст через терминал. Это бесплатно, но требует скачивания тяжелых моделей (от 1.5 до 3 ГБ) и мощного процессора (желательно Apple Silicon M1/M2/M3).

Способ 2: Для всех остальных (VoiceType)

Что если вы не хотите писать код? Что если вы просто хотите нажать кнопку на клавиатуре, сказать фразу, и чтобы она мгновенно напечаталась в Telegram, Word или браузере?

Для этих целей мы создали VoiceType — нативную утилиту для macOS, которая работает как системная клавиатура, но использует мощь нейросетей (включая модели Whisper и Deepgram).

Голосовой ввод следующего поколения

Никаких терминалов и сложной установки. Просто перетащите иконку в папку Программы, вставьте API-ключ и диктуйте текст в любом приложении на Mac.

Скачать VoiceType

Почему нативный интерфейс лучше?

Если ваша цель — экономия времени и повышение продуктивности, использование готовой утилиты окупается в первый же день использования.