20+ лучших приложений для чтения книг: бесплатные и платные сервисы

Готовим поляну

Прежде чем писать и тестировать код, убедимся, что операционная система готова к синтезу речи, в том числе на русском языке.

Чтобы компьютер заговорил, нужны: 

  • голосовой движок (синтезатор речи) с поддержкой нужных нам языков,
  • голоса дикторов для этого движка.

В Windows есть штатный речевой интерфейс Microsoft Speech API (SAPI). Голоса к нему выпускают, помимо Microsoft, сторонние производители: Nuance Communications, Loquendo, Acapela Group, IVONA Software. 

Есть и свободные кроссплатформенные голосовые движки: 

  • RHVoice от Ольги Яковлевой  — имеет четыре голоса для русского языка (один  мужской и три женских), а также поддерживает татарский, украинский, грузинский, киргизский, эсперанто и английский. Работает в Windows, GNU/Linux и Android.
  • eSpeak и его ответвление — eSpeak NG — c поддержкой более 100 языков и диалектов, включая даже латынь. NG означает New Generation  — «новое поколение». Эта версия разрабатывается сообществом с тех пор, как автор оригинальной eSpeak перестал выходить на связь. Система озвучит ваш текст в Windows, Android, Linux, Mac, BSD. При этом старый eSpeak стабилен в ОС Windows 7 и XP, а eSpeak NG совместим с Windows 8 и 10.

В статье я ориентируюсь только на перечисленные свободные синтезаторы, чтобы мы могли писать кроссплатформенный код и не были привязаны к проприетарному софту.

По качеству голоса RHVoice неплох и к нему быстро привыкаешь, а вот eSpeak очень специфичен и с акцентом. Зато eSpeak запускается на любом утюге и подходит как вариант на крайний случай, когда ничто другое не работает или не установлено у пользователя.

Установка речевых движков, голосов и модулей в Windows 

С установкой синтезаторов в Windows проблем возникнуть не должно. Единственный нюанс — для русского голоса eSpeak и eSpeak NG нужно скачать расширенный словарь произношения. Распакуйте архив в подкаталог espeak-data или espeak-ng-data в директории программы. Теперь замените старый словарь новым: переименуйте ru_dict-48 в ru_dict, предварительно удалив имеющийся файл с тем же именем (ru_dict).

Теперь установите модули pywin32, python-espeak и py-espeak-ng, которые потребуются нам для доступа к возможностям TTS:

pip install pywin32 python-espeak pyttsx3 py-espeak-ng

Если у вас на компьютере соседствуют Python 2 и 3, здесь и далее пишите «pip3», а при запуске скриптов  — «python3».

Установка eSpeak(NG) в Linux

Подружить «пингвина» с eSpeak, в том числе NG, можно за минуту:

sudo apt-get install espeak-ng python-espeak

pip3 install py-espeak-ng pyttsx3

Дальше загружаем и распаковываем словарь ru_dict с официального сайта:

wget http://espeak.sourceforge.net/data/ru_dict-48.zip

unzip ru_dict-48.zip

Теперь ищем адрес каталога espeak-data (или espeak-ng-data) где-то в /usr/lib/ и перемещаем словарь туда. В моем случае команда на перемещение выглядела так:

sudo mv ru_dict-48 /usr/lib/i386-linux-gnu/espeak-data/ru_dict

Обратите внимание: вместо «i386» у вас в системе может быть «x86_64…» или еще что-то. Если не уверены, воспользуйтесь поиском:. find /usr/lib/ -name «espeak-data»

find /usr/lib/ -name «espeak-data»

Готово! 

RHVoice в Linux

Инструкцию по установке RHVoice в Linux вы найдете, например, в начале этой статьи. Ничего сложного, но времени занимает больше, потому что придется загрузить несколько сотен мегабайт.

Смысл в том, что мы клонируем git-репозиторий и собираем необходимые компоненты через scons.

Для экспериментов в Windows и Linux я использую одни и те же русские голоса: стандартный ‘ru’ в eSpeak и Aleksandr в RHVoice.

Как проверить работоспособность синтезатора

Прежде чем обращаться к движку, убедитесь, что он установлен и работает правильно. 

Проверить работу eSpeak в Windows проще всего через GUI  — достаточно запустить TTSApp.exe в папке с программой. Дальше открываем список голосов, выбираем eSpeak-RU, вводим текст в поле редактирования и жмем на кнопку Speak.

Обратиться к espeak можно и из терминала. Базовые консольные команды для eSpeak и NG совпадают — надо только добавлять или убирать «-ng» после «espeak»:

espeak -v ru -f D:\my.txt

espeak-ng -v en «The Cranes are Flying»

echo «Да, это от души. Замечательно. Достойно восхищения» |RHVoice-test -p Aleksandr

Как нетрудно догадаться, первая команда с ключом -f  читает русский текст из файла. Чтобы в Windows команда espeak подхватывалась вне зависимости от того, в какой вы директории, добавьте путь к консольной версии eSpeak (по умолчанию — C:\Program Files\eSpeak\command_line) в переменную окружения Path. Вот как это сделать.

VLC media player 2.2.1 [2015, Медиаплеер] 32/64-bit

Год выпуска: 2015Жанр: МедиаплеерРазработчик: VideoLANСайт разработчика: http://www.videolan.org/Язык интерфейса: Мультиязычный (русский присутствует)Тип сборки: StandardРазрядность: 32/64-bitОперационная система: Windows XP, Vista, 7, 8, 8.1, 10 Описание: VLC Media Player — универсальный плеер, способный воспроизводить практически любые существующие на сегодняшний день форматы файлов: MPEG-1, MPEG-2, MPEG-4, DivX, XviD, H.264, MP3, OGG и другие, обычные DVD и VCD диски, а также музыкальные. Одной из его особенностей является возможность проигрывания практически любого типа потокового …

Программы / Программы для работы с Мультимедиа / Кодеки и Медиаплееры
Подробнее  

Программы для чтения текста голосом

1. IVONA Reader

Сайт разработчика: www.ivona.com/

Одна из самых лучших программ для озвучивания текста.Позволяет вашему ПК читать не только простые текстовые файлы в формате txt, но и новости, RSS, любые веб-страницы в интернете, электронную почту и пр.

Кроме того, позволяет преобразовать текст в mp3 файл (который вы потом можете загрузить на любой телефон или mp3 плеер и слушать в дороге, например). Т.е. вы можете самостоятельно создавать аудио-книги!

Голоса программы IVONA очень похожи на реальный голос, достаточно не плохое произношение, не запинаются. Кстати, программа может быть полезна для тех, кто изучает иностранный язык. Благодаря ней можно слушать правильное произношение тех или иных слов, оборотов.

Поддерживает SAPI5, плюс к этому хорошо кооперируется с внешними приложениями (например, Apple Itunes, Skype).

Пример (текст воспроизведения одной моей недавней статьи)

Из минусов: некоторые незнакомые слова читает с неправильным ударением и интонацией. В целом же весьма не плохо, чтобы прослушать, например, параграф из книги по истории, пока идешь на лекцию/занятие — даже более чем!

2. Балаболка

Сайт разработчика: www.cross-plus-a.ru/balabolka.html

Программа «Балаболка», главным образом, предназначена для чтения вслух текстовых файлов. Для воспроизведения текста нужны, помимо программы, голосовые движки (синтезаторы речи).

Воспроизведение речи можно контролировать при помощи стандартных кнопок, подобных тем, что присутствуют в любой мультимедийной программе («воспроизвести/приостановить/остановить»).

Пример воспроизведения (тот же):

Минусы: некоторые незнакомые слова читает не правильно: ударение, интонация. Иногда, пропускает знаки препинания и не делает паузы между словами. Но в целом слушать можно.

Кстати, качество звучания сильно зависит от речевого движка, поэтому, в одной и той же программе звук воспроизведения текста может отличаться в разы!

3. ICE Book Reader

Сайт разработчика: www.ice-graphics.com/ICEReader/IndexR.html

Отличная программа для работы с книгами: чтение, каталогизирование, поиск нужной и пр. Помимо стандартных документов, которые могут читать и другие программы (TXT-HTML, HTML-TXT, TXT-DOC, DOC-TXT, PDB-TXT, LIT-TXT, FB2-TXT и т.д.) ICE Book Reader поддерживает файлы форматов: .LIT, .CHM и .ePub.

К тому же ICE Book Reader позволяет не только читать, но и отличная настольная библиотека:

— позволяет хранить, обрабатывать, каталогизировать книги (до 250000 тысяч экземпляров!);

— автоматическое упорядочивание вашей коллекции;

— быстрый поиск книги из вашей «свалки» (особенно актуально, если у вас много не каталогизированной литературы);

— ядро базы данных ICE Book Reader превосходит большинство программ подобного рода.

Так же программа позволяет озвучивать тексты голосом.

Lkя этого нужно зайти в настройки программы и настроить две вкладки: «Режим»(выбрать чтение голосом) и «Режим синтеза речи» (выбрать непосредственно сам голосовой движок).

4. Говорилка

Сайт программы: www.vector-ski.ru/vecs/govorilka/index.htm

Основные возможности программы «Говорилка»:

  1. Чтение текста голосом (открывает документы txt, doc, rtf, html и пр.);
  2. Позволяет записывать текст из книги в форматы (*.WAV, *.MP3) с повышенной скоростью — т.е. по сути создание электронной аудио-книги;
  3. Хорошие функции по регулировке скорости чтения;
  4. Авто прокрутка читаемого текста;
  5. Возможность пополнения словарей произношения;
  6. Поддерживает старые файлы из времен DOS (многие современные программы не могут прочитать файлы в подобной кодировке);
  7. Размер файла, из которого программа может прочитать текст: до 2 гигабайт;
  8. Возможность делать закладки: при выходе из программы, она автоматически запоминает место остановки курсора.

5. Sakrament Talker

Сайт разработчика: sakrament.by/index.html

С помощью Sakrament Talker можно превратить свой компьютер в «говорящую» аудио книгу! Программа Sakrament Talker поддерживает форматы RTF и TXT,может автоматически распознавать кодировку файла (наверное, иногда замечали, что некоторые программы открывают файл с «крякозабрами» вместо текста, так вот в Sakrament Talker такое невозможно!).

Кроме того Sakrament Talker позволяет воспроизводить достаточно большие файлы, быстро находить те или иные файлы. Озвученный текст можно не только прослушать на компьютере, но и сохранить в mp3 файл (который в последствии можно скопировать на любой плеер или телефон и прослушивать вдалеке от ПК).

В целом довольно не плохая программа, которая поддерживает все популярные голосовые движки.

Govorilka

Небольшое приложение для озвучивания текста с русским интерфейсом и простым дизайном в стиле Windows XP. Настроек у него не так много: можно установить скорость, высоту тембра и громкость. Говорилка отслеживает процесс и подсвечивает отрывки, которые в данный момент проигрываются.

Среди дополнительных возможностей – сохранение звукового файла и разбивка длинных книг на части. Вручную настраивается размер выходного аудио и устанавливается скорость записи. Можно открывать вплоть до 8 вкладок, поддерживается одновременная загрузка нескольких файлов.

По функционалу Говорилка напоминает софт Balabolka

Синтезатор речи Google для озвучки текста

Приложение от Гугл заранее встраивается во многие телефоны с операционной системой Android. Однако он необязательно ставится в качестве используемого по умолчанию синтезатора. Поэтому пользователь может не догадываться о том, что у него уже есть эта программа.

Как скачать синтезатор Гугл для озвучки различных текстов женским голосом:

  1. Зайдите в «Настройки».

    Настройки на смартфоне Android

  2. Откройте «Специальные возможности».

    Нужная клавиша выделена серым

  3. Выберите пункт «Синтез речи».

    Переход к скачиванию ПО для синтеза речи

  4. Нажмите на значок шестеренки.

    Переход в дополнительные Настройки

  5. Тапните по строчке «Установка голосовых данных».

    Клавиша для перехода к загрузке электронных чтецов

  6. Выберите язык. Нажмите на символ загрузки, нарисованный в виде направленной вниз стрелки.

    Кнопка загрузки

Что делать дальше:

  1. Откройте программу TalkBack. Если у вас ее нет, отправляйтесь на Google Play и скачайте ее.

    Как перейти к работе с Talkback

  2. Тапните на клавишу в правом верхнем углу, чтобы попасть в «Настройки».

    Включение и Настройки TalkBack

  3. Затем нажмите на «Возобновить работу».

    Переход к настройкам вызова Talkback

  4. Выберите активацию одним нажатием.

    Тумблер для включения быстрого запуска

  5. Затем переходите к Управлению жестами и задавайте нужные настройки.

    Какие движения или их комбинации могут вызывать диктора

Как преобразовать текст в женский голос с использованием ПО от Google:

  1. Зайдите на страницу «Язык и Ввод».
  2. В разделе «Речь» выберите строчку «Преобразование текста».
  3. Посмотрите, что стоит у вас в графе «Предпочитаемый модуль».

Скачать программу можно с Google Store. Синтезатор речи от Гугла используется для:

  • Зачитывания книг из магазина Google Play.
  • Озвучивания слов и фраз в Гугл Переводчике.
  • В качестве дополнительного синтезатора в приложениях-читалках, выложенных в Google Market.

В такого рода программах озвучку от Гугл нужно обычно устанавливать вручную. Зайдите в настройки приложения и найдите наиболее подходящий вариант.

Бенчмарки по Скорости

После качества скорость является следующим определяющим свойством модели, для измерения скорости синтеза мы используем следующие простые метрики:

  • RTF (Real Time Factor) — какую долю длительности аудио занимает синтез этого аудио;
  • RTS = 1 / RTF (Real Time Speed) — насколько синтез «быстрее» риалтайма;

Метрики мы снимали на двух устройствах с помощью встроенных в PyTorch 1.8 утилит:

  • CPU — Intel i7-6800K CPU @ 3.40GHz;
  • GPU — 1080 Ti;
  • При снятии метрик на CPU мы также ограничивали число используемых потоков;

Для моделей 16 kHz получаются такие показатели:

Батч Устройство RTF RTS
1 CPU 1 thread 0.7 1.4
1 CPU 2 threads 0.4 2.3
1 CPU 4 threads 0.3 3.1
4 CPU 1 thread 0.5 2.0
4 CPU 2 threads 0.3 3.2
4 CPU 4 threads 0.2 4.9
————
1 GPU 0.06 16.9
4 GPU 0.02 51.7
8 GPU 0.01 79.4
16 GPU 0.008 122.9
32 GPU 0.006 161.2
————

Для моделей 8 kHz получаются такие показатели:

Батч Устройство RTF RTS
1 CPU 1 thread 0.5 1.9
1 CPU 2 threads 0.3 3.0
1 CPU 4 threads 0.2 4.2
4 CPU 1 thread 0.4 2.8
4 CPU 1 threads 0.2 4.4
4 CPU 4 threads 0.1 6.6
————
1 GPU 0.06 17.5
4 GPU 0.02 55.0
8 GPU 0.01 92.1
16 GPU 0.007 147.7
32 GPU 0.004 227.5
————

Также при расчетах скорости мы были удивлены ряду вещей:

  • Процессоры AMD показали себя сильно хуже;
  • Удивительно, но бутылочным горлышком в нашем случае оказался именно такотрон а не вокодер (еще остается существенный потенциал ускорения всей системы в 3-4 раза, а может даже и в 10 раз, если получится квантизация и дополнительное сжатие);
  • Более чем 4 потока CPU не помогают, равно как и батч больше 4;

Балаболка – бесплатная программа для озвучивания (Windows)

Балаболка – настольная программа, использует встроенный речевой синтезатор Speech API. Работает на платформе Windows (XP/7/8/10). Для ее работы, как правило, не требуется установка дополнительных языковых или звуковых пакетов. Скачиваете, устанавливаете и пользуетесь. К слову, есть портативная сборка “Балаболки” – она не требует даже установки и умеет запускаться с флешки. 

Отметим особенности этой “говорилки”: 

  • Переключение между Speech API 4, 5 и Microsoft Speech Platform: в зависимости от версии ОС, может использоваться тот или иной речевой синтезатор.
  • Настройка скорости, высоты звуков и громкости.
  • Чтение текста из различных источников: буфер обмена, документ, текстовый файл, загруженный через меню “Балаболки”.; текст, набираемый на клавиатуре. 
  • Проверка орфографии, учет знаков препинания. 
  • Дробление текста на фрагменты, сравнение файлов. 
  • Использование в качестве программы для озвучивания книг. Поддерживаются различные форматы электронных книг и документов: AZW, CHM, DjVu, DOC, DOCX, EPUB, FB2 и прочие. 
  • Конвертация текста в аудио (форматы – WAV, MP3, MP4, OGG и WMA) и наоборот.  

В общем, “Балаболка” – отличная и к тому же бесплатная программа, которая дает фору онлайн-сервисам. В ней нет раздражительной рекламы, а интерфейс очень понятен и привычен более-менее осведомленному Windows-пользователю. 

На Android

Помимо того, что Google Assistant поможет вам добраться от точки A в точку Б, а также ответит на простые вопросы, он также легко зачитает вам текст входящих СМС. Для этого убедитесь, что у вас активированы функции голосового помощника («Приложения и уведомления» > «Ассистент» > «Настройки»), а затем попросите ассистента прочитать новые сообщения, чтобы услышать их через динамик.

К сожалению, эта функция работает лишь для новых сообщений, которые еще не были прочитаны (полезная функция во время вождения). Но, несмотря на это, у вас есть возможность на них ответить. Раньше помощник мог читать старые СМС, но по какой-то странной причине эта функция больше недоступна.

Чтобы прочитать что-либо еще, вы можете использовать механизм преобразования текста в речь, встроенный в операционную систему вашего смартфона.

Из меню «Настройки» перейдите в раздел «Специальные возможности» > «Озвучивание текста», чтобы настроить параметры для скорости чтения и высоты тона голоса. Вернувшись на экран «Специальные возможности», нажмите «Озвучивание при нажатии» и активируйте функцию. После этого вы сможете провести двумя пальцами вниз от экрана, когда вам понадобится что-то прочитать, и помощник сделает все за вас.

фото: hd01.ru

Просто нажмите значок воспроизведения – и вуаля! Но сперва мы должны вас предупредить: у встроенного механизма преобразования текста в речь есть несколько причуд, и он использует не самый естественный человеческий голос. Но в то же время он полностью справляется со своей задачей, преобразуя в текст все – от электронных писем до содержания веб-страниц.

фото: play.google.com

Со смартфоном на базе Android вы можете без проблем использовать сторонние приложения. Например, freemium Ping , который зачитывает тексты, электронные письма и сообщения от WhatsApp и Facebook, а также имеет режимы «за рулем», «тренировка» и «работа».

 фото: play.google.com

Существует и бесплатный @Voice Aloud Reader , который функционирует за счет рекламы и может работать поверх встроенного механизма преобразования текста в речь Android. Приложение может считывать практически любые документы или веб-страницы по вашему желанию, если активировать опцию Android Share.

 фото: Gizmodo

Этого должно хватить для нормальной работы. Однако не забывайте о том, что у некоторых приложений уже имеется встроенная функция чтения вслух. Так, если вы сохраняете веб-статьи в Pocket или Instapaper, вы можете активировать функцию, которая будет зачитывать сохраненные материалы. Для этого в Pocket коснитесь значка наушников внизу, а в Instapaper – трех точек (вверху справа) и затем кнопки «Speak» (Произнести).

Список синтезаторов речи:

1. Acapela

Acapela — один из самых распространенных речевых синтезаторов во всем мире. Программа распознает и озвучивает тексты более, чем на тридцати языках. Русский язык поддерживается двумя голосами: мужской голос — Николай, женский — Алена. Женский голос появился значительно позднее мужского и является более усовершенствованным.

Прослушать, как звучат голоса, можно на официальном сайте программы. Достаточно лишь выбрать язык и голос, и набрать свой небольшой текст.

Кстати, для мужского голоса был разработан отдельный словарь ударений, что позволяет достичь еще большей четкости произношения.

Установка программы проходит без проблем. Разработаны версии для операционных систем Windows, Linux, Mac, а также для мобильных ОС Android u IOS.

Программа платная, скачать ее можно с официального сайта Acapela.

2. Vokalizer

Вторым в нашем списке, но не по популярности является движок Милена от разработчика программы Vocalizer компании Nuance. Голос звучит очень естественно, речь чистая

Есть возможность установить различные словари, а также подкорректировать громкость, скорость и ударение, что не маловажно. Как и в случае с Акапелой, программа имеет различные версии для мобильных, автомобильных и компьютерных приложений

Прекрасно подходит для чтения книг.

Скачать все версии Vokalizer и русскоязычный движок Милена можно на официальном сайте производителя программы.

3. RHVoice

Синтезатор речи RHVoice был разработан Ольгой Яковлевой. Программа озвучивает русские тексты тремя голосами: Елена, Ирина и Александр. Подробнее об установке и применении, а также прослушать голоса Вы сможете в прошлой статье

Код синтезатора открыт для всех, программы же абсолютно бесплатны. RHVoice выпущена в двух вариантах: как отдельная программа, так и как приложение к NVDA. Все версии можно скачать с официального сайта разработчика.

4. ESpeak

Первая версия бесплатного синтезатора речи eSpeak была выпущена в 2006 году. С тех пор компания-разработчик постоянно выпускает все более усовершенствованные версии. Последняя версия была представлена в конце весны две тысячи тринадцатого года.

  • Microsoft Windows,
  • Mac OS X,
  • Linux,
  • RISC OS

Возможна также компиляция кода для Windows Mobile, но делать ее придется самостоятельно. А вот с мобильной ОС Android программа работает без проблем, хотя русские словари еще не до конца разработаны. Русскоязычных голосов много, можно выбрать на свой вкус.

Для разработчиков будет интересно узнать, что C++ код программы доступен в сети. Скачать программу, а также посмотреть ее код можно на официальном сайте.

5. Festival

Festival — это целая система распознавания и синтеза речи, которая была разработана в эдинбургском университете. Программы и все модули абсолютно бесплатно и распространяются по системе open source. Скачать их и ознакомиться с демо-версиями можно на официальном сайте университета Эдинбурга.

Русский голос представлен в одном варианте, но звучание довольно хорошее и ясное, без акцента и с правильной расстановкой ударений. К сожалению, программа пока может быть установлена только в среде API, Linux. Также есть модуль для работы в Mac OS, но русский язык пока поддерживается не очень хорошо.

Библиотека pyttsx3

PyTTSx3 — удобная кроссплатформенная библиотека для реализации TTS в приложениях на Python 3. Использует разные системы синтеза речи в зависимости от текущей ОС:

  • в Windows — SAPI5,
  • в Mac OS X — nsss,
  • в Linux и на других платформах — eSpeak.

Это очень удобно: пишете код один раз и он работает везде. Кстати, eSpeak NG поддерживается наравне с исходной версией.

А теперь примеры!

Просмотр голосов

У каждого голоса есть несколько параметров, с которыми можно работать:

  • id (идентификатор в операционной системе), 
  • name (имя),
  • languages (поддерживаемые языки),
  • gender (пол),
  • age (возраст).

Первый вопрос всегда в том, какие голоса установлены на стороне пользователя. Поэтому создадим скрипт, который покажет все доступные голоса, их имена и ID. Назовем файл, например, list_voices.py:

import pyttsx3

tts = pyttsx3.init() # Инициализировать голосовой движок.

У активного движка есть стандартный параметр ‘voices’, где содержится список всех доступных этому движку голосов. Это нам и нужно:

voices = tts.getProperty(‘voices’)

 # Перебрать голоса и вывести параметры каждого

for voice in voices:

    print(‘=======’)

    print(‘Имя: %s’ % voice.name)

    print(‘ID: %s’ % voice.id)

    print(‘Язык(и): %s’ % voice.languages)

    print(‘Пол: %s’ % voice.gender)

    print(‘Возраст: %s’ % voice.age)

Теперь открываем терминал или командную строку, переходим в директорию, куда сохранили скрипт, и запускаем list_voices.py.

 Результат будет примерно таким:

В Linux картина будет похожей, но с другими идентификаторами. 

Как видите, в Windows для большинства установленных голосов MS SAPI заполнены только «Имя» и ID. Однако этого хватит, чтобы решить следующую нашу задачу: написать код, который выберет русский голос и что-то им произнесет.

Например, у голоса RHVoice Aleksandr есть преимущество — его имя уникально, потому что записано транслитом и в таком виде не встречается у других известных производителей голосов. Но через pyttsx3 этот голос будет работать только в Windows. Для воспроизведения в Linux ему нужен Speech Dispatcher (подробнее чуть позже), с которым библиотека взаимодействовать не умеет. Как общаться с «диспетчером» еще обсудим, а пока разберемся с доступными голосами.

Как выбрать голос по имени

В Windows голос удобно выбирать как по ID, так и по имени. В Linux проще работать с именем или языком голоса. Создадим новый файл set_voice_and_say.py:

import pyttsx3

tts = pyttsx3.init()

voices = tts.getProperty(‘voices’)

# Задать голос по умолчанию

tts.setProperty(‘voice’, ‘ru’) 

# Попробовать установить предпочтительный голос

for voice in voices:

    if voice.name == ‘Aleksandr’:

        tts.setProperty(‘voice’, voice.id)

tts.say(‘Командный голос вырабатываю, товарищ генерал-полковник!’)

tts.runAndWait()

В Windows вы услышите голос Aleksandr, а в Linux — стандартный русский eSpeak. Если бы мы вовсе не указали голос, после запуска нас ждала бы тишина, так как по умолчанию синтезатор говорит по-английски.

Обратите внимание: tts.say() не выводит реплики мгновенно, а собирает их в очередь, которую затем нужно запустить на воспроизведение командой tts.runAndWait(). Выбор голоса по ID

Выбор голоса по ID

Часто бывает, что в системе установлены голоса с одинаковыми именами, поэтому надежнее искать необходимый голос по ID.

Заменим часть написанного выше кода:

for voice in voices:

    ru = voice.id.find(‘RHVoice\Anna’)  # Найти Анну от RHVoice

    if ru > -1: # Eсли нашли, выбираем этот голос

        tts.setProperty(‘voice’, voice.id)

Теперь в Windows мы точно не перепутаем голоса Anna от Microsoft и RHVoice. Благодаря поиску в подстроке нам даже не пришлось вводить полный ID голоса.

Но когда мы пишем под конкретную машину, для экономии ресурсов можно прописать голос константой. Выше мы запускали скрипт list_voices.py — он показал параметры каждого голоса в ОС

Тогда-то вы и могли обратить внимание, что в Windows идентификатором служит адрес записи в системном реестре:

import pyttsx3

tts = pyttsx3.init()

EN_VOICE_ID = «HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\MS-Anna-1033-20DSK»

RU_VOICE_ID = «HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\TokenEnums\RHVoice\Anna»

# Использовать английский голос

tts.setProperty(‘voice’, EN_VOICE_ID)

tts.say(«Can you hear me say it’s a lovely day?»)

# Теперь — русский

tts.setProperty(‘voice’, RU_VOICE_ID)

tts.say(«А напоследок я скажу»)

tts.runAndWait()

Модуль Google TTS — голоса из интернета

Google предлагает онлайн-озвучку текста с записью результата в mp3-файл. Это не для каждой задачи:

  • постоянно нужен быстрый интернет;
  • нельзя воспроизвести аудио средствами самого gtts;
  • скорость обработки текста ниже, чем у офлайн-синтезаторов.

Что касается голосов, английский и французский звучат очень реалистично. Русский голос Гугла — девушка, которая немного картавит и вдобавок произносит «ц» как «ч». По этой причине ей лучше не доверять чтение аудиокниг, имен и топонимов.

Еще один нюанс. Когда будете экспериментировать с кодом, не называйте файл «gtts.py» — он не будет работать! Выберите любое другое имя, например use_gtts.py.

Простейший код, который сохраняет текст на русском в аудиофайл:

from gtts import gTTS

tts = gTTS(‘Иван Федорович Крузенштерн. Человек и пароход!’, lang=’ru’)

tts.save(‘tts_output.mp3’)

После запуска этого кода в директории, где лежит скрипт, появится запись. Чтобы воспроизвести файл «не отходя от кассы», придется использовать еще какой-то модуль или фреймворк. Годится pygame или pyglet. 

Вот листинг приложения, которое построчно читает txt-файлы с помощью связки gtts и PyGame. Я заметила, что для нормальной работы этого скрипта текст из text.txt должен быть в кодировке Windows-1251 (ANSI).

Веб-страницы для преобразования текста в речь

Для всех тех людей, которые больше не ищут программ на своем компьютере, доступно множество веб-страниц, которые выполняют основные функции преобразования текста в речь, и мы собираемся проанализировать основные из них.

NaturalReader Интернет

Это то же приложение, которое мы ранее проанализировали в качестве программы, и доступно бесплатно в веб-формате. Этот веб-формат является лучшим из всех онлайн-вариантов для преобразования текста в речь, как письменного текста, так и документов. Это имеет прямое чтение того, что мы пишем, это имеет типографику для дислексии и это позволяет загружать все типы документов онлайн. Он имеет более 100 естественных голосов, доступных на 16 различных языках.

Чтобы иметь возможность выполнять преобразование текста в речь с NaturalReader Online, все, что вам нужно сделать, это получить доступ к своему веб-сайту .

текстовая речь

Это веб-страница, с которой мы можем конвертировать любой текст в речь в аудиоформате MP3 и позволяет нам скачать его бесплатно. Он поддерживает восемь языков, включая испанский, и имеет на выбор пять голосов (три мужчины и две женщины) для адаптации к каждому случаю. Мы также можем выбрать скорость чтения между медленной, средней, быстрой и очень быстрой. Кроме того, он поддерживает до 500,000 XNUMX прочитанных символов.

Мы можем преобразовать текст в речь с помощью текстовой речи бесплатно доступ к своему официальному сайту .

Читать

Это веб-страница ориентирован на профессиональный сектор это позволяет нам слушать онлайн текст, который мы вставляем или который мы пишем в разделе персонализации вашего сообщения в Интернете. Имеет совместимость с несколько языков В том числе испанский, где у нас будет выбор женского и мужского голоса. ReadSpeaker оптимизирован для различных секторов или отраслей (автомобилестроение, развлечения, здравоохранение и т. Д.). Сайт включает в себя синтез голоса и чтение вслух для нашей компании.

Если мы заходим на сайт ReadSpeaker, мы можем выполнить демо как тест чтобы увидеть, как работает сервис. Если мы хотим получить доступ к их услугам, мы должны связаться с ними.

iSpeech

Эта страница позволяет нам читать тексты и конвертировать их в голос больше чем языки 27 в том числе испанский. В нем есть 3 различный скорость чтения адаптировать чтение к скорости, которая нам подходит лучше всего. Кроме того, при регистрации вы можете скачать аудио в нескольких форматах, среди которых: WAV, MP3, OGG, WMA, AIFF, ALAW, ULAW, VOX и MP4.

Мы можем получить доступ к странице iSpeech и сделать бесплатную пробную версию их службы. Мы также можем нанять ваши услуги преобразования текста в аудио, от 100 долларов за 900 слов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector