Программа балаболка как поставить ударение

Создание аудиокниг с использованием синтезатора RHVoice, конфигурационный файл, словарь омографов для Балаболки, словарь ударений и примеры готовых книг, в редакции от 15.03.2023.

Содержание

  • Выбор синтезатора
  • Расстановка ударений
  • Конфигурационный файл RHVoice
  • Словари
  • Подключение и настройка словарей
  • Поиск омографов
  • Файл sample.bxd
  • Мой вариант расстановки ударений

Выбор синтезатора

Панель выбора текущего голоса и его настроек открывается и закрывается клавишей F10. Обычно сразу после первого запуска Балаболки она открыта. Если же перемещение клавишей Tab озвучивает только пустую открытую вкладку или вкладку с текстом книги, то нажмите F10 один раз, затем табайте и настраивайте голос. Ещё одна панель открывается и закрывается клавишей F11, но об этом чуть ниже.

Мой выбор — голос Александр синтезатора RHVoice. Пробовал Онлайн-сервис для синтеза речи, но ни один из вариантов не проговаривает русские слова и не расставляет интонации так, как это делает RHVoice. Зарубежные сервисы редко встречающиеся русские слова вообще искажают до потери смысла, например слово «скот» звучит как «скат».

Расстановка ударений

Если записываю для себя, тем более большие книги, то голос Александр синтезатора RHVoice обеспечивает приемлемое по разборчивости озвучивание без дополнительной обработки, а на некоторые отклонения звучания слов можно не обращать внимание. Кстати, старая версия RHVoice 0.2.94 проговаривает слова ощутимо хуже, а скорость отклика на новых версиях ничуть не хуже.

Для расстановки ударений назначил в конфигурационном фале знак ` (русская буква Ё в английской раскладке). Теперь можно править ударения как расстановкой этого знака в текстовом редакторе, так и в самой Балаболке, но вручную тут, ИМХО, не удобно, – прыгает фокус, не точно озвучивается его положение при передвижении средствами NVDA.

Конфигурационный файл RHVoice

Вы вероятнее всего уже знаете, что скорость чтения синтезатора RHVoice можно существенно повысить, внеся изменения в файл RHVoice.ini. Могу предложить настроенный на максимальные скорости файл с командным файлом автоматической установки на Яндекс-диске.

Распакуйте архив и запустите командный файл. Теперь скорость чтения в Балаболке с помощью синтезатора RHVoice можно существенно увеличить.

Например, для себя я настраиваю скорость чтения 75%, высоту 45%, что позволяет читать тексты со скоростью около 400 слов в минуту. С этими же настройками записываю для себя книги, чтобы оторваться от компьютера и читать их на портативной колонке.

На ста процентах скорость чтения увеличивается до 550 слов в минуту, но трудно разобрать незнакомые слова, хотя попривыкнув, стал читать книги прямо в Балаболке именно с этой скоростью. Что интересно, то при чтении текстов самой NVDA с этим же конфигурационным файлом удаётся достичь скорости чтения только около 400 слов в минуту.

Для записи книг другим слушателям остановился на следующих настройках:

  • Скорость 45%;
  • Высота 60%;
  • Громкость 60%.

Эти настройки обеспечивают проговаривание со скоростью около двухсот слов в минуту.

Если интересно, то можно послушать некоторые из таких записей на Яндекс-диске: лесниковское, детское, разное.

Если запустить проигрывание выше опубликованных файлов в PotPlayer, а затем нажать десять раз клавишу C, то скорость увеличится в два раза и составит 400 слов в минуту, – а это как раз та скорость, с которой слушаю я. Причём заметил, что если слушать с малой скоростью, то потом труднее опять привыкать к высокой скорости этого же синтезатора.

Словари

Вы можете изготовить словарь омографов сами, а можете скачать готовый с Яндекс-диска.

Я его изготовил из файла для синтезатора Ольга.

Файл назвал RHVoice.hmg. Разместить его нужно в портабельной версии по пути

Balabolkadictionaries

аналогично и в установочной версии.

Чтобы не путаться, удалил из этой папки лишние словари, оставив только RHVoice.hmg и sample.bxd.

Кстати, стандартным словарям лучше изменить название, чтобы после очередного обновления их не затереть. Я добавил к названию файла цифру 1.

Подключение и настройка словарей

В Балаболке для включения панели со словарями жмём клавишу F11. Панель настройки голоса на это время можно отключить, клавиша F10 однократно.

Вначале нужно найти файл sample.bxd и отметить его флажком. Впрочем, какие словари подключать, а какие отключить, вы своё решение можете изменить в любой момент.

Затем табать дальше и точно также отметить файл RHVoice.hmg

Перед каждым файлом есть кнопка «Редактировать». Если после нажатия кнопки будет звучать:

Коррекция произношения [sample.bxd]

то открыта возможность редактировать этот файл.

Тут в наличии только две строки. В первой показан пример замены одного слова другим:

1 Активно: Да; Произносить: Xmas; Как: Christmas

а во второй строке показан пример замены с помощью регулярных выражений:

2 Активно: Да; Произносить: ((http|ftp|https)://)?(www.)?([-a-zA-Z0-9@:%._+~#=]{2,256}.[a-z]{2,6}b)([-; Как: $4; Описание: Replace a web address by its domain name («example.com»)

Жмём отмену и попробуем вначале редактировать второй файл. Должно прозвучать:

Коррекция произношения [RHVoice.hmg]

Сразу предлагается ввести новое слово, в следующем редакторе перечислить варианты произношения через запятую, без пробела после запятой, но мы вначале ознакомимся со списком уже имеющихся омографов.

Табаем до вкладки Омографы, а затем ещё раз и попадаем на список, который можно просмотреть, перемещаясь стрелкой вниз. Вообще это файл можно просто открыть в любом текстовом редакторе и просмотреть. В нём 1525 строк.

Кроме первой вкладки тут есть ещё две, ознакомьтесь сами.

Поиск омографов

Открываем в Балаболке текстовый документ и даём команду поиска омографов, Control +M (русская Ь). Откроется первое найденное слово и варианты выбора.

Чтобы понять контекст, можно нажать F5, будет озвучена строка, в которой слово находится.

Выбрав нужный вариант, жмём F2 и слово заменяется на правильно звучащее, а открывается следующий омограф.

Если слово нужно пропустить, то жмём F3.

Закрыть окно можно как обычное окно Windows.

Отредактированный файл можно сохранить в формате txt или в формате разметки Балаболки.

Файл sample.bxd

В него вносятся слова, которые просто требуется правильно произносить или можно вообще заменять одно выражение другими. Выше по тексту есть примеры его настроек, а с Яндекс-диска можете скачать словарь с некоторыми готовыми словами и выражениями.

Прежде, чем нажать кнопку «Редактировать», перейдите в список со словарями и остановитесь на том, который собираетесь редактировать.

Если в словаре много слов, то есть возможность включить фильтр, чтобы не искать нужное слово или выражение вручную. В первом же поле нужно выбрать, по каким условиям отображать, например, «содержит», в следующем поле ввести слово, дотабать и нажать «Применить фильтр», а далее в списке останутся только нужное слова. Или можно воспользоваться другими условиями фильтра.

Мой вариант расстановки ударений

Мне оказалось проще открыть текстовый файл в AkelPad, затем с отключёнными словарями расставить ударения.

Далее текстовый файл перегоняю в mp3, внимательно слушаю и по ходу вношу правки в текст.

После этого опять прогоняю в mp3, но уже со вставкой звуковых эффектов, прослушиваю, и если грубых ошибок не случилось, то файл считаю готовым. Честно сказать, прогонять приходится некоторые тексты по 3 и более раз, если дать отдохнуть голове пару дней после каждого редактирования.

А словарь омографов, спросите вы? А пусть будет!

Примечание. Ура! В одной из рассылок рассказали, как вернуть чтение аннотации. Для этого жмём команду Control +Shift +F6,

Откроется окно «Настройки импорта текста»

Переходим на вкладку Извлечение текста из файлов, находим пункт:

Извлечь аннотацию из файла и вставить в начало текста (для форматов FB2 и FB3) флажок не отмечено

отмечаем, сохраняем.

Как настроить ударения в балаболке

Теги — это текстовые управляющие команды, вставляемые в читаемый текст, причем они сами не читаются, а передают речевому синтезатору команду изменить тот или иной параметр чтения текста. Каждый элемент XML состоит из стартового тега , завершающего тега и текста между этими двумя тегами. Если элемент пустой и текст отсутствует, то тег может быть записан так: .

С помощью тегов можно изменить, например, скорость чтения:

Этот текст читается со скоростью пять.

Подробную информацию о тегах можно найти в файле справки программы «Балаболка».

Как сменить голос во время чтения вслух?

Можно воспользоваться тегами SAPI 5. Рекомендуется вставлять стартовый тег и парный ему завершающий тег внутрь одного и того же абзаца. Например:

Привет, как дела?
Всё в порядке.

Как выполнить «тихую» установку программы?
Установка программы в автоматическом режиме без показа диалогов («тихая» установка) возможна при указании ключа -silent в командной строке.
В моем компьютере установлены две звуковые карты. Как выбрать нужное аудиоустройство для воспроизведения речи?
Можно осуществить выбор аудиоустройства в панели управления Windows; например, в разделе «Звук, речь, аудиоустройства», кнопка «Аудио выход» («Audio Output»). Звуковую карту можно также выбрать в программе «Балаболка», при помощи пункта главного меню «Настройки | Выбор аудиоустройства».
Голос Nicolai произносит «пространство» каждый раз, когда в тексте встречается неразрывный пробел (символ ALT+0160). Как это исправить?
Программа может автоматически заменять неразрывные пробелы обычными пробелами во время чтения. Выберите пункт главного меню «Настройки | Общие настройки», в открывшемся окне перейдите на вкладку «Чтение» и поставьте «галочку» в пункте «Игнорировать символы во время чтения«. Добавьте неразрывный пробел в список игнорируемых символов: нажмите клавишу ALT и напечатайте «0160» на цифровом блоке клавиатуры. Можно указать и другие символы, которые голоса произносят вслух («кавычки», «тире» и т.д.).
Открываю в программе файл в формате DjVu, но текст отсутствует. В чем дело?
Формат DjVu был разработан для хранения сканированных документов; в DjVu-файлах в сжатом виде хранятся графические изображения страниц книг, журналов и т.д. Также, формат DjVu предусматривает наличие текстового (OCR) слоя, который содержит текст со страницы. Файлы с текстовым слоем иногда обозначают как DjVu+OCR.

Программа «Балаболка» умеет извлекать данные лишь из текстового слоя. В случае, если текстовый слой недоступен, единственный метод получения текста — это выполнение оптического распознавания, например, в FineReader.

Открываю в программе электронную книгу, но текст в окне «Балаболки» отсутствует. В чем дело?
Этому может быть несколько объяснений. Во-первых, файл может представлять собой набор отсканированных изображений страниц бумажной книги. Во-вторых, электронная книга может иметь защиту DRM. Программа «Балаболка» не имеет возможности извлечь текст из книги с такой защитой (это было бы незаконно).
Мне требуется удалить из текста тире, стоящие в начале строки. Как это сделать?
Воспользуйтесь пунктом главного меню «Правка | Заменить». В строке «Найти» напишите ^p—, в строке «Заменить на» укажите ^p. Программа позволяет использовать в окнах «Найти» и «Заменить» большинство из специальных кодов, которые применяются в Microsoft Word:

^p знак абзаца ^t знак табуляции ^nnn знак ASCII (где nnn — код знака) ^0nnn знак ANSI (где 0 — это ноль, а nnn — код знака) ^Unnnnn знак в кодировке Юникод (где nnnnn — код знака) ^+ длинное тире ( — ) ^= короткое тире ( – ) ^^ знак крышки ^s неразрывный пробел ^? любой знак (только в поле «Найти») ^# любая цифра (только в поле «Найти») ^$ любая буква (только в поле «Найти») ^c содержимое буфера обмена Windows (только в поле «Заменить на») ^& содержимое поля «Найти» (только в поле «Заменить на»)

Меня не удовлетворяет, как программа «Балаболка» извлекает текст из файлов формата PDF. Могу я использовать другой способ для обработки файлов PDF?
Процесс извлечения текста из файлов формата PDF достаточно сложен, так как файл PDF не содержит обычный текст. Вы можете использовать для извлечения текста внешнюю программу, поддерживающую передачу параметров в командной строке. Например, утилиту pdftotext.exe из состава проекта Xpdf. Скопируйте pdftotext.exe в подкаталог «utils» в папке программы «Балаболка», выберите пункт главного меню «Настройки | Импорт текста», вкладку «Внешние программы для импорта текста», и нажмите кнопку «Добавить». Задайте команду для использования pdftotext.exe:

%BFolder%utilspdftotext.exe -q -nopgbrk -enc UTF-8 %Input% %Output%

Введите имя для данного формата (например, «Xpdf Converter»), расширение файла («PDF») и кодировку текста («UTF-8»). После того, как будет выбран пункт Использовать вместо метода извлечения текста по умолчанию для данного формата файлов, программа сможет использовать внешнюю утилиту для извлечения текста из файлов формата PDF.

Как сохранять речь в виде звуковых файлов формата FLAC?
Программа позволяет использовать разные кодеки для создания звуковых файлов. Необходимо указать командную строку для вызова внешней программы; например, можно использовать утилиту FLAC.EXE, созданную некоммерческой организацией Xiph.Org Foundation. В программе «Балаболка» выберите пункт главного меню «Настройки | Аудиофайлы», вкладку «Другие кодеки». Нажмите кнопку «Добавить» и укажите значения для параметров: название (например, «Аудиофайлы FLAC»), расширение файла (FLAC) и командную строку.

C:Utilsflac.exe %Input% -o %Output%

Переменная %Input% обозначает имя входного файла с расширением WAV (файл формата RIFF WAVE), переменная %Output% — имя звукового файла в формате FLAC. Файл FLAC.EXE можно скопировать в ту же папку, где находится «Балаболка»; переменная %BFolder% обозначает путь к этой папке.

Как сделать так, чтобы каждая строка текстового файла записывалась в отдельный аудиофайл?
Могу предложить такой способ. Добавьте в текстовый файл по две пустых строки после каждой строки: выберите пункт главного меню «Правка | Заменить», в поле «Найти» напишите ^p, в поле «Заменить на» напишите ^p^p^p, нажмите кнопку «Заменить все». Сохраните текстовый файл.

Выберите пункт главного меню «Файл | Сохранить как несколько аудиофайлов». В появившемся диалоговом окне выберите способ деления текста: Искать две пустые строки подряд. Всё, можно начинать запись аудиофайлов.

Можно ли сделать так, чтобы при преобразовании документа в несколько звуковых файлов в качестве имени файла использовалась первая строка текста (например, «01 Глава первая.mp3», «02 Глава вторая.mp3»)?
В окне «Разделить текст на части и преобразовать в аудиофайлы» в поле «Шаблон для имени файла» вставьте переменную %FirstLine%. При делении текста программа заменит переменную на содержимое первой строки каждой части текста. Для того, чтобы вставить порядковый номер файла внутрь имени, используйте переменную %Number%.
Могу ли я использовать в видео для YouTube звуковые файлы, созданные в программе «Балаболка»?
«Балаболка» является бесплатным программным продуктом, поэтому пользователь может использовать звуковые файлы, созданные приложением, по своему усмотрению. Но если применяется коммерческая версия компьютерного голоса, необходимо связаться с разработчиками этого голоса и приобрести специальную лицензию для его коммерческого использования. Такая лицензия позволит легально осуществлять распространение аудиоматериалов.

Фирмы, выпускающие компьютерные голоса, предоставляют два вида лицензий:

  • для индивидуального использования (for personal use);
  • для коммерческого использования и распространения аудиоматериалов
    (for commercial use/audio broadcast).

Если пользователь намерен использовать синтез речи в видео на YouTube или собирается включить звуковые файлы, созданные в программе «Балаболка», в состав своего программного продукта, необходимо приобрести у фирмы-изготовителя голоса соответствующую лицензию.

Балаболка, настройки для RHVoice

Создание аудиокниг с использованием синтезатора RHVoice, конфигурационный файл, словарь омографов для Балаболки, словарь ударений и примеры готовых книг.

Выбор синтезатора

Панель выбора текущего голоса и его настроек открывается и закрывается клавишей F10. Обычно сразу после первого запуска Балаболки она открыта. Если же перемещение клавишей Tab озвучивает только пустую открытую вкладку или вкладку с текстом книги, то нажмите F10 один раз, затем табайте и настраивайте голос. Ещё одна панель открывается и закрывается клавишей F11, но об этом чуть ниже.

Мой выбор — голос Александр синтезатора RHVoice. Пробовал Онлайн-сервис для синтеза речи, но ни один из вариантов не проговаривает русские слова и не расставляет интонации так, как это делает RHVoice. Зарубежные сервисы редко встречающиеся русские слова вообще искажают до потери смысла, например слово «скот» звучит как «скат».

Расстановка ударений

Если записываю для себя, тем более большие книги, то голос Александр синтезатора RHVoice обеспечивает приемлемое по разборчивости озвучивание без дополнительной обработки, а на некоторые отклонения звучания слов можно не обращать внимание. Кстати, старая версия RHVoice 0.2.94 проговаривает слова ощутимо хуже, а скорость отклика на новых версиях ничуть не хуже.

Для расстановки ударений назначил в конфигурационном фале знак ` (русская буква Ё в английской раскладке). Теперь можно править ударения как расстановкой этого знака в текстовом редакторе, так и в самой Балаболке, но вручную тут, ИМХО, не удобно, – прыгает фокус, не точно озвучивается его положение при передвижении средствами NVDA.

Конфигурационный файл RHVoice

Вы вероятнее всего уже знаете, что скорость чтения синтезатора RHVoice можно существенно повысить, внеся изменения в файл RHVoice.ini. Могу предложить настроенный на максимальные скорости файл с командным файлом автоматической установки на Яндекс-диске.

Распакуйте архив и запустите командный файл. Теперь скорость чтения в Балаболке с помощью синтезатора RHVoice можно существенно увеличить.

Например, для себя я настраиваю скорость чтения 75%, высоту 45%, что позволяет читать тексты со скоростью около 400 слов в минуту. С этими же настройками записываю для себя книги, чтобы оторваться от компьютера и читать их на портативной колонке.

На ста процентах скорость чтения увеличивается до 550 слов в минуту, но трудно разобрать незнакомые слова, хотя попривыкнув, стал читать книги прямо в Балаболке именно с этой скоростью. Что интересно, то при чтении текстов самой NVDA с этим же конфигурационным файлом удаётся достичь скорости чтения только около 400 слов в минуту.

Для записи книг другим слушателям остановился на следующих настройках:

Эти настройки обеспечивают проговаривание со скоростью около двухсот слов в минуту.

Если интересно, то можно послушать некоторые из таких записей на Яндекс-диске: лесниковское, детское, разное.

Если запустить проигрывание выше опубликованных файлов в PotPlayer, а затем нажать десять раз клавишу C, то скорость увеличится в два раза и составит 400 слов в минуту, – а это как раз та скорость, с которой слушаю я. Причём заметил, что если слушать с малой скоростью, то потом труднее опять привыкать к высокой скорости этого же синтезатора.

Словари

Вы можете изготовить словарь омографов сами, а можете скачать готовый с Яндекс-диска.

Я его изготовил из файла для синтезатора Ольга.

Файл назвал RHVoice.hmg. Разместить его нужно в портабельной версии по пути

аналогично и в установочной версии.

Чтобы не путаться, удалил из этой папки лишние словари, оставив только RHVoice.hmg и sample.bxd.

Кстати, стандартным словарям лучше изменить название, чтобы после очередного обновления их не затереть. Я добавил к названию файла цифру 1.

Подключение и настройка словарей

В Балаболке для включения панели со словарями жмём клавишу F11. Панель настройки голоса на это время можно отключить, клавиша F10 однократно.

Вначале нужно найти файл sample.bxd и отметить его флажком. Впрочем, какие словари подключать, а какие отключить, вы своё решение можете изменить в любой момент.

Затем табать дальше и точно также отметить файл RHVoice.hmg

Перед каждым файлом есть кнопка «Редактировать». Если после нажатия кнопки будет звучать:

Коррекция произношения [sample.bxd]

то открыта возможность редактировать этот файл.

Тут в наличии только две строки. В первой показан пример замены одного слова другим:

1 Активно: Да; Произносить: Xmas; Как: Christmas

а во второй строке показан пример замены с помощью регулярных выражений:

2 Активно: Да; Произносить: ((http|ftp|https)://)?(www.)?([-a-zA-Z0-9@:%._+

#=]<2,256>.[a-z]<2,6>b)([-; Как: $4; Описание: Replace a web address by its domain name («example.com»)

Жмём отмену и попробуем вначале редактировать второй файл. Должно прозвучать:

Коррекция произношения [RHVoice.hmg]

Сразу предлагается ввести новое слово, в следующем редакторе перечислить варианты произношения через запятую, без пробела после запятой, но мы вначале ознакомимся со списком уже имеющихся омографов.

Табаем до вкладки Омографы, а затем ещё раз и попадаем на список, который можно просмотреть, перемещаясь стрелкой вниз. Вообще это файл можно просто открыть в любом текстовом редакторе и просмотреть. В нём 1525 строк.

Кроме первой вкладки тут есть ещё две, ознакомьтесь сами.

Поиск омографов

Открываем в Балаболке текстовый документ и даём команду поиска омографов, Control +M (русская Ь). Откроется первое найденное слово и варианты выбора.

Чтобы понять контекст, можно нажать F5, будет озвучена строка, в которой слово находится.

Выбрав нужный вариант, жмём F2 и слово заменяется на правильно звучащее, а открывается следующий омограф.

Если слово нужно пропустить, то жмём F3.

Закрыть окно можно как обычное окно Windows.

Отредактированный файл можно сохранить в формате txt или в формате разметки Балаболки.

Файл sample.bxd

В него вносятся слова, которые просто требуется правильно произносить или можно вообще заменять одно выражение другими. Выше по тексту есть примеры его настроек, а с Яндекс-диска можете скачать словарь с некоторыми готовыми словами и выражениями.

Прежде, чем нажать кнопку «Редактировать», перейдите в список со словарями и остановитесь на том, который собираетесь редактировать.

Если в словаре много слов, то есть возможность включить фильтр, чтобы не искать нужное слово или выражение вручную. В первом же поле нужно выбрать, по каким условиям отображать, например, «содержит», в следующем поле ввести слово, дотабать и нажать «Применить фильтр», а далее в списке останутся только нужное слова. Или можно воспользоваться другими условиями фильтра.

Мой вариант расстановки ударений

Мне оказалось проще открыть текстовый файл в AkelPad, затем с отключёнными словарями расставить ударения.

Далее текстовый файл перегоняю в mp3, внимательно слушаю и по ходу вношу правки в текст.

После этого опять прогоняю в mp3, но уже со вставкой звуковых эффектов, прослушиваю, и если грубых ошибок не случилось, то файл считаю готовым. Честно сказать, прогонять приходится некоторые тексты по 3 и более раз, если дать отдохнуть голове пару дней после каждого редактирования.

А словарь омографов, спросите вы? А пусть будет!

Настроенная Балаболка, версия 2.14

Предлагаю Балаболку с настройками для синтезатора RHVoice. Мне больше нравится голос Александр, но можно использовать любой другой, из комплекта этого синтезатора.

Есть более свежие версии Балаболки, но, к сожалению, они читают многие книги не с самого начала, поэтому для себя я пока вернулся на версию 2.14, так что не рекомендую обновлять именно этот вариант Балаболки.

Скачайте архив с Яндекс-диска, распакуйте, а чтобы пользоваться, сделайте некоторые настройки, которые обычно слетают после переноса Балаболки на другой компьютер.

Вызовите меню настроек аудиофайлов командой Shift +F5, затем клавишей Tab пройдите по пути:

  • MP3 вкладка выделено;
  • Постоянный битрейт (CBR) радиокнопка отмечено;
  • комбинированный список 48 Кбит/сек.

Почему 48? Просто услышал, что создатель RHVoice Ольга Яковлева говорила, что синтезатор использует именно этот битрейт, так что нет смысла записывать файлы с большим битрейтом, отчего они только будут иметь увеличенный размер, но качество звучания при этом не изменится.

Далее пробежитесь по Общему меню настроек, команда Shift +F6.

Ранее я уже описывал эти настройки, но для данной сборки нужно зайти на вкладку «Паузы», далее после слов:

Список. Вставить паузу в конец звукового файла (1000 мс)

опуститься на следующую строку:

Вставить аудиоклип в конец звукового файла (перелистывание длинное.mp3)

отсюда клавишей Tab перейти на кнопку «Редактирование» и поправить путь к файлу «перелистывание длинное.mp3», который находится в папке с программой.

Благодаря этому файлу каждый аудио отрывок будет завершаться длинным сигналом перелистывания страниц, что удобно при прослушивании.

Наконец, обязательно перепроверьте настройки синтезатора: скорость, высоту и громкость. Предпочитаемые мной значения описаны в статье, на которую я дал ссылку чуть выше.

Для себя я записываю звуковые файлы, используя выше описанный Конфигурационный файл RHVoice , задавая размер текста 27 тысяч знаков, получая в результате файлы объёмом 3.5 Мб, продолжительностью звучания около 10 мину, записывая по 40 файлов за один час.

Запускаю кодирование нескольких книг, потом смотрю в Области уведомлений на значке Балаболка, сколько файлов будет создано всего и сколько сделано уже.

Вы можете распаковать и настроить несколько копий Балаболки, используя каждую для своих целей. Например, с помощью одной записывать аудио книги, а с помощью другой читать текстовые книги зная, что закрытие этой Балаболки оставит открытыми читаемые книги.

Кстати, после создания сразу многих книг, записываемых по команде Control +Y, обязательно проверяйте, все ли книги записались и в полном ли объёме.

Иногда после этого приходится отдельные книги записывать по одной, команда Control +F8.

Добавить комментарий Отменить ответ

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

Как расставить ударения в балаболке

Как расставить ударения в балаболке

Теги — это текстовые управляющие команды, вставляемые в читаемый текст, причем они сами не читаются, а передают речевому синтезатору команду изменить тот или иной параметр чтения текста. Каждый элемент XML состоит из стартового тега , завершающего тега и текста между этими двумя тегами. Если элемент пустой и текст отсутствует, то тег может быть записан так: .

С помощью тегов можно изменить, например, скорость чтения:

Этот текст читается со скоростью пять.

Подробную информацию о тегах можно найти в файле справки программы «Балаболка».

Как сменить голос во время чтения вслух?
Можно воспользоваться тегами SAPI 5. Рекомендуется вставлять стартовый тег и парный ему завершающий тег внутрь одного и того же абзаца. Например:

Привет, как дела?
Всё в порядке.

Как выполнить «тихую» установку программы?
Установка программы в автоматическом режиме без показа диалогов («тихая» установка) возможна при указании ключа -silent в командной строке.
В моем компьютере установлены две звуковые карты. Как выбрать нужное аудиоустройство для воспроизведения речи?
Можно осуществить выбор аудиоустройства в панели управления Windows; например, в разделе «Звук, речь, аудиоустройства», кнопка «Аудио выход» («Audio Output»). Звуковую карту можно также выбрать в программе «Балаболка», при помощи пункта главного меню «Настройки | Выбор аудиоустройства».
Голос Nicolai произносит «пространство» каждый раз, когда в тексте встречается неразрывный пробел (символ ALT+0160). Как это исправить?
Программа может автоматически заменять неразрывные пробелы обычными пробелами во время чтения. Выберите пункт главного меню «Настройки | Общие настройки», в открывшемся окне перейдите на вкладку «Чтение» и поставьте «галочку» в пункте «Игнорировать символы во время чтения«. Добавьте неразрывный пробел в список игнорируемых символов: нажмите клавишу ALT и напечатайте «0160» на цифровом блоке клавиатуры. Можно указать и другие символы, которые голоса произносят вслух («кавычки», «тире» и т.д.).
Открываю в программе файл в формате DjVu, но текст отсутствует. В чем дело?
Формат DjVu был разработан для хранения сканированных документов; в DjVu-файлах в сжатом виде хранятся графические изображения страниц книг, журналов и т.д. Также, формат DjVu предусматривает наличие текстового (OCR) слоя, который содержит текст со страницы. Файлы с текстовым слоем иногда обозначают как DjVu+OCR.

Программа «Балаболка» умеет извлекать данные лишь из текстового слоя. В случае, если текстовый слой недоступен, единственный метод получения текста — это выполнение оптического распознавания, например, в FineReader.

Открываю в программе электронную книгу, но текст в окне «Балаболки» отсутствует. В чем дело?
Этому может быть несколько объяснений. Во-первых, файл может представлять собой набор отсканированных изображений страниц бумажной книги. Во-вторых, электронная книга может иметь защиту DRM. Программа «Балаболка» не имеет возможности извлечь текст из книги с такой защитой (это было бы незаконно).
Мне требуется удалить из текста тире, стоящие в начале строки. Как это сделать?
Воспользуйтесь пунктом главного меню «Правка | Заменить». В строке «Найти» напишите ^p—, в строке «Заменить на» укажите ^p. Программа позволяет использовать в окнах «Найти» и «Заменить» большинство из специальных кодов, которые применяются в Microsoft Word:

^p знак абзаца ^t знак табуляции ^nnn знак ASCII (где nnn — код знака) ^0nnn знак ANSI (где 0 — это ноль, а nnn — код знака) ^Unnnnn знак в кодировке Юникод (где nnnnn — код знака) ^+ длинное тире ( — ) ^= короткое тире ( – ) ^^ знак крышки ^s неразрывный пробел ^? любой знак (только в поле «Найти») ^# любая цифра (только в поле «Найти») ^$ любая буква (только в поле «Найти») ^c содержимое буфера обмена Windows (только в поле «Заменить на») ^& содержимое поля «Найти» (только в поле «Заменить на»)

Меня не удовлетворяет, как программа «Балаболка» извлекает текст из файлов формата PDF. Могу я использовать другой способ для обработки файлов PDF?
Процесс извлечения текста из файлов формата PDF достаточно сложен, так как файл PDF не содержит обычный текст. Вы можете использовать для извлечения текста внешнюю программу, поддерживающую передачу параметров в командной строке. Например, утилиту pdftotext.exe из состава проекта Xpdf. Скопируйте pdftotext.exe в подкаталог «utils» в папке программы «Балаболка», выберите пункт главного меню «Настройки | Импорт текста», вкладку «Внешние программы для импорта текста», и нажмите кнопку «Добавить». Задайте команду для использования pdftotext.exe:

%BFolder%utilspdftotext.exe -q -nopgbrk -enc UTF-8 %Input% %Output%

Введите имя для данного формата (например, «Xpdf Converter»), расширение файла («PDF») и кодировку текста («UTF-8»). После того, как будет выбран пункт Использовать вместо метода извлечения текста по умолчанию для данного формата файлов, программа сможет использовать внешнюю утилиту для извлечения текста из файлов формата PDF.

Как сохранять речь в виде звуковых файлов формата FLAC?
Программа позволяет использовать разные кодеки для создания звуковых файлов. Необходимо указать командную строку для вызова внешней программы; например, можно использовать утилиту FLAC.EXE, созданную некоммерческой организацией Xiph.Org Foundation. В программе «Балаболка» выберите пункт главного меню «Настройки | Аудиофайлы», вкладку «Другие кодеки». Нажмите кнопку «Добавить» и укажите значения для параметров: название (например, «Аудиофайлы FLAC»), расширение файла (FLAC) и командную строку.

C:Utilsflac.exe %Input% -o %Output%

Переменная %Input% обозначает имя входного файла с расширением WAV (файл формата RIFF WAVE), переменная %Output% — имя звукового файла в формате FLAC. Файл FLAC.EXE можно скопировать в ту же папку, где находится «Балаболка»; переменная %BFolder% обозначает путь к этой папке.

Как сделать так, чтобы каждая строка текстового файла записывалась в отдельный аудиофайл?
Могу предложить такой способ. Добавьте в текстовый файл по две пустых строки после каждой строки: выберите пункт главного меню «Правка | Заменить», в поле «Найти» напишите ^p, в поле «Заменить на» напишите ^p^p^p, нажмите кнопку «Заменить все». Сохраните текстовый файл.

Выберите пункт главного меню «Файл | Сохранить как несколько аудиофайлов». В появившемся диалоговом окне выберите способ деления текста: Искать две пустые строки подряд. Всё, можно начинать запись аудиофайлов.

Можно ли сделать так, чтобы при преобразовании документа в несколько звуковых файлов в качестве имени файла использовалась первая строка текста (например, «01 Глава первая.mp3», «02 Глава вторая.mp3»)?
В окне «Разделить текст на части и преобразовать в аудиофайлы» в поле «Шаблон для имени файла» вставьте переменную %FirstLine%. При делении текста программа заменит переменную на содержимое первой строки каждой части текста. Для того, чтобы вставить порядковый номер файла внутрь имени, используйте переменную %Number%.
Могу ли я использовать в видео для YouTube звуковые файлы, созданные в программе «Балаболка»?
«Балаболка» является бесплатным программным продуктом, поэтому пользователь может использовать звуковые файлы, созданные приложением, по своему усмотрению. Но если применяется коммерческая версия компьютерного голоса, необходимо связаться с разработчиками этого голоса и приобрести специальную лицензию для его коммерческого использования. Такая лицензия позволит легально осуществлять распространение аудиоматериалов.

Фирмы, выпускающие компьютерные голоса, предоставляют два вида лицензий:

  • для индивидуального использования (for personal use);
  • для коммерческого использования и распространения аудиоматериалов
    (for commercial use/audio broadcast).

Если пользователь намерен использовать синтез речи в видео на YouTube или собирается включить звуковые файлы, созданные в программе «Балаболка», в состав своего программного продукта, необходимо приобрести у фирмы-изготовителя голоса соответствующую лицензию.

Балаболка, настройки для RHVoice

Создание аудиокниг с использованием синтезатора RHVoice, конфигурационный файл, словарь омографов для Балаболки, словарь ударений и примеры готовых книг.

Выбор синтезатора

Панель выбора текущего голоса и его настроек открывается и закрывается клавишей F10. Обычно сразу после первого запуска Балаболки она открыта. Если же перемещение клавишей Tab озвучивает только пустую открытую вкладку или вкладку с текстом книги, то нажмите F10 один раз, затем табайте и настраивайте голос. Ещё одна панель открывается и закрывается клавишей F11, но об этом чуть ниже.

Мой выбор — голос Александр синтезатора RHVoice. Пробовал Онлайн-сервис для синтеза речи, но ни один из вариантов не проговаривает русские слова и не расставляет интонации так, как это делает RHVoice. Зарубежные сервисы редко встречающиеся русские слова вообще искажают до потери смысла, например слово «скот» звучит как «скат».

Расстановка ударений

Если записываю для себя, тем более большие книги, то голос Александр синтезатора RHVoice обеспечивает приемлемое по разборчивости озвучивание без дополнительной обработки, а на некоторые отклонения звучания слов можно не обращать внимание. Кстати, старая версия RHVoice 0.2.94 проговаривает слова ощутимо хуже, а скорость отклика на новых версиях ничуть не хуже.

Для расстановки ударений назначил в конфигурационном фале знак ` (русская буква Ё в английской раскладке). Теперь можно править ударения как расстановкой этого знака в текстовом редакторе, так и в самой Балаболке, но вручную тут, ИМХО, не удобно, – прыгает фокус, не точно озвучивается его положение при передвижении средствами NVDA.

Конфигурационный файл RHVoice

Вы вероятнее всего уже знаете, что скорость чтения синтезатора RHVoice можно существенно повысить, внеся изменения в файл RHVoice.ini. Могу предложить настроенный на максимальные скорости файл с командным файлом автоматической установки на Яндекс-диске.

Распакуйте архив и запустите командный файл. Теперь скорость чтения в Балаболке с помощью синтезатора RHVoice можно существенно увеличить.

Например, для себя я настраиваю скорость чтения 75%, высоту 45%, что позволяет читать тексты со скоростью около 400 слов в минуту. С этими же настройками записываю для себя книги, чтобы оторваться от компьютера и читать их на портативной колонке.

На ста процентах скорость чтения увеличивается до 550 слов в минуту, но трудно разобрать незнакомые слова, хотя попривыкнув, стал читать книги прямо в Балаболке именно с этой скоростью. Что интересно, то при чтении текстов самой NVDA с этим же конфигурационным файлом удаётся достичь скорости чтения только около 400 слов в минуту.

Для записи книг другим слушателям остановился на следующих настройках:

Эти настройки обеспечивают проговаривание со скоростью около двухсот слов в минуту.

Если интересно, то можно послушать некоторые из таких записей на Яндекс-диске: лесниковское, детское, разное.

Если запустить проигрывание выше опубликованных файлов в PotPlayer, а затем нажать десять раз клавишу C, то скорость увеличится в два раза и составит 400 слов в минуту, – а это как раз та скорость, с которой слушаю я. Причём заметил, что если слушать с малой скоростью, то потом труднее опять привыкать к высокой скорости этого же синтезатора.

Словари

Вы можете изготовить словарь омографов сами, а можете скачать готовый с Яндекс-диска.

Я его изготовил из файла для синтезатора Ольга.

Файл назвал RHVoice.hmg. Разместить его нужно в портабельной версии по пути

аналогично и в установочной версии.

Чтобы не путаться, удалил из этой папки лишние словари, оставив только RHVoice.hmg и sample.bxd.

Кстати, стандартным словарям лучше изменить название, чтобы после очередного обновления их не затереть. Я добавил к названию файла цифру 1.

Подключение и настройка словарей

В Балаболке для включения панели со словарями жмём клавишу F11. Панель настройки голоса на это время можно отключить, клавиша F10 однократно.

Вначале нужно найти файл sample.bxd и отметить его флажком. Впрочем, какие словари подключать, а какие отключить, вы своё решение можете изменить в любой момент.

Затем табать дальше и точно также отметить файл RHVoice.hmg

Перед каждым файлом есть кнопка «Редактировать». Если после нажатия кнопки будет звучать:

Коррекция произношения [sample.bxd]

то открыта возможность редактировать этот файл.

Тут в наличии только две строки. В первой показан пример замены одного слова другим:

1 Активно: Да; Произносить: Xmas; Как: Christmas

а во второй строке показан пример замены с помощью регулярных выражений:

2 Активно: Да; Произносить: ((http|ftp|https)://)?(www.)?([-a-zA-Z0-9@:%._+

#=] .[a-z] b)([-; Как: $4; Описание: Replace a web address by its domain name («example.com»)

Жмём отмену и попробуем вначале редактировать второй файл. Должно прозвучать:

Коррекция произношения [RHVoice.hmg]

Сразу предлагается ввести новое слово, в следующем редакторе перечислить варианты произношения через запятую, без пробела после запятой, но мы вначале ознакомимся со списком уже имеющихся омографов.

Табаем до вкладки Омографы, а затем ещё раз и попадаем на список, который можно просмотреть, перемещаясь стрелкой вниз. Вообще это файл можно просто открыть в любом текстовом редакторе и просмотреть. В нём 1525 строк.

Кроме первой вкладки тут есть ещё две, ознакомьтесь сами.

Поиск омографов

Открываем в Балаболке текстовый документ и даём команду поиска омографов, Control +M (русская Ь). Откроется первое найденное слово и варианты выбора.

Чтобы понять контекст, можно нажать F5, будет озвучена строка, в которой слово находится.

Выбрав нужный вариант, жмём F2 и слово заменяется на правильно звучащее, а открывается следующий омограф.

Если слово нужно пропустить, то жмём F3.

Закрыть окно можно как обычное окно Windows.

Отредактированный файл можно сохранить в формате txt или в формате разметки Балаболки.

Файл sample.bxd

В него вносятся слова, которые просто требуется правильно произносить или можно вообще заменять одно выражение другими. Выше по тексту есть примеры его настроек, а с Яндекс-диска можете скачать словарь с некоторыми готовыми словами и выражениями.

Прежде, чем нажать кнопку «Редактировать», перейдите в список со словарями и остановитесь на том, который собираетесь редактировать.

Если в словаре много слов, то есть возможность включить фильтр, чтобы не искать нужное слово или выражение вручную. В первом же поле нужно выбрать, по каким условиям отображать, например, «содержит», в следующем поле ввести слово, дотабать и нажать «Применить фильтр», а далее в списке останутся только нужное слова. Или можно воспользоваться другими условиями фильтра.

Мой вариант расстановки ударений

Мне оказалось проще открыть текстовый файл в AkelPad, затем с отключёнными словарями расставить ударения.

Далее текстовый файл перегоняю в mp3, внимательно слушаю и по ходу вношу правки в текст.

После этого опять прогоняю в mp3, но уже со вставкой звуковых эффектов, прослушиваю, и если грубых ошибок не случилось, то файл считаю готовым. Честно сказать, прогонять приходится некоторые тексты по 3 и более раз, если дать отдохнуть голове пару дней после каждого редактирования.

А словарь омографов, спросите вы? А пусть будет!

Настроенная Балаболка, версия 2.14

Предлагаю Балаболку с настройками для синтезатора RHVoice. Мне больше нравится голос Александр, но можно использовать любой другой, из комплекта этого синтезатора.

Есть более свежие версии Балаболки, но, к сожалению, они читают многие книги не с самого начала, поэтому для себя я пока вернулся на версию 2.14, так что не рекомендую обновлять именно этот вариант Балаболки.

Скачайте архив с Яндекс-диска, распакуйте, а чтобы пользоваться, сделайте некоторые настройки, которые обычно слетают после переноса Балаболки на другой компьютер.

Вызовите меню настроек аудиофайлов командой Shift +F5, затем клавишей Tab пройдите по пути:

  • MP3 вкладка выделено;
  • Постоянный битрейт (CBR) радиокнопка отмечено;
  • комбинированный список 48 Кбит/сек.

Почему 48? Просто услышал, что создатель RHVoice Ольга Яковлева говорила, что синтезатор использует именно этот битрейт, так что нет смысла записывать файлы с большим битрейтом, отчего они только будут иметь увеличенный размер, но качество звучания при этом не изменится.

Далее пробежитесь по Общему меню настроек, команда Shift +F6.

Ранее я уже описывал эти настройки, но для данной сборки нужно зайти на вкладку «Паузы», далее после слов:

Список. Вставить паузу в конец звукового файла (1000 мс)

опуститься на следующую строку:

Вставить аудиоклип в конец звукового файла (перелистывание длинное.mp3)

отсюда клавишей Tab перейти на кнопку «Редактирование» и поправить путь к файлу «перелистывание длинное.mp3», который находится в папке с программой.

Благодаря этому файлу каждый аудио отрывок будет завершаться длинным сигналом перелистывания страниц, что удобно при прослушивании.

Наконец, обязательно перепроверьте настройки синтезатора: скорость, высоту и громкость. Предпочитаемые мной значения описаны в статье, на которую я дал ссылку чуть выше.

Для себя я записываю звуковые файлы, используя выше описанный Конфигурационный файл RHVoice , задавая размер текста 27 тысяч знаков, получая в результате файлы объёмом 3.5 Мб, продолжительностью звучания около 10 мину, записывая по 40 файлов за один час.

Запускаю кодирование нескольких книг, потом смотрю в Области уведомлений на значке Балаболка, сколько файлов будет создано всего и сколько сделано уже.

Вы можете распаковать и настроить несколько копий Балаболки, используя каждую для своих целей. Например, с помощью одной записывать аудио книги, а с помощью другой читать текстовые книги зная, что закрытие этой Балаболки оставит открытыми читаемые книги.

Кстати, после создания сразу многих книг, записываемых по команде Control +Y, обязательно проверяйте, все ли книги записались и в полном ли объёме.

Иногда после этого приходится отдельные книги записывать по одной, команда Control +F8.

Добавить комментарий Отменить ответ

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

Изменить ударение в балаболке

Изменить ударение в балаболке

Теги — это текстовые управляющие команды, вставляемые в читаемый текст, причем они сами не читаются, а передают речевому синтезатору команду изменить тот или иной параметр чтения текста. Каждый элемент XML состоит из стартового тега , завершающего тега и текста между этими двумя тегами. Если элемент пустой и текст отсутствует, то тег может быть записан так: .

С помощью тегов можно изменить, например, скорость чтения:

Этот текст читается со скоростью пять.

Подробную информацию о тегах можно найти в файле справки программы «Балаболка».

Как сменить голос во время чтения вслух?
Можно воспользоваться тегами SAPI 5. Рекомендуется вставлять стартовый тег и парный ему завершающий тег внутрь одного и того же абзаца. Например:

Привет, как дела?
Всё в порядке.

Как выполнить «тихую» установку программы?
Установка программы в автоматическом режиме без показа диалогов («тихая» установка) возможна при указании ключа -silent в командной строке.
В моем компьютере установлены две звуковые карты. Как выбрать нужное аудиоустройство для воспроизведения речи?
Можно осуществить выбор аудиоустройства в панели управления Windows; например, в разделе «Звук, речь, аудиоустройства», кнопка «Аудио выход» («Audio Output»). Звуковую карту можно также выбрать в программе «Балаболка», при помощи пункта главного меню «Настройки | Выбор аудиоустройства».
Голос Nicolai произносит «пространство» каждый раз, когда в тексте встречается неразрывный пробел (символ ALT+0160). Как это исправить?
Программа может автоматически заменять неразрывные пробелы обычными пробелами во время чтения. Выберите пункт главного меню «Настройки | Общие настройки», в открывшемся окне перейдите на вкладку «Чтение» и поставьте «галочку» в пункте «Игнорировать символы во время чтения«. Добавьте неразрывный пробел в список игнорируемых символов: нажмите клавишу ALT и напечатайте «0160» на цифровом блоке клавиатуры. Можно указать и другие символы, которые голоса произносят вслух («кавычки», «тире» и т.д.).
Открываю в программе файл в формате DjVu, но текст отсутствует. В чем дело?
Формат DjVu был разработан для хранения сканированных документов; в DjVu-файлах в сжатом виде хранятся графические изображения страниц книг, журналов и т.д. Также, формат DjVu предусматривает наличие текстового (OCR) слоя, который содержит текст со страницы. Файлы с текстовым слоем иногда обозначают как DjVu+OCR.

Программа «Балаболка» умеет извлекать данные лишь из текстового слоя. В случае, если текстовый слой недоступен, единственный метод получения текста — это выполнение оптического распознавания, например, в FineReader.

Открываю в программе электронную книгу, но текст в окне «Балаболки» отсутствует. В чем дело?
Этому может быть несколько объяснений. Во-первых, файл может представлять собой набор отсканированных изображений страниц бумажной книги. Во-вторых, электронная книга может иметь защиту DRM. Программа «Балаболка» не имеет возможности извлечь текст из книги с такой защитой (это было бы незаконно).
Мне требуется удалить из текста тире, стоящие в начале строки. Как это сделать?
Воспользуйтесь пунктом главного меню «Правка | Заменить». В строке «Найти» напишите ^p—, в строке «Заменить на» укажите ^p. Программа позволяет использовать в окнах «Найти» и «Заменить» большинство из специальных кодов, которые применяются в Microsoft Word:

^p знак абзаца ^t знак табуляции ^nnn знак ASCII (где nnn — код знака) ^0nnn знак ANSI (где 0 — это ноль, а nnn — код знака) ^Unnnnn знак в кодировке Юникод (где nnnnn — код знака) ^+ длинное тире ( — ) ^= короткое тире ( – ) ^^ знак крышки ^s неразрывный пробел ^? любой знак (только в поле «Найти») ^# любая цифра (только в поле «Найти») ^$ любая буква (только в поле «Найти») ^c содержимое буфера обмена Windows (только в поле «Заменить на») ^& содержимое поля «Найти» (только в поле «Заменить на»)

Меня не удовлетворяет, как программа «Балаболка» извлекает текст из файлов формата PDF. Могу я использовать другой способ для обработки файлов PDF?
Процесс извлечения текста из файлов формата PDF достаточно сложен, так как файл PDF не содержит обычный текст. Вы можете использовать для извлечения текста внешнюю программу, поддерживающую передачу параметров в командной строке. Например, утилиту pdftotext.exe из состава проекта Xpdf. Скопируйте pdftotext.exe в подкаталог «utils» в папке программы «Балаболка», выберите пункт главного меню «Настройки | Импорт текста», вкладку «Внешние программы для импорта текста», и нажмите кнопку «Добавить». Задайте команду для использования pdftotext.exe:

%BFolder%utilspdftotext.exe -q -nopgbrk -enc UTF-8 %Input% %Output%

Введите имя для данного формата (например, «Xpdf Converter»), расширение файла («PDF») и кодировку текста («UTF-8»). После того, как будет выбран пункт Использовать вместо метода извлечения текста по умолчанию для данного формата файлов, программа сможет использовать внешнюю утилиту для извлечения текста из файлов формата PDF.

Как сохранять речь в виде звуковых файлов формата FLAC?
Программа позволяет использовать разные кодеки для создания звуковых файлов. Необходимо указать командную строку для вызова внешней программы; например, можно использовать утилиту FLAC.EXE, созданную некоммерческой организацией Xiph.Org Foundation. В программе «Балаболка» выберите пункт главного меню «Настройки | Аудиофайлы», вкладку «Другие кодеки». Нажмите кнопку «Добавить» и укажите значения для параметров: название (например, «Аудиофайлы FLAC»), расширение файла (FLAC) и командную строку.

C:Utilsflac.exe %Input% -o %Output%

Переменная %Input% обозначает имя входного файла с расширением WAV (файл формата RIFF WAVE), переменная %Output% — имя звукового файла в формате FLAC. Файл FLAC.EXE можно скопировать в ту же папку, где находится «Балаболка»; переменная %BFolder% обозначает путь к этой папке.

Как сделать так, чтобы каждая строка текстового файла записывалась в отдельный аудиофайл?
Могу предложить такой способ. Добавьте в текстовый файл по две пустых строки после каждой строки: выберите пункт главного меню «Правка | Заменить», в поле «Найти» напишите ^p, в поле «Заменить на» напишите ^p^p^p, нажмите кнопку «Заменить все». Сохраните текстовый файл.

Выберите пункт главного меню «Файл | Сохранить как несколько аудиофайлов». В появившемся диалоговом окне выберите способ деления текста: Искать две пустые строки подряд. Всё, можно начинать запись аудиофайлов.

Можно ли сделать так, чтобы при преобразовании документа в несколько звуковых файлов в качестве имени файла использовалась первая строка текста (например, «01 Глава первая.mp3», «02 Глава вторая.mp3»)?
В окне «Разделить текст на части и преобразовать в аудиофайлы» в поле «Шаблон для имени файла» вставьте переменную %FirstLine%. При делении текста программа заменит переменную на содержимое первой строки каждой части текста. Для того, чтобы вставить порядковый номер файла внутрь имени, используйте переменную %Number%.
Могу ли я использовать в видео для YouTube звуковые файлы, созданные в программе «Балаболка»?
«Балаболка» является бесплатным программным продуктом, поэтому пользователь может использовать звуковые файлы, созданные приложением, по своему усмотрению. Но если применяется коммерческая версия компьютерного голоса, необходимо связаться с разработчиками этого голоса и приобрести специальную лицензию для его коммерческого использования. Такая лицензия позволит легально осуществлять распространение аудиоматериалов.

Фирмы, выпускающие компьютерные голоса, предоставляют два вида лицензий:

  • для индивидуального использования (for personal use);
  • для коммерческого использования и распространения аудиоматериалов
    (for commercial use/audio broadcast).

Если пользователь намерен использовать синтез речи в видео на YouTube или собирается включить звуковые файлы, созданные в программе «Балаболка», в состав своего программного продукта, необходимо приобрести у фирмы-изготовителя голоса соответствующую лицензию.

Небольшая инструкция по работе в программе «Балаболка»

Где скачать «Балаболку»?

Вот ссылки на скачивание с официального сайта. Установочная версия:
http://www.cross-plus-a.com/balabolka.zip
Портабельная версия:
http://www.cross-plus-a.com/balabolka_portable.zip

Как настроить параметры синтезатора речи в программе «Балаболка»?

Делается это очень просто:
1. Открываете нужную вам книжку в «Балаболке». Это можно сделать двумя способами:
1.1. Встаньте на файл текстовый книги в проводнике Windows, затем нажмите контекстное меню. Там откройте подменю «Балаболка», где нажмите на пункт «Открыть».
1.2. Откройте «Балаболку», по умолчанию у вас откроется пустое поле редактора. Вставьте туда содержимое нужной вам текстовой книги.
2. Как я уже говорил ,по умолчанию курсор стоит на поле редактора, где содержится ваша книжка. Один раз двиньтесь табом, и вы окажетесь в списке вкладок. Вкладки будут такие: «Sapi4», «Sapi5» и «Microsoft speech platform». Если у вас установлены какие-нибудь голоса под эти речевые интерфейсы, выберите нужную вкладку и двиньтесь табом ещё раз.
3. Теперь вам открылся комбинированный список, где содержатся все установленные голоса выбранного вами речевого интерфейса. Выбираете нужный вам голос.
4. Дальше будут два поля редактора подряд: в первом из них указывается скорость, а в другом — высота выбранного вами голоса. Настроив скорость и высоту, возвращайтесь в поле редактора с книжкой и проверьте, как будет звучать голос по сделанным вами настройкам. Для начала прослушивания нажмите клавишу F5, для преостановки прослушивания — F6, а для остановки прослушивания — F7. Если настройки вас удовлетворяют, начинайте делать запись книжки!

Как сделать чтобы книга на выходе была разделена на небольшие файлы, примерно по 10 минут?

Открыв книгу в «Балаболке» и выбрав нужные параметры синтезатора для записи, откройте подменю «Файл», там найдите пункт «Сохранить как несколько аудиофайлов» (или же воспользуйтесь сочетанием клавиш Ctrl +F8). Курсор сразу же встанет на поле редактора, где нужно указать путь к папке, куда будут складироваться готовые аудиофайлы. Нажмите на кнопку «Выбрать», чтобы выбрать папку для записи, после чего в поле редактора будет автоматически прописан путь. После кнопки «Выбрать» будет комбинированный список, где нужно указать формат звукового файла для записи, например, «mp3». После этого комбинированного списка будут два поля редактора подряд: в одном из них будет прописано название книги, а в другом — цифра 1. Если во втором поле редактора цифру 1 изменить на какую-нибудь другую цифру, то нумерация дорожек будет начинаться не с цифры 1, а с той цифры, которую вы указали во втором поле редактора. Представьте, что книга называется «Ночной дозор». Если вы так всё и оставите, то на выходе получатся файлы, называемые «Ночной дозор 1», «Ночной дозор 2» и так далее. Если вы сотрёте всё из поля редактора «Ночной дозор», то на выходе должны получиться файлы с такими названиями: «1», «2» и так далее. Если вы дальше продвинетесь табом, вы увидите множество флажков и радиокнопок, которые лично я не трогаю. Но нас, прежде всего, интересует поле редактора, которое находится перед кнопкой «Произносить номер блока». В этом поле редактора надо указать количество килобайт, которое будет затрачено на запись одного звукового файла. При нормальной скорости чтения 1 килобайт текста читается примерно за минуту, так что чтобы файл длился десять минут, можно указать в этом поле редактора цифру 10. Если вы хотите, чтобы после записи произносились номера блоков, нажмите на кнопку «Произносить номер блока», там отметьте флажки, которые вас интересуют (можно сделать так, чтобы номер блока произносился в его начале, можно сделать так, чтобы номер блока произносился в конце блока и так далее). Сделав нужные настройки, нажмите на кнопку «OK», и вы окажетесь в том окне, в котором были до нажатия на кнопку «Произносить номер блока». После этого табом ищите кнопку «Разделить и преобразовать», на которую и нажимаете. Вам откроются результаты преобразования: будет указано, сколько блоков у вас получилось, и если вы двинитесь стрелками, вы услышите начало каждого блока и словосочетание «Флажок отмечено». Если вы снимите отметку с какого-нибудь флажка, то этот блок объединится с предыдущим блоком. Дальше табом ищите кнопку «Выполнить», после чего начнётся запись!

PS: если вы хотите, чтобы книжка состояла из одного звукового файла, тогда, открыв книжку и настроив параметры синтезатора, пройдите в меню «Файл» и нажмите на пункт «Сохранить аудиофайл». Вам будет предложен диалог сохранения аудиофайла, укажите имя вашего файла и его тип, также выберите папку, куда он будет сохранён, и нажмите на кнопку «Сохранить».

можно ли настроить качество мп3 файла?

Можно. Для этого откройте строку меню, дойдите до подменю «Настройки» и откройте пункт «Аудиофайлы» (или воспользуйтесь сочетанием клавиш Shift +F5). Вам откроются настройки, в которых можно указать частоту дискретизации файла (лучше будет, если вы в комбинированном списке выберите «По умолчанию для голоса», потому что иначе при выборе слишком большой частоты дискретизации голос будет поскрипывать), можно выбрать битрейт файла для записи (по умолчанию значение постоянного битрейта установлено на 128 kbps, в принципе, это очень даже неплохо). Есть и другие настройки, которые я не очень-то помню, так что если интересно, можете сами покопаться!

При чтении книг синтезатором «Николай» всё время произносится слово «Пространство». Что делать?

По ходу, Николай так реагирует на неразрывный пробел. Находясь в окне программы, нажмите сочетание клавиш Shift +F6, или же в строке меню откройте подменю «Настройки», в котором откройте пункт «Установки». Дальше ищите вкладку «Чтение». Дальше, двигаясь табом, вы попадёте на флажок «Игнорировать символы во время чтения и заменять их пробелами». По умолчанию этот флажок не отмечен, отметьте его. После этого флажка будет поле редактора, в который вы должны вписать символ, который надо игнорировать. Впишите в это поле редактора 0160, причём вписывать его нужно именно с калькуляторного блока клавиатуры, зажимая клавишу Alt (именно этот символ не нравится Николаю), после этого табом ищите кнопку «OK», на которую и нажимаете. После этого Николай должен прекратить произношение слова «Пространство»!

Опубликовали в рассылках без указания автора

Балаболка, настройки для RHVoice

Создание аудиокниг с использованием синтезатора RHVoice, конфигурационный файл, словарь омографов для Балаболки, словарь ударений и примеры готовых книг.

Выбор синтезатора

Панель выбора текущего голоса и его настроек открывается и закрывается клавишей F10. Обычно сразу после первого запуска Балаболки она открыта. Если же перемещение клавишей Tab озвучивает только пустую открытую вкладку или вкладку с текстом книги, то нажмите F10 один раз, затем табайте и настраивайте голос. Ещё одна панель открывается и закрывается клавишей F11, но об этом чуть ниже.

Мой выбор — голос Александр синтезатора RHVoice. Пробовал Онлайн-сервис для синтеза речи, но ни один из вариантов не проговаривает русские слова и не расставляет интонации так, как это делает RHVoice. Зарубежные сервисы редко встречающиеся русские слова вообще искажают до потери смысла, например слово «скот» звучит как «скат».

Расстановка ударений

Если записываю для себя, тем более большие книги, то голос Александр синтезатора RHVoice обеспечивает приемлемое по разборчивости озвучивание без дополнительной обработки, а на некоторые отклонения звучания слов можно не обращать внимание. Кстати, старая версия RHVoice 0.2.94 проговаривает слова ощутимо хуже, а скорость отклика на новых версиях ничуть не хуже.

Для расстановки ударений назначил в конфигурационном фале знак ` (русская буква Ё в английской раскладке). Теперь можно править ударения как расстановкой этого знака в текстовом редакторе, так и в самой Балаболке, но вручную тут, ИМХО, не удобно, – прыгает фокус, не точно озвучивается его положение при передвижении средствами NVDA.

Конфигурационный файл RHVoice

Вы вероятнее всего уже знаете, что скорость чтения синтезатора RHVoice можно существенно повысить, внеся изменения в файл RHVoice.ini. Могу предложить настроенный на максимальные скорости файл с командным файлом автоматической установки на Яндекс-диске.

Распакуйте архив и запустите командный файл. Теперь скорость чтения в Балаболке с помощью синтезатора RHVoice можно существенно увеличить.

Например, для себя я настраиваю скорость чтения 75%, высоту 45%, что позволяет читать тексты со скоростью около 400 слов в минуту. С этими же настройками записываю для себя книги, чтобы оторваться от компьютера и читать их на портативной колонке.

На ста процентах скорость чтения увеличивается до 550 слов в минуту, но трудно разобрать незнакомые слова, хотя попривыкнув, стал читать книги прямо в Балаболке именно с этой скоростью. Что интересно, то при чтении текстов самой NVDA с этим же конфигурационным файлом удаётся достичь скорости чтения только около 400 слов в минуту.

Для записи книг другим слушателям остановился на следующих настройках:

Эти настройки обеспечивают проговаривание со скоростью около двухсот слов в минуту.

Если интересно, то можно послушать некоторые из таких записей на Яндекс-диске: лесниковское, детское, разное.

Если запустить проигрывание выше опубликованных файлов в PotPlayer, а затем нажать десять раз клавишу C, то скорость увеличится в два раза и составит 400 слов в минуту, – а это как раз та скорость, с которой слушаю я. Причём заметил, что если слушать с малой скоростью, то потом труднее опять привыкать к высокой скорости этого же синтезатора.

Словари

Вы можете изготовить словарь омографов сами, а можете скачать готовый с Яндекс-диска.

Я его изготовил из файла для синтезатора Ольга.

Файл назвал RHVoice.hmg. Разместить его нужно в портабельной версии по пути

аналогично и в установочной версии.

Чтобы не путаться, удалил из этой папки лишние словари, оставив только RHVoice.hmg и sample.bxd.

Кстати, стандартным словарям лучше изменить название, чтобы после очередного обновления их не затереть. Я добавил к названию файла цифру 1.

Подключение и настройка словарей

В Балаболке для включения панели со словарями жмём клавишу F11. Панель настройки голоса на это время можно отключить, клавиша F10 однократно.

Вначале нужно найти файл sample.bxd и отметить его флажком. Впрочем, какие словари подключать, а какие отключить, вы своё решение можете изменить в любой момент.

Затем табать дальше и точно также отметить файл RHVoice.hmg

Перед каждым файлом есть кнопка «Редактировать». Если после нажатия кнопки будет звучать:

Коррекция произношения [sample.bxd]

то открыта возможность редактировать этот файл.

Тут в наличии только две строки. В первой показан пример замены одного слова другим:

1 Активно: Да; Произносить: Xmas; Как: Christmas

а во второй строке показан пример замены с помощью регулярных выражений:

2 Активно: Да; Произносить: ((http|ftp|https)://)?(www.)?([-a-zA-Z0-9@:%._+

#=] .[a-z] b)([-; Как: $4; Описание: Replace a web address by its domain name («example.com»)

Жмём отмену и попробуем вначале редактировать второй файл. Должно прозвучать:

Коррекция произношения [RHVoice.hmg]

Сразу предлагается ввести новое слово, в следующем редакторе перечислить варианты произношения через запятую, без пробела после запятой, но мы вначале ознакомимся со списком уже имеющихся омографов.

Табаем до вкладки Омографы, а затем ещё раз и попадаем на список, который можно просмотреть, перемещаясь стрелкой вниз. Вообще это файл можно просто открыть в любом текстовом редакторе и просмотреть. В нём 1525 строк.

Кроме первой вкладки тут есть ещё две, ознакомьтесь сами.

Поиск омографов

Открываем в Балаболке текстовый документ и даём команду поиска омографов, Control +M (русская Ь). Откроется первое найденное слово и варианты выбора.

Чтобы понять контекст, можно нажать F5, будет озвучена строка, в которой слово находится.

Выбрав нужный вариант, жмём F2 и слово заменяется на правильно звучащее, а открывается следующий омограф.

Если слово нужно пропустить, то жмём F3.

Закрыть окно можно как обычное окно Windows.

Отредактированный файл можно сохранить в формате txt или в формате разметки Балаболки.

Файл sample.bxd

В него вносятся слова, которые просто требуется правильно произносить или можно вообще заменять одно выражение другими. Выше по тексту есть примеры его настроек, а с Яндекс-диска можете скачать словарь с некоторыми готовыми словами и выражениями.

Прежде, чем нажать кнопку «Редактировать», перейдите в список со словарями и остановитесь на том, который собираетесь редактировать.

Если в словаре много слов, то есть возможность включить фильтр, чтобы не искать нужное слово или выражение вручную. В первом же поле нужно выбрать, по каким условиям отображать, например, «содержит», в следующем поле ввести слово, дотабать и нажать «Применить фильтр», а далее в списке останутся только нужное слова. Или можно воспользоваться другими условиями фильтра.

Мой вариант расстановки ударений

Мне оказалось проще открыть текстовый файл в AkelPad, затем с отключёнными словарями расставить ударения.

Далее текстовый файл перегоняю в mp3, внимательно слушаю и по ходу вношу правки в текст.

После этого опять прогоняю в mp3, но уже со вставкой звуковых эффектов, прослушиваю, и если грубых ошибок не случилось, то файл считаю готовым. Честно сказать, прогонять приходится некоторые тексты по 3 и более раз, если дать отдохнуть голове пару дней после каждого редактирования.

А словарь омографов, спросите вы? А пусть будет!

Настроенная Балаболка, версия 2.14

Предлагаю Балаболку с настройками для синтезатора RHVoice. Мне больше нравится голос Александр, но можно использовать любой другой, из комплекта этого синтезатора.

Есть более свежие версии Балаболки, но, к сожалению, они читают многие книги не с самого начала, поэтому для себя я пока вернулся на версию 2.14, так что не рекомендую обновлять именно этот вариант Балаболки.

Скачайте архив с Яндекс-диска, распакуйте, а чтобы пользоваться, сделайте некоторые настройки, которые обычно слетают после переноса Балаболки на другой компьютер.

Вызовите меню настроек аудиофайлов командой Shift +F5, затем клавишей Tab пройдите по пути:

  • MP3 вкладка выделено;
  • Постоянный битрейт (CBR) радиокнопка отмечено;
  • комбинированный список 48 Кбит/сек.

Почему 48? Просто услышал, что создатель RHVoice Ольга Яковлева говорила, что синтезатор использует именно этот битрейт, так что нет смысла записывать файлы с большим битрейтом, отчего они только будут иметь увеличенный размер, но качество звучания при этом не изменится.

Далее пробежитесь по Общему меню настроек, команда Shift +F6.

Ранее я уже описывал эти настройки, но для данной сборки нужно зайти на вкладку «Паузы», далее после слов:

Список. Вставить паузу в конец звукового файла (1000 мс)

опуститься на следующую строку:

Вставить аудиоклип в конец звукового файла (перелистывание длинное.mp3)

отсюда клавишей Tab перейти на кнопку «Редактирование» и поправить путь к файлу «перелистывание длинное.mp3», который находится в папке с программой.

Благодаря этому файлу каждый аудио отрывок будет завершаться длинным сигналом перелистывания страниц, что удобно при прослушивании.

Наконец, обязательно перепроверьте настройки синтезатора: скорость, высоту и громкость. Предпочитаемые мной значения описаны в статье, на которую я дал ссылку чуть выше.

Для себя я записываю звуковые файлы, используя выше описанный Конфигурационный файл RHVoice , задавая размер текста 27 тысяч знаков, получая в результате файлы объёмом 3.5 Мб, продолжительностью звучания около 10 мину, записывая по 40 файлов за один час.

Запускаю кодирование нескольких книг, потом смотрю в Области уведомлений на значке Балаболка, сколько файлов будет создано всего и сколько сделано уже.

Вы можете распаковать и настроить несколько копий Балаболки, используя каждую для своих целей. Например, с помощью одной записывать аудио книги, а с помощью другой читать текстовые книги зная, что закрытие этой Балаболки оставит открытыми читаемые книги.

Кстати, после создания сразу многих книг, записываемых по команде Control +Y, обязательно проверяйте, все ли книги записались и в полном ли объёме.

Иногда после этого приходится отдельные книги записывать по одной, команда Control +F8.

Добавить комментарий Отменить ответ

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

источники:

Балаболка, настройки для RHVoice

http://b2.cooksy.ru/articles/kak-rasstavit-udareniya-v-balabolke/

Небольшая инструкция по работе в программе «Балаболка»

Как настроить параметры синтезатора речи в программе «Балаболка»?

Делается это очень просто:
1. Открываете нужную вам книжку в «Балаболке». Это можно сделать двумя способами:
1.1. Встаньте на файл текстовый книги в проводнике Windows, затем нажмите контекстное меню. Там откройте подменю «Балаболка», где нажмите на пункт «Открыть».
1.2. Откройте «Балаболку», по умолчанию у вас откроется пустое поле редактора. Вставьте туда содержимое нужной вам текстовой книги.
2. Как я уже говорил ,по умолчанию курсор стоит на поле редактора, где содержится ваша книжка. Один раз двиньтесь табом, и вы окажетесь в списке вкладок. Вкладки будут такие: «Sapi4», «Sapi5» и «Microsoft speech platform». Если у вас установлены какие-нибудь голоса под эти речевые интерфейсы, выберите нужную вкладку и двиньтесь табом ещё раз.
3. Теперь вам открылся комбинированный список, где содержатся все установленные голоса выбранного вами речевого интерфейса. Выбираете нужный вам голос.
4. Дальше будут два поля редактора подряд: в первом из них указывается скорость, а в другом — высота выбранного вами голоса. Настроив скорость и высоту, возвращайтесь в поле редактора с книжкой и проверьте, как будет звучать голос по сделанным вами настройкам. Для начала прослушивания нажмите клавишу F5, для преостановки прослушивания — F6, а для остановки прослушивания — F7. Если настройки вас удовлетворяют, начинайте делать запись книжки!

Как сделать чтобы книга на выходе была разделена на небольшие файлы, примерно по 10 минут?

Открыв книгу в «Балаболке» и выбрав нужные параметры синтезатора для записи, откройте подменю «Файл», там найдите пункт «Сохранить как несколько аудиофайлов» (или же воспользуйтесь сочетанием клавиш Ctrl +F8). Курсор сразу же встанет на поле редактора, где нужно указать путь к папке, куда будут складироваться готовые аудиофайлы. Нажмите на кнопку «Выбрать», чтобы выбрать папку для записи, после чего в поле редактора будет автоматически прописан путь. После кнопки «Выбрать» будет комбинированный список, где нужно указать формат звукового файла для записи, например, «mp3». После этого комбинированного списка будут два поля редактора подряд: в одном из них будет прописано название книги, а в другом — цифра 1. Если во втором поле редактора цифру 1 изменить на какую-нибудь другую цифру, то нумерация дорожек будет начинаться не с цифры 1, а с той цифры, которую вы указали во втором поле редактора. Представьте, что книга называется «Ночной дозор». Если вы так всё и оставите, то на выходе получатся файлы, называемые «Ночной дозор 1», «Ночной дозор 2» и так далее. Если вы сотрёте всё из поля редактора «Ночной дозор», то на выходе должны получиться файлы с такими названиями: «1», «2» и так далее. Если вы дальше продвинетесь табом, вы увидите множество флажков и радиокнопок, которые лично я не трогаю. Но нас, прежде всего, интересует поле редактора, которое находится перед кнопкой «Произносить номер блока». В этом поле редактора надо указать количество килобайт, которое будет затрачено на запись одного звукового файла. При нормальной скорости чтения 1 килобайт текста читается примерно за минуту, так что чтобы файл длился десять минут, можно указать в этом поле редактора цифру 10. Если вы хотите, чтобы после записи произносились номера блоков, нажмите на кнопку «Произносить номер блока», там отметьте флажки, которые вас интересуют (можно сделать так, чтобы номер блока произносился в его начале, можно сделать так, чтобы номер блока произносился в конце блока и так далее). Сделав нужные настройки, нажмите на кнопку «OK», и вы окажетесь в том окне, в котором были до нажатия на кнопку «Произносить номер блока». После этого табом ищите кнопку «Разделить и преобразовать», на которую и нажимаете. Вам откроются результаты преобразования: будет указано, сколько блоков у вас получилось, и если вы двинитесь стрелками, вы услышите начало каждого блока и словосочетание «Флажок отмечено». Если вы снимите отметку с какого-нибудь флажка, то этот блок объединится с предыдущим блоком. Дальше табом ищите кнопку «Выполнить», после чего начнётся запись!

PS: если вы хотите, чтобы книжка состояла из одного звукового файла, тогда, открыв книжку и настроив параметры синтезатора, пройдите в меню «Файл» и нажмите на пункт «Сохранить аудиофайл». Вам будет предложен диалог сохранения аудиофайла, укажите имя вашего файла и его тип, также выберите папку, куда он будет сохранён, и нажмите на кнопку «Сохранить».

можно ли настроить качество мп3 файла?

Можно. Для этого откройте строку меню, дойдите до подменю «Настройки» и откройте пункт «Аудиофайлы» (или воспользуйтесь сочетанием клавиш Shift +F5). Вам откроются настройки, в которых можно указать частоту дискретизации файла (лучше будет, если вы в комбинированном списке выберите «По умолчанию для голоса», потому что иначе при выборе слишком большой частоты дискретизации голос будет поскрипывать), можно выбрать битрейт файла для записи (по умолчанию значение постоянного битрейта установлено на 128 kbps, в принципе, это очень даже неплохо). Есть и другие настройки, которые я не очень-то помню, так что если интересно, можете сами покопаться!

При чтении книг синтезатором «Николай» всё время произносится слово «Пространство». Что делать?

По ходу, Николай так реагирует на неразрывный пробел. Находясь в окне программы, нажмите сочетание клавиш Shift +F6, или же в строке меню откройте подменю «Настройки», в котором откройте пункт «Установки». Дальше ищите вкладку «Чтение». Дальше, двигаясь табом, вы попадёте на флажок «Игнорировать символы во время чтения и заменять их пробелами». По умолчанию этот флажок не отмечен, отметьте его. После этого флажка будет поле редактора, в который вы должны вписать символ, который надо игнорировать. Впишите в это поле редактора 0160, причём вписывать его нужно именно с калькуляторного блока клавиатуры, зажимая клавишу Alt (именно этот символ не нравится Николаю), после этого табом ищите кнопку «OK», на которую и нажимаете. После этого Николай должен прекратить произношение слова «Пространство»!

Балаболка — читает вслух за вас.

Приветствую Вас на моем сайте. Сегодня хочу рассказать о программе Балаболка, которая будет читать вам книги, так же возможно прочтение любого другого текста. У программы есть возможность сохранить озвученный текст в аудио файле. Поэтому на этом ее возможности не ограничиваются.

Давайте разберем эту программу по порядку. Программа полностью бесплатна, есть как версия с установкой, так и портативная версия программы.

Называется, сие чудо программа, Балаболка.

Собственно так она называется потому, что читает текст в слух. Очень удобно, скачали книгу в текстовом формате, закинули в эту программу и все. Можно откинуться на спинку кресла и слушать книгу. Прямо как в детстве.

Программа воспринимает не только файлы txt но и форматы: AZW, AZW3, CHM, DjVu, DOC, DOCX, EPUB, FB2, HTML, LIT, MOBI, ODT, PDB, PDF, PRC, RTF, TCR, WPD.

Некоторые скажут, скачай аудио книгу и слушай голос профессионального диктора.

К сожалению не все книги есть в аудио формате и иногда необходимо озвучить текст совсем не их художественной литературы.

Например при съемке видео, с экрана монитора, возникает необходимость озвучить голосом свои действия или дать пояснения.

Многие пишут в текстовом редакторе о своих действиях, дают пояснения. Необходимо читать. Согласитесь не так уж удобно.

Проблема вроде бы решаема, купи микрофон, и проблем то. Есть причины, по которым озвучивание голосом не возможно, по иным причинам.

Программа имеет интуитивно понятный интерфейс. Поддержку русского языка и множества других.

балаболка

Текст может быть сохранен в аудио файле такого формата как WAV, MP3, MP4, OGG и WMA.

Также аудио файл может быть разбит на несколько, например, по абзацам в тексте. Сколько абзацев столько и файлов получится.

Программа Балаболка имеет множество функций в которых вы с легкостью разберетесь.

Голос которым озвучивается текст может быть изменен по трем параметрам:

Согласитесь очень удобно.

Вот, что получилось.

Программу можете скачать с официального сайта Балаболки.

Программа поддерживает операционную систему Windows, как скачать и установить программу описывать не буду весе достаточно просто, скачиваем и запускаем скаченный файл, затем внимательно читаем и двигаемся шаг за шагом вместе с установщиком.

Ниже в видео как работает программа.

Если вы используете Linux то через wine эта программа работает без нареканий.

Функции Balabolka

Программа “Балаболка” предназначена для чтения вслух текстовых файлов. Для воспроизведения звуков человеческого голоса могут использоваться любые речевые синтезаторы, установленные на компьютере. Воспроизведение речи можно контролировать при помощи стандартных кнопок, подобных тем, что присутствуют в любой мультимедийной программе (“воспроизвести”, “пауза”, “стоп”). Приложение умеет читать вслух содержимое буфера обмена, показывать текст, содержащийся в документах, изменять настройки шрифта и цвета, управлять процессом чтения из системного трея (области уведомлений) или при помощи глобальных сочетаний клавиш, произносить набираемый на клавиатуре текст, проверять орфографию, делить текстовый файл на несколько файлов меньшего размера, искать омографы. “Балаболка” предоставляет возможность удалить из текста все знаки переноса на концах строк; это позволит избежать запинок при чтении слов. Поддерживаются форматы файлов: AZW, AZW3, CHM, DjVu, DOC, DOCX, EPUB, FB2, HTML, LIT, MOBI, ODT, PDB, PDF, PRC, RTF, TCR, WPD.

Ударения в microsoft azure

avgaz Дата: Четверг, 21.10.2021, 15:56 | Сообщение #1

Группа: Пользователи

Статус: Offline

Собственно вопрос, как поставить ударение в озвучке через онлайн microsoft azure?

 
balabolka Дата: Четверг, 21.10.2021, 21:27 | Сообщение #2

V.I.P.

Группа: Модераторы

Статус: Offline

Произношение слов в Microsoft Azure можно изменить с помощью тегов SSML:

Код

<phoneme alphabet=»ipa» ph=»təˈmeɪtoʊ»> tomato </phoneme>

Сейчас теги SSML в «Балаболке» не поддерживаются (они будут переданы на сервер как обычный текст). Попробую изменить это в следующей версии программы.

Но должен предупредить, что для русских голосов поддержка транскрипций реализована довольно криво. Иногда голос отказывается читать транскрипцию, возвращая ошибку HTTP 403; иногда русский голос Microsoft Azure произносит транскрипцию неправильно (хотя, например, голоса IVONA читают ее корректно).

 
avgaz Дата: Пятница, 22.10.2021, 23:41 | Сообщение #3

Группа: Пользователи

Статус: Offline

Цитата balabolka ()

Сейчас теги SSML в «Балаболке» не поддерживаются (они будут переданы на сервер как обычный текст). Попробую изменить это в следующей версии программы.

Было бы не плохо, а то после того как голос Филиппа испоганили, этот самый нормальный, но иногда ужасно ставит ударения..
Ещё такой вопрос, сейчас точка делает очень большую паузу между предложениями, можно чем то заменить? из документации вроде следует, что паузу можно так регулировать


Код

<break time=»600ms» />

но через программу не получается так, вместо точки несколько запятых тоже не прокатывает. Может есть какой символ для более короткой паузы чем точка?

 
balabolka Дата: Суббота, 23.10.2021, 23:54 | Сообщение #4

V.I.P.

Группа: Модераторы

Статус: Offline

В «Балаболке» есть свой собственный тег для пауз (в миллисекундах):

Как уже писал, в следующей версии программы будут поддерживаться теги SSML для Microsoft Azure:

Код

<break time=»600ms»/>
<mstts:silence type=»Sentenceboundary» value=»200ms»/>

 
avgaz Дата: Воскресенье, 24.10.2021, 00:55 | Сообщение #5

Группа: Пользователи

Статус: Offline

Цитата balabolka ()

В «Балаболке» есть свой собственный тег для пауз (в миллисекундах):

он не работает для Microsoft Azure пробовал в место точки и {{Pause=10}} и {{Pause=1000}}  пауза по времени такая же как и при точке

Сообщение отредактировал avgazВоскресенье, 24.10.2021, 11:22

 
balabolka Дата: Воскресенье, 24.10.2021, 17:52 | Сообщение #6

V.I.P.

Группа: Модераторы

Статус: Offline

Цитата avgaz ()

он не работает для Microsoft Azure пробовал в место точки и {{Pause=10}}

Всё работает, но надо понимать, как именно текст преобразуется в речь с помощью онлайн-сервисов. В данном случае тег паузы делит текст на две части, например:

Код

первый текст {{Pause=10}} второй текст

Программа сначала преобразует «первый текст» в аудиофайл, добавит к этому звуковому файлу 10 миллисекунд тишины, затем преобразует «второй текст» во второй аудиофайл и объединит звуковые файлы. Проблема здесь в том, что онлайн-сервис сам вставляет небольшую тишину в начало и конец каждого маленького звукового файла. Вот и получается, что, поделив текст на две части, пауза между частями не уменьшилась, а может быть, даже увеличилась.

 
avgaz Дата: Вторник, 26.10.2021, 00:25 | Сообщение #7

Группа: Пользователи

Статус: Offline

balabolka, спасибо, что добавили поддержку тегов, можете объяснить как в русских словах ставить ударения  где брать эту транскрипцию слов для тега
<phoneme alphabet=»ipa» ph=»təˈmeɪtoʊ»> tomato </phoneme>
Может есть какой то сервис преобразования?
И ещё вопрос, что дает API ключ? и как его получить, зарегистрировался в Azure но где там этот ключ черт ногу сломит ((

И ещё вопрос, не знаете что с голосом Филиппа у Яндекса он уже недели две как звучит отвратно, что с ключом что без, но в том же сервисе звукограмме его исправили за несколько дней и там с час он по старому звучит. Может есть какое то решение его поправить?

 
tonio_k Дата: Вторник, 26.10.2021, 12:29 | Сообщение #8

Группа: Пользователи

Статус: Offline

Цитата avgaz ()

где брать эту транскрипцию слов для тега

1)транскрипция онлайн (имеет ограничения)
2) с помощью скрипта для программы Демагог
Инструкция:

Сообщение отредактировал tonio_kВторник, 26.10.2021, 12:29

 
balabolka Дата: Вторник, 26.10.2021, 19:33 | Сообщение #9

V.I.P.

Группа: Модераторы

Статус: Offline

Цитата avgaz ()

И ещё вопрос, что дает API ключ? и как его получить, зарегистрировался в Azure но где там этот ключ черт ногу сломит

API-ключ позволяет пользоваться сервисами Microsoft Azure легально, а также получать техническую поддержку. Например, раз Вы уже зарегистрировались в Azure, то задавать вопрос «где там этот ключ» можно не на форуме, а непосредственно службе поддержки Microsoft Azure. (И, кстати, стоит поторопиться с этим, так как бесплатный период пользования сервисом уже начался.)

Чтобы создать API-ключ и начать работу с синтезом речи:

  • Зайдите на сайт Microsoft Azure.
  • Выберите пункт Create a resource из меню.
  • Найдите и добавьте Speech Service.
  • В разделе Resource Management найдите пункт Keys and Endpoint.
  • Выберите этот пункт и создайте API-ключ. Скопируйте ключ и сохраните его на диске.
  • Всё, теперь у Вас есть ключ и регион (endpoint). Можно начать использовать сервис.

Инструкцию с картинками можно посмотреть здесь и здесь.

Цитата avgaz ()

не знаете что с голосом Филиппа у Яндекса

Не знаю. Может быть, используют другие настройки кодеков. Если скачать файл формата OGG из онлайн-демо Yandex SpeechKit и файл этого же формата из звукограмма, то можно убедиться, что настройки кодеков разные.

 
avgaz Дата: Воскресенье, 31.10.2021, 23:10 | Сообщение #10

Группа: Пользователи

Статус: Offline

Цитата balabolka ()

Не знаю. Может быть, используют другие настройки кодеков. Если скачать файл формата OGG из онлайн-демо Yandex SpeechKit и файл этого же формата из звукограмма, то можно убедиться, что настройки кодеков разные.

В балаболку нельзя не как вернуть старого Филиппа, просто попался ещё один сервис озвучки texttospeech.ru там также старая версия, видимо есть какой то выход. Может на яндексе изменили адрес запроса для версии или ещё что то. Просто то что сейчас с ним, это жесть хуже чем обычные голоса.

Сообщение отредактировал avgazВоскресенье, 31.10.2021, 23:27

 
balabolka Дата: Понедельник, 01.11.2021, 17:46 | Сообщение #11

V.I.P.

Группа: Модераторы

Статус: Offline

Цитата avgaz ()

Может на яндексе изменили адрес запроса для версии или ещё что то.

Нет, формат запросов не менялся. Что-то изменилось внутри SpeechKit, они по-другому обрабатывают звуковые файлы перед тем, как отдать их пользователям.
Я не знаю, какой именно обработке подвергаются аудиофайлы (не очень разбираюсь в этом). Надо экспериментировать с FFmpeg, или можно поинтересоваться у знакомых звукорежиссеров. «Балаболка» сохраняет файлы без какой-либо обработки.


Отправил сообщение в службу поддержки Yandex Cloud (раздел AI API, куда входит SpeechKit): «Несколько недель назад изменилось звучание голоса «Филипп» (filipp), используемого технологией Yandex.SpeechKit. Прилагаю примеры звучания голоса раньше и сейчас. Пожалуйста, верните прежнее звучание голоса.»
Отправляйте свои сообщения, чтобы добиться какой-либо реакции от разработчиков.

 
avgaz Дата: Понедельник, 01.11.2021, 19:32 | Сообщение #12

Группа: Пользователи

Статус: Offline

Цитата balabolka ()

Отправляйте свои сообщения, чтобы добиться какой-либо реакции от разработчиков.

Я уже дважды отправил на speechkit@support.yandex.ru но ответа уже две недели нет ((
Когда только изменился голос, в поддержке звукограмма сказали, что ведут переговоры с Яндексом о возвращении старой версии, после у них стало по старому озвучивать

 
avgaz Дата: Понедельник, 08.11.2021, 11:24 | Сообщение #13

Группа: Пользователи

Статус: Offline

Цитата balabolka ()

Отправил сообщение в службу поддержки Yandex Cloud

Не каких новостей нет?

Ещё такой вопрос, при озвучке через Microsoft Azure при простое возникает ошибка, то есть озвучил текст, далее пытаешься через час ещё раз озвучить, но выдает ошибку, приходится перезапускать программу.
Ещё можно сделать, что бы при Microsoft Azure убирался перенос строки? то есть, что бы сократить паузу при точке я использую <breaktime=»430ms»/>, но если идет перенос строки, то появляется такая же пауза как и при точке, приходиться весь текст в одну строку делать, что собственно не удобно и отнимает время. Может можно, что бы программа сама при отправке убирала перенос?

В идеале ещё бы сделать автоматическую замену и точки на настроенный параметр паузы через breaktime=»430ms», что бы это не делать самому каждый раз..

 
balabolka Дата: Понедельник, 08.11.2021, 15:22 | Сообщение #14

V.I.P.

Группа: Модераторы

Статус: Offline

Цитата avgaz ()

Не каких новостей нет?

Нет, обращение в службу поддержки пока осталось без ответа.

Цитата avgaz ()

Ещё такой вопрос, при озвучке через Microsoft Azure при простое возникает ошибка, то есть озвучил текст, далее пытаешься через час ещё раз озвучить, но выдает ошибку, приходится перезапускать программу.

Спасибо за информацию. Не проверяли, через сколько времени при постое сервис выдает ошибку? Чем точнее удастся узнать минимальную длительность простоя на разных компьютерах, тем лучше.

Цитата avgaz ()

Ещё можно сделать, что бы при Microsoft Azure убирался перенос строки?

Форматируйте текст в главном окне программы (пункт главного меню «Текст|Форматировать текст», настроить форматирование можно в окне «Общие настройки»). Это всё, что могу предложить.

Цитата avgaz ()

В идеале ещё бы сделать автоматическую замену и точки на настроенный параметр паузы

Правила для замен в этом окне не применяются. С тегами SSML рекомендую быть осторожнее: программа делит текст на части, чтобы отправить запросы к серверу. Если убрать знаки препинания и разрывы строк, текст будет поделен на части непредсказуемым образом.

 
avgaz Дата: Понедельник, 08.11.2021, 23:34 | Сообщение #15

Группа: Пользователи

Статус: Offline

Цитата balabolka ()

Спасибо за информацию. Не проверяли, через сколько времени при постое сервис выдает ошибку? Чем точнее удастся узнать минимальную длительность простоя на разных компьютерах, тем лучше.

минут через 30 уже отдает ошибку 500

Цитата balabolka ()

С тегами SSML рекомендую быть осторожнее: программа делит текст на части, чтобы отправить запросы к серверу. Если убрать знаки препинания и разрывы строк, текст будет поделен на части непредсказуемым образом.

ну тут как бы приходится использовать т.к у этого голоса точки и перенос строки очень длинные паузы.. А на какое количество символов разбивается текст на части?

 

Вопрос знатокам: Как поставить ударение в программе балаболка?

С уважением, Коля Колин

Лучшие ответы

Crashoverride:

Символ «<» меняет ударение в слове только для голоса «Николай» (и только при работе через SAPI 4.

Светлана Коробковa:

Как проставить ударение в Максиме?

HellBladePlay:

так: привЕт

Татьяна Николаева:

перед буквой с правильным ударением поставить апостроф, русская буква э, только в английской раскладке метод работает

Видео-ответ

Это видео поможет разобраться

Ответы знатоков

Дроп Тэйбл:

‘ перед ударной гласной. Но как-то не всегда срабатывает.
Или:
1. Запустить редактор plshelper.exe (я его скачал отдельно и положил его в папку движка c:Program FilesIVONAIVONA 2 Voice).
2. В поле «Текст» ввести ошибочное слово. Нажать F2, чтобы прослушать.
3. В поле «Транскрипция» ввести правильную транскрипцию. Знаки транскипции брать (двойной клик) из правого окна с примерами. Перед знаком, на кот. должно быть ударение ставить ‘ (одинарную кавычку).
4. Открыть c:Program FilesIVONAIVONA 2 Voicerussian-ivona.pls на редактирование и в нем создать новую строку по шаблону.
5. После сохранения этого текстового файла и перезагрузки Балаболки в Балаболке слово начнет произноситься по-новому.

Stepeecoyote:

подключить словарь произношений
погуглить по настройке голосового движка

S@NSeY:

Слишком сложный вопрос. Есть что попроще?

Валентин Б:

Ставить ударение в тексте курсором после буквы, на которой должно сто́ять ударение, и нажима́ем комбинацию кла́виш Alt + 769. Важно: цифры нужно нажимать на цифровой клавиатуре справа.

lverts lverts:

в конце в начале слова >>, << вставляй появляется интонация в словах, проверь и доп. пробелы
а вообще ударение этот знак — ‘

получается вот такой ковардак — «П-а-н-э-ль'<< до’ <<ступа'<< р<<а<з’бло’ки’рована>>.
.» пока не будет устраивать произношение интонация и ударение

Понравилась статья? Поделить с друзьями: