Вы находитесь здесь: Главная Проект "Универсальный мобильный помощник" Обзор приложения “Eleven labs Reader” для озвучивания текстов с помощью нейросети

Обзор приложения “Eleven labs Reader” для озвучивания текстов с помощью нейросети

На изображении изображена женщина с короткими волнистыми волосами, одетая в зеленый свитер. Она держит в руках микрофон и носит большие наушники. На фоне изображены разноцветные световые эффекты, переходящие от фиолетового к зеленому и желтому. Справа от женщины находится текст "ELEVENLABS - ОЗВУЧЬ ЭТО!" и логотип "Eleven Labs".

В этом подкасте рассматривается интерфейс приложения Eleven labs Reader, описывается его функционал и приведено несколько примеров работы.

Автор подкаста: Маргарита Мельникова, специалист отдела контроля качества фонограмм издательства “ЭКСМО”, транскрибатор, основатель проектов “Опиши мне”, “Журналы вслух”, “Жемчужная библиотечка” и других.

Прочитать и скачать конспект подкаста можно на сайте Центра “Камерата”

Прослушать подкаст

Прочитать конспект

Приложение Eleven labs Reader — это уникальный инструмент для чтения (озвучивания) текстовых документов и веб-страниц. Уникальность его заключается в том, что преобразование текста в речь происходит с помощью голосов, созданных в нейросетевой модели.

Сотни людей предоставили свои голоса компании Eleven Labs. Посредством нейросетевой модели голоса, образно говоря, клонируются, за счёт чего они сохраняют живое, естественное, «человеческое» звучание.

Это уже не те синтезаторы речи, к которым привыкло большинство незрячих и слабовидящих людей!

Ещё одна важная особенность Eleven labs Reader заключается в том, что большинство голосов, присутствующих в библиотеке сервиса, мультиязычные. То есть одним голосом можно прочитать (озвучить) и текст на русском языке, и, например, англоязычную веб-страницу.

Однако если в одном тексте содержится информация на нескольких языках, при чтении могут возникать ошибки: чтение с акцентом, не очень понятное произнесение некоторых слов.

Также важно отметить, что для работы в приложении Eleven labs reader требуется доступ к сети интернет.

Интерфейс приложения

Приложение Eleven labs reader имеет веб-интерфейс и состоит из трёх основных разделов:

        • – Главный экран;
        • «Голоса» / библиотека голосов;
        • Аккаунт.

Если в приложении воспроизводится какой-либо файл, появляется четвёртый раздел: Плеер.

На главном экране присутствуют следующие элементы:

        • Кнопка Import. Активировав её, можно выбрать источник загрузки контента в приложение. Источники следующие: внутреннее файловое хранилище; веб-страница; изображение с камеры или из фотогалереи. Да, вы не ослышались: в приложение можно отправить отсканированный документ или фото из вашей галереи, и, если на изображении есть текст, он будет озвучен.
        • Фильтр типа контента: Всё; Веб-страницы; Тексты; Файлы.
        • Список ранее открытых в приложении документов (файлов, текстов, веб-страниц и так далее).

Чтобы удалить документ из списка, например, если вы его уже прочитали или больше не хотите с ним знакомиться, нужно открыть файл, активировать кнопку More (дополнительные действия) и выбрать опцию Delete (удалить).

Eleven labs reader работает с форматами: TXT, PDF, Epub, а также с веб-страницами. FB2 не поддерживается на момент написания данного обзора.

В приложении поддерживается чтение контента на тридцати двух языках, среди них: русский, английский, украинский, немецкий, итальянский, корейский, японский, даже малайский и тамильский.

Раздел Voices (голоса)

Здесь присутствуют следующие элементы:

        • Фильтры (о них немного позже);
        • Мои голоса (My voices) — этот пункт есть, если вы сохранили ранее в избранном хотя бы один голос;
        • Iconic voices collection: голоса знаменитостей (актёров, телеведущих, учёных и так далее);
        • Библиотека голосов (Library): перечисляются голоса с их кратким описанием.

Рассмотрим подраздел «фильтры». Голоса можно отфильтровать по следующим параметрам:

        • Самые популярные;
        • В тренде;
        • Последние использованные (не вами, а всеми пользователями сервиса);
        • Языки (можно выбрать один или несколько языков);
        • Варианты использования (use cases): Анимация, озвучка персонажей; озвучка разговорной речи, диалогов; образование и информационные сообщения; озвучка книг, рассказов; развлечение и ТВ; соц.сети; Реклама, объявления.
        • Пол;
        • Возраст.
        • Далее две кнопки: Reset (сбросить) и Apply (применить).

Примечание 1:

Можно отфильтровать голоса сразу по нескольким категориям. Будет показано число фильтров.

Примечание 2: Категория «варианты использования» весьма условна. Очевидно, что только вам решать, для чего будете использовать тот или иной голос.

Например, если указано, что голос мужской, серьёзный, пожилой, подходит для чтения образовательных текстов, ничто не мешает вам слушать с его помощью художественные книги.

Экран голоса

Если открыть страницу (экран) того или иного голоса, будут доступны элементы play (прослушать) и Save (сохранить).

Таким образом, нажав Play, вы сможете послушать, как звучит голос. Если понравится, сохраняйте в свою библиотеку. После активации, кнопка Save изменится на Remove (удалить).

Воспроизведение контента

Как было сказано ранее, для добавления контента в приложение можно воспользоваться опцией Import. Но также вы можете делиться документами и ссылками на веб-страницы с Eleven labs Reader из других приложений: из браузера, из мессенджеров и соц.сетей, из облачных сервисов, и так далее.

Чтобы воспроизвести контент, добавленный в Reader, дождитесь окончания буферизации и нажмите Listen (слушать). Но прежде не забудьте выбрать голос (Select voice). Голос можно выбрать как из добавленных вами ранее в избранное (my voices), так и из общей библиотеки.

Есть возможность:

        • Регулировать скорость воспроизведения – от 0.8 до 2x;
        • Осуществлять перемотку назад и вперёд на 15 секунд;
        • Ставить на паузу и возобновлять воспроизведение.

Кроме того, вы вольны поменять голос в процессе воспроизведения. Начали слушать одним, не понравилось, выбирайте другой. Позиция воспроизведения в приложении запоминается. Вы будете видеть, сколько прослушано, сколько осталось (в минутах и процентах).

Аккаунт

И, наконец, последний раздел приложения — Аккаунт. Здесь присутствуют следующие элементы:

        • Регистрация и вход: проще всего по Email или через Google.
        • Сбросить пароль;
        • Настройки темы (тёмная, светлая, контрастность. Настройки, актуальные для слабовидящих);
        • Удалить аккаунт;
        • Часто задаваемые вопросы;
        • Справочный центр;
        • Правила сервиса;
        • Политика приватности;
        • Выход.

Примечание:

Контентом, озвученным с помощью Eleven labs Reader, делиться не получится. Также нет возможности загружать его себе на устройство для доступа вне сервиса Eleven labs. Подобные ограничения позволяют сервису оставаться более безопасным и бесплатным.

Приятного использования Eleven labs Reader! Читайте больше с этими великолепными голосами!

Ссылки на приложение

Скачивайте приложение “Eleven labs Reader” для Android и для iOS.

Справочная информация

Этот материал подготовлен в рамках общероссийского социального проекта “Универсальный мобильный помощник”, который реализует Нижегородский областной центр реабилитации инвалидов по зрению “Камерата” в партнерстве с некоммерческими организациями из регионов России при поддержке ПАО “МегаФон”.

Получить консультацию по вопросам подбора, настройки и использования мобильной, компьютерной и другой бытовой техники, а также записаться на бесплатный курс по цифровой грамотности можно по телефону горячей линии “IT-помощь незрячим”: 8-800-550-46-80 (пн-пт с 08:00 до 20:00 по московскому времени).