Разработчики) | Фонд Mozilla |
---|---|
Первый выпуск | Июнь 2017, 19 |
Репозиторий | https://github.com/mozilla/voice-web |
Доступно в | Многоязычный ( список языков ) |
Лицензия | Creative Commons CC0 |
Веб-сайт | commonvoice.mozilla.org |
Common Voice - это краудсорсинговый проект, начатый Mozilla с целью создания бесплатной базы данных для программного обеспечения распознавания речи . Проект поддерживается волонтерами, которые записывают образцы предложений с помощью микрофона и просматривают записи других пользователей. Транскрибированные предложения будут собраны в доступной под голосовой базой публичного домена лицензия CC0 . Эта лицензия гарантирует, что разработчики могут использовать базу данных для приложений преобразования голоса в текст без ограничений и затрат. Неофициальный андроид приложение доступно .
Цели [ править ]
Common Voice направлен на предоставление разнообразных голосовых образцов. По словам Катарины Борхерт из Mozilla , многие существующие проекты использовали наборы данных с общественного радио или иным образом имели наборы данных, в которых недостаточно представлены как женщины, так и люди с ярко выраженным акцентом. [1]
Голосовая база данных [ править ]
База данных English Common Voice является второй по величине общедоступной голосовой базой данных после LibriSpeech . К моменту публикации первых данных 29 ноября 2017 года более 20000 пользователей по всему миру зарегистрировали 400000 проверенных предложений общей продолжительностью 500 часов. [2]
В феврале 2019 года была выпущена первая партия языков. Это включало 18 языков: английский , французский , немецкий и мандаринский китайский , а также менее распространенные языки, такие как валлийский и кабильский . В общей сложности это включало почти 1400 часов записанных голосовых данных от более чем 42000 участников. [3]
По состоянию на июль 2020 года в базе данных накоплено 7 226 часов голосовых записей на 54 языках, 5 591 час из которых были проверены волонтерами. [4]
См. Также [ править ]
Ссылки [ править ]
- ^ «Почему мы учитываем гендерный фактор ИИ? Фирмы, занимающиеся голосовыми технологиями, стремятся стать более инклюзивными» . Хранитель . 11 января 2020 . Проверено 19 апреля 2020 . CS1 maint: обескураженный параметр ( ссылка )
- ^ «Объявление о первом выпуске модели распознавания речи Mozilla с открытым исходным кодом и набора голосовых данных» . блог mozilla.org . 29 ноября 2017 года.
- ^ «Mozilla обновляет набор данных Common Voice, добавляя 1400 часов речи на 18 языках» . VentureBeat . 28 февраля 2019.
- ^ «Обновления Mozilla Common Voice помогут обучить Wakeword« Привет, Firefox »для голосового просмотра веб-страниц» . VentureBeat . 1 июля 2020. Архивировано из оригинала на 10 марта 2021 года . Проверено 1 апреля 2021 года .