Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Common Voice - это краудсорсинговый проект, начатый Mozilla с целью создания бесплатной базы данных для программного обеспечения распознавания речи . Проект поддерживается волонтерами, которые записывают образцы предложений с помощью микрофона и просматривают записи других пользователей. Транскрибированные предложения будут собраны в доступной под голосовой базой публичного домена лицензия CC0 . Эта лицензия гарантирует, что разработчики могут использовать базу данных для приложений преобразования голоса в текст без ограничений и затрат. Неофициальный андроид приложение доступно .

Цели [ править ]

Common Voice направлен на предоставление разнообразных голосовых образцов. По словам Катарины Борхерт из Mozilla , многие существующие проекты использовали наборы данных с общественного радио или иным образом имели наборы данных, в которых недостаточно представлены как женщины, так и люди с ярко выраженным акцентом. [1]

Голосовая база данных [ править ]

База данных English Common Voice является второй по величине общедоступной голосовой базой данных после LibriSpeech . К моменту публикации первых данных 29 ноября 2017 года более 20000 пользователей по всему миру зарегистрировали 400000 проверенных предложений общей продолжительностью 500 часов. [2]

В феврале 2019 года была выпущена первая партия языков. Это включало 18 языков: английский , французский , немецкий и мандаринский китайский , а также менее распространенные языки, такие как валлийский и кабильский . В общей сложности это включало почти 1400 часов записанных голосовых данных от более чем 42000 участников. [3]

По состоянию на июль 2020 года в базе данных накоплено 7 226 часов голосовых записей на 54 языках, 5 591 час из которых были проверены волонтерами. [4]

См. Также [ править ]

Ссылки [ править ]

  1. ^ «Почему мы учитываем гендерный фактор ИИ? Фирмы, занимающиеся голосовыми технологиями, стремятся стать более инклюзивными» . Хранитель . 11 января 2020 . Проверено 19 апреля 2020 . CS1 maint: обескураженный параметр ( ссылка )
  2. ^ «Объявление о первом выпуске модели распознавания речи Mozilla с открытым исходным кодом и набора голосовых данных» . блог mozilla.org . 29 ноября 2017 года.
  3. ^ «Mozilla обновляет набор данных Common Voice, добавляя 1400 часов речи на 18 языках» . VentureBeat . 28 февраля 2019.
  4. ^ «Обновления Mozilla Common Voice помогут обучить Wakeword« Привет, Firefox »для голосового просмотра веб-страниц» . VentureBeat . 1 июля 2020. Архивировано из оригинала на 10 марта 2021 года . Проверено 1 апреля 2021 года .