Умный динамик


Умный динамик — это тип громкоговорителя и устройства голосового управления со встроенным виртуальным помощником , который предлагает интерактивные действия и активацию без помощи рук с помощью одного «горячего слова» (или нескольких «горячих слов»). Некоторые интеллектуальные колонки также могут выступать в качестве интеллектуальных устройств , использующих Wi-Fi , Bluetooth и другие стандарты протоколов для расширения использования за пределы воспроизведения звука, например, для управления устройствами домашней автоматизации . Это может включать, помимо прочего, такие функции, как совместимость с рядом служб и платформ, одноранговое соединение черезячеистые сети , виртуальные помощники и другие. Каждый из них может иметь свой собственный назначенный интерфейс и внутренние функции , обычно запускаемые или управляемые с помощью приложения или программного обеспечения для домашней автоматизации . [1] Некоторые смарт-колонки также имеют экран, чтобы показать пользователю визуальный ответ.

По оценкам NPR и Edison Research, на зиму 2017 года 39 миллионов американцев (16% населения старше 18 лет) владеют умными колонками. [2]

Умный динамик с сенсорным экраном известен как умный дисплей. [3] [4] Это смарт-устройство Bluetooth, в котором диалоговый пользовательский интерфейс объединяется с экранами дисплея для улучшения голосового взаимодействия с изображениями и видео. Они работают на основе одного из распространенных голосовых помощников и предлагают элементы управления для устройств умного дома, приложений для потоковой передачи и веб-браузеров с сенсорным управлением для выбора контента. Первые умные дисплеи были представлены в 2017 году компанией Amazon ( Amazon Echo Show , [5] Amazon Echo Spot).

Согласно исследованию Proceedings of the National Academy of Sciences United States of America , опубликованному в марте 2020 года, шесть крупнейших компаний по разработке технологий, Amazon , Apple , Google , Yandex , IBM и Microsoft , неправильно идентифицировали больше слов, произнесенных « черными ». люди », чем « белые люди ». Системы проверили ошибки и нечитаемость с расхождением 19 и 35 процентов для первого и 2 и 20 процентов для второго. [6]

Североамериканское отделение Ассоциации компьютерной лингвистики ( NAACL) также выявило несоответствие между мужскими и женскими голосами. Согласно их исследованию, программное обеспечение Google для распознавания речи на 13% точнее для мужчин, чем для женщин. Он работает лучше, чем системы, используемые Bing , AT&T и IBM. [7]

Встроенный микрофон умных колонок постоянно слушает «горячие слова», за которыми следует команда. Однако эти постоянно прослушиваемые микрофоны также вызывают у пользователей опасения в отношении конфиденциальности. [8] К ним относятся то, что записывается, как данные будут использоваться, как они будут защищены и будут ли они использоваться для навязчивой рекламы. [9] [10] Кроме того, анализ Amazon Alexa Echo Dots показал, что 30–38% «ложных аудиозаписей были человеческими разговорами», что позволяет предположить, что эти устройства захватывают звук, отличный от точного обнаружения горячего слова. [11]