Машинное восприятие - это способность компьютерной системы интерпретировать данные аналогично тому, как люди используют свои чувства для связи с окружающим миром. [1] [2] [3] Основной метод, который компьютеры принимают и реагируют на свою среду, - это подключенное оборудование. До недавнего времени ввод был ограничен клавиатурой или мышью, но достижения в области технологий, как аппаратного, так и программного обеспечения, позволили компьютерам воспринимать сенсорный ввод так же, как и люди. [1] [2]
Машинное восприятие позволяет компьютеру использовать этот сенсорный ввод, а также обычные вычислительные средства для сбора информации, чтобы собирать информацию с большей точностью и представлять ее в виде, более удобном для пользователя. [1] К ним относятся компьютерное зрение , машинный слух , машинное прикосновение и машинное обоняние.
Конечная цель машинного восприятия - дать машинам возможность видеть, чувствовать и воспринимать мир, как люди, и, следовательно, чтобы они могли объяснять по-человечески, почему они принимают свои решения, предупреждать нас, когда он терпит неудачу. и, что более важно, причина, по которой он не работает. [4] Эта цель очень похожа на предлагаемые цели для искусственного интеллекта в целом, за исключением того, что машинное восприятие только наделяет машины ограниченным разумом , а не наделяет машины полным сознанием , самосознанием и интенциональностью . Современные технологии, ученые и исследователи, тем не менее, должны пройти еще долгий путь, прежде чем они достигнут этой цели.
Машинное зрение
Компьютерное зрение - это область, которая включает в себя методы получения, обработки, анализа и понимания изображений и многомерных данных из реального мира для получения числовой или символьной информации, например, в форме решений. Компьютерное зрение имеет множество приложений, которые уже используются сегодня, такие как распознавание лиц , географическое моделирование и даже эстетическое суждение. [5]
Тем не менее, машинам все еще трудно интерпретировать визуальный вмененный элемент точно, если он нечеткий и если точка обзора, с которой просматривается стимул, часто меняется. Компьютерам также сложно определить истинную природу какого-либо стимула, если он перекрывается с другим стимулом или легко соприкасается с ним. Это относится к принципу хорошего продолжения . Машины также с трудом воспринимают и регистрируют действие стимула в соответствии с принципом кажущегося движения, который исследовали гештальт-психологи .
Машинный слух
Машинный слух , также известный как машинное слушание или компьютерное прослушивание , - это способность компьютера или машины принимать и обрабатывать звуковые данные, такие как речь или музыка. [6] [7] Эта область имеет широкий спектр приложений, включая запись и сжатие музыки, синтез речи и распознавание речи. [8] Более того, эта технология позволяет машине воспроизводить способность человеческого мозга выборочно фокусироваться на определенном звуке на фоне множества других конкурирующих звуков и фонового шума. Эта особая способность называется «анализ слуховой сцены». Технология позволяет машине сегментировать несколько потоков, происходящих одновременно. [6] [9] [10] Многие широко используемые устройства, такие как смартфоны, голосовые переводчики и автомобили, в той или иной форме используют машинный слух. Однако современные технологии все еще иногда сталкиваются с проблемами сегментации речи . Это означает, что вы должны слышать слова в предложениях, особенно с учетом человеческого акцента.
Машинное касание
Машинное прикосновение - это область машинного восприятия, в которой тактильная информация обрабатывается машиной или компьютером. Приложения включают тактильное восприятие свойств поверхности и ловкость, посредством чего тактильная информация может способствовать интеллектуальным рефлексам и взаимодействию с окружающей средой. (Возможно, это можно сделать путем измерения того, когда и где возникает трение, а также его природы и интенсивности). Однако машины до сих пор не имеют возможности измерить некоторые физические ощущения человека, которые мы считаем обычными, включая физическую боль. Например, ученым еще предстоит изобрести механический заменитель ноцицепторов в теле и мозге, которые отвечают за обнаружение и измерение физического дискомфорта и страданий человека.
Машинное обоняние
Ученые также разрабатывают компьютеры, известные как машинное обоняние, которые также могут распознавать и измерять запахи. Химические вещества в воздухе можно обнаружить и классифицировать с помощью устройства, которое иногда называют электронным носом . Хотя существующие прототипы этой технологии все еще являются элементарными, возможности использования таких машин в будущем поразительно впечатляют.
Будущее
Помимо перечисленных выше, некоторые из будущих препятствий, которые науке о машинном восприятии еще предстоит преодолеть, включают, но не ограничиваются:
- Воплощенное познание - теория о том, что познание - это опыт всего тела, и поэтому он может существовать и, следовательно, быть измерен и проанализирован только в полноте, если все необходимые человеческие способности и процессы работают вместе через взаимно осознаваемую и поддерживающую сеть систем.
- Парадокс Моравца (см. Ссылку)
- Принцип подобия - способность маленьких детей определять, к какой семье относится вновь введенный стимул, даже если упомянутый стимул отличается от членов, с которыми ребенок обычно ассоциирует указанную семью. (Примером может быть ребенок, считающий, что чихуахуа - это собака и домашний питомец, а не паразит.)
- Бессознательный вывод : естественное человеческое поведение, заключающееся в определении того, опасен ли новый стимул, что это такое, а затем как к нему относиться, не требуя никаких новых сознательных усилий.
- Врожденная человеческая способность следовать принципу правдоподобия , чтобы со временем учиться на обстоятельствах и других людях .
- Теория распознавания по компонентам - способность мысленно анализировать и разбивать даже сложные механизмы на управляемые части, с которыми можно взаимодействовать. Например: человек, который видит как чашку, так и ручки, составляющие кружку, полную горячего какао, чтобы использовать ручку, чтобы держать кружку, чтобы избежать ожогов.
- Принцип свободной энергии - определение задолго до этого, сколько энергии можно безопасно передать осознанию вещей вне себя без потери энергии, необходимой для поддержания их жизни и удовлетворительного функционирования. Это позволяет обоим оптимально осознавать окружающий мир, не истощая настолько сильно, что они испытывают разрушительный стресс, усталость от решений и / или истощение.
Смотрите также
Рекомендации
- ^ a b c d Малкольм Татум (3 октября 2012 г.). «Что такое машинное восприятие» .
- ^ а б в Александр Серов (29 января 2013 г.). «Субъективная реальность и сильный искусственный интеллект». arXiv : 1301.6359 [ cs.AI ].
- ^ «Лаборатория машинного восприятия и когнитивной робототехники» . www.ccs.fau.edu . Проверено 18 июня 2016 .
- ^ «Исследование машинного восприятия - ECE - Технологический институт Вирджинии» . www.ECE.VT.edu . Проверено 10 января 2018 года .
- ^ а б Дхар, Санник; Ордонез, Висенте; Берг, Тамара Л. (2011). «Описание атрибутов высокого уровня для предсказания эстетики и интереса» (PDF) . CVPR 2011 . С. 1657–1664. DOI : 10.1109 / CVPR.2011.5995467 . ISBN 978-1-4577-0394-2.
- ^ а б Тангиан ( Tangian ), Андраник (1993). Искусственное восприятие и распознавание музыки . Берлин-Гейдельберг: Springer.
- ^ Тангиан (Tangian), Андраник (1994). «Принцип коррелятивности восприятия и его приложения к распознаванию музыки». Восприятие музыки . 11 (4): 465–502.
- ^ а б Лион, Ричард (2010). «Машинный слух: развивающаяся область [Исследовательский DSP». Журнал обработки сигналов IEEE . 27 (5): 131–139. Bibcode : 2010ISPM ... 27..131L . DOI : 10.1109 / MSP.2010.937498 .
- ^ Тангиан, Андраник (2001). «Как мы думаем: моделирование взаимодействия памяти и мышления». Когнитивная обработка . 2 : 117–151.
- ^ «Лаборатория машинного восприятия и когнитивной робототехники» . ccs.FAU.edu . Проверено 10 января 2018 года .
- ^ Терк, Мэтью (2000). «Перцептивные медиа: машинное восприятие и взаимодействие человека с компьютером» (PDF) . Китайский журнал компьютеров . 12 . страницы 1235-1244