MovieLens

Рекомендательные системы
Концепции
Коллективный разум Актуальность Звездные рейтинги Длинный хвост
Методы и проблемы
Холодный запуск Совместная фильтрация Снижение размерности Неявный сбор данных Совместная фильтрация элементов Факторизация матрицы Выявление предпочтений Поиск сходства
Реализации
Совместная поисковая система Платформа для обнаружения контента Система поддержки принятия решений Проект Музыкального Генома Поиск продукта
Исследовать
GroupLens Research MovieLens Приз Netflix
v т е

MovieLens - это веб- система рекомендаций и виртуальное сообщество, которое рекомендует фильмы для просмотра своими пользователями на основе их предпочтений, используя совместную фильтрацию рейтингов фильмов и обзоров фильмов участников. Он содержит около 11 миллионов оценок примерно к 8500 фильмам. ^[1] MovieLens была создана в 1997 году GroupLens исследований , научно - исследовательской лаборатории в отделе компьютерных наук и инженерии в Университете Миннесоты , ^[2] с целью сбора научных данных о персонализированных рекомендаций. ^[3]

История [ править ]

MovieLens - не первая рекомендательная система, созданная GroupLens. В мае 1996 года GroupLens сформировала коммерческое предприятие под названием Net Perceptions, которое обслуживало клиентов, среди которых был E! Интернет и Amazon.com . E! Online использовала сервисы Net Perceptions для создания системы рекомендаций для Moviefinder.com ^{[3], в} то время как Amazon.com использовала технологию компании для формирования своего раннего механизма рекомендаций для покупок потребителей. ^[4]

Когда в 1997 году закрылся еще один сайт рекомендаций по фильмам, eachmovie.org ^[5] , создатели этого сайта публично опубликовали собранные ими анонимные рейтинговые данные для использования другими исследователями. Исследовательская группа GroupLens, возглавляемая Брентом Даленом и Джоном Херлокером, использовала этот набор данных для запуска нового сайта рекомендаций по фильмам, который они решили назвать MovieLens. С момента своего создания, MovieLens стала весьма заметной исследовательской платформы: ее выводы данных были представлены в подробном обсуждении в статье New Yorker по Малкольм Гладуэлл , ^[6] , а также отчет в полном эпизоде ABC Nightline. ^[7]Кроме того, данные MovieLens сыграли решающую роль в нескольких исследованиях, включая совместное исследование Университета Карнеги-Меллона, Мичиганского университета, Университета Миннесоты и Университета Питтсбурга «Использование социальной психологии для мотивации участия в онлайн-сообществах». ^[8]

Весной 2015 года при поиске по запросу "киноленты" было получено 2750 результатов в Google Книгах и 7580 результатов в Google Scholar. ^[9]

Рекомендации [ править ]

MovieLens основывает свои рекомендации на информации, предоставленной пользователями веб-сайта, например на рейтингах фильмов . ^[2] Сайт использует множество алгоритмов рекомендаций, включая алгоритмы совместной фильтрации , такие как элемент-элемент , ^[10] пользователь-пользователь и регуляризованный SVD . ^[11] Кроме того, для решения проблемы холодного запуска для новых пользователей MovieLens использует методы определения предпочтений . ^[12]Система просит новых пользователей оценить, насколько им нравится смотреть различные группы фильмов (например, фильмы с черным юмором по сравнению с романтическими комедиями). Предпочтения, записанные в ходе этого опроса, позволяют системе давать первоначальные рекомендации еще до того, как пользователь оценил большое количество фильмов на веб-сайте.

Для каждого пользователя MovieLens прогнозирует, как пользователь оценит любой данный фильм на веб-сайте. ^[13] На основе этих прогнозируемых оценок система рекомендует фильмы, которые пользователь, скорее всего, получит высокую оценку. Веб-сайт предлагает пользователям оценить как можно больше полностью просмотренных фильмов, чтобы рекомендации были более точными, поскольку в этом случае система будет лучше отражать вкусы фильмов пользователя. ^[3] Тем не менее, метод поощрения рейтингов MovieLens не всегда особенно эффективен, поскольку исследователи обнаружили, что более 20% фильмов, перечисленных в системе, имеют настолько мало оценок, что рекомендательные алгоритмы не могут точно предсказать, понравятся они подписчикам или нет. . ^[8]Рекомендации по фильмам не могут содержать каких-либо маркетинговых ценностей, позволяющих рассматривать большое количество рейтингов фильмов как «исходный набор данных». ^[14]

Помимо рекомендаций фильмов, MovieLens также предоставляет информацию об отдельных фильмах, такую как список актеров и режиссеров каждого фильма. Пользователи также могут отправлять и оценивать теги (форма метаданных , например, «на основе книги», «слишком длинный» или «манерный»), которые могут использоваться для повышения точности системы рекомендаций по фильмам. ^[3]

Рейтинги в MovieLens могут появиться в любое время, на самом деле, это может произойти спустя годы после просмотра фильма. Пользователи часто вводили сразу несколько оценок, надеясь, что получат более персонализированные рекомендации или просто для удовлетворения. ^[15]

Прием [ править ]

К сентябрю 1997 года сайт посетили более 50 000 пользователей. ^[3] Когда Akron Beacon Journal ' s Paula Schleis опробовал сайт, она была удивлена тем , насколько точным сайт был с точки зрения рекомендаций новые фильмы для нее , чтобы посмотреть на ее основе вкусов фильма. ^[13]

За пределами области рекомендаций по фильмам, данные из MovieLens использовались компанией Solution by Simulation для прогнозирования Оскара. ^[16]

Исследование [ править ]

В 2004 году совместное исследование с исследователями из Университета Карнеги-Меллона , Университета Мичигана , Университета Миннесоты и Университета Питтсбурга разработало и протестировало стимулы, основанные на принципах социальной психологии социальной бездельничаности и постановки целей для пользователей MovieLens. ^[8]Исследователи увидели, что недостаточный вклад, по-видимому, является проблемой для сообщества, и организовали исследование, чтобы определить наиболее эффективный способ мотивировать пользователей оценивать и просматривать больше фильмов. В рамках исследования были выполнены два полевых эксперимента; одно касалось сообщений электронной почты, которые напоминали пользователям об уникальности их вклада и вытекающих из них выгодах, а другое давало пользователям ряд индивидуальных или групповых целей для вклада.

Первый эксперимент, основанный на анализе совокупного ответа сообщества MovieLens, показал, что пользователи с большей вероятностью будут вносить свой вклад в сообщество, когда им напоминают об их уникальности, что заставляет их думать, что их вклад не является дублированием того, что могут делать другие пользователи. предоставлять. Вопреки гипотезе исследователей, они также обнаружили, что пользователи с меньшей вероятностью будут вносить свой вклад, когда для них было подчеркнуто преимущество, которое они получают от рейтинга, или выгоду, которую получают другие, когда они оценивают. Наконец, они не нашли поддержки взаимосвязи между уникальностью и выгодой.

Второй эксперимент показал, что пользователи с большей вероятностью будут вносить свой вклад, когда им ставят конкретные и сложные цели и заставляют поверить в то, что их вклад необходим для достижения цели группы. Исследование показало, что в этом конкретном контексте предоставление пользователям целей на уровне группы фактически увеличивает вклад по сравнению с индивидуальными целями, где исследователи предсказывали обратное из-за эффектов социального бездельничания. Взаимосвязь между сложностью цели и вкладом пользователей как в группе, так и в отдельных случаях дала слабые доказательства того, что после определенного порога сложности производительность падает, а не на плато, как ранее предполагалось в теории постановки целей Локка и Латама.

Наборы данных [ править ]

GroupLens Research , лаборатория исследования взаимодействия человека и компьютера при Университете Миннесоты , предоставляет наборы рейтинговых данных, собранные с веб-сайта MovieLens, для использования в исследованиях. Полный набор данных содержит 26 000 000 оценок и 750 000 приложений тегов, примененных к 45 000 фильмов 270 000 пользователей. Он также включает данные генома тегов с 12 миллионами оценок релевантности для 1100 тегов (последнее обновление 8/2017). ^[17] На основе наборов данных MovieLens проводится много типов исследований. Лю и др. использовали наборы данных MovieLens для проверки эффективности улучшенного алгоритма случайного блуждания, подавляя влияние крупных объектов. ^[18] GroupLens имеет условия использования набора данных, ион принимает запросы через Интернет .

Ссылки [ править ]

^ http://license.umn.edu/technologies/z05173_movielens-database
^ a b Скофилд, Джек (22 мая 2003 г.). «Земля Гнода» . Хранитель . Лондон.
^ a b c d e Охеда-Сапата, Хулио (1997-09-15). «Новый сайт персонализирует обзоры фильмов». Св. Павла Pioneer Press . п. 3E.
^ Бут, Майкл (2005-01-30). «Откуда компьютеры так много знают о нас?». Денвер Пост . п. F01.
^ Лим, Мюнгеун; Ким, Juntae (2001). «Адаптивная система рекомендаций с агентом-координатором» . Труды Первой Азиатско-Тихоокеанской конференции по веб-аналитике: исследования и разработки . Азиатско-Тихоокеанская конференция по веб-аналитике. Конспект лекций по информатике. 2198/2001. Springer Berlin / Heidelberg. С. 438–442 . DOI : 10.1007 / 3-540-45490-X_56 . ISBN 978-3-540-42730-8. Проверено 30 декабря 2009 .
Перейти ↑ Gladwell, Malcolm (4 октября 1999 г.). "Анналы маркетинга: наука о спящем: как информационная эра может сдвинуть с мертвой точки блокбастер" . Житель Нью-Йорка . 75 (29): 48–55. Архивировано из оригинала на 30 декабря 2009 года . Проверено 29 декабря 2009 .
^ Krulwich, Роберт (10 декабря 1999). "ABC Nightline: Родственная душа" . ABC.
^ a b c Beenen, Джерард; Линг, Кимберли; Ван, Сяоцин; Чанг, Кларисса; Франковски, Дэн; Резник, Пол; Краут, Роберт Э. (2004). «Использование социальной психологии для мотивации участия в онлайн-сообществах» . CommunityLab . CiteSeerX 10.1.1.320.5540 .
^ http://files.grouplens.org/papers/harper-tiis2015.pdf
^ Сарвар, Бадрул и др. «Алгоритмы рекомендаций совместной фильтрации на основе элементов». Материалы 10-й международной конференции по всемирной паутине. ACM, 2001.
^ Экстранд, Майкл Д. К инструментам разработки рекомендаций и экспериментам для выявления различий в рекомендациях. Дисс. УНИВЕРСИТЕТ МИННЕСОТА, 2014.
^ Чанг, Шуо, Ф. Максвелл Харпер и Лорен Тервин. «Использование групп элементов для начальной загрузки новых пользователей в рекомендательных системах». Материалы 18-й конференции ACM по совместной работе с компьютерной поддержкой и социальным вычислениям. ACM, 2015.
^ a b Шлейс, Паула (2000-11-13). «Сайт позволяет всем быть критиком». Акрон Бикон Журнал . п. D2.
^ http://license.umn.edu/technologies/z05173_movielens-database
^ http://files.grouplens.org/papers/harper-tiis2015.pdf
^ Хикки, Уолт. «Складываются ли ваши прогнозы на Оскар? Вот что говорят данные». FiveThirtyEight. Np, 18 февраля 2016 г. Web. 8 марта 2016 г. < http://fivethirtyeight.com/features/oscar-data-model-predictions-2015/ >
^ "GroupLens" .
^ Чуанг Лю, Чжэнь Лю, Цзы-Кэ Чжан, Цзюнь-Линь Чжоу, Ян Фу, Да-Ченг Не (2014). «Алгоритм персонализированной рекомендации через случайное блуждание». 11-я Международная совместная конференция по информатике и программной инженерии (JCSSE) .CS1 maint: несколько имен: список авторов ( ссылка )

Внешние ссылки [ править ]

Официальный сайт

[1] ttp://license.umn.edu/technologies/z05173_movielens-database

[guardian-2] Скофилд, Джек (22 мая 2003 г.). «Земля Гнода» . Хранитель . Лондон.

[stpaul-3] Охеда-Сапата, Хулио (1997-09-15). «Новый сайт персонализирует обзоры фильмов». Св. Павла Pioneer Press . п. 3E.

[denver-4] Бут, Майкл (2005-01-30). «Откуда компьютеры так много знают о нас?». Денвер Пост . п. F01.

[5] Лим, Мюнгеун; Ким, Juntae (2001). «Адаптивная система рекомендаций с агентом-координатором» . Труды Первой Азиатско-Тихоокеанской конференции по веб-аналитике: исследования и разработки . Азиатско-Тихоокеанская конференция по веб-аналитике. Конспект лекций по информатике. 2198/2001. Springer Berlin / Heidelberg. С. 438–442 . DOI : 10.1007 / 3-540-45490-X_56 . ISBN 978-3-540-42730-8. Проверено 30 декабря 2009 .

[6] Перейти ↑ Gladwell, Malcolm (4 октября 1999 г.). "Анналы маркетинга: наука о спящем: как информационная эра может сдвинуть с мертвой точки блокбастер" . Житель Нью-Йорка . 75 (29): 48–55. Архивировано из оригинала на 30 декабря 2009 года . Проверено 29 декабря 2009 .

[7] Krulwich, Роберт (10 декабря 1999). "ABC Nightline: Родственная душа" . ABC.

[:0-8] Beenen, Джерард; Линг, Кимберли; Ван, Сяоцин; Чанг, Кларисса; Франковски, Дэн; Резник, Пол; Краут, Роберт Э. (2004). «Использование социальной психологии для мотивации участия в онлайн-сообществах» . CommunityLab . CiteSeerX 10.1.1.320.5540 .

[9] ttp://files.grouplens.org/papers/harper-tiis2015.pdf

[10] Сарвар, Бадрул и др. «Алгоритмы рекомендаций совместной фильтрации на основе элементов». Материалы 10-й международной конференции по всемирной паутине. ACM, 2001.

[11] Экстранд, Майкл Д. К инструментам разработки рекомендаций и экспериментам для выявления различий в рекомендациях. Дисс. УНИВЕРСИТЕТ МИННЕСОТА, 2014.

[12] Чанг, Шуо, Ф. Максвелл Харпер и Лорен Тервин. «Использование групп элементов для начальной загрузки новых пользователей в рекомендательных системах». Материалы 18-й конференции ACM по совместной работе с компьютерной поддержкой и социальным вычислениям. ACM, 2015.

[akron-13] Шлейс, Паула (2000-11-13). «Сайт позволяет всем быть критиком». Акрон Бикон Журнал . п. D2.

[14] ttp://license.umn.edu/technologies/z05173_movielens-database

[15] ttp://files.grouplens.org/papers/harper-tiis2015.pdf

[16] Хикки, Уолт. «Складываются ли ваши прогнозы на Оскар? Вот что говорят данные». FiveThirtyEight. Np, 18 февраля 2016 г. Web. 8 марта 2016 г. < http://fivethirtyeight.com/features/oscar-data-model-predictions-2015/ >

[grouplens-17] "GroupLens" .

[paper-18] Чуанг Лю, Чжэнь Лю, Цзы-Кэ Чжан, Цзюнь-Линь Чжоу, Ян Фу, Да-Ченг Не (2014). «Алгоритм персонализированной рекомендации через случайное блуждание». 11-я Международная совместная конференция по информатике и программной инженерии (JCSSE) .CS1 maint: несколько имен: список авторов ( ссылка )

[1]