Совместная фильтрация

На этом изображении показан пример прогнозирования рейтинга пользователя с помощью совместной фильтрации. Сначала люди оценивают разные предметы (например, видео, изображения, игры). После этого система делает прогнозы относительно оценки пользователем элемента, который пользователь еще не оценил. Эти прогнозы основаны на существующих рейтингах других пользователей, которые имеют аналогичные оценки с активным пользователем. Например, в нашем случае система сделала прогноз, что активному пользователю видео не понравится.

Рекомендательные системы
Концепции
Коллективный разум Актуальность Звездные рейтинги Длинный хвост
Методы и проблемы
Холодный запуск Совместная фильтрация Снижение размерности Неявный сбор данных Совместная фильтрация элементов Факторизация матрицы Выявление предпочтений Поиск сходства
Реализации
Совместная поисковая система Платформа для обнаружения контента Система поддержки принятия решений Проект Музыкального Генома Поиск продукта
Исследование
GroupLens Research MovieLens Приз Netflix
v т е

Совместная фильтрация ( CF ) - это метод, используемый рекомендательными системами . ^[1] Совместная фильтрация имеет два смысла: узкое и более общее. ^[2]

В новом, более узком смысле, совместная фильтрация является методом создания автоматических прогнозов (фильтрация) об интересах пользователя путем сбора предпочтений или вкусовой информации от многих пользователей (взаимодействующих). Основное предположение подхода совместной фильтрации состоит в том, что если человек A придерживается того же мнения, что и человек B по вопросу, A с большей вероятностью будет иметь мнение B по другому вопросу, чем мнение случайно выбранного человека. Например, система рекомендаций совместной фильтрации для телевидения.вкусы могут делать прогнозы о том, какое телешоу должно понравиться пользователю, с учетом частичного списка вкусов этого пользователя (симпатий или антипатий). ^[3] Обратите внимание, что эти прогнозы относятся к конкретному пользователю, но используют информацию, полученную от многих пользователей. Это отличается от более простого подхода, когда по каждому интересующему пункту выставляется средний (неспецифический) балл, например, на основании количества голосов .

В более общем смысле совместная фильтрация - это процесс фильтрации информации или шаблонов с использованием методов, предполагающих сотрудничество между несколькими агентами, точками зрения, источниками данных и т. Д. ^[2] Приложения совместной фильтрации обычно включают очень большие наборы данных. Методы совместной фильтрации применялись ко многим различным типам данных, включая: данные зондирования и мониторинга, например, при разведке полезных ископаемых, зондирование окружающей среды на больших площадях или множественные датчики; финансовые данные, например, об учреждениях финансовых услуг, которые объединяют множество финансовых источников; или в электронной коммерции и веб-приложениях, где основное внимание уделяется пользовательским данным и т. д. Остальная часть этого обсуждения посвящена совместной фильтрации пользовательских данных, хотя некоторые методы и подходы могут применяться и к другим основным приложениям.

Обзор [ править ]

Рост в Интернете стало гораздо труднее эффективно извлекать полезную информацию из всех доступных в Интернете информации . Подавляющее количество данных требует механизмов для эффективной фильтрации информации . Совместная фильтрация - один из методов, используемых для решения этой проблемы.

Мотивация к совместной фильтрации исходит из того, что люди часто получают лучшие рекомендации от кого-то с похожими вкусами. Совместная фильтрация включает в себя методы сопоставления людей со схожими интересами и выработку рекомендаций на этой основе.

Алгоритмы совместной фильтрации часто требуют (1) активного участия пользователей, (2) простого способа представления интересов пользователей и (3) алгоритмов, которые могут сопоставить людей со схожими интересами.

Обычно рабочий процесс системы совместной фильтрации:

Пользователь выражает свои предпочтения с помощью элементов рейтинга (например, книг, фильмов или компакт-дисков) системы. Эти рейтинги можно рассматривать как приблизительное представление интереса пользователя к соответствующему домену.
Система сравнивает оценки этого пользователя с оценками других пользователей и находит людей с наиболее «похожими» вкусами.
Схожим пользователям система рекомендует элементы, которые схожие пользователи высоко оценили, но еще не получили оценку этим пользователем (предположительно, отсутствие оценки часто рассматривается как незнакомость элемента).

Ключевая проблема совместной фильтрации заключается в том, как объединить и взвесить предпочтения соседей пользователей. Иногда пользователи могут сразу оценить рекомендуемые товары. В результате система получает более точное представление о предпочтениях пользователя с течением времени.

Методология [ править ]

Совместная фильтрация в рекомендательных системах

Системы совместной фильтрации имеют множество форм, но многие общие системы можно свести к двум этапам:

Ищите пользователей, которые разделяют те же шаблоны оценок с активным пользователем (пользователем, для которого сделан прогноз).
Используйте рейтинги единомышленников, найденные на шаге 1, чтобы рассчитать прогноз для активного пользователя.

Это подпадает под категорию совместной фильтрации на основе пользователей. Конкретным применением этого является пользовательский алгоритм ближайшего соседа .

В качестве альтернативы, совместная фильтрация на основе элементов (пользователи, купившие x, также покупают y), работает по принципу, ориентированному на элементы:

Постройте матрицу элемент-элемент, определяющую отношения между парами элементов.
Сделайте вывод о вкусах текущего пользователя, изучив матрицу и сопоставив данные этого пользователя.

См., Например, семейство совместной фильтрации на основе элементов Slope One .

Другая форма совместной фильтрации может быть основана на неявных наблюдениях за нормальным поведением пользователя (в отличие от искусственного поведения, навязанного оценочной задачей). Эти системы наблюдают за тем, что сделал пользователь, вместе с тем, что сделали все пользователи (какую музыку они слушали, какие предметы купили), и используют эти данные для прогнозирования поведения пользователя в будущем или для прогнозирования того, что пользователю может понравиться. вести себя при наличии возможности. Затем эти прогнозы необходимо отфильтровать с помощью бизнес-логики, чтобы определить, как они могут повлиять на действия бизнес-системы. Например, бесполезно предлагать кому-то продать определенный альбом музыки, если он уже продемонстрировал, что он владеет этой музыкой.

Использование системы оценки или оценки, которая усредняется для всех пользователей, игнорирует конкретные требования пользователя и особенно плохо справляется с задачами, в которых наблюдается большой разброс интересов (например, в рекомендациях по музыке). Однако есть и другие методы борьбы с информационным взрывом, такие как веб- поиск и кластеризация данных .

Типы [ править ]

На основе памяти [ править ]

Подход, основанный на памяти, использует данные оценки пользователей для вычисления сходства между пользователями или элементами. Типичными примерами этого подхода являются CF на основе соседства и рекомендации Top-N на основе элементов / пользователей. Например, в подходах, основанных на пользователях, значение оценок, которые пользователь u дает элементу i , рассчитывается как совокупность некоторых аналогичных пользовательских оценок элемента:

{\ displaystyle r_ {u, i} = \ operatorname {aggr} _ {u ^ {\ prime} \ in U} r_ {u ^ {\ prime}, i}}

где U обозначает набор из N лучших пользователей, которые наиболее похожи на пользователя u, который оценил элемент i . Некоторые примеры функции агрегирования включают:

{\ displaystyle r_ {u, i} = {\ frac {1} {N}} \ sum \ limits _ {u ^ {\ prime} \ in U} r_ {u ^ {\ prime}, i}}

{\ displaystyle r_ {u, i} = k \ sum \ limits _ {u ^ {\ prime} \ in U} \ operatorname {simil} (u, u ^ {\ prime}) r_ {u ^ {\ prime} ,я}}

где k - нормализующий коэффициент, определяемый как , и ${\ displaystyle k = 1 / \ sum _ {u ^ {\ prime} \ in U} | \ operatorname {simil} (u, u ^ {\ prime}) |}$

{\ displaystyle r_ {u, i} = {\ bar {r_ {u}}} + k \ sum \ limits _ {u ^ {\ prime} \ in U} \ operatorname {simil} (u, u ^ {\ prime}) (r_ {u ^ {\ prime}, i} - {\ bar {r_ {u ^ {\ prime}}}}})}

где - средний рейтинг пользователя u по всем элементам, оцененным пользователем u . ${\ displaystyle {\ bar {r_ {u}}}}$

Алгоритм на основе соседства вычисляет сходство между двумя пользователями или элементами и производит прогноз для пользователя, взяв средневзвешенное значение всех оценок. Вычисление сходства между элементами или пользователями - важная часть этого подхода. Для этого используются множественные меры, такие как корреляция Пирсона и сходство на основе векторного косинуса .

Сходство корреляции Пирсона двух пользователей x , y определяется как

\operatorname {simil} (x,y)={\frac {\sum \limits _{i\in I_{xy}}(r_{x,i}-{\bar {r_{x}}})(r_{y,i}-{\bar {r_{y}}})}{{\sqrt {\sum \limits _{i\in I_{xy}}(r_{x,i}-{\bar {r_{x}}})^{2}}}{\sqrt {\sum \limits _{i\in I_{xy}}(r_{y,i}-{\bar {r_{y}}})^{2}}}}}

где I _xy - это набор элементов, оцененных как пользователем x, так и пользователем y .

Подход, основанный на косинусе, определяет косинус-подобие между двумя пользователями x и y как: ^[4]

\operatorname {simil} (x,y)=\cos({\vec {x}},{\vec {y}})={\frac {{\vec {x}}\cdot {\vec {y}}}{||{\vec {x}}||\times ||{\vec {y}}||}}={\frac {\sum \limits _{i\in I_{xy}}r_{x,i}r_{y,i}}{{\sqrt {\sum \limits _{i\in I_{x}}r_{x,i}^{2}}}{\sqrt {\sum \limits _{i\in I_{y}}r_{y,i}^{2}}}}}

Алгоритм рекомендаций топ-N на основе пользователей использует основанную на сходстве векторную модель для определения k пользователей, наиболее похожих на активного пользователя. После того, как будут найдены k наиболее похожих пользователей, соответствующие им матрицы элементов-пользователей агрегируются для определения набора элементов, которые следует рекомендовать. Популярным методом поиска похожих пользователей является хеширование с учетом местоположения , которое реализует механизм ближайшего соседа за линейное время.

К преимуществам этого подхода относятся: объяснимость результатов, что является важным аспектом рекомендательных систем; простота создания и использования; легкое внесение новых данных; независимость от содержания рекомендуемых элементов; хорошее масштабирование с предметами с одинаковым рейтингом.

У этого подхода также есть несколько недостатков. Его производительность снижается, когда данные становятся разреженными , что часто случается с элементами, связанными с Интернетом. Это препятствует масштабируемости этого подхода и создает проблемы с большими наборами данных. Хотя он может эффективно обрабатывать новых пользователей, потому что он полагается на структуру данных , добавление новых элементов становится более сложным, поскольку это представление обычно зависит от определенного векторного пространства . Добавление новых элементов требует включения нового элемента и повторной вставки всех элементов в структуру.

На основе модели [ править ]

При таком подходе модели разрабатываются с использованием различных алгоритмов интеллектуального анализа данных и машинного обучения для прогнозирования оценок пользователей безрейтинговых элементов. Существует множество алгоритмов CF, основанных на моделях. Байесовские сети , модели кластеризации , скрытые семантические модели, такие как разложение по сингулярным значениям , вероятностный скрытый семантический анализ , множественный мультипликативный фактор, скрытое распределение Дирихле и модели на основе марковского процесса принятия решений . ^[5]

Благодаря этому подходу методы уменьшения размерности в основном используются в качестве дополнительных методов для повышения надежности и точности подхода, основанного на памяти. В этом смысле такие методы, как разложение по сингулярным числам , анализ главных компонент, известные как модели скрытых факторов, сжимают матрицу элементов пользователя в низкоразмерное представление в терминах скрытых факторов. Одним из преимуществ использования этого подхода является то, что вместо того, чтобы иметь матрицу большой размерности, содержащую большое количество пропущенных значений, мы будем иметь дело с гораздо меньшей матрицей в пространстве меньшей размерности. Сокращенное представление можно использовать для алгоритмов соседства на основе пользователей или элементов, которые представлены в предыдущем разделе. У этой парадигмы есть несколько преимуществ. Он справляется с разреженностью исходной матрицы лучше, чем матрицы на основе памяти. Кроме того, сравнение сходства в результирующей матрице гораздо более масштабируемо, особенно при работе с большими разреженными наборами данных. ^[6]

Гибрид [ править ]

Ряд приложений объединяют алгоритмы CF на основе памяти и на основе моделей. Они преодолевают ограничения собственных подходов CF и улучшают производительность прогнозирования. Важно отметить, что они преодолевают такие проблемы CF, как разреженность и потеря информации. Однако они имеют повышенную сложность и дороги в реализации. ^[7] Обычно большинство коммерческих рекомендательных систем являются гибридными, например, рекомендательная система новостей Google. ^[8]

Глубокое обучение [ править ]

В последние годы был предложен ряд методов нейронного и глубокого обучения. Некоторые обобщают традиционные алгоритмы матричной факторизации с помощью нелинейной нейронной архитектуры ^[9] или используют новые типы моделей, такие как вариационные автоэнкодеры . ^[10]Хотя глубокое обучение применялось во многих различных сценариях: с учетом контекста, с учетом последовательности, социальных тегов и т. Д., Его реальная эффективность при использовании в сценарии простых совместных рекомендаций была поставлена под сомнение. Систематический анализ публикаций, применяющих глубокое обучение или нейронные методы к первоочередной проблеме рекомендаций, опубликованных на ведущих конференциях (SIGIR, KDD, WWW, RecSys), показал, что в среднем менее 40% статей воспроизводимы при минимальном как 14% на некоторых конференциях. В целом исследование выявило 18 статей, только 7 из них могли быть воспроизведены, а 6 из них могли быть лучше, чем гораздо более старые и более простые, правильно настроенные исходные данные. В статье также освещается ряд потенциальных проблем в современной исследовательской науке и содержится призыв к совершенствованию научной практики в этой области. ^[11]Подобные проблемы были обнаружены также в рекомендательных системах, учитывающих последовательность. ^[12]

Совместная фильтрация с учетом контекста [ править ]

Многие рекомендательные системы просто игнорируют другую контекстную информацию, существующую вместе с рейтингом пользователя, при предоставлении рекомендаций по предметам. ^[13] Однако из-за повсеместной доступности контекстной информации, такой как время, местоположение, социальная информация и тип устройства, которое использует пользователь, для успешной системы рекомендаций становится как никогда важно предоставлять контекстно-зависимые рекомендации. По словам Чару Аггравала, «контекстно-зависимые рекомендательные системы адаптируют свои рекомендации к дополнительной информации, которая определяет конкретную ситуацию, при которой рекомендации делаются. Эта дополнительная информация называется контекстом». ^[6]

Принимая во внимание контекстную информацию, у нас будет дополнительное измерение к существующей матрице рейтингов пользовательских элементов. Например, предположим, что система музыкальных рекомендаций дает разные рекомендации в зависимости от времени суток. В этом случае у пользователя могут быть разные предпочтения в отношении музыки в разное время суток. Таким образом, вместо использования матрицы «пользователь-элемент» мы можем использовать тензор 3-го порядка (или выше для рассмотрения других контекстов) для представления контекстно-зависимых предпочтений пользователей. ^[14]^[15]^[16]

Чтобы воспользоваться преимуществами совместной фильтрации и, в частности, методов, основанных на соседстве, подходы могут быть расширены от двумерной рейтинговой матрицы до тензора более высокого порядка ^{[ необходима ссылка ]} . Для этого используется подход к поиску пользователей, наиболее похожих / единомышленников на целевого пользователя; можно извлечь и вычислить подобие срезов (например, матрицу элемент-время), соответствующих каждому пользователю. В отличие от контекстно-нечувствительного случая, для которого вычисляется схожесть двух рейтинговых векторов, в контекстно-зависимых подходах схожесть рейтинговых матриц, соответствующих каждому пользователю, вычисляется с использованием коэффициентов Пирсона . ^[6] После того, как будут найдены наиболее единомышленники, их соответствующие рейтинги суммируются для определения набора элементов, которые следует рекомендовать целевому пользователю.

Самый важный недостаток включения контекста в модель рекомендаций - это возможность работать с большим набором данных, который содержит гораздо больше пропущенных значений по сравнению с матрицей рейтинга пользовательских элементов ^{[ необходима ссылка ]} . Следовательно, подобно методам матричной факторизации, методы тензорной факторизации могут использоваться для уменьшения размерности исходных данных перед использованием каких-либо методов, основанных на соседстве ^{[ необходима ссылка ]} .

Приложение в социальной сети [ править ]

В отличие от традиционной модели основных СМИ, в которой есть несколько редакторов, которые устанавливают правила, в социальных сетях с совместной фильтрацией может быть очень большое количество редакторов, а контент улучшается по мере увеличения числа участников. Такие сервисы, как Reddit , YouTube и Last.fm, являются типичными примерами мультимедиа на основе совместной фильтрации. ^[17]

Один из сценариев применения совместной фильтрации - рекомендовать интересную или популярную информацию по мнению сообщества. Как типичный пример, истории появляются на первой странице Reddit, поскольку они «проголосованы» (оценены положительно) сообществом. По мере того как сообщество становится больше и разнообразнее, продвигаемые истории могут лучше отражать средний интерес членов сообщества.

Другим аспектом систем совместной фильтрации является возможность генерировать более персонализированные рекомендации путем анализа информации из прошлой активности конкретного пользователя или истории других пользователей, которые, как считается, имеют схожие вкусы с данным пользователем. Эти ресурсы используются для профилирования пользователей и помогают сайту рекомендовать контент для каждого пользователя. Чем больше конкретный пользователь использует систему, тем точнее становятся рекомендации, поскольку система получает данные для улучшения своей модели этого пользователя.

Проблемы [ править ]

Система совместной фильтрации не обязательно автоматически подбирает контент в соответствии с предпочтениями пользователя. Если платформа не обеспечивает необычно хорошего разнообразия и независимости мнений, одна точка зрения всегда будет преобладать над другой в конкретном сообществе. Как и в сценарии персонализированной рекомендации, введение новых пользователей или новых элементов может вызвать проблему холодного запуска , так как данных по этим новым записям будет недостаточно для правильной работы совместной фильтрации. Чтобы дать соответствующие рекомендации новому пользователю, система должна сначала изучить предпочтения пользователя, проанализировав прошлые голосования или рейтинговые действия. Система совместной фильтрации требует, чтобы значительное количество пользователей оценили новый элемент, прежде чем его можно будет рекомендовать.

Проблемы [ править ]

Редкость данных [ править ]

На практике многие коммерческие рекомендательные системы основаны на больших наборах данных. В результате матрица «пользователь-элемент», используемая для совместной фильтрации, может быть чрезвычайно большой и разреженной, что затрудняет выполнение рекомендаций.

Одной из типичных проблем, вызванных нехваткой данных, является проблема холодного запуска . Поскольку методы совместной фильтрации рекомендуют элементы на основе прошлых предпочтений пользователей, новым пользователям необходимо будет оценить достаточное количество элементов, чтобы система могла точно уловить их предпочтения и, таким образом, предоставить надежные рекомендации.

Точно такая же проблема у новинок. Когда новые элементы добавляются в систему, они должны быть оценены значительным числом пользователей, прежде чем их можно будет рекомендовать пользователям, чьи вкусы аналогичны тем, кто их оценил. Проблема с новым элементом не влияет на рекомендации , основанные на содержании , потому что рекомендация элемента основана на его дискретном наборе описательных качеств, а не на его рейтингах.

Масштабируемость [ править ]

По мере роста числа пользователей и элементов традиционные алгоритмы CF будут страдать от серьезных проблем с масштабируемостью ^{[ необходима цитата ]} . Например, с десятками миллионов клиентов и миллионами элементов алгоритм CF со сложностью уже слишком велик. Кроме того, многие системы должны немедленно реагировать на онлайн-требования и давать рекомендации для всех пользователей, независимо от их покупок и истории рейтингов, что требует более высокой масштабируемости системы CF. Крупные веб-компании, такие как Twitter, используют кластеры машин для масштабирования рекомендаций для миллионов пользователей, при этом большая часть вычислений выполняется на машинах с очень большой памятью. ^[18] $O(M)$ $O(N)$ $n$

Синонимы [ править ]

Синонимы относятся к тенденции нескольких одинаковых или очень похожих элементов иметь разные имена или записи. Большинство рекомендательных систем неспособны обнаружить эту скрытую ассоциацию и поэтому по-разному относятся к этим продуктам.

Например, кажущиеся разными элементами «детский фильм» и «детский фильм» на самом деле относятся к одному и тому же элементу. Действительно, степень вариативности в использовании описательных терминов больше, чем обычно предполагалось. ^{[ необходима цитата ]} Преобладание синонимов снижает эффективность рекомендаций систем CF. Тематическое моделирование (например, техника скрытого распределения Дирихле ) может решить эту проблему, сгруппировав разные слова, принадлежащие одной теме. ^{[ необходима цитата ]}

Серые овцы [ править ]

Серые овцы относятся к пользователям, мнения которых не всегда совпадают или не согласуются с какой-либо группой людей и, следовательно, не получают выгоды от совместной фильтрации. Черная овца - это группа, чьи идиосинкразические вкусы делают рекомендации практически невозможными. Хотя это и является ошибкой рекомендательной системы, неэлектронные рекомендательные системы также имеют большие проблемы в этих случаях, поэтому наличие паршивой овцы - приемлемый отказ. ^{[ оспаривается - обсудить ]}

Атаки шиллинга [ править ]

В системе рекомендаций, где каждый может давать оценки, люди могут давать много положительных оценок своим товарам и отрицательных оценок своим конкурентам. Системам совместной фильтрации часто необходимо вводить меры предосторожности, чтобы препятствовать подобным манипуляциям.

Разнообразие и длинный хвост [ править ]

Ожидается, что совместные фильтры увеличат разнообразие, потому что они помогают нам открывать новые продукты. Однако некоторые алгоритмы могут непреднамеренно сделать обратное. Поскольку совместные фильтры рекомендуют продукты на основе прошлых продаж или рейтингов, они обычно не могут рекомендовать продукты с ограниченными историческими данными. Это может создать для популярных товаров эффект «богатство - обогащение», аналогичный положительным отзывам . Этот уклон в сторону популярности может помешать тому, что в противном случае лучше соответствует потребительскому продукту. В исследовании Wharton подробно описывается этот феномен вместе с несколькими идеями, которые могут способствовать разнообразию и « длинному хвосту ». ^[19] Несколько алгоритмов совместной фильтрации были разработаны для поощрения разнообразия и « длинного хвоста»."рекомендуя новые, неожиданные ^[20] и случайные предметы. ^[21]

Инновации [ править ]

Новые алгоритмы были разработаны для CF в результате приз Netflix .
Межсистемная совместная фильтрация, при которой профили пользователей в нескольких рекомендательных системах объединяются таким образом, чтобы сохранить конфиденциальность.
Надежная совместная фильтрация , при которой рекомендации устойчивы к усилиям манипуляции. Эта область исследований все еще активна и полностью не решена. ^[22]

Вспомогательная информация [ править ]

Матрица «пользователь-элемент» является базовой основой традиционных методов совместной фильтрации и страдает от проблемы разреженности данных (т.е. холодного старта ). Как следствие, за исключением матрицы «пользователь-элемент», исследователи пытаются собрать больше вспомогательной информации, чтобы помочь повысить эффективность рекомендаций и разработать персонализированные рекомендательные системы. ^[23] Обычно существует две популярных вспомогательной информации: информация об атрибутах и информация о взаимодействии. Информация об атрибутах описывает свойства пользователя или элемента. Например, атрибут пользователя может включать общий профиль (например, пол и возраст) и социальные контакты (например, подписчиков или друзей в социальных сетях.); Атрибут предмета означает такие свойства, как категория, бренд или контент. Кроме того, информация о взаимодействии относится к неявным данным, показывающим, как пользователи взаимодействуют с элементом. Широко используемая информация о взаимодействии содержит теги, комментарии или обзоры, историю просмотров и т. Д. Вспомогательная информация играет важную роль во многих аспектах. Явные социальные связи, как надежный представитель доверия или дружбы, всегда используются при вычислении сходства, чтобы найти похожих людей, которые разделяют интересы с целевым пользователем. ^[24]^[25] Связанная с взаимодействием информация - теги - используется в качестве третьего измерения (в дополнение к пользователю и элементу) в расширенной совместной фильтрации для построения трехмерной тензорной структуры для исследования рекомендаций. ^[26]

См. Также [ править ]

Язык разметки профилирования внимания (APML)
Холодный запуск
Совместная модель
Совместная поисковая система
Коллективный разум
Привлечения клиентов
Делегативная демократия , тот же принцип применяется к голосованию, а не к фильтрации
Закладки предприятия
Firefly (веб-сайт) , несуществующий веб-сайт, основанный на совместной фильтрации.
Пузырь с фильтром
Рейтинг страницы
Выявление предпочтений
Психографическая фильтрация
Система рекомендаций
Актуальность (информационный поиск)
Система репутации
Надежная совместная фильтрация
Поиск сходства
Склон один
Социальная прозрачность

Ссылки [ править ]

^ Франческо Риччи, Лиор Рокач и Браха Шапира, Введение в справочник по рекомендательным системам, Справочник по рекомендательным системам, Springer, 2011, стр. 1-35
^ а б Тервин, Лорен ; Хилл, Уилл (2001). «За пределами рекомендательных систем: помогать людям помогать друг другу» (PDF) . Эддисон-Уэсли. п. 6 . Проверено 16 января 2012 года .
^ Комплексный подход к рекомендациям TV и VOD. Архивировано 6 июня 2012 г. на Wayback Machine.
^ Джон С. Бриз, Дэвид Хекерман и Карл Кэди, Эмпирический анализ алгоритмов прогнозирования для совместной фильтрации , 1998 г. Архивировано 19 октября 2013 г. в Wayback Machine
^ Сяоюань Су, Таги М. Хошгофтаар, Обзор методов совместной фильтрации , Архив достижений в области искусственного интеллекта, 2009.
^ a b c Рекомендательные системы - Учебник | Чару С. Аггарвал | Springer . Springer. 2016. ISBN. 9783319296579.
^ Газанфар, Мустансар Али; Прюгель-Беннет, Адам; Сзедмак, Сандор (2012). "Алгоритмы системы Kernel-Mapping Recommender". Информационные науки . 208 : 81–104. CiteSeerX 10.1.1.701.7729 . DOI : 10.1016 / j.ins.2012.04.012 .
^ Das, Abhinandan S .; Датар, Маюр; Гарг, Ашутош; Раджарам, Шьям (2007). «Персонализация новостей Google». Материалы 16-й международной конференции по всемирной паутине - WWW '07 . п. 271. DOI : 10,1145 / 1242572,1242610 . ISBN 9781595936547. S2CID 207163129 .
^ Он, Xiangnan; Ляо, Лизи; Чжан, Ханван; Не, Лицян; Ху, Ся; Чуа, Тат-Сенг (2017). «Совместная нейронная фильтрация» . Материалы 26-й Международной конференции по всемирной паутине . Руководящий комитет международных конференций в Интернете: 173–182. arXiv : 1708.05031 . DOI : 10.1145 / 3038912.3052569 . ISBN 9781450349130. S2CID 13907106 . Дата обращения 16 октября 2019 .
^ Лян, Давен; Кришнан, Рахул Г .; Хоффман, Мэтью Д.; Джебара, Тони (2018). "Вариационные автоэнкодеры для совместной фильтрации" . Материалы конференции World Wide Web 2018 . Руководящий комитет международных конференций в Интернете: 689–698. arXiv : 1802.05814 . DOI : 10.1145 / 3178876.3186150 . ISBN 9781450356398.
^ Феррари Дакрема, Маурицио; Кремонези, Паоло; Яннах, Дитмар (2019). «Действительно ли мы делаем большой прогресс? Тревожный анализ недавних подходов к нейронным рекомендациям» . Материалы 13-й конференции ACM по рекомендательным системам . ACM: 101–109. arXiv : 1907.06902 . DOI : 10.1145 / 3298689.3347058 . hdl : 11311/1108996 . ISBN 9781450362436. S2CID 196831663 . Дата обращения 16 октября 2019 .
^ Людвиг, Мальте; Мауро, Ноэми; Латифи, Сара; Яннах, Дитмар (2019). «Сравнение производительности нейронных и ненейронных подходов к рекомендации на основе сеанса» . Материалы 13-й конференции ACM по рекомендательным системам . ACM: 462–466. DOI : 10.1145 / 3298689.3347041 . ISBN 9781450362436. Дата обращения 16 октября 2019 .
^ Адомавичюс, Гедиминас; Тужилин, Александр (1 января 2015). Риччи, Франческо; Рокач, Лиор; Шапира, Браха (ред.). Справочник рекомендательных систем . Springer США. С. 191–226. DOI : 10.1007 / 978-1-4899-7637-6_6 . ISBN 9781489976369.
^ Би, Сюань; Ку, Энни; Шен, Сяотун (2018). «Многослойная тензорная факторизация с приложениями к рекомендательным системам» . Анналы статистики . 46 (6B): 3303–3333. arXiv : 1711.01598 . DOI : 10.1214 / 17-AOS1659 . S2CID 13677707 .
^ Чжан, Яньцин; Би, Сюань; Тан, Няньшэн; Ку, Энни (2020). «Динамические тензорные рекомендательные системы». arXiv : 2003.05568v1 [ stat.ME ].
^ Би, Сюань; Тан, Сивэй; Юань, Юбай; Чжан, Яньцин; Цюй, Энни (2021). «Тензоры в статистике» . Ежегодный обзор статистики и ее применение . 8 (1): аннурьев. Bibcode : 2021AnRSA ... 842720B . DOI : 10.1146 / annurev-statistics-042720-020816 .
↑ Collaborative Filtering: Lifeblood of the Social Web. Архивировано 22 апреля 2012 г. в Wayback Machine.
^ Pankaj Gupta, Ashish Гоел, Джимми Лин, Aneesh Шарма, Дон Ван и Реза Заде Bosagh WTF: Система , которые в последующей в Twitter , Труды 22й международной конференции по World Wide Web
^ Фледер, Даниэль; Хосанагар, Картик (май 2009 г.). «Следующий подъем или падение культуры блокбастеров: влияние рекомендательных систем на разнообразие продаж». Наука управления . 55 (5): 697–712. DOI : 10.1287 / mnsc.1080.0974 . SSRN 955984 .
^ Адамопулос, Панайотис; Тужилин, Александр (январь 2015). «О неожиданностях в рекомендательных системах: или как лучше ожидать неожиданного». ACM-транзакции по интеллектуальным системам и технологиям . 5 (4): 1–32. DOI : 10.1145 / 2559952 . S2CID 15282396 .
^ Адамопулос Панайотис (октябрь 2013 г. ). Помимо точности прогнозирования рейтингов: о новых перспективах в рекомендательных системах . Материалы 7-й конференции ACM по рекомендательным системам . С. 459–462. DOI : 10.1145 / 2507157.2508073 . ISBN 9781450324090. S2CID 1526264 .
^ Мехта, Бхаскар; Хофманн, Томас; Нейдл, Вольфганг (19 октября 2007 г.). Материалы конференции ACM 2007 г. по рекомендательным системам - Rec Sys '07 . Portal.acm.org. п. 49. CiteSeerX 10.1.1.695.1712 . DOI : 10.1145 / 1297231.1297240 . ISBN 9781595937308. S2CID 5640125 .
^ Ши, Юэ; Ларсон, Марта; Hanjalic, Алан (2014). «Совместная фильтрация за пределами матрицы пользовательских элементов: обзор современного состояния и будущих проблем». ACM Computing Surveys . 47 : 1–45. DOI : 10.1145 / 2556270 . S2CID 5493334 .
^ Масса, Паоло; Авесани, Паоло (2009). Вычисления с доверием общества . Лондон: Спрингер. С. 259–285.
^ Гро Георг; Эмиг Кристиан. Рекомендации в областях, связанных со вкусом: совместная фильтрация или социальная фильтрация . Материалы международной конференции ACM 2007 г. «Поддержка групповой работы». С. 127–136. CiteSeerX 10.1.1.165.3679 .
^ Симеонидис, Панайотис; Нанопулос, Александрос; Манолопулос, Яннис (2008). Рекомендации по тегам, основанные на уменьшении тензорной размерности . Материалы конференции ACM 2008 г. по рекомендательным системам . С. 43–50. CiteSeerX 10.1.1.217.1437 . DOI : 10.1145 / 1454008.1454017 . ISBN 9781605580937. S2CID 17911131 .

Внешние ссылки [ править ]

За пределами рекомендательных систем: помогая людям помогать друг другу , стр. 12, 2001 г.
Рекомендательные системы. Прем Мелвилл и Викас Синдвани. В Энциклопедии машинного обучения, Клод Саммут и Джеффри Уэбб (редакторы), Springer, 2010 г.
Рекомендательные системы в промышленных условиях - докторская диссертация (2012 г.), включающая всесторонний обзор многих совместных рекомендательных систем.
К следующему поколению рекомендательных систем: обзор современного состояния и возможных расширений ^{[ мертвая ссылка ]} . Адомавичюс, Г., Тужилин, А. Транзакции IEEE по разработке знаний и данных 06.2005
Оценка рекомендательных систем совместной фильтрации ( DOI : 10.1145 / 963770.963772 )
Научные статьи GroupLens .
Совместная фильтрация с усилением содержимого для улучшения рекомендаций. Прем Мелвилл, Раймонд Дж. Муни и Рамадасс Нагараджан. Материалы восемнадцатой национальной конференции по искусственному интеллекту (AAAI-2002), стр. 187–192, Эдмонтон, Канада, июль 2002 г.
Коллекция прошлых и настоящих проектов "фильтрации информации" (включая совместную фильтрацию) в MIT Media Lab.
Eigentaste: алгоритм совместной фильтрации с постоянным временем. Кен Голдберг, Тереза Родер, Дхрув Гупта и Крис Перкинс. Информационный поиск, 4 (2), 133-151. Июль 2001 г.
Обзор методов совместной фильтрации Су, Сяоюань и Хошгортаар, Таги. M
Персонализация Google Новостей: масштабируемая совместная фильтрация в Интернете Абхинандан Дас, Маюр Датар, Ашутош Гарг и Шьям Раджарам. Международная конференция по всемирной паутине, Труды 16-й международной конференции по всемирной паутине
Фактор соседей: масштабируемая и точная совместная фильтрация Иегуда Корен, Транзакции при обнаружении знаний из данных (TKDD) (2009)
Прогнозирование рейтинга с использованием совместной фильтрации
Рекомендательные системы
Совместная фильтрация Беркли

[handbook-1] Франческо Риччи, Лиор Рокач и Браха Шапира, Введение в справочник по рекомендательным системам, Справочник по рекомендательным системам, Springer, 2011, стр. 1-35

[recommender-2] а б Тервин, Лорен ; Хилл, Уилл (2001). «За пределами рекомендательных систем: помогать людям помогать друг другу» (PDF) . Эддисон-Уэсли. п. 6 . Проверено 16 января 2012 года .

[3] Комплексный подход к рекомендациям TV и VOD. Архивировано 6 июня 2012 г. на Wayback Machine.

[Breese1999-4] Джон С. Бриз, Дэвид Хекерман и Карл Кэди, Эмпирический анализ алгоритмов прогнозирования для совместной фильтрации , 1998 г. Архивировано 19 октября 2013 г. в Wayback Machine

[Suetal2009-5] Сяоюань Су, Таги М. Хошгофтаар, Обзор методов совместной фильтрации , Архив достижений в области искусственного интеллекта, 2009.

[:0-6] Рекомендательные системы - Учебник | Чару С. Аггарвал | Springer . Springer. 2016. ISBN. 9783319296579.

[7] Газанфар, Мустансар Али; Прюгель-Беннет, Адам; Сзедмак, Сандор (2012). "Алгоритмы системы Kernel-Mapping Recommender". Информационные науки . 208 : 81–104. CiteSeerX 10.1.1.701.7729 . DOI : 10.1016 / j.ins.2012.04.012 .

[8] Das, Abhinandan S .; Датар, Маюр; Гарг, Ашутош; Раджарам, Шьям (2007). «Персонализация новостей Google». Материалы 16-й международной конференции по всемирной паутине - WWW '07 . п. 271. DOI : 10,1145 / 1242572,1242610 . ISBN 9781595936547. S2CID 207163129 .

[9] Он, Xiangnan; Ляо, Лизи; Чжан, Ханван; Не, Лицян; Ху, Ся; Чуа, Тат-Сенг (2017). «Совместная нейронная фильтрация» . Материалы 26-й Международной конференции по всемирной паутине . Руководящий комитет международных конференций в Интернете: 173–182. arXiv : 1708.05031 . DOI : 10.1145 / 3038912.3052569 . ISBN 9781450349130. S2CID 13907106 . Дата обращения 16 октября 2019 .

[10] Лян, Давен; Кришнан, Рахул Г .; Хоффман, Мэтью Д.; Джебара, Тони (2018). "Вариационные автоэнкодеры для совместной фильтрации" . Материалы конференции World Wide Web 2018 . Руководящий комитет международных конференций в Интернете: 689–698. arXiv : 1802.05814 . DOI : 10.1145 / 3178876.3186150 . ISBN 9781450356398.

[11] Феррари Дакрема, Маурицио; Кремонези, Паоло; Яннах, Дитмар (2019). «Действительно ли мы делаем большой прогресс? Тревожный анализ недавних подходов к нейронным рекомендациям» . Материалы 13-й конференции ACM по рекомендательным системам . ACM: 101–109. arXiv : 1907.06902 . DOI : 10.1145 / 3298689.3347058 . hdl : 11311/1108996 . ISBN 9781450362436. S2CID 196831663 . Дата обращения 16 октября 2019 .

[12] Людвиг, Мальте; Мауро, Ноэми; Латифи, Сара; Яннах, Дитмар (2019). «Сравнение производительности нейронных и ненейронных подходов к рекомендации на основе сеанса» . Материалы 13-й конференции ACM по рекомендательным системам . ACM: 462–466. DOI : 10.1145 / 3298689.3347041 . ISBN 9781450362436. Дата обращения 16 октября 2019 .

[13] Адомавичюс, Гедиминас; Тужилин, Александр (1 января 2015). Риччи, Франческо; Рокач, Лиор; Шапира, Браха (ред.). Справочник рекомендательных систем . Springer США. С. 191–226. DOI : 10.1007 / 978-1-4899-7637-6_6 . ISBN 9781489976369.

[14] Би, Сюань; Ку, Энни; Шен, Сяотун (2018). «Многослойная тензорная факторизация с приложениями к рекомендательным системам» . Анналы статистики . 46 (6B): 3303–3333. arXiv : 1711.01598 . DOI : 10.1214 / 17-AOS1659 . S2CID 13677707 .

[15] Чжан, Яньцин; Би, Сюань; Тан, Няньшэн; Ку, Энни (2020). «Динамические тензорные рекомендательные системы». arXiv : 2003.05568v1 [ stat.ME ].

[16] Би, Сюань; Тан, Сивэй; Юань, Юбай; Чжан, Яньцин; Цюй, Энни (2021). «Тензоры в статистике» . Ежегодный обзор статистики и ее применение . 8 (1): аннурьев. Bibcode : 2021AnRSA ... 842720B . DOI : 10.1146 / annurev-statistics-042720-020816 .

[17] Collaborative Filtering: Lifeblood of the Social Web. Архивировано 22 апреля 2012 г. в Wayback Machine.

[twitterwtf-18] Pankaj Gupta, Ashish Гоел, Джимми Лин, Aneesh Шарма, Дон Ван и Реза Заде Bosagh WTF: Система , которые в последующей в Twitter , Труды 22й международной конференции по World Wide Web

[19] Фледер, Даниэль; Хосанагар, Картик (май 2009 г.). «Следующий подъем или падение культуры блокбастеров: влияние рекомендательных систем на разнообразие продаж». Наука управления . 55 (5): 697–712. DOI : 10.1287 / mnsc.1080.0974 . SSRN 955984 .

[20] Адамопулос, Панайотис; Тужилин, Александр (январь 2015). «О неожиданностях в рекомендательных системах: или как лучше ожидать неожиданного». ACM-транзакции по интеллектуальным системам и технологиям . 5 (4): 1–32. DOI : 10.1145 / 2559952 . S2CID 15282396 .

[21] Адамопулос Панайотис (октябрь 2013 г. ). Помимо точности прогнозирования рейтингов: о новых перспективах в рекомендательных системах . Материалы 7-й конференции ACM по рекомендательным системам . С. 459–462. DOI : 10.1145 / 2507157.2508073 . ISBN 9781450324090. S2CID 1526264 .

[22] Мехта, Бхаскар; Хофманн, Томас; Нейдл, Вольфганг (19 октября 2007 г.). Материалы конференции ACM 2007 г. по рекомендательным системам - Rec Sys '07 . Portal.acm.org. п. 49. CiteSeerX 10.1.1.695.1712 . DOI : 10.1145 / 1297231.1297240 . ISBN 9781595937308. S2CID 5640125 .

[23] Ши, Юэ; Ларсон, Марта; Hanjalic, Алан (2014). «Совместная фильтрация за пределами матрицы пользовательских элементов: обзор современного состояния и будущих проблем». ACM Computing Surveys . 47 : 1–45. DOI : 10.1145 / 2556270 . S2CID 5493334 .

[24] Масса, Паоло; Авесани, Паоло (2009). Вычисления с доверием общества . Лондон: Спрингер. С. 259–285.

[25] Гро Георг; Эмиг Кристиан. Рекомендации в областях, связанных со вкусом: совместная фильтрация или социальная фильтрация . Материалы международной конференции ACM 2007 г. «Поддержка групповой работы». С. 127–136. CiteSeerX 10.1.1.165.3679 .

[26] Симеонидис, Панайотис; Нанопулос, Александрос; Манолопулос, Яннис (2008). Рекомендации по тегам, основанные на уменьшении тензорной размерности . Материалы конференции ACM 2008 г. по рекомендательным системам . С. 43–50. CiteSeerX 10.1.1.217.1437 . DOI : 10.1145 / 1454008.1454017 . ISBN 9781605580937. S2CID 17911131 .

[1]