Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Факторизация матрицы - это класс алгоритмов совместной фильтрации , используемых в рекомендательных системах . Алгоритмы матричной факторизации работают путем разложения матрицы взаимодействия пользователя с элементом на произведение двух прямоугольных матриц меньшей размерности. [1] Это семейство методов стало широко известно во время конкурса Netflix за свою эффективность, о чем сообщил Саймон Фанк в своем блоге 2006 года [2], где он поделился своими выводами с исследовательским сообществом. Результаты прогнозирования можно улучшить, присвоив скрытым факторам различные веса регуляризации в зависимости от популярности элементов и активности пользователей. [3]

Методы [ править ]

Идея матричной факторизации состоит в том, чтобы представить пользователей и элементы в скрытом пространстве более низкой размерности. Со времени первой работы Функ в 2006 году было предложено множество подходов к матричной факторизации для рекомендательных систем. Некоторые из наиболее часто используемых и простых из них перечислены в следующих разделах.

Funk MF [ править ]

Первоначальный алгоритм, предложенный Саймоном Функом в его сообщении в блоге [2], факторизовал матрицу рейтинга пользователь-элемент как произведение двух матриц меньшей размерности, в первой из которых есть строка для каждого пользователя, а во второй - столбец для каждого элемента. Строка или столбец, связанные с конкретным пользователем или элементом, называются скрытыми факторами . [4] Обратите внимание, что в Funk MF не применяется декомпозиция по сингулярным значениям , это SVD-подобная модель машинного обучения. [2] Прогнозируемые рейтинги могут быть вычислены как , где - матрица рейтингов пользовательских элементов, содержащая скрытые факторы пользователя и скрытые факторы элемента.

В частности, прогнозируемая оценка, которую пользователь u поставит элементу i , вычисляется как:

Настроить выразительную силу модели можно, изменив количество скрытых факторов. Было продемонстрировано [5], что матричная факторизация с одним скрытым фактором эквивалентна наиболее популярному или популярному рекомендателю (например, рекомендует элементы с наибольшим взаимодействием без какой-либо персонализации). Увеличение количества скрытых факторов улучшит персонализацию и, следовательно, качество рекомендаций, пока количество факторов не станет слишком большим, после чего модель начнет переобучаться, и качество рекомендаций снизится. Распространенная стратегия, позволяющая избежать переобучения, - это добавить к целевой функции условия регуляризации . [6] [7]Funk MF был разработан как задача прогнозирования рейтингов , поэтому он использует явные числовые рейтинги в качестве взаимодействий между пользователем и элементом.

Учитывая все обстоятельства, Funk MF минимизирует следующую целевую функцию:

Где определяется как норма фробениуса, тогда как другие нормы могут быть либо фробениусом, либо другой нормой в зависимости от конкретной рекомендующей проблемы. [8]

SVD ++ [ править ]

Хотя Funk MF может обеспечить очень хорошее качество рекомендаций, его способность использовать только явные числовые рейтинги в качестве взаимодействий между пользователями и элементами представляет собой ограничение. Современные рекомендательные системы должны использовать все доступные взаимодействия, как явные (например, числовые рейтинги), так и неявные (например, лайки, покупки, пропущенные, добавленные в закладки). С этой целью SVD ++ также был разработан с учетом неявных взаимодействий. [9] [10] По сравнению с Funk MF, SVD ++ также учитывает предвзятость пользователя и элемента.

Прогнозируемая оценка, которую пользователь u поставит элементу i , вычисляется как:

Однако SVD ++ имеет некоторые недостатки, главный недостаток заключается в том, что этот метод не основан на модели. Это означает, что если добавлен новый пользователь, алгоритм не сможет его моделировать, если не будет переобучена вся модель. Несмотря на то, что система, возможно, собрала некоторые взаимодействия для этого нового пользователя, ее скрытые факторы недоступны, и поэтому рекомендации не могут быть рассчитаны. Это пример проблемы с холодным запуском , то есть рекомендатель не может эффективно работать с новыми пользователями или предметами, и для устранения этого недостатка необходимо разработать специальные стратегии. [11]

Возможным способом решения этой проблемы холодного запуска является изменение SVD ++, чтобы он стал алгоритмом на основе модели , что позволяет легко управлять новыми элементами и новыми пользователями.

Как упоминалось ранее в SVD ++, у нас нет скрытых факторов новых пользователей, поэтому необходимо представить их по-другому. Скрытые факторы пользователя представляют предпочтение этого пользователя в отношении латентных факторов соответствующего элемента, поэтому латентные факторы пользователя могут быть оценены с помощью прошлых взаимодействий с пользователем. Если система способна собрать некоторые взаимодействия для нового пользователя, можно оценить его скрытые факторы. Обратите внимание, что это не полностью решает проблему холодного старта , поскольку рекомендатель по-прежнему требует некоторых надежных взаимодействий для новых пользователей, но, по крайней мере, нет необходимости каждый раз пересчитывать всю модель. Было продемонстрировано, что эта формулировка почти эквивалентна модели SLIM [12], которая представляет собой элемент-элемент рекомендатель на основе модели.

При такой формулировке эквивалентный рекомендательный элемент-элемент был бы таким . Следовательно, матрица подобия симметрична.

Асимметричный СВД [ править ]

Асимметричный SVD направлен на объединение преимуществ SVD ++, будучи алгоритмом на основе модели, что позволяет рассматривать новых пользователей с несколькими рейтингами без необходимости переобучать всю модель. В отличие от SVD на основе модели здесь матрица скрытых факторов пользователя H заменена на Q, которая изучает предпочтения пользователя в зависимости от их оценок. [13]

Прогнозируемая оценка, которую пользователь u поставит элементу i , вычисляется как:

При такой формулировке эквивалентный рекомендательный элемент-элемент был бы таким . Поскольку матрицы Q и W различны, матрица подобия асимметрична, отсюда и название модели.

Групповой SVD [ править ]

Групповой SVD может быть эффективным решением проблемы холодного запуска во многих сценариях. [6] Он группирует пользователей и элементы на основе информации о зависимостях и сходства характеристик. Затем, когда появляется новый пользователь или элемент, мы можем присвоить ему метку группы и аппроксимировать его латентный фактор групповыми эффектами (соответствующей группы). Следовательно, хотя рейтинги, связанные с новым пользователем или элементом, не обязательно доступны, групповые эффекты обеспечивают немедленные и эффективные прогнозы.

Прогнозируемая оценка, которую пользователь u поставит элементу i , вычисляется как:

Здесь и представляют собой метку группы пользователя u и элемента i , соответственно, которые идентичны для всех членов одной группы. А и - матрицы групповых эффектов. Например, для нового пользователя, чей скрытый фактор недоступен, мы можем, по крайней мере, определить его групповой ярлык и спрогнозировать его рейтинги как:

Это дает хорошее приближение к ненаблюдаемым рейтингам.

Гибридный MF [ править ]

В последние годы было разработано множество других моделей матричной факторизации для использования постоянно увеличивающегося количества и разнообразия доступных данных о взаимодействии и сценариев использования. Алгоритмы гибридной матричной факторизации способны объединять явные и неявные взаимодействия [14] или как контент, так и совместные данные [15] [16] [17]

Глубокое обучение MF [ править ]

В последние годы был предложен ряд нейронных методов и методов глубокого обучения, некоторые из которых обобщают традиционные алгоритмы матричной факторизации с помощью нелинейной нейронной архитектуры. [18] Хотя глубокое обучение применялось во многих различных сценариях: с учетом контекста, с учетом последовательности, социальных тегов и т. Д., Его реальная эффективность при использовании в простой совместной фильтрациисценарий был поставлен под сомнение. Систематический анализ публикаций, применяющих глубокое обучение или нейронные методы для решения топ-k проблем рекомендаций, опубликованных на ведущих конференциях (SIGIR, KDD, WWW, RecSys, IJCAI), показал, что в среднем менее 40% статей воспроизводимы, причем всего 14% на некоторых конференциях. В целом исследования выявили 26 статей, только 12 из них могли быть воспроизведены, а 11 из них могли превзойти более старые и более простые, правильно настроенные исходные данные. В статьях также освещается ряд потенциальных проблем в современной исследовательской науке и содержится призыв к совершенствованию научной практики в этой области. [19] Подобные проблемы были замечены и в рекомендательных системах, учитывающих последовательность. [20]

См. Также [ править ]

  • Совместная фильтрация
  • Рекомендательная система

Ссылки [ править ]

  1. ^ Корен, Иегуда; Белл, Роберт; Волинский, Крис (август 2009 г.). "Методы матричной факторизации рекомендательных систем". Компьютер . 42 (8): 30–37. CiteSeerX  10.1.1.147.8295 . DOI : 10,1109 / MC.2009.263 . S2CID  58370896 .
  2. ^ a b c Функ, Саймон. «Обновление Netflix: попробуйте дома» .
  3. ^ ChenHung-Hsuan; ChenPu (09.01.2019). «Дифференциация весов регуляризации - простой механизм для облегчения холодного старта в рекомендательных системах». Транзакции ACM при обнаружении знаний из данных (TKDD) . 13 : 1–22. DOI : 10.1145 / 3285954 . S2CID 59337456 . 
  4. ^ Агарвал, Дипак; Чен, Би-Чунг (28 июня 2009 г.). «Модели латентных факторов на основе регрессии». Материалы 15-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных - KDD '09 . ACM. С. 19–28. DOI : 10.1145 / 1557019.1557029 . ISBN 9781605584959. S2CID  17484284 .
  5. ^ Яннах, Дитмар; Лерче, Лукас; Гедикли, Фатих; Боннин, Джеффрей (2013). Что рекомендуют рекомендатели - анализ влияния на точность, популярность и разнообразие продаж . Пользовательское моделирование, адаптация и персонализация . Конспект лекций по информатике. 7899 . Springer Berlin Heidelberg. С. 25–37. CiteSeerX 10.1.1.465.96 . DOI : 10.1007 / 978-3-642-38844-6_3 . ISBN  978-3-642-38843-9.
  6. ^ а б Би, Сюань; Ку, Энни; Ван, Цзюньхуэй; Шен, Сяотун (2017). «Групповая рекомендательная система» . Журнал Американской статистической ассоциации . 112 (519): 1344–1353. DOI : 10.1080 / 01621459.2016.1219261 . S2CID 125187672 . 
  7. ^ Чжу, Юньчжан; Шэнь, Сяотун; Е, Чанцин (2016). «Персонализированное прогнозирование и поиск разреженности в моделях скрытых факторов» . Журнал Американской статистической ассоциации . 111 (513): 241–252. DOI : 10.1080 / 01621459.2016.1219261 . S2CID 125187672 . 
  8. ^ Paterek, Аркадиуш (2007). «Улучшение регуляризованного разложения по сингулярным значениям для совместной фильтрации» (PDF) . Материалы Кубка и Мастерской KDD .
  9. ^ Цао, Цзянь; Ху, Хэнкуй; Луо, Тианян; Ван, Цзя; Хуанг, май; Ван, Карл; Ву, Чжунхай; Чжан, Син (2015). Распределенный дизайн и реализация алгоритма SVD ++ для персонализированной рекомендательной системы электронной коммерции . Коммуникации в компьютерных и информационных науках. 572 . Springer Singapore. С. 30–44. DOI : 10.1007 / 978-981-10-0421-6_4 . ISBN 978-981-10-0420-9.
  10. ^ Цзя, Яньчэн (сентябрь 2014 г.). «Предпочтение брендов пользователей на основе SVD ++ в рекомендательных системах». 2014 IEEE Workshop on Advanced Research and Technology in Industry Applications (WARTIA) . IEEE. С. 1175–1178. DOI : 10.1109 / wartia.2014.6976489 . ISBN 978-1-4799-6989-0. S2CID  742206 . Отсутствует или пусто |title=( справка )
  11. ^ Клювер, Дэниел; Констан, Джозеф А. (6 октября 2014 г.). «Оценка рекомендательного поведения для новых пользователей». Материалы 8-й конференции ACM по рекомендательным системам - Rec Sys '14 . ACM. С. 121–128. DOI : 10.1145 / 2645710.2645742 . ISBN 9781450326681. S2CID  18509558 .
  12. ^ Чжэн, Юн; Мобашер, Бамшад; Берк, Робин (6 октября 2014 г.). «ЦСЛИМ». CSLIM: контекстные алгоритмы рекомендаций SLIM . ACM. С. 301–304. DOI : 10.1145 / 2645710.2645756 . ISBN 9781450326681. S2CID  15931532 .
  13. ^ Пу, Ли; Фальтингс, Бой (12 октября 2013 г.). «Понимание и улучшение реляционной матричной факторизации в рекомендательных системах» . Материалы 7-й конференции ACM по рекомендательным системам - Rec Sys '13 . ACM. С. 41–48. DOI : 10.1145 / 2507157.2507178 . ISBN 9781450324090. S2CID  14106198 .
  14. ^ Чжао, Чанвэй; Сунь, Сухуань; Хань, Линьцянь; Пэн, Цинке (2016). «Гибридная матричная факторизация рекомендательных систем в социальных сетях» . Мир нейронной сети . 26 (6): 559–569. DOI : 10.14311 / NNW.2016.26.032 .
  15. ^ Чжоу, Тинхуэй; Шан, ханьхуай; Банерджи, Ариндам; Сапиро, Гильермо (26 апреля 2012 г.). Ядро вероятностная матричная факторизация: использование графиков и дополнительной информации . Материалы Международной конференции SIAM 2012 по интеллектуальному анализу данных . Общество промышленной и прикладной математики. С. 403–414. DOI : 10.1137 / 1.9781611972825.35 . ISBN 978-1-61197-232-0.
  16. ^ Адамс, Райан Прескотт; Даль, Джордж Э .; Мюррей, Иэн (25 марта 2010 г.). "Включение дополнительной информации в вероятностную матричную факторизацию с гауссовскими процессами 1003.4944". arXiv : 1003.4944 [ stat.ML ].
  17. ^ Фанг, Йи; Си, Луо (27 октября 2011 г.). «Матричная кофакторизация для рекомендаций с богатой дополнительной информацией и неявной обратной связью». Труды 2-го Международного семинара по неоднородности и слиянию информации в рекомендательных системах - Het Rec '11 . ACM. С. 65–69. DOI : 10.1145 / 2039320.2039330 . ISBN 9781450310277. S2CID  13850687 .
  18. ^ Он, Xiangnan; Ляо, Лизи; Чжан, Ханван; Не, Лицян; Ху, Ся; Чуа, Тат-Сенг (2017). «Совместная нейронная фильтрация» . Материалы 26-й Международной конференции по всемирной паутине . Руководящий комитет международных конференций в Интернете: 173–182. arXiv : 1708.05031 . DOI : 10.1145 / 3038912.3052569 . ISBN 9781450349130. S2CID  13907106 . Дата обращения 16 октября 2019 .
  19. ^ Рендл, Штеффен; Кричене, Валид; Чжан, Ли; Андерсон, Джон (22 сентября 2020 г.). «Нейронная совместная фильтрация против матричной факторизации снова» . Четырнадцатая конференция ACM по рекомендательным системам : 240–248. DOI : 10.1145 / 3383313.3412488 .
  20. ^ Людвиг, Мальте; Мауро, Ноэми; Латифи, Сара; Яннах, Дитмар (2019). «Сравнение производительности нейронных и ненейронных подходов к рекомендации на основе сеанса» . Материалы 13-й конференции ACM по рекомендательным системам . ACM: 462–466. DOI : 10.1145 / 3298689.3347041 . ISBN 9781450362436. Дата обращения 16 октября 2019 .