Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В веб - аналитики , на сессии , или визит является единицей измерения действия пользователя , принятых в течение определенного периода времени или в отношении выполнения задачи. Сеансы также используются в оперативной аналитике и предоставлении пользовательских рекомендаций . Для определения сеанса используются два основных метода: ориентированные на время подходы, основанные на непрерывности действий пользователя, и подходы на основе навигации, основанные на непрерывности в цепочке запрашиваемых страниц.

Определение [ править ]

Определение «сеанса» варьируется, особенно применительно к поисковым системам . [1] Обычно под сеансом понимается «последовательность запросов, сделанных одним конечным пользователем во время посещения определенного сайта». [2] В контексте поисковых систем «сеансы» и «сеансы запросов» имеют как минимум два определения. [1] Сеансом или сеансом запросов могут быть все запросы, сделанные пользователем в определенный период времени [3], или это также может быть серия запросов или переходов с согласованной основной потребностью пользователя. [4] [5]

Использует [ редактировать ]

Сеансы на пользователя могут использоваться как измерение использования веб-сайта. [6] [7] Другие показатели, используемые в исследованиях и прикладной веб-аналитике, включают продолжительность сеанса, [8] и действия пользователя за сеанс. [9] Продолжительность сеанса рассматривается как более точная альтернатива измерению просмотров страниц . [10]

Реконструированные сеансы также использовались для измерения общего пользовательского ввода, в том числе для измерения количества рабочих часов, затраченных на создание Википедии . [11] Сеансы также используются для оперативной аналитики, анонимизации данных , выявления сетевых аномалий и создания синтетической рабочей нагрузки для тестирования серверов с искусственным трафиком. [12] [13]

Реконструкция сеанса [ править ]

иллюстрация различных критериев, используемых разными подходами к реконструкции сеанса.

Для использования сеансов в веб-аналитике важна возможность их идентифицировать. Это известно как «реконструкция сеанса». Подходы к реконструкции сеанса можно разделить на две основные категории: ориентированные на время и ориентированные на навигацию. [14]

Ориентированные на время подходы [ править ]

Ориентированные на время подходы к реконструкции сеанса ищут установленный период бездействия пользователя, обычно называемый «порогом бездействия». По истечении этого периода бездействия предполагается, что пользователь покинул сайт или полностью прекратил использование браузера, и сеанс завершается. Дальнейшие запросы от того же пользователя считаются вторым сеансом. Обычное значение порога бездействия составляет 30 минут и иногда считается отраслевым стандартом. [15] [16] Некоторые утверждали, что 30-минутный порог вызывает артефакты вокруг естественно длинных сессий, и экспериментировали с другими пороговыми значениями. [17] [18] Другие просто заявляют: «Временной порог не эффективен при идентификации [сеансов]». [19]

Одна из предложенных альтернатив - использование пороговых значений для конкретных пользователей, а не единого глобального порогового значения для всего набора данных. [20] [21] Это связано с предположением, что пороговые значения соответствуют бимодальному распределению , и не подходит для наборов данных, охватывающих длительный период времени. [17]

Подходы, ориентированные на навигацию [ править ]

Подходы, ориентированные на навигацию, используют структуру веб-сайтов - в частности, наличие гиперссылок и тенденцию пользователей переходить между страницами на одном и том же веб-сайте, нажимая на них, а не вводя полный URL-адрес в своем браузере. [14] Один из способов идентификации сеансов, глядя на эти данные, - это построить карту веб-сайта: если первая страница пользователя может быть идентифицирована, «сеанс» действий длится до тех пор, пока они не попадут на страницу, к которой нельзя получить доступ из любого ранее посещенных страниц. При этом учитывается обратное отслеживание, когда пользователь повторяет свои шаги перед открытием новой страницы. [22] Более простой подход, который не принимает во внимание обратное отслеживание, состоит в том, чтобы просто потребовать, чтобы HTTP-референткаждого запроса должна быть страница, которая уже находится в сеансе. Если это не так, создается новый сеанс. [23] Этот класс эвристики «показывает очень низкую производительность» на веб-сайтах, содержащих наборы фреймов . [24]

Ссылки [ править ]

  1. ^ а б Гайо-Авелло 2009 , стр. 1824 г.
  2. ^ Arlitt 2000 , стр. 2.
  3. ^ Донато 2010 , стр. 324.
  4. ^ Гайо-Avello 2009 , стр. 1825 г.
  5. Перейти ↑ Lam 2007 , p. 147.
  6. ^ Weischdel 2006 , стр. 464.
  7. ^ Catledge 1995 , стр. 5.
  8. ^ Янсен 2006 , стр. 10.
  9. ^ Янсен 2000 , стр. 12.
  10. ^ Khoo 2008 , стр. 377.
  11. ^ Гейгер 2014 , стр. 1.
  12. ^ Meiss 2009 , стр. 177.
  13. ^ Arlitt 2000 , стр. 8.
  14. ^ a b Spiliopoulou 2003 , стр. 176.
  15. ^ Ортега 2010 , стр. 332.
  16. ^ Eickhoff 2014 , стр. 3.
  17. ^ a b Mehrzadi 2012 , стр. 3.
  18. ^ He 2002 , стр. 733.
  19. ^ Джонс 2008 , стр. 2.
  20. ^ Мюррей 2006 , стр. 3.
  21. ^ Mehrzadi 2012 , стр. 1.
  22. Перейти ↑ Cooley 1999 , p. 19.
  23. Перейти ↑ Cooley 1999 , p. 23.
  24. ^ Берендт 2003 , стр. 179.

Библиография [ править ]

  • Арлит, Мартин (2000). «Описание сеансов веб-пользователей» (PDF) . Обзор оценки эффективности SIGMETRICS . 28 (2): 50–63. DOI : 10.1145 / 362883.362920 .CS1 maint: ref=harv (link)
  • Берендт, Беттина; Мобашер, Бамшад; Накагава, Мики; Спилиопулу, Майра (2003). «Влияние структуры сайта и пользовательской среды на реконструкцию сеанса при анализе использования Интернета» (PDF) . WEBKDD 2002 - Анализ веб-данных для выявления шаблонов использования и профилей . WEBKDD. Springer. DOI : 10.1007 / 978-3-540-39663-5_10 . ISBN 978-3-540-39663-5.CS1 maint: ref=harv (link)
  • Catledge, L .; Питков, Дж. (1995). «Описание стратегий просмотра во всемирной паутине» (PDF) . Труды Третьей международной всемирной веб-конференции по технологиям, инструментам и приложениям . 27 (6): 1065–1073. DOI : 10.1016 / 0169-7552 (95) 00043-7 .CS1 maint: ref=harv (link)
  • Кули, Роберт; Мобашер, Бамшад; Шривастава, Джайдип (1999). «Подготовка данных для разработки шаблонов просмотра Всемирной паутины» (PDF) . Знания и информационные системы . 1 (1): 5–32. CiteSeerX  10.1.1.33.2792 . DOI : 10.1007 / BF03325089 . ISSN  0219-3116 .CS1 maint: ref=harv (link)
  • Донато, Дебора ; Бонки, Франческо; Чи, Том (2010). «Хотите делать заметки?: Определение исследовательских задач в поисковой панели Yahoo!» (PDF) . Материалы 19-й Международной конференции по всемирной паутине . ACM.CS1 maint: ref=harv (link)
  • Айкхофф, Карстен; Тиван, Хайме; Уайт, Райен; Дюмэ, Сьюзен. (2014). Уроки из путешествия: анализ журнала запросов внутрисессионного обучения (PDF) . Труды Седьмой Международной конференции по веб-поиску и интеллектуальному анализу веб-данных . ACM. С. 223–232. DOI : 10.1145 / 2556195.2556217 . ISBN 9781450323512.CS1 maint: ref=harv (link)
  • Гайо-Авелло, Даниэль (2009). «Обзор методов обнаружения сеансов в журналах запросов и предложение для будущей оценки» (PDF) . Информационные науки . 179 (12): 1822–1843. DOI : 10.1016 / j.ins.2009.01.026 . ISSN  0020-0255 .CS1 maint: ref=harv (link){{Dead link} | date = январь 2017 г.}
  • Гейгер, RS; Халфакер, А. (2014). Использование сеансов редактирования для измерения участия в Википедии (PDF) . Материалы конференции ACM 2013 года по совместной работе с компьютерной поддержкой . ACM. п. 861. DOI : 10,1145 / 2441776,2441873 . ISBN 9781450313315.CS1 maint: ref=harv (link)
  • Он, Дацин; Гокер, Эйс; Харпер, Дэвид Дж. (2002). «Объединение свидетельств для автоматической идентификации веб-сеанса». Обработка информации и управление . 38 (5): 727–742. DOI : 10.1016 / S0306-4573 (01) 00060-7 . ISSN  0306-4573 .CS1 maint: ref=harv (link)
  • Heer, Джеффри; Чи, Эд Х. (2002). «Разделение роя: методы категоризации для пользовательских сессий в сети» (PDF) . Труды конференции SIGCHI по человеческому фактору в вычислительных системах . ACM. 4 (1).CS1 maint: ref=harv (link)
  • Хуанг, Цзянь-Кан; Чиен, Ли-Фэн; Оян, Йен-Джен (2003). «Предложение релевантного термина в интерактивном веб-поиске на основе контекстной информации в журналах сеанса запросов». Журнал Американского общества информационных наук и технологий . 54 (7): 638–649. CiteSeerX  10.1.1.105.5584 . DOI : 10.1002 / asi.10256 .CS1 maint: ref=harv (link)
  • Янсен, Бернард Дж .; Спинк, Аманда; Сарачевич, Тефко (2000). «Реальная жизнь, реальные пользователи и реальные потребности: изучение и анализ запросов пользователей в Интернете» (PDF) . Обработка информации и управление . 36 (2): 207–227. CiteSeerX  10.1.1.155.1383 . DOI : 10.1016 / S0306-4573 (99) 00056-4 . ISSN  0306-4573 .CS1 maint: ref=harv (link)
  • Янсен, Бернард Дж .; Спинк, Аманда (2006). «Как мы ищем во всемирной паутине? Сравнение девяти журналов транзакций поисковых систем» (PDF) . Обработка информации и управление . 42 (1): 248–263. DOI : 10.1016 / j.ipm.2004.10.007 . ISSN  0306-4573 .CS1 maint: ref=harv (link)
  • Джонс, Рози; Клинкнер, Кристина Лиза (2008). По истечении времени ожидания сеанса: автоматическая иерархическая сегментация тем поиска в журналах запросов (PDF) . Cikm 08 . ACM. п. 699. DOI : 10,1145 / 1458082,1458176 . ISBN 9781595939913.CS1 maint: ref=harv (link)
  • Ху, Майкл; Пагано, Джо; Вашингтон, Энн Л .; Рекер, Мими; Палмер, Барт; Донахью, Роберт А. (2008). «Использование веб-метрик для анализа электронных библиотек» (PDF) . Труды 8-й совместной конференции ACM / IEEE-CS по электронным библиотекам . ACM.CS1 maint: ref=harv (link)
  • Лам, Хайди ; = Рассел, Дэниел; Тан, Дайан (2007). «Средство просмотра сеансов: визуальный исследовательский анализ журналов веб-сеансов». Симпозиум IEEE по науке и технологиям визуальной аналитики . IEEE.CS1 maint: ref=harv (link)
  • Мехрзади, Дэвид; Фейтельсон, Дрор Г. (2012). «Об извлечении данных сеанса из журналов активности» (PDF) . Труды 5-й ежегодной международной конференции по системам и хранению данных . СИСТОР '12. ACM. CiteSeerX  10.1.1.381.1956 . DOI : 10.1145 / 2367589.2367592 . ISBN 978-1-4503-1448-0.CS1 maint: ref=harv (link)
  • Мейс, Марк; Дункан, Джон; Гонсалвеш, Бруно; Ramasco, José J .; Менцер, Филиппо (2009). «Что в сеансе: отслеживание индивидуального поведения в сети» (PDF) . Материалы 20-й конференции ACM по гипертексту и гипермедиа . ACM.CS1 maint: ref=harv (link)
  • Menascé, Daniel A .; Almeida, V .; Fonseca, R .; Мендес, М. (1999). «Методология определения рабочей нагрузки сайтов электронной коммерции» (PDF) . Материалы конференции ACM по электронной коммерции . ACM.CS1 maint: ref=harv (link)
  • Мюррей, Дж. Крейг; Лин, Джимми; Чоудхури, Абдур (2006). «Идентификация пользовательских сессий с помощью иерархической агломеративной кластеризации» (PDF) . Труды Американского общества информационных наук и технологий . 43 (1): 1–9. DOI : 10.1002 / meet.14504301312 .CS1 maint: ref=harv (link)
  • Ортега, JL; Агильо, И. (2010). «Различия между веб-сеансами в зависимости от происхождения их посещений» (PDF) . Журнал информетрики . 4 (3): 331–337. DOI : 10.1016 / j.joi.2010.02.001 . ISSN  1751-1577 .CS1 maint: ref=harv (link)
  • Спилиопулу, Майра; Мобашер, Бамшад; Берендт, Беттина; Накагава, Мики (2003). «Фреймворк для оценки эвристики реконструкции сеанса при анализе использования Интернета» (PDF) . ИНФОРМС Журнал по вычислительной технике . 15 (2): 171–190. CiteSeerX  10.1.1.621.3037 . DOI : 10.1287 / ijoc.15.2.171.14445 . ISSN  1526-5528 .CS1 maint: ref=harv (link)
  • Вайшдель, Биргит; Хейзинг, Элко КРЕ (2006). Оптимизация веб-сайтов с использованием веб-метрик: пример из практики (PDF) . Материалы 8-й Международной конференции по электронной торговле . п. 463. DOI : 10,1145 / 1151454,1151525 . ISBN 978-1595933928.CS1 maint: ref=harv (link)