Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Стеблевой и листовой график значений 20, 30, 32, 35, 41, 41, 43, 47, 48, 51, 53, 53, 54, 56, 57, 58, 58, 59, 60, 62, 64, 65, 65, 69, 71, 74, 77, 88 и 102

Дисплей стволового и листьев или стволовый и листьев участок представляет собой устройство для представления количественных данных в графическом формате, похожем на гистограмму , чтобы помочь в визуализации формы в виде распределения . Они произошли от работ Артура Боули в начале 1900-х годов и являются полезными инструментами в исследовательском анализе данных . Графики стали более широко использоваться в 1980-х годах после публикации книги Джона Тьюки по исследовательскому анализу данных в 1977 году. [1] Популярность в те годы объясняется их использованием моноширинных шрифтов.(пишущая машинка) шрифтовые стили, которые позволяли компьютерным технологиям того времени легко создавать графику. Превосходные графические возможности современных компьютеров означают, что эти методы используются реже.

Этот сюжет был реализован в Octave [2] и R. [3]

Диаграмма стволовых и листовых диаграмм также называется диаграммой стволовых диаграмм , но последний термин часто относится к диаграммам другого типа. Простой стержневой график может относиться к нанесению матрицы значений y на общую ось x и идентификации общего значения x с помощью вертикальной линии и отдельных значений y с помощью символов на линии. [4]

В отличие от гистограмм, отображение «ствол и лист» сохраняет исходные данные с точностью до двух значащих цифр и упорядочивает данные, тем самым облегчая переход к выводам на основе порядка и непараметрической статистике .


Строительство [ править ]

Чтобы построить отображение стеблей и листьев, наблюдения необходимо сначала отсортировать в порядке возрастания: это проще всего сделать, если работать вручную, построив черновик отображения стеблей и листьев с несортированными листьями, а затем отсортировав листья, чтобы произвести окончательную демонстрацию стеблей и листьев. Вот отсортированный набор значений данных, который будет использоваться в следующем примере:

44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

Затем необходимо определить, что будут представлять стебли и что будут представлять листья. Обычно лист содержит последнюю цифру числа, а основа - все остальные цифры. В случае очень больших чисел значения данных могут быть округлены до определенного разряда (например, разряда сотен), который будет использоваться для листьев. Остальные цифры слева от округленного значения разряда используются в качестве основы.

В этом примере лист представляет собой разряды единиц, а стержень - оставшуюся часть числа (разряды десятков и выше).

Схема «стебель-лист» состоит из двух столбцов, разделенных вертикальной линией. Стебли перечислены слева от вертикальной линии. Важно, чтобы каждый стебель был указан только один раз и чтобы никакие номера не пропускались, даже если это означает, что у некоторых стеблей нет листьев. Листья перечислены в порядке возрастания справа от каждого стебля.

Важно отметить, что когда в данных есть повторяющееся число (например, два 72), тогда график должен отражать это (так что график будет выглядеть как 7 | 2 2 5 6 7, когда он имеет числа 72 72 75 76 77).

Ключ:
Листовой блок: 1.0
Шток: 10,0

Скругление может потребоваться для отображения стебля и листьев. Основываясь на следующем наборе данных, будет создан основной график, представленный ниже:

-23,678758, -12,45, -3,4, 4,43, 5,5, 5,678, 16,87, 24,7, 56,8

Для отрицательных чисел перед единицей стержня помещается отрицательное число, которое по-прежнему имеет значение X / 10. Нецелые числа округляются. Это позволило графику стебля и листа сохранить свою форму даже для более сложных наборов данных. Как в этом примере ниже:

Ключ:

Использование [ править ]

Отображение расписания
Отображение расписания в стиле стебля и листа [ оспаривается ] на станции Йокогама в Иокогаме , Япония. Это широко распространенный дизайн в стране.

Стволовые и листовые дисплеи полезны для отображения относительной плотности и формы данных, давая читателю быстрый обзор распределения. Они сохраняют (большую часть) необработанные числовые данные, часто с идеальной целостностью. Они также полезны для выделения выбросов и поиска режима . Однако отображение «стебель-лист» полезно только для наборов данных среднего размера (около 15–150 точек данных). С очень маленькими наборами данных отображение «стебель-лист» может быть мало пригодным, поскольку для определения точных свойств распределения требуется разумное количество точек данных. Для таких данных лучше подходит точечный график . С очень большими наборами данных отображение «стебель-лист» станет очень загроможденным, поскольку каждая точка данных должна быть представлена ​​в числовом виде. АЯщичковая диаграмма или гистограмма могут стать более подходящими по мере увеличения размера данных.

Заметки [ править ]

  1. ^ Тьюки, Джон В. (1977). Исследовательский анализ данных (1-е изд.). Пирсон. ISBN 0-201-07616-0.
  2. ^ функция стволового листа
  3. ^ функция
  4. ^ Примеры: основные функции MATLAB и Matplotlib . Они не создают демонстрацию стеблей и листьев.

Ссылки [ править ]

  • Уайлд, К. и Себер, Г. (2000) Случайные встречи: первый курс анализа и вывода данных, стр. 49–54 Джон Уайли и сыновья. ISBN 0-471-32936-3 
  • Эллиотт, Джейн; Кэтрин Марш (2008). Изучение данных: введение в анализ данных для социологов (2-е изд.). Polity Press. ISBN 0-7456-2282-8.