Из Википедии, бесплатной энциклопедии
  (Перенаправлено из журнала Stata )
Перейти к навигации Перейти к поиску

Stata - это универсальный статистический программный пакет, созданный в 1985 году компанией StataCorp. Большинство его пользователей занимаются исследованиями , особенно в области экономики , социологии , политологии , биомедицины и эпидемиологии . [2]

Возможности Stata включают управление данными, статистический анализ, графики, моделирование, регрессию и индивидуальное программирование. Он также имеет систему для распространения программ, написанных пользователями, что позволяет ему непрерывно расти.

Имя Stata - это слоговое сокращение слов статистика и данные . [3] В FAQ официального форума Stata утверждается, что правильное английское произношение Stata «должно оставаться загадкой»; любые из «Stay-ta», «Sta-ta» или «Stah-ta» (рифмы трех вариантов произношения слова «data») считаются приемлемыми. Более поздние обновления показывают , что сотрудники Stata произносят его / s т т ə / . [3]

Каждая версия Stata состоит из четырех основных сборок: [4]

  • Stata / MP для многопроцессорных компьютеров (включая двухъядерные и многоядерные процессоры)
  • Stata / SE для больших баз данных
  • Stata / IC, стандартная версия
  • Numerics by Stata, поддерживает любой из размеров данных, перечисленных выше, во встроенной среде

Small Stata, которая была уменьшенной студенческой версией только для образовательных целей, больше не доступна.

Пользовательский интерфейс [ править ]

Stata всегда уделяла особое внимание интерфейсу командной строки, который облегчает воспроизводимый анализ. Однако, начиная с версии 8.0, Stata включает графический пользовательский интерфейс, основанный на платформе Qt, который использует меню и диалоговые окна для предоставления доступа почти ко всем встроенным командам. Это генерирует код, который всегда отображается, облегчая переход к интерфейсу командной строки и более гибкому языку сценариев . Набор данных можно просматривать или редактировать в формате электронной таблицы. Начиная с версии 11, другие команды могут выполняться, пока открыт браузер данных или редактор.

Структура и хранение данных [ править ]

До выпуска версии 16 [5] Stata могла открывать только один набор данных за один раз. Stata хранит наборы данных в (с произвольным доступом или виртуальной ) памяти, что ограничивает его использование чрезвычайно большими наборами данных. Это в некоторой степени смягчается эффективным внутренним хранилищем, поскольку существуют целочисленные типы хранилищ, которые занимают только один или два байта, а не четыре, и одинарная точность (4 байта), а не двойная точность (8 байтов) является значением по умолчанию для плавающих номера точек .

Набор данных всегда имеет прямоугольный формат, то есть все переменные содержат одинаковое количество наблюдений (в математических терминах все векторы имеют одинаковую длину, хотя в некоторых записях могут отсутствовать значения ).

Совместимость формата данных [ править ]

Stata может импортировать данные в различных форматах. Сюда входят форматы данных ASCII (такие как CSV или форматы банка данных) и форматы электронных таблиц (включая различные форматы Excel ).

Собственные форматы файлов Stata со временем изменились, хотя не каждый выпуск Stata включает новый формат набора данных. Каждая версия Stata может читать все старые форматы наборов данных и может записывать как текущий, так и самый последний предыдущий формат набора данных с помощью команды saveold . [6] Таким образом, текущая версия Stata всегда может открывать наборы данных, созданные в более старых версиях, но более старые версии не могут читать наборы данных более нового формата.

Stata может читать и записывать наборы данных в формате SAS XPORT изначально, используя команды fdause и fdasave .

Некоторые другие эконометрические приложения, включая gretl , могут напрямую импортировать форматы файлов Stata.

Расширяемость [ править ]

Stata позволяет напрямую загружать из Интернета написанные пользователем команды, распространяемые в виде так называемых ado-файлов, которые затем становятся неотличимы для пользователя от встроенных команд. В этом отношении Stata сочетает расширяемость, чаще ассоциируемую с пакетами с открытым исходным кодом, с функциями, обычно связанными с коммерческими пакетами, такими как проверка программного обеспечения , техническая поддержка и профессиональная документация. Некоторые написанные пользователем команды были позже приняты StataCorp, чтобы стать частью последующего официального выпуска после соответствующей проверки, сертификации и документации.

Сообщество пользователей [ править ]

У Stata был активный список адресов электронной почты с августа 1994 года («Статалист», более 1000 сообщений в месяц), который был преобразован в веб-форум в марте 2014 года и до сих пор называется «Статалист». [3] Сотрудники StataCorp регулярно вносят вклад в Statalist. Его поддерживает Марчелло Пагано из Гарвардской школы общественного здравоохранения, а не сама StataCorp.

Статьи об использовании Stata и новых пользовательских командах публикуются в ежеквартальном рецензируемом журнале Stata Journal . Stata журнал ежеквартальное издание , содержащее статьи о статистике, анализ данных, методы обучения, а также эффективное использование языка STATA в.

Встречи групп пользователей проводятся ежегодно в США (конференция Stata), Великобритании, Германии и Италии и реже - в некоторых других странах. StataCorp LP принимает только ежегодную конференцию Stata, которая проводится в США. Местные дистрибьюторы Stata проводят собрания групп пользователей в своих странах, однако разработчики Stata часто приезжают и присутствуют на этих собраниях. Сингапурская группа пользователей Stata, созданная в соответствии с Законом об обществах 10 мая 2008 года, является первой в мире группой пользователей, одобренной правительством (регистрационный номер: 2048/2008; уникальный номер юридического лица: T08SS0091A). Его слоган - «Осмысленное формирование данных». Как некоммерческая организация StataUGS не организует регулярных встреч, но предоставляет пользователям в Сингапуре советы по программированию и статистике неформальными средствами.Активные члены StataUGS в основном занимаются биомедицинскими исследованиями.

Пример кода Stata [ править ]

Для того, чтобы выполнить линейную (МНК) регрессионный от у по х :

регресс yx [если]

Необязательная часть if позволяет ограничить выборку, используемую в команде, подмножеством. Например, если команда должна применяться только к женщинам в выборке, можно указать: if female == 1.

Для выполнения логистической регрессии в у по х :

логистический yx

Чтобы отобразить график рассеяния на у от х , ограниченных значений х ниже 10:

разброс yx, если x <  10

Чтобы выполнить регрессию OLS y по x со стандартными ошибками Уайта, согласованными с гетероскедастичностью :

regress yx, vce (надежный)

Чтобы вычислить информационный критерий Акаике (AIC) и байесовский информационный критерий (BIC) для регрессии: [7]

Estat ic

Чтобы закодировать " fizzbuzz ":

программа определяет аргументы fizzbuzz x для значений i = 1 / `x ' { if  mod ( ` i' , 15 ) ==  0 { display  "fizzbuzz"}иначе, если  mod ( `i ' , 5 ) ==  0 { display  " buzz "}иначе, если  mod ( `i ' , 3 ) ==  0 { display  " fizz "}else {  display  `i '}}конец

Хронология релизов [ править ]

С 2000 года StataCorp выпускает новую основную версию Stata (увеличивая целую часть номера версии) примерно каждые два года. Пользователи должны заплатить комиссию, если они хотят обновить до последней основной версии. Незначительные выпуски (с увеличением десятичной части номера версии) иногда становятся доступными между основными выпусками. Они доступны в виде бесплатных загружаемых обновлений для тех, у кого есть лицензия на предыдущий основной выпуск. Даты всех релизов доступны на сайте Stata. [8] Stata 16 был выпущен 26 июня 2019 г.

Система управления версиями Stata разработана для обеспечения очень высокой степени обратной совместимости , гарантируя, что код, написанный для предыдущих выпусков, продолжает работать. [9] Однако пользователям следует быть осторожными, когда они сохраняют или открывают данные в разных версиях.

См. Также [ править ]

  • Список статистических пакетов
  • Сравнение статистических пакетов
  • Анализ данных

Ссылки [ править ]

  1. ^ "Stata Journal | Статья" . www.stata-journal.com .
  2. ^ "Кто использует Stata?" . Stata . Проверено 28 июня 2017 .
  3. ^ a b c "Справка - статистик" . www.statalist.org .
  4. ^ "Какой Stata мне подходит?" . Stata . Проверено 4 апреля 2010 .
  5. ^ «Фреймы данных: несколько наборов данных в памяти» . www.stata.com . Проверено 13 августа 2020 .
  6. ^ «Stata 16 помогает спасти» . www.stata.com .
  7. ^ «Выбор модели регрессии в Stata» .
  8. ^ "Stata | FAQ: История Stata" . www.stata.com .
  9. ^ "Справка по Stata 16 для версии" . www.stata.com .

Дальнейшее чтение [ править ]

  • Биттманн, Феликс (2019). Стата - действительно краткое введение . Бостон: ДеГрюйтер Ольденбург. ISBN 978-3-11061-729-0.
  • Пинзон, Энрике, изд. (2015). Тридцать лет со Статой: ретроспектива . Колледж-Стейшн, Техас: Stata Press. ISBN 978-1-59718-172-3.
  • Гамильтон, Лоуренс К. (2013). Статистика с помощью STATA . Бостон: Cengage. ISBN 978-0-84006-463-9.

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • Stata Journal
  • Stata Press