Информационный взрыв является быстрым увеличением количества опубликованной информации или данных и последствий этого изобилия. [1] По мере роста количества доступных данных проблема управления информацией становится все более сложной, что может привести к информационной перегрузке . Оксфордский онлайн-словарь английского языка указывает на использование этой фразы в статье New Statesman за март 1964 года. [2] New York Times впервые использовала эту фразу в своем редакционном содержании в статье Уолтера Салливана от 7 июня 1964 года, в которой он назвал фразу «много обсуждаемой». (стр. 11.) [3]Впервые эта фраза использовалась, по-видимому, в рекламном приложении IBM к New York Times, опубликованном 30 апреля 1961 года [4], и Фрэнком Фремонт-Смитом, директором программы междисциплинарных конференций Американского института биологических наук, в статья в апреле 1961 г. в бюллетене AIBS (стр. 18) [5]
Во многих секторах наблюдается быстрое увеличение объема доступной информации, например, здравоохранения, супермаркетов и даже правительств с информацией о свидетельствах о рождении и записями о вакцинации. [6] Другой сектор, затронутый этим явлением, - журналистика. Такая профессия, которая в прошлом отвечала за распространение информации, может быть подавлена переизбытком информации сегодня. [7]
Методы сбора знаний из чрезмерного количества электронной информации (например, слияние данных может помочь в интеллектуальном анализе данных ) существуют с 1970-х годов. Другой распространенный метод работы с таким объемом информации - качественное исследование . [8] Такие подходы нацелены на организацию информации, синтез, категоризацию и систематизацию, чтобы сделать ее более удобной для использования и облегчить поиск.
Модели роста
- Мировой технологический потенциал для хранения информации вырос с 2,6 (оптимально сжатых) эксабайт в 1986 году до 15,8 в 1993 году, более 54,5 в 2000 году и до 295 (оптимально сжатых) эксабайт в 2007 году. Это эквивалентно менее чем одному компакт - диску объемом 730 МБ. ROM на человека в 1986 году (539 МБ на человека), примерно 4 CD-ROM на человека в 1993 году, 12 CD-ROM на человека в 2000 году и почти 61 CD-ROM на человека в 2007 году. Компакт-диск 2007 года будет создавать стопку от Земли до Луны и четверть этого расстояния за ней (с толщиной 1,2 мм на компакт-диск). [9]
- Мировой технологический потенциал по приему информации через сети одностороннего вещания составлял 432 экзабайта (оптимально сжатой) информации в 1986 году, 715 (оптимально сжатых) экзабайт в 1993 году, 1200 (оптимально сжатых) экзабайт в 2000 году и 1900 в 2007 году [9]. ]
- Эффективная мировая способность обмена информацией через двусторонние телекоммуникационные сети составляла 0,281 экзабайта (оптимально сжатой) информации в 1986 году, 0,471 в 1993 году, 2,2 в 2000 году и 65 (оптимально сжатых) экзабайт в 2007 году [9].
Новый показатель, который используется в попытке охарактеризовать рост персональной информации, - это дисковое хранилище на человека (DSP), которое измеряется в мегабайтах на человека (где мегабайты составляют 10 6 байтов, а сокращенно - МБ). Global DSP (GDSP) - это общее пространство на жестком диске (в МБ), на котором были проданы новые устройства за год, деленное на численность населения мира в этом году. Метрика GDSP - это грубая мера того, сколько дискового пространства можно было бы использовать для сбора конкретных данных о населении мира. [6] В 1983 году во всем мире было продано 1 миллион жестких дисков общим объемом 90 терабайт ; Диски на 30 Мбайт занимали самый большой сегмент рынка. [10] В 1996 году было продано 105 миллионов дисков общим объемом 160 623 терабайта, из них 1 и 2 гигабайта были лидерами отрасли. [11] К 2000 году, когда в отрасли лидируют диски емкостью 20 ГБ, общий объем проданных жестких дисков за год прогнозируется на уровне 2 829 288 терабайт. В 1997 году объем продаж жестких дисков превысит 34 миллиарда долларов.
По словам Латании Суини , сегодня в сборе данных можно выделить три тенденции:
Тип 1. Увеличение количества собираемых полей, известное как тренд «собирать больше».
Тип 2. Замените существующий сбор совокупных данных на сбор данных по конкретному человеку, известный как тренд «сбор конкретных».
Тип 3. Соберите информацию, запустив новый сбор данных по конкретному человеку, известный как тренд «собери, если сможешь». [6]
Связанные термины
Поскольку «информация» в электронных средствах массовой информации часто используется как синоним «данных», термин информационный взрыв тесно связан с концепцией потока данных (также называемого потоком данных ). Иногда также используется термин информационный поток . Все это в основном сводится к постоянно растущему количеству электронных данных, которыми обмениваются в единицу времени. Осведомленность о неуправляемых объемах данных росла вместе с появлением все более мощной обработки данных с середины 1960-х годов. [12]
Вызовы
Несмотря на то, что обилие информации может быть полезным на нескольких уровнях, некоторые проблемы могут вызывать беспокойство, такие как конфиденциальность , правовые и этические нормы, фильтрация и точность данных. [13] Фильтрация относится к поиску полезной информации среди большого количества данных, что относится к работе специалистов по данным. Типичный пример необходимости фильтрации данных ( интеллектуальный анализ данных ) - в здравоохранении, поскольку в ближайшие годы должны появиться электронные медицинские карты пациентов. Имея такой объем доступной информации, врачам необходимо будет определить закономерности и выбрать важные данные для постановки диагноза пациенту. [13] С другой стороны, по мнению некоторых экспертов, наличие такого большого количества общедоступных данных затрудняет предоставление фактически анонимных данных. [6] Еще один момент, который следует принять во внимание, - это правовые и этические нормы, которые касаются того, кто будет владельцем данных, и как часто он / она обязаны публиковать их и как долго. [13] При таком большом количестве источников данных другой проблемой будет их точность. Недоверенный источник может быть оспорен другими, заказав новый набор данных, что приведет к повторению информации. [13] По словам Эдварда Хута, еще одной проблемой является доступность и стоимость такой информации. [14] Уровень доступности можно улучшить либо за счет снижения затрат, либо за счет повышения полезности информации. По словам автора, сокращение затрат могло бы быть осуществлено ассоциациями, которые должны оценить, какая информация имеет отношение к делу, и собрать ее более организованным образом.
Веб-серверы
По состоянию на август 2005 года насчитывалось более 70 миллионов веб-серверов . [15] По состоянию на сентябрь 2007 г.[Обновить]было более 135 миллионов веб-серверов. [16]
Блоги
По данным Technorati , количество блогов удваивается примерно каждые 6 месяцев и на апрель 2006 г. составило 35,3 миллиона блогов.[ref]. [17] Это пример ранних стадий логистического роста , где рост примерно экспоненциальный , поскольку блоги - недавнее нововведение. По мере того, как количество блогов приближается к количеству возможных производителей (людей), происходит насыщение, рост замедляется, и количество блогов в конечном итоге стабилизируется.
Смотрите также
- Большое количество данных
- Проклятие размерности
- Сбор данных
- Информационная энвайронментализм
- Информационное общество
- Информационная эпоха
- Система фильтрации информации
- Закон меткалфа
- Нейроусиление
- Вторая половина шахматной доски
Рекомендации
- Перейти ↑ Hilbert, M. (2015). Глобальный информационный взрыв: https://www.youtube.com/watch?v=8-AqzPe_gNs&list=PLtjBSCvWCU3rNm46D3R85efM0hrzjuAIg . Цифровые технологии и социальные изменения [Открытый онлайн-курс Калифорнийского университета], свободно доступный по адресу: https://canvas.instructure.com/courses/949415
- ^ «Информация». http://dictionary.oed.com . по состоянию на 4 января 2008 г.
- ^ https://www.nytimes.com/1964/06/07/us-will-remove-reactor-in-arctic.html?_r=0
- ^ http://www-03.ibm.com/ibm/history/ibm100/us/en/icons/translation/
- ^ Дэвис, Кейт (1973). «Аргументы в пользу и против принятия бизнесом социальных обязанностей». Журнал Академии Управления . 16 (2): 312–322. DOI : 10.2307 / 255331 . JSTOR 255331 .
- ^ a b c d Суини, Латанья. «Информационный взрыв». Конфиденциальность, раскрытие информации и доступ к данным: теория и практическое применение для статистических агентств (2001): 43-74.
- ^ Фуллер, Джек. Что происходит с новостями: информационный взрыв и кризис журналистики. Издательство Чикагского университета, 2010.
- ↑ Майор, Клэр Хауэлл и Мэгги Савин-Баден. Введение в качественный синтез исследований: управление информационным взрывом в исследованиях в области социальных наук. Рутледж, 2010.
- ^ a b c "The Womartinhilbert.net/WorldInfoCapacity.html" свободный доступ к исследованию " и " видео-анимации " .
- ^ Диск / Отчет о тенденциях 1983 г., «Неделя компьютеров». Маунтин-Вью, Калифорния. (46) 11.11.83.
- ^ Продаж Жесткий диск привода к началу 34000000000 $ в 1997 году,»Disk / Trend News. Маунтин-Вью, Калифорния: Disk / Trend, Inc., 1997.
- ^ Программа просмотра Google Книг Ngram для терминов, упомянутых здесь
- ^ a b c d Бернер, Эта С. и Жаклин Мосс. «Информатика вызовет грядущий информационный взрыв для пациентов». Журнал Американской ассоциации медицинской информатики 12.6 (2005): 614-617.
- ^ Хут, Эдвард Дж. «Информационный взрыв». Бюллетень Нью-Йоркской медицинской академии 65.6 (1989): 647.
- ^ Роберт Х. Закон (15 декабря 2010 г.). "Хронология интернета Гоббса 10.1" . zakon.org . Проверено 27 августа 2011 года .
- ^ «Обзор веб-серверов, август 2011 г.» . netcraft.com. Август 2011 . Проверено 27 августа 2011 года .
- ^ "Состояние блогосферы, апрель 2006 г. Часть 1: О росте блогосферы" . Оповещения Sifry (sifry.com). 17 апреля 2006 года Архивировано из оригинала 9 января 2013 . Проверено 27 августа 2011 года .
Внешние ссылки
- Концептуализация информационных систем и когнитивной устойчивости в экономике внимания 21-го века (включая программу)
- Сколько информации? 2003 г.
- Пережить информационный взрыв: как люди находят свою электронную информацию [1]
- Почему информационный взрыв может быть плохим для интеллектуального анализа данных и как слияние данных дает выход [2]
- Информационный взрыв, Крупнейшие базы данных