Как любой новый технологический пакет, Большие Данные тут же обросли мифами и заблуждениями. Многие из них постоянно усиливаются как самими производителями программных продуктов в сфере Больших Данных, так и средствами массовой информации, вынужденными адаптировать сложные вопросы информационных технологий для читателей, не обремененных излишними знаниями.
Из всей совокупности мифов стоит выделить три главных. Именно они наносят наибольший вред технологиям Больших Данных и тормозят их практическое применение, в том числе в нашей стране.
Прежде всего, в маркетинговых целях прикладываются немалые усилия, чтобы представить технологии Больших Данных неким новым Святым Граалем. На них необоснованно возлагается роль панацеи от всех бед. Между тем, очевидно, что любой технологический пакет имеет строго определенные условия для своего применения. Касательно Больших Данных таким ограничением является сопоставимость текущей ситуации с ранее наблюдавшимися ситуациями, процессами, периодами времени и т. п. В качестве примера можно привести прогнозирование потребительского поведения. Каждый человек на собственном опыте знает, что в ситуации умеренной инфляции он будет делать одни покупки, а при гиперинфляции его потребительское поведение коренным образом изменится. Если уже имеются Большие Данные как по периоду с низким уровнем инфляции, так и ситуации гиперинфляционного шока, то технологии Больших Данных будут полезны. Они позволят распознать, к какому классу относится текущая ситуация, обратиться к соответствующим поведенческим паттернам, характеризуемым теми или иными параметрами, и позволят дать достаточно достоверный прогноз. А вот если Больших Данных по периоду гиперинфляции нет, а она наступила, то в такой ситуации технологии Больших Данных будут бесполезны. Более того, их применение чревато непоправимыми ошибками. Этот пример показывает: технологический пакет Больших Данных, также как и другие технологические пакеты имеют строгие условия, где его применение эффективно, а где — нет.
Бытует мнение, что Большие Данные могут применяться только государственными структурами и транснациональными корпорациями, и недоступны для других субъектов. Связано это с дороговизной как серверной части, так и программных продуктов, требуемых для работы с Большими Данными. И, наконец, с высокой зарплатой специалистов по Большим Данным. На практике в последние пару лет пользу из Больших Данных извлекают не только гигантские, но и небольшие структуры. Это стало доступным благодаря облачным вычислениям. В этом случае небольшие структуры выступают конечными пользователями технологического пакета, который получают как услугу. Использование этой технологии, как показывает опыт небольшого и среднего бизнеса в США, Западной Европе и Японии дает компаниям неоспоримые конкурентные преимущества по сравнению с бизнесами, которые подобными возможностями не располагают.
Наконец, очень серьезным заблуждением является рассмотрение технологического пакета Больших Данных как чисто машинной технологии. Многие государственные и корпоративные структуры впустую затратили огромные суммы средств только потому, что все ресурсы были направлены на закупку компьютерного железа и программных продуктов. При этом, затраты на кадры формировались по остаточному принципу. Между тем технологии Больших Данных требуют специалистов высочайшего уровня квалификации, как правило, обладающих образованием и профессиональными навыками не только в области информационных, но и гуманитарных наук. Сегодня, например, в США по оценкам экспертов не хватает от 50 до 70 тыс. специалистов по данным (data scientists). Большие Данные представляют собой не машинную, а человеко-машинную технологию.
Это наглядно показал пример любимого детища АНБ, компании П. Тиля Palantir. Одна из версий программы ориентирована на борьбу с мошенничествами в крупных финансовых структурах. Пока действовал чисто машинный вариант, система давала множество ложных срабатываний. При этом полностью выявлялись и реальные случаи хищений, но они были смешаны с неточными выводами. В результате за программу посадили ветеранов служб экономической безопасности в качестве операторов. За короткий срок они обучились работе с программой и, используя человеческий опыт, выбирали из всей совокупности сигналов лишь те, которые указывали на реальные хищения.
По этому поводу руководитель одной из самых перспективных компаний в области прогнозирования Quid, также принадлежащей П. Тилю, Ш. Горли сказал: «Наибольший эффект Большие Данные дают тогда, когда возможности компьютеров в обработке гигантских массивов информации и выявлении нетривиальных связей соединены с человеческим опытом и профессиональной интуицией. А все, что вам рассказывает Р. Курцвейл про искусственный интеллект, это как минимум на ближайшее будущее просто красивые истории и PR-ходы».
Подытоживая суть технологий Больших Данных, можно согласиться с краткой формулировкой консалтинговой компании Forrester: «Большие Данные объединяют техники и технологии, которые извлекают смысл из данных на экстремальном пределе практичности».
Большие Данные в первую очередь были использованы в маркетинге, инвестиционном бизнесе, в продажах и т. п. Т. е. фактически там, где речь идет о косвенном, незаметном управлении поведением. Другой сферой применения Больших Данных стали процессы, описываемые множеством параметров, где за счет изменения режима можно получить экономию того или иного ресурса. В этой связи за пределами маркетинга и продаж самыми активными пользователями Больших Данных стали государственные учреждения и энергетический сектор экономики.
Но это лишь надводная часть айсберга. А подводная часть, как известно, всегда намного больше и, если можно так сказать, серьезнее. Подводной частью айсберга стало использование технологий Больших Данных в таких сферах как разведка и контрразведка, военное дело, геостратегия и то, что традиционно называлось информационными войнами, а фактически представляет собой форму жесткого когнитивного противоборства.
Большие Данные были быстро осознаны такими странами, как Соединенные Штаты, Великобритания и Япония, в качестве важнейшего ресурса стратегического значения. 29 марта 2012 года администрация Б. Обамы выступила с инициативой «Big Data Research and Development Initiative». Инициативой предусматриваются вложение значительных объемов ресурсов и проведение комплексных мероприятий в целях активного использования технологий Больших Данных на ключевых направлениях государственной политики США. В рамках инициативы ежегодно в Вашингтоне проводятся большие конференции «Big Data for government & defense».
В сентябре 2013 года правительство Японии опубликовало информацию о разработке национальной программы по Большим Данным. Летом того же года правительство Австралии заявило, что рассматривает Большие Данные как важнейший национальный стратегический ресурс и выдвинуло задачу стать головной страной в сфере использования технологий Больших Данных как на правительственном уровне, так и на всех других уровнях государственного аппарата в масштабах Британского Содружества Наций.
3.2. Большие Данные в сетевом измерении
Долгие десятилетия в основе политтехнологий, методов жесткого информационного противоборства, конструкторов для проведения государственных переворотов и революций лежала так называемая «теория толпы». Она была разработана усилиями Лебона, Тарда, Конетти, Московичи и проч. Эта теория базировалась на внешнем описании процессов. Как любая описательная теория она исходила частично из наблюдений, частично из картины мира самих исследователей. Тем не менее, теория, так или иначе, работала и построенные на ее основе методы давали определенный эффект. Едва ли не последним представителем школы «теории толпы» был Дж. Шарп с его книгами, включая работу «От диктатуры к демократии». Однако сегодня с уверенностью можно сказать, что «теория толпы» описывает лишь небольшой фрагмент реальности.