BIG DATA. Вся технология в одной книге | Андреас Вайгенд | страница 79 | LoveRead.ec

В 1960-х годах с этой проблемой столкнулся канадский экономист Стэнли Л. Уорнер, собиравший статистику для своей научной работы^[415]. Он понял, что у человека часто бывают веские причины не предоставлять полную информацию о себе, и никакие разговоры об общественной значимости и его же собственной пользе не убедят его стать полностью откровенным. При постановке провокационных вопросов вроде «Курите ли вы марихуану?» или «Диагностирован ли у вас ВИЧ?» способов выявить процент обмана не будет (кроме внезапного анализа крови респондентов).

Уорнер сознавал, что некоторые будут лгать и что он не знает, какие именно подгруппы населения более склонны делать это. Если к ложным ответам склонны жители определенных районов, его данные окажутся неисправимо искаженными. Он предложил создать защитный слой между респондентом и его ответом, придав данным элемент хаотичности.

Вот как это устроено: перед ответом на вопрос человек подбрасывает монетку. Если выпадает орел, он дает честный утвердительный или отрицательный ответ, если решка – только утвердительный вне зависимости от соответствия действительности. Только сам субъект опроса знает, дал ли он откровенный ответ или сказал то, что велела монетка. Если впоследствии к человеку возникнут вопросы в связи с его утвердительным ответом, то он всегда сможет сказать, что так выпало, и предъявить ему какие-либо претензии будет нельзя. Прелесть метода Уорнера в том, что он обеспечивает получение необходимой информации при соблюдении интересов граждан. На самом деле полученные таким способом данные могут быть достовернее полученных без использования элемента хаотичности.

Размытие может применяться как к первичной информации, так и к обогащенной. Жонглируя своими подробностями, мы можем затемнять свои личные данные, в полной мере пользуясь плодами агрегирования и анализа для целей прогнозов и рекомендаций.

Право экспериментировать с обработкой данных

Инфопереработчики постоянно экспериментируют с дизайном, настройками и алгоритмами. В предыдущих главах мы узнали, что они экспериментируют и со своими пользователями. Если они могут экспериментировать с нами, мы тоже должны иметь право экспериментировать с ними.

Если право на изменения представляет собой аналог права на свободу самовыражения, а право на размытие – права на самоопределение, то право на эксперимент относится к свободе исследования, предоставлению пользователям права рассматривать разные возможности. К одной из ключевых функций инфопереработчика относится определение порядка, в котором продукты и услуги представляются пользователю. Ранжирование результатов основано на ряде параметров: новизне (во главу списка попадают самые свежие предложения), географической близости (наверху помещают то, что находится ближе) или социальной близости (на топовых позициях оказывается то, что в большей степени соответствует статусу данного человека). Мне по душе сравнение этих настроек с ручками и движками микшерского пульта звукорежиссера, которые используются для изменения баланса источников звука при записи музыкального произведения^[416].

К сожалению, движки и кнопки приборов инфопереработчика не всегда видны пользователю. Почему эти настройки так часто помещают в «черный ящик», делая незаметными и недоступными для пользователей? Отнюдь не по таким прозаическим причинам, как лень или жадность, и не из-за стойкой приверженности принципу простоты дизайна интерфейса^[417]. Отсутствие доступа к регулировкам обусловлено деловыми соображениями, в том числе и такими: это стоит денег, это может раскрыть коммерческие тайны или даже подвести компанию под суд. Компании не занимаются программированием по индивидуальным заказам. Они не будут добавлять регулировки по просьбе пользователей, однако должны хотя бы предоставить им возможность доступа к уже существующим регулировкам. Но есть и соображения эпистемологического характера. Часто бывает трудно подобрать слово, описывающее назначение какой-либо регулировки, которое стопроцентно было бы понятно пользователям и не создавало им дополнительных трудностей. При этом, как указывают в своем фундаментальном труде «Большие данные» Виктор Майер-Шенбергер и Кеннет Кукьер (издательство Манн, Иванов и Фербер, 2013 г. – Ред.), прогностические и рекомендательные функции могут использоваться и без досконального понимания того, как они устроены^[418]. При всей обоснованности таких соображений они служат и поводом для ограничения права выбора пользователей. Я считаю, что лишь в процессе практического освоения регулировок люди приобретают понимание их назначения и функционала и того, какие настройки подходят им больше.

Функция срочного подбора рейсов на билетном сайте Hipmunk ранжирует предложения по комбинации цены, количества пересадок и времени в пути. Хотя это шаг в правильном направлении, пользователю, которому не слишком понравились результаты срочного подбора, придется прибегнуть к сортировкам только по цене, только по времени вылета или только по времени прилета, или попытаться отфильтровать то, что его точно не интересует (какие-то авиакомпании или перелеты со многими пересадками, например). А разве не было бы удобнее для всех, если бы пользователь мог самостоятельно обозначать вес каждого параметра в формуле срочного подбора? Следующим шагом могла бы стать возможность варьировать веса каждого из условий срочного подбора. Это было бы и в интересах самой Hipmunk. Инновационные решения компании в части группировок авиарейсов или удобной и детальной визуализации сравниваемых маршрутов не принесут большой пользы в случае, если значимость факторов, определяющих выбор потенциального клиента, не совпадает с пониманием компании. Дайте пользователю возможность поиграть с настройками и найти рейс, устраивающий его во всех отношениях.

BIG DATA. Вся технология в одной книге - читать онлайн книгу. Автор: Андреас Вайгенд cтр.№ 79

Онлайн книга - BIG DATA. Вся технология в одной книге | Автор книги - Андреас Вайгенд