BIG DATA. Вся технология в одной книге - читать онлайн книгу. Автор: Андреас Вайгенд cтр.№ 43

читать книги онлайн бесплатно
 
 

Онлайн книга - BIG DATA. Вся технология в одной книге | Автор книги - Андреас Вайгенд

Cтраница 43
читать онлайн книги бесплатно

Интернет-магазины понимают, что иногда потребитель хочет видеть сортировку товаров по цене, а иногда – по отзывам покупателей. Сайты турагентств и бронирования авиабилетов позволяют клиентам применять сортировки по тарифу, длительности перелета, времени вылета и прилета, количеству пересадок и названию перевозчика. На сервисе Hipmunk, созданном Адамом Голдстайном и Стивом Хаффманом из Reddit, есть «экстренная» функция, позволяющая оценивать совокупность факторов цены, количества пересадок и времени в пути и выдающая результаты исходя из весов этих оценок. (Позже подобный подход был внедрен и на Google Flights.) Алгоритм, учитывающий присущие процессу принятия решений компромиссы, – это очень хорошо, а предоставление пользователю возможности определять значение отдельных факторов – еще лучше. Компания CWT, работающая в области организации поездок, проанализировала 15 миллионов транзакций и 7000 анкет, чтобы определить и количественно оценить источники стресса в путешествиях, от потерь рабочего времени до недосыпа [212]. Возможно, вам понравится идея оценить в долларах необходимость встать ни свет ни заря, чтобы успеть на более дешевый утренний рейс. Удивительно, что никто из других инфопереработчиков не предлагает пользователям подобный уровень свободы выбора, хотя обоюдная выгода здесь налицо. Пользователь лучше понимает свои предпочтения, ранжируя значимость факторов и определяя, какая из предложенных комбинаций больше вдохновляет его на покупку, а компания получает данные, позволяющие совершенствовать процесс подготовки рекомендаций, как общих, так и персональных. Возможности сортировки и оценки значимости факторов для пользователей должны быть расширены, и не только в интернет-торговле. Они должны быть доступны и в социальных сетях.

С другой стороны, пользуясь доступом к более широкому выбору вариантов группировки, мы даем возможность людям из своего социального окружения узнавать об особенностях нашего образа жизни. Если запрос в Facebook окажется весьма специфичен, ответом на него станет выборка из одного человека – лично вас.

Данные социального графа будут все больше и больше использоваться для оценки надежности людей до и в период их взаимодействия с разными учреждениями. Несколько лет назад компания Allstate, продающая 10 процентов полисов страхования имущества физических лиц в США, предположила, что клиенты более склонны предъявлять фальшивые требования на выплату страхового возмещения, если в их социальном окружении есть люди, которые поступали так прежде. Это разумное осмысление принципов гомофилии: дружить будут, скорее, люди с одинаковыми ценностями (в данном случае со склонностью мошенничать со страховкой). Ежегодно Allstate получает миллионы требований по страховым выплатам, и тщательно проверить каждое из них невозможно. В прошлом компания руководствовалась грубыми прикидками, например общей статистикой мошенничеств со страховками в районе проживания клиента. Данные о круге знакомств клиента из социального графа позволяют сотрудникам выделять требования, нуждающиеся в более тщательной проверке.

Страхование имущества – бизнес преимущественно офлайновый, поэтому Allstate нужен был источник данных из интернета. Страховщики обратились к брокеру данных RapLeaf, обладающему огромным архивом электронных адресов и информации из социальных сетей. Данные из Facebook, в том числе списки контактов пользователей, были куплены у приложений, получающих доступ к аккаунтам с разрешения пользователей (подчас с целями, которые пользователи себе даже не представляют). Сначала в RapLeaf проанализировали информацию с целью идентифицировать все сетевые аккаунты, принадлежащие одному и тому же человеку. На втором этапе с использованием данных из Facebook были установлены связи между людьми. Полученная от RapLeaf база данных позволяла Allstate идентифицировать клиентов, в числе друзей которых были другие клиенты компании. Исходя из истории отношений этих друзей со страховщиком устанавливался уровень проверки конкретного клиента. После статьи в «Уолл-стрит Джорнэл» с беспощадной критикой RapLeaf в связи со случайной утечкой в сеть личных данных, собранных из различных источников, Facebook запретила компании заниматься скрейпингом на своем сайте [213].

Разумеется, и сама платформа Facebook ищет способы монетизации своих данных о социальном графе. В 2010 году компания приобрела у Friendster патент на использование данных социального графа для получения информации об отдельных людях [214]. Однако, когда в 2015 году Facebook обратилась за возобновлением патентных прав, сама идея патента относилась уже исключительно к деньгам. Как сказано в патентном документе: «При получении кредитной заявки частного лица заимодатель исследует кредитные рейтинги связанных с данным лицом представителей его социального окружения. Если их средний рейтинг соответствует минимальному показателю кредитной оценки, заимодатель продолжает обработку заявки. В иных случаях заявка отклоняется» [215].


BIG DATA. Вся технология в одной книге

ЛЮДИ СКЛОННЫ

КОНТРОЛИРОВАТЬ

СВОЕ ПОВЕДЕНИЕ,

КОГДА ЗНАЮТ,

ЧТО ЗА НИМИ

НАБЛЮДАЮТ

BIG DATA. Вся технология в одной книге

Станете ли вы рассматривать человека из списка ваших друзей в Facebook в качестве делового партнера, если в реальной жизни вас объединяет с ним только то, что вы когда-то работали в одной компании или играли в одной детской баскетбольной команде, или вы знаете от мамы, что он – троюродный кузен вашего двоюродного дяди? Я думаю, что было бы правильнее, если бы мы могли «связывать» свою личную репутацию с репутацией людей из своей социальной сети. Идея вот в чем: я доверяю своему другу Дэниэлу Канеману в числе прочего еще и потому, что он – лауреат Нобелевской премии по экономике. Возможно, я хотел бы привязать 50 процентов своей репутации к его репутации, что будет соответствовать значению 0,5 «коэффициента доверия связанных репутаций». Это значит, что если оценка репутации Дэниэла возрастет на одно значение, то оценка моей увеличится на 0,5 этого значения. И наоборот, если по какой-либо причине оценка репутации Дэниэла снизится на одно значение, моя оценка также снизится на 0,5 этого значения. Коэффициенты доверия позволили бы мне более осознанно оценивать различные аспекты моей идентичности – друзей, наставников и вдохновителей – по сравнению с обычным бинарным выбором «друг/недруг».

Вернуться к просмотру книги Перейти к Оглавлению Перейти к Примечанию