Потребовалось некоторое время, чтобы до меня дошло. Меньшее значение?! Видимо, в тот момент я выглядел слегка пришибленным. Думаю, Елин почувствовал мое разочарование. Я приехал, чтобы узнать о самом сложном в мире техническом средстве прогнозирования вкусовых предпочтений в кино, а мне говорят, что вопросам вкуса – по крайней мере выраженным с помощью рейтингов – здесь придают «меньшее значение»! «Нигде во Вселенной не жмут так много на «звездочки» фильмов и телешоу, как у нас! – рассказал Елин. – И мы разработали множество алгоритмов для повышения точности этих предсказаний». Но, как он сказал, это было «последним писком» году этак в 2005-м или в 2006-м. И мои смешные вопросы о «звездочках» тут же стали ужасно отдавать стариной. Значит, вложив такую бездну времени и усилий в постройку совершенной системы рекомендаций на базе оценок, Netflix от нее отказалась?
Не совсем. «Люди по-прежнему выставляют оценки, мы считаем эту информацию полезной. Просто она – второстепенная», – говорит Елин. Случилось сразу две вещи, которые затмили пользу «звездочек». Первая, как рассказал Ксавье Аматриайн, руководитель по системе рекомендаций, – компания вплотную приблизилась к некоей конечной скорости прогнозирования вкусов. «Как часто бывает при работе с алгоритмами, – рассказал он, – 20 % времени уходит на достижение 90-процентной точности; а затем уже 80 % времени уйдет на обеспечение оставшихся 10 % точности». Было совершенно непонятно, стоит ли инвестировать в работу над этими оставшимися 10 %, что привело бы к еще большему усложнению рекомендательной системы, в которой и без того уже работала и «Ограниченная машина Больтцмана», имелись и «Случайные леса», и «Латентные размещения Дрихле», – будет ли это оправданно?
Поменялось и еще кое-что. С тех пор как Netflix объявила состязание программистов с крупным призом, компания вместо услуг проката DVD по почте стала заниматься предоставлением онлайн-услуг потокового видео. «Люди, которые давали свои оценки, отражали таким образом свой мыслительный процесс. Вы добавляете что-то в очередь просмотра, а просматриваете пару дней спустя. А затем выражаете мнение, которое возымеет эффект в долгосрочной перспективе. При потоковой передаче данных концепция совершенно меняется. Вам не нравится? Ну и ладно – переключаем и смотрим что-нибудь другое. Затрат на переключение у вас практически нет», – рассказал Аматриайн.
При оказании потоковых онлайн-услуг Netflix получает меньше формально выраженных оценок, зато имеет место косвенная информация – это поведение пользователей. «У нас появилась возможность получения данных по просмотрам в реальном времени, а это гораздо более ценная информация, чем то, что говорят сами пользователи о своих предпочтениях», – объясняет Елин. В Netflix бесконечно больше знают о том, что и как вы смотрите: когда вы смотрите, где вы смотрите, в какой момент прекращаете смотреть, что смотрите потом, пересматриваете ли. Что вы ищете – это еще один сигнал вашего вкуса. Елин заинтересованно, почти страстно мне об этом рассказывает. Он слегка тараторит, у него немного угловатый, напряженный взгляд, он лысоват – и всем своим видом напоминает гиперинформированного консультанта из магазина видеокассет ушедшей эпохи. Но только это консультант всемогущий, он знает, что крутит на своих «видаках» вся страна – и в какие моменты нажимает на «перемотку». Пусть это и выглядит как вмешательство в личную жизнь, но главный момент здесь такой: от своего вкуса не спрячешься!
Появление компаний вроде Netflix, обладающих петабайтами данных о людских симпатиях и антипатиях в виде всех этих «лайков» и «избранных», позволило бросить взгляд в до этого всегда казавшуюся непроницаемой область: как формируются оценки, как выражаются предпочтения, каковы механизмы формирования вкуса? Обширное поле сетевой активности – сетевое «сарафанное радио». Вот где абстрактные, «непостижимые» вкусы попадают в эмпирически формируемую упорядоченность Интернета, с его алгоритмами совместной фильтрации, пространными наборами данных, бесконечными отчетами по произведенным действиям. Любая отдельно взятая рецензия или отдельный «лайк» совершенно бесполезны. Тут же возникает проблема «слово не деньги», как ее обозначил Рей Фишман. И лишь на агрегированном уровне с помощью чистой математики можно отфильтровать шум, отбросить аномальные значения и достичь статистической согласованности данных.
Социологи вроде Пьера Бурдьё, посвятившие размышлениям о вкусе огромное количество времени (мы еще вспомним о нем позже), всегда сталкивались с проблемой «рассказчика»: спросить людей о том, что им нравится, совсем не то, что наблюдать за их действиями. Интернет прекрасен в том плане, что вне зависимости от того, что люди рассказывают, можно наблюдать со все возрастающей достоверностью за их реальным поведением. Практически любой из интересовавших Бурдьё аспектов человеческого вкуса ежедневно каталогизируется онлайн, причем в объемах, превосходящих любые мечты социологов. Какая музыка нравится? Посмотрите на Spotify, Pandora. Как выглядит идеальное человеческое лицо? Посмотрите OKCupid, Match.com. Какие фото нравятся больше всего? Посмотрите Flickr и Instagram.
Так что, если раньше Netflix полагался на слова людей о том, что им нравится – на этом для того времени новом основании базировались все системы рекомендаций
[85], – теперь компания стала фокусировать внимание на том, что люди реально смотрят. «В таком подходе заключена масса преимуществ. Одно из них в том, как именно люди выставляют оценки: это делается в духе мотивации – они оценивают, что и как им бы хотелось смотреть», – говорит Аматриайн. Как рассказал Карлос Гомес-Юриб, директор по новым продуктам Netflix, «относительно высокий процент людей рассказывают, что они часто смотрят иностранные или документальные фильмы. На самом деле это не так».