С того времени люди и начали игру в «звездочки». Очевидной проблемой, возникшей в силу разницы вкусов, является то, что «трехзвездочный», по чьему-либо мнению, фильм для вас лично может стать «пятизвездочным» хитом. Вот почему Netflix четко разделяет общее количество «звездочек» и параметр «Лучшее для вас по нашему мнению». При этом во главу угла ставится вкус: этот фильм понравился вам на 0,7 больше других. И хотя можно предположить, что это точно отражает ваш вкус, дело осложняется тем, что, как и во всех рекомендательных системах, числовое значение здесь вычисляется с учетом действий других людей
[89]. Еще одной проблемой является то, что вы можете по-другому выставлять оценки – у вас может быть склонность к занижению или к завышению – вне зависимости от того, что вы в действительности думаете о фильме. «Некоторые мои знакомые очень щепетильно относятся к выставлению высоких оценок. Так что две или три «звездочки» в их случае – это совсем не плохо», – рассказал Аматриайн.
И это заставляет обратить внимание на нечто интересное в Netflix и его рейтингах. Подчиняясь традиции, появившейся в те времена, когда наше мнение формировали в основном рецензенты, имеющие собственную систему оценок, мы можем принять рейтинг и «звездочки» за твердое мерило качества – по крайней мере для нашего вкуса. Но и на индивидуальном, и на агрегированном уровне система «звездочек» Netflix вовсе не является постоянной величиной. Оценки тут напоминают скорее свободный рынок: в их мире тоже случаются поправки, «пузыри», эффект хеджирования, инфляция и иные формы статистических «шумов».
В начале 2004 года, например, в Netflix произошло «внезапное повышение среднего кинорейтинга». Неужели голливудские фильмы внезапно улучшились? Нет, улучшилась система рекомендаций. «Пользователи стали ставить больше оценок фильмам, которые отвечали их вкусам», – писал Иегуда Корень, исследователь, участвовавший в конкурсе Netflix по улучшению алгоритмов. Другими словами, фильмы стали оцениваться выше, потому что их стало выбирать больше людей, которые считали, что это хорошие фильмы. В зависимости от точки зрения можно расценивать это как нечто вроде ошибки выборки – люди, которым с большей вероятностью понравится данный фильм, ставили более высокие оценки. Либо это было достижение рыночного равновесия в области вкусов: люди получили возможность более точно выбирать фильмы (т. е. появилось предложение), которые им с большей вероятностью придутся по вкусу (т. е. на них появился спрос).
На индивидуальном уровне все еще более запутано. Попросите кого-нибудь заново оценить просмотренный фильм, и скорее всего оценка будет другой. Как показали эксперименты, путем простого изменения исходного пользовательского рейтинга можно повлиять на то, как тот же самый человек позже повторно оценит фильм. По всей видимости, люди дают другие оценки, если оценивают массив фильмов (для «натаскивания» алгоритма), а не один фильм. Телешоу люди оценивают иначе, чем фильмы. «Средний рейтинг телешоу гораздо выше, чем у фильмов», – рассказал Елин. Телевидение лучше, чем кино? «Интуиция мне подсказывает, что дело тут в выборке», – говорит он. «Кто, скажем, оценивает «Клан Сопрано»? Явно не тот, кто посмотрел пять минут и выключил, потому что решил, что ему неинтересно тратить на это время. Оценивает тот, кто увлекся и потратил на просмотр сто часов своей жизни». С другой стороны, «кто оценивает фильм «Шопокоп»? Возможно, фильм так себе, но он идет всего девяносто минут. Ваши пороговые критерии оценки могут быть совершенно иными».
Аналогично, один и тот же фильм при просмотре онлайн и на DVD может иметь разные рейтинги. «Особенно если фильм до боли правдивый», – рассказывает Елин – например, «крайне эмоциональный» фильм Спилберга. «Он на вас повлияет, но влияние может быть мимолетным. Так что, если вы оцениваете его сразу после титров, оценка может быть выше. А спустя неделю впечатление от него уже пройдет». Просмотр кино в одиночестве может окончиться более низкой оценкой, чем просмотр в компании воодушевленных друзей.
И так далее. «Я много лет играл с рейтингами», – серьезным тоном произносит Елин, напоминая в этот момент бывалого гангстера, вспоминающего свои сомнительные уличные подвиги. Я почувствовал, что в этих рейтингах ему хотелось достичь некой идеальной чистоты, найти платонов идеал того, что нравится людям. «Знаете, почему у меня осталось так мало волос? Я вырвал их, пытаясь постичь все эти вещи!» В итоге рейтинги оказались не столь уж мощным средством понять, что будут смотреть люди. Пол и география – тоже. «Хотя и это может помочь, если больше ничего не известно. Но, как только люди просмотрят на Netflix хотя бы пять фильмов, мы уже будем знать о них на порядок больше, чем пока знали лишь их возраст, пол и местожительство», – говорит Елин. Вы – это то, что вы смотрите.
Любовь к сладкому – это любовь к самой жизни.
Все эти разговоры о том, что рейтинги имеют меньшее значение, не означают, что меньшее значение теперь придается и рекомендациям. Они находятся в самом центре всей работы Netflix по совершенствованию алгоритмов и обеспечивают порядка 75 % просмотров.
Но теперь они стали гораздо менее явными. Вместо того чтобы сказать, что вам понравится, Netflix теперь в основном демонстрирует то, что вас интересует, в виде «персонализированных» блоков, которые строятся в соответствии с вашим пользовательским поведением. «Все на свете – рекомендация!» – как любит говорить Аматриайн о новом подходе «не только пять звезд». Даже поисковые запросы говорят о том, что «у нас нет того, что пользователи хотят смотреть», и это тоже учитывается системой рекомендаций. Зная, что вы ищете, можно вычислить, что вам может понравиться. Любое действие на сайте Netflix можно рассматривать в качестве метарекомендации: сайт, как и большая часть Интернета, представляет собой один обширный и постоянно длящийся эксперимент в области предпочтений, серию «А/В-тестов», в которых вы участвуете, сами не зная об этом. Если окно поиска на сайте обувного магазина будет слева, повысятся ли продажи по сравнению с вариантом дизайна, когда окно справа? А если пустить на сайте блок с названием «Зарубежные драмы 1980-х», будете ли вы смотреть больше зарубежных драм из 1980-х?
Рекомендательные блоки отражают нечто вроде «золотой середины» между двумя экстремумами сигналов, которые сами по себе не несут особой пользы: первое – то, что, как вы говорите, вам нравится. Этот сигнал может завести во вкусовой тупик, полностью забитый малоизвестными, но интересными фильмами, которые вы будете смотреть только изредка. У создателей алгоритмов это называется «чрезмерно близкая подгонка»: система дает рекомендации, которые в некотором роде чересчур совершенны – и абсолютно стерильны.