Роман с Data Science. Как монетизировать большие данные - читать онлайн книгу. Автор: Роман Зыков cтр.№ 65

читать книги онлайн бесплатно
 
 

Онлайн книга - Роман с Data Science. Как монетизировать большие данные | Автор книги - Роман Зыков

Cтраница 65
читать онлайн книги бесплатно

Какой сотрудник лучше: тот, кто прошел штук 20 разных курсов и сделал очень много учебных заданий, или тот, кто пару несложных проектов довел до конца, от идеи до реализации? В 95 % случаев я выберу второго. Моя личная практика показала, что есть люди-теоретики, а есть практики. Я нанимал теоретика на одну из наших задач, думая, что если человек хорошо разбирается в теории, то он разберется и в практике. Ничего хорошего из этого не получилось.

Хорошо, можно много не читать, но как тогда получать информацию? Вот что написал Хэмминг:

«Если вы все время читаете, что сделали другие люди, вы будете думать, как думали они. Если вы хотите думать новые мысли, отличающиеся мысли, тогда делайте то, что делают многие креативные люди: сформулируйте задачу достаточно ясно и отказывайтесь смотреть какие-либо ответы, пока основательно не продумаете задачу – как вы будете решать ее, как вы можете немного изменить ее, чтобы формулировать ее правильно. Поэтому да, вам надо быть в курсе. Вам надо быть в курсе больше, чтобы узнавать, какие есть задачи, чем читать, чтобы находить решения. Чтение, чтобы находить решения, не кажется путем к значимым исследованиям. Поэтому я дам два ответа. Вы читайте; но имеет значение не сколько, а как вы читаете».

В свое время меня критиковал мой преподаватель физики: «Зачем ты изобретаешь велосипед и выводишь эту формулу?» Я никогда не любил учить наизусть, просто ненавидел это. Мне было проще знать базовые принципы и несколько формул, все остальное выводится через них – пускай это и дольше, чем пользоваться готовыми. Вы знаете, что на письменном экзамене по физике на Физтехе можно пользоваться любой литературой? Хоть целый рюкзак учебников приноси. Как вы думаете, это сильно помогало? Нет, потому что без понимания базовых принципов сложнейшие физические задачи не решить. Принципы решения задач отрабатываются на задачах, а не на чтении решений и заучивании формул. Невозможно все знать, и бывает проще найти свой подход, чем копать горы литературы в поисках очередных «кейсов». Кейсы сейчас воспринимаются как рецепты – применишь, и все получится. Но чего-то нестандартного из кейсов уже не сочинишь.

Еще Хэмминг заметил, что ученые в Bell Labs, у которых была приоткрыта дверь в кабинет, добились большего, чем ученые, дверь которых была закрыта. И это тоже альтернатива чтению. Открытость ума и широта взглядов помогают добиться успеха. Что мы можем для этого сделать? Как минимум не отмахиваться от коллег, как от назойливых мух, и не запираться от них в своих кабинетах с магнитными замками. Да, они могут отвлекать своими вопросами и просьбами, но они также и опускают вас с небес ваших мыслей на земную твердь реальности. Коллеги – источник информации, которую вы нигде больше не получите. Заодно они могут участвовать в брейншторме ваших идей – в информационном вакууме заточить их невозможно. Будучи сооснователем и директором по аналитике Retail Rocket, я иногда садился со своим ноутбуком в других отделах, просто сидел, слушал в фоновом режиме, что там происходит, и именно так узнавал о проблемах, о которых не подозревал и никогда бы не узнал, если бы задавал вопросы в лоб. И это давало мне полезную информацию, которую я мог воплотить в своих решениях.

Эпилог

Цель этой книги – дать практические советы. И если у вас получится применить в работе хотя бы несколько моих идей, для меня, как для автора, это будет успехом.

Напоследок еще один совет: постоянно задавайте себе вопрос «все ли я выжимаю из данных?» Где-то аналитику я организовывал сам (Ozon.ru, Wikimart.ru, Retail Rocket), где-то консультировал («Технониколь», «Иннова», «Купивип», Fastlane Ventures) и понял, что дело не только в цифрах. Чтобы использовать данные максимально эффективно, нужно, во-первых, следить за качеством самих данных, а во-вторых, правильно организовать взаимодействие людей внутри компании, приоритизацию гипотез и использование технологий. Все эти направления я постарался подробно разобрать в главах этой книги.

Мы получаем знания о жизни методом проб и ошибок: дети экспериментируют больше, а взрослые меньше. Точно так же организации, чтобы развиваться, нужно экспериментировать: генерировать идеи, проверять их на практике, получать результат и повторять этот цикл снова и снова, даже если результат не так хорош, как вы ожидали, и у вас опускаются руки. Не бойтесь неудач – именно через эксперименты происходят все улучшения.

Вы всегда можете связаться со мной через сайт поддержки книги https://topdatalab.ru/book или написать мне по адресу электронной почты rzykov@todatalab.ru. Буду рад ответить на ваши вопросы!

Список литературы

Список литературы для книги сделан в основном на ссылках. Спустя какое-то время часть ссылок перестает работать. Поэтому я сделал механизм поддержки работающих ссылок. Он построен на URL: http://topdatalab.ru/ref?link=[Номер ссылки]. Номер ссылки означает номер из списка литературы (например, для номера 1 – https://topdatalab.ru/ref?link=1). Если какая-то ссылка или QR-код в книге перестает работать и мне становится об этом известно, то я восстановлю ее работоспособность. Читателю для этого ничего делать не нужно, кроме как уведомить меня по email (rzykov@topdatalab.ru), что ссылка перестала работать.


1. Роберт Сапольски. «Биология добра и зла. Как наука объясняет наши поступки».

2. Письмо Amazon.com акционерам, 2015 год. https://www.dropbox.com/s/c2m4zvcv0bxqb6f/2015-Letter-to-Shareholders.PDF?dl=0

3. Письмо Amazon.com акционерам, 2016 год. https://blog.aboutamazon.com/company-news/2016-letter-to-shareholders

4. What is decision intelligence. https://towardsdatascience.com/introduction-to-decision-intelligence-5d147ddab767

5. Focus on decisions not outcomes. https://towardsdatascience.com/focus-on-decisions-not-outcomes-bf6e99cf5e4f

6. В России очень низкая смертность от коронавируса. Как ее считают? https://www.bbc.com/russian/news-52641008

7. Understanding Decision Fatigue. https://topdatalab.ru/ref?link=7

8. Саша Сулим, «Безлюдное место. Как ловят маньяков в России».

9. «Building Data Science Teams» by DJ Patil. https://www.dropbox.com/s/9scdtqmi8k2lb5y/Building%20Data%20Science%20Teams.pdf?dl=0

10. What’s the difference between analytics and statistics? https://towardsdatascience.com/whats-the-difference-between-analytics-and-statistics-cd35d457e17

11. «Поиск причин проблем». https://multithreaded.stitchfix.com/blog/2016/03/23/debunking-narrative-fallacies/

12. «Атака на АБ-тест: рецепт ‘R’+t(101)+’es46». https://habr.com/ru/company/retailrocket/blog/330012/

13. Измеряйте самое важное. Как Google, Intel и другие компании добиваются роста с помощью OKR | Дорр Джон.

14. Dogs vs. Cats: Create an algorithm to distinguish dogs from cats. https://www.kaggle.com/c/dogs-vs-cats

15. ResNet-50 is a convolutional neural network. https://github.com/matlab-deep-learning/resnet-50

Вернуться к просмотру книги Перейти к Оглавлению