Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать онлайн книгу. Автор: Эйден Эрец, Жан-Батист Мишель cтр.№ 65

читать книги онлайн бесплатно
 
 

Онлайн книга - Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры | Автор книги - Эйден Эрец , Жан-Батист Мишель

Cтраница 65
читать онлайн книги бесплатно

Жизнь тяжела


Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Новые времена


Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Великие умы


Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Мудрые слова


Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
О графиках

Графики в этой книге были созданы под впечатлением от великолепного визуального стиля веб-комикса xkcd авторства Рэндалла Манро (http://xkcd.com/). Идея автоматизации создания графиков в стиле xkcd была предложена Дэймоном Макдугаллом. Графики в самой книге создавались в программе Python, с использованием модифицированной версии программы Джейка Вандерпласа. Эти n-грамы можно создавать интерактивно на сайте Google Ngram Viewer: http://books.google.com/ngrams/, а в стиле xkcd – по адресу http://xkcd.culturomics.org. Мы надеемся, что Манро не будет на нас в обиде (см. http://xkcd.com/1007/ и http://xkcd.com/1140/). Некоторые из его любимых n-грамов можно найти по адресу: http://xkcd.com/ngram-charts/.

Обратите внимание, что данные приводятся с учетом регистра, а вид графиков n-грамов зависит от нескольких параметров. Если в заметках не указано иное, то все графики n-грамов, приведенные в тексте книги, в точности соответствуют результатам работы Google Ngram Viewer, при использовании корпуса English 2012 и трехлетнего сглаживания. Также, если не указано иное, текст запроса приводится полностью в нижнем регистре, за исключением имен собственных, которые пишутся как обычно. Все соответствующие массивы данных для работы можно загрузить по адресу: http://goo.gl/3IIA9.

При упоминании конкретных n-грамов, таких как Marc Chagall и Kubismus в корпусе на немецком языке, они указываются в виде NV: «Marc Chagall, Kubismus»/German. В случае если корпус не указан (например, NV: «cubism»), использовался корпус English 2012. В ряде случаев мы указываем диапазон лет или значение параметра сглаживания.

Вернуться к просмотру книги Перейти к Оглавлению Перейти к Примечанию