Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Жан-Батист Мишель , Эрец Эйден

Описание

Эта книга исследует, как "большие данные" могут быть использованы для изучения сложных проблем языка, культуры и истории. Авторы, лингвисты и компьютерные гении, показывают, как анализ огромных массивов информации помогает раскрыть тайны прошлого и предсказать будущее нашей культуры. Книга основана на использовании сервиса Google Ngram Viewer и термина "культуромика", предоставляя читателям уникальную перспективу на исторические процессы. Книга описывает, как анализ больших данных может помочь нам понять эволюцию языка и культуры, а также предсказать будущие тенденции. Авторы показывают, как "большие данные" могут быть использованы для изучения сложных проблем языка, культуры и истории.

<p>Эрец Эйден, Жан-Батист Мишель</p><p>Неизведанная территория</p><p>Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры</p>

Моему папе, который всегда верил, что я умею считать

– ЭРЕЦ ЭЙДЕН —

Моей семье

– ЖАН-БАТИСТ МИШЕЛЬ —
* * *

Erez Aiden and Jean-Baptiste Michel

Uncharted: Big Data as a Lens on Human Culture

Дизайн обложки: студия OpenDesign

Печатается с разрешения авторов и литературного агентства Brockman, Inc.

Исключительные права на публикацию книги на русском языке принадлежат издательству AST Publishers. Любое использование материала данной книги, полностью или частично, без разрешения правообладателя запрещается.

Фото Эреца Эйдена © Eliza Grinnel

Фото Жана-Батиста Мишеля © Bret Hartman

<p>Глава 1</p><p>Зазеркалье</p>

Давайте представим, что у нас есть робот, способный прочитать каждую книгу на каждой полке всех крупных библиотек мира. Он может их прочесть невероятно быстро и запомнить каждое прочитанное слово в своей бесперебойно работающей памяти. Чему мы могли бы научиться у такого робота-историка?

Вот вам простой пример, знакомый каждому американцу. В наши дни принято говорить, что южные штаты полны (are full, множественное число) южан. Мы также говорим, что северные штаты полны (are full) северян или что штаты Новой Англии полны (are full) жителями. Однако мы говорим: the United States is full of citizens (то есть «США полон жителей», единственное число). Почему мы используем единственное число? Вопрос лежит не только в области грамматики – это, скорее, вопрос нашей национальной идентичности.

После основания Соединенных Штатов Америки основополагающий документ – Статьи Конфедерации – наделил центральное правительство слабыми полномочиями и описывал новое государство не как национальное объединение, а, скорее, как «дружеский союз» между отдельными государствами, чем-то напоминающий современный Европейский союз. Люди воспринимали себя не гражданами США, а гражданами определенного штата (государства).

И в этом смысле граждане говорили о Соединенных Штатах во множественном числе, что было вполне закономерно для союза различных и в целом независимых государств. Например, в обращении президента Джона Адамса 1799 года говорится о «Соединенных Штатах и их договорах с ее Британским Величеством» (курсив наш. – Э. Э. и Ж.-Б. М.). В наше время для президента США это совершенно немыслимо.

Когда же слова «Мы, народ…» (Конституция США, принятая в 1787 году) стали обозначать «одну нацию» (Клятва верности флагу, включенная в «Кодекс о флаге США» в 1942 году)? [1]

Если бы мы спросили об этом людей-историков, то, возможно, они бы указали нам на самый знаменитый ответ из финала знаменитой книги Джеймса Макферсона по истории гражданской войны – «Боевой клич свободы» [2]:

…Некоторые масштабные последствия войны кажутся очевидными. Были побеждены раскол и рабство, чтобы никогда не возникнуть вновь, даже через полтора столетия после Аппоматокса. Этот итог означал серьезную трансформацию американского общества и изменение государственного устройства, уточнившегося, если не сформировавшегося, в результате войны.

До 1861 года слова «Соединенные Штаты» чаще всего использовались как существительное во множественном числе: the United States are republic («Соединенные Штаты представляют собой республику»). Война привела к тому, что «Соединенные Штаты» стали в английском языке существительным в единственном числе.

Похожие книги

97 этюдов для архитекторов программных систем

Нил Форд, Билл де Ора

Архитекторы программного обеспечения играют ключевую роль в успехе проектов. Книга "97 Этюдов для архитекторов программных систем" предлагает практические советы от ведущих специалистов. Она охватывает широкий спектр тем, от решения распространенных проблем до создания эффективных команд. Авторы, включая Билла де Ору, Майкла Хайгарда и Нила Форда, делятся своим опытом, предлагая решения для повышения качества и эффективности работы в сфере разработки ПО. Книга является ценным ресурсом для всех, кто хочет улучшить свои навыки проектирования архитектуры программных систем и добиться успеха в IT-профессии.

BPwin и Erwin. CASE-средства для разработки информационных систем

Сергей Владимирович Маклаков

Эта книга – практическое руководство по созданию информационных систем с помощью CASE-средств BPwin и ERwin. Она детально описывает методы структурного анализа и проектирования моделей данных, необходимые для практической работы. Книга наглядно демонстрирует применение CASE-технологий для автоматизации этапов анализа, проектирования и кодогенерации информационных систем. Идеально подходит для системных аналитиков, проектировщиков, администраторов баз данных, а также студентов, изучающих основы системного анализа и проектирования информационных систем. Вы научитесь использовать BPwin и ERwin для эффективного управления сложными проектами, моделирования бизнес-процессов и создания качественных отчетов.

MySQL: руководство профессионала

Алексей В Паутов, Алексей В. Паутов

Это практическое руководство по MySQL, основанное на заметках автора, посвященных версиям 4 и 5. Оно предоставляет глубокое понимание работы с базами данных MySQL, особенно в отношении точной математики и типов данных. Особое внимание уделено местам, специфичным для каждой версии. Материал логически продолжает предыдущее руководство «MySQL: Руководство администратора» и ориентирован на ту же аудиторию. Автор Алексей В. Паутов, используйте ссылку на автора и проект RussianLDP:MySQL при любом использовании.

Программирование. Принципы и практика использования C++ Исправленное издание

Бьёрн Страуструп, Ирина Сергеевна Козлова

Это переработанное издание популярной книги по C++ от автора языка. Книга подробно описывает язык программирования C++, предоставляя практические примеры и подходы к решению задач. В ней освещены как базовые, так и продвинутые концепции, включая стандартную библиотеку шаблонов (STL), пространства имен, механизм идентификации типов во время выполнения (RTTI), явные приведения типов (cast-операторы) и другие. Добавлены новые приложения по локализации и безопасной обработке исключений. Книга подходит для программистов, преподавателей, студентов и всех, кто хочет изучить C++.