От «преглупого индиффирентизма» к «тупому пофигизму»: лингвист Борис Иомдин о том, как устроен и почему меняется язык
Впрочем, почитать о самом исследовании можно на странице исследований «Яндекса». Мы же пообщались с одним из его авторов, кандидатом филологических наук, заведующим сектором теоретической семантики Института русского языка им. Виноградова и ученым «Яндекса» Борисом Иомдиным, узнав, как и в каком направлении меняется родная речь.
– Эта работа – просто удачный пиар, или же она имеет и научную ценность?
Подобных исследований, кажется, еще не было. Хотя бы потому, что до последнего времени не существовало самой возможности рассмотреть такие тексты. Речь идет о большом корпусе дневников за 1900-1940 гг., собранных проектом «Прожито» Европейского университета в Санкт-Петербурге. Другим источником послужили блоги «Яндекс.Дзен» – огромное количество записей за 2019-2021 гг., общим объемом около 11 млрд словоупотреблений.
Организованного корпуса этих текстов пока нет, а часто их нельзя найти и просто в открытом доступе. А между тем, именно они позволяют увидеть, как сейчас пишут по-русски люди, не обремененные рамками редактуры и корректуры – «как пишется». Конечно, многих людей такие тексты возмущают большим числом ошибок. Но для лингвистов это – золотое дно.
Кроме того, в последние годы появился метод семантических векторов, который позволяет описать значение каждого слова в цифрах. Для этого алгоритм фиксирует, рядом с какими словами оно появляется и как часто. По такому окружению можно сказать, что слово «стилист» ближе всего к словам «парикмахер», «визажист» и т.д. Затем сравниваем со старыми текстами: здесь оно появляется рядом со словами «литература», «беллетристика», «писатель». Так можно автоматически отобрать те слова, которые значительно изменили значение.
Далее мы садимся и перебираем найденные примеры вручную. Стоит исключить имена собственные, а также понятия, связанные с изменившимися реалиями жизни – «смартфон», «антиоксидант», «автокредит», – их появление объяснимо и не слишком интересно. Ясно, что с улиц исчезли извозчики и ямщики, поэтому эти слова используются намного реже. Их можно отсеять, чтобы сосредоточиться на тех словах, которые и были, и есть, но изменились.
Может показаться, что время, которое охватывают исследованные тексты, недостаточно велико. Мы легко понимаем и устную, и письменную речь людей начала прошлого века, и даже в школе читают куда более старые тексты. Но недаром школьники так часто жалуются на непонятные термины в классической литературе. Для этого имеются все причины: за это время изменились и слова, а главное – словоупотребление. Как, например, инфлюэнца, которая была тогда и остается сегодня, но теперь называется уже по-другому: гриппом.
– Можно ли в общих чертах понять общее направление этих изменений?
Можно выделить лишь некоторые долговременные тенденции. Например, для русского характерен очень медленный дрейф в сторону аналитичности. Дело в том, что для выражения понятий и мыслей разные языки используют разные механизмы. Русский язык – скорее синтетический, он любит «уложить» несколько смыслов в одно слово. Есть языки полисинтетические, с еще более сложными и длинными словами, в которые иногда «упаковываются» целые предложения, как в чукотском.
А вот яркий пример аналитического языка – китайский, в нем каждому смыслу соответствует отдельный иероглиф-слог, и слова очень короткие. По-русски мы можем сказать «перераспределяющееся», это длинное синтетическое слово, состоящее из многих слогов. В аналитическом языке оно выглядело бы как набор отдельных слов-«кирпичиков»: «то, что теперь распределяется по-другому». Английский язык – тоже скорее аналитический. То, что по-русски мы скажем в три слова – «он пытался встать», – по-английски потребует уже шести: he was trying to get up.
Русский понемногу движется к аналитизму, в сторону китайского и английского. Это можно заметить и по изменениям, произошедшим за последнее столетие. Мы куда реже употребляем такие сравнительные степени, как «высочайший» или «значительнейший», и скорее скажем «самый высокий» и «самый значительный». То же с некоторыми приставками: «архи-» и «пре–». «Премило», «прелюбопытно», «архисрочно» – в корпусе старых дневников мы встречаем такие слова десятками, а сейчас их почти не найти. Эту роль взяло на себя отдельное слово «очень»: «очень мило», «очень срочно».
А вот хорошего ответа на вопрос о том, что движет этими изменениями, нет. Мы можем лишь заметить движение, но не знаем, какая внутренняя сила его направляет. Тем более что единой тенденции здесь нет: одни языки дрейфуют к аналитичности, другие – к синтетичности.
– Насколько влияют на этот процесс официальные нормы и правила?
Не влияют практически никак. Взять хотя бы знаменитую реформу орфографии, с отменой твердого знака на конце слов. Когда-то в древнерусском имелись очень краткие гласные. В далеком прошлом они произносились и на концах слов, но часто «проглатывались» и постепенно исчезли вовсе: слова вроде «столъ», «братъ» стали произносить в один слог. Произносить эти гласные перестали еще около XII века: это видно потому, что в текстах стали массово появляться ошибки (привычные нам теперь написания «стол», «брат» и т. п.). Очень краткие гласные очень давно не произносили в устной речи, но продолжали писать, и только через 800 лет правила зафиксировали это исчезновение. Фиксация изменения языка опоздала на сотни лет. А, скажем, во французском или английском языке в похожей ситуации так и продолжают писать на конце слов непроизносимые гласные (например, table, rose), и это тоже никак не повлияло на давно совершившееся изменение произношения.
На сам язык официальные нормы не оказывают практически никакого влияния. В слове «солнце» они и сегодня требуют писать букву «л», но это не заставляет нас ее произносить. Устная речь очень редко меняется под влиянием написания, а вот орфография постепенно может подстроиться под устную речь. И в нашем исследовании видны некоторые такие изменения. Скажем, раньше писали «биллиард», а теперь «бильярд», очевидно, под влиянием произношения Никакие регулирующие органы никакой роли в этом не играют. Не существует документов, которые бы указывали, например: «Перестаем говорить "хворать", говорим "болеть"». Это происходит само собой
О причинах таких изменений можно говорить лишь в редких случаях. Скажем, в последнее время русский язык «полюбил» предлоги «по» и «на». Можно заметить, что они вытесняют многие другие предлоги, такие как «о» и «для». Все чаще говорят «поговорим по этому вопросу», «пучки на редкие волосы», что многим образованным людям кажется некорректным и некрасивым. То же и с приставкой «по», которая замещает «конкурентов»: мы говорим «подорожание», а не «вздорожание», «поцеловаться», а не «расцеловаться».
Этот процесс соблазнительно связать со стремлением языка к стандартизации. Большое разнообразие форм и вариантов трудно запомнить и применять. Если совершенный вид глагола образуется миллионом разных способов («вздорожать», «расцеловаться», «проконспектировать», «срепетировать», «выкупаться»), это неудобно. И по-видимому, происходящее с предлогом и приставкой «по» укладывается в эту тенденцию.
– Получается, что лексика меняется быстрее орфографии?
Лексика меняется быстрее всего. Новые слова и значения появляются постоянно – вспомните хотя бы «ковид» или «омикрон», совсем свежие приобретения. Существенно медленнее движется фонетика, то есть звучание языка. За последний век она изменилась мало. Достаточно послушать аудиозаписи столетней давности, чтобы заметить, что тогда люди говорили в целом так же, хотя некоторые отличия всё-таки бросятся в уши.
Стабильнее всего грамматика языка. Скажем, системы падежей и родов в русском существенно не изменились со времен древнерусского. Заметнее всего упростились времена глаголов, но и это произошло уже очень давно: даже во времена Пушкина глагольные времена были те же, что и у нас. В далеком прошлом их было шесть, а сегодня осталось всего три, причем три полноценные разные формы сохранил только глагол «быть»: «был», «есть», «буду». У всех остальных есть или только настоящее и прошедшее («писал», «пишу»), или прошедшее и будущее («написал», «напишу»). В других вариантах слово либо не употребляется (нельзя сказать «написать» в настоящем времени), либо замещается аналитической формой (в будущем – «буду писать»). Таким образом, остается гораздо меньше форм, которые необходимо держать в голове.
– Куда заведет нас этот процесс в будущем?
В современном русском можно выделить несколько «трудных» моментов, которые переживают довольно быстрые изменения в сторону упрощения. Это, например, числительные. Нелегко сходу правильно сформулировать фразу «с тысячью восемьюстами», и люди все охотнее говорят просто «с тысячей восемьсот». При желании, здесь тоже можно заметить тенденцию к аналитизму (уменьшение количества изменяемых слов), и она наверняка сохранится.
Еще один известный пример — перенос ударения на первый слог в таких глагольных формах, как «звонит», «солит», «включит», «долбит». Этот процесс идет уже достаточно давно, и можно ожидать, что в будущем они окончательно превратятся в «звОнит», «сОлит», «вклЮчит» и «дОлбит».
Но вот, скажем, откуда и какими темпами будут заимствоваться новые слова, предсказать невозможно. Сегодня они приходят к нам, в основном, из английского («веб», «лейбл», «лайфхак»), либо из научной терминологии («плацебо», «коллаген»). Многие считают, что в таком заимствовании есть нечто плохое, и со временем «чужие» слова вытеснят все наши «родные». Но на самом деле совсем не редко происходит и обратное. Так, как показало наше исследование, мы уже давно не говорим «телефонировать» или «визитировать», употребляя русские «звонить» или «ходить в гости», а в первой половине XX века они еще вполне были распространены.
Многие новые слова образуются внутри самого языка: «посудомоечный», «послевкусие», «пошаговый», «предзаказ» — это новые приобретения, которые ни разу не встретились в дневниках за 1900–1940 годы. Кроме того, в прошлые эпохи шире заимствовались слова французские, немецкие, тюркские, польские. И в будущем английский, может быть, перестанет быть главным источником новинок, а его место займет какой-нибудь другой. Впрочем, в разных российских регионах и сейчас происходят заимствования из разных языков. Например, в некоторых регионах Дальнего Востока в значении «кафешка» употребляется пришедшее из китайского «чифанька», а на Сахалине лапшу быстрого приготовления называют корейским словом «кукса». Но это уже тема другого нашего исследования.