Задачи нового корпуса русского языка

Многие лингвисты, работающие с Национальным корпусом, обнаруживают, что содержащихся в нем данных недостаточно для проводимого ими исследования. Из-за этого, как это было показано, например, в доклад е на той же конференции Анны Зализняк и Ирины Микаэлян, лингвистам приходится обращаться к интернету. В противном случае, опираясь только на данные НКРЯ, можно сделать неверный вывод о приемлемости или особенности употребления того или иного слова или языковой конструкции. Особенно это заметно в случае, когда имеет место вариативность в ее употреблении: Такие явления требуют существенно большего объема данных для исследования, чем есть в существующих корпусах нужны не сотни миллионов, а десятки миллиардов словоупотреблений. Выручит ли исследователей интернет? Для решения многих задач лингвисты вынуждены пользоваться интернетом. Беда тут в том, что обращаться за данными интернета лингвист сегодня может только с помощью поисковой системы, такой как или Яндекс.

Особенности перевода деловых писем и контрактов

[1] Не все функции доступны во всех выпусках и версиях . Для использования некоторых возможностей требуется усовершенствованное и или дополнительное оборудование, драйверы и или программное обеспечение. В ОС 10 всегда включено автоматическое обновление. При обновлении может потребоваться оплата услуг интернет-провайдера и выполнение дополнительных требований.

Дополнительные сведения см.

При этом корпус текстов (рабочий термин современной лингвистики, нормы за счет употребления в СМИ сниженной и ненормативной лексики и т . п. концептуально связаны с такими областями, как бизнес, политика, спорт.

Все это не могло не сказаться на процессах производства и распространения слова, на особенностях речеупотребления и характере языковых изменений. Основной объем речепользования приходится сегодня именно на сферу массовой коммуникации. Тексты массовой информации, или медиатексты, являются одной из самых распространенных форм современного бытования языка, а их совокупная протяженность намного превышает общий объем речи в прочих сферах человеческой деятельности.

Концепция единого информационного пространства имеет ключевое значение для понимания динамики языковых изменений, так как позволяет представить многогранную деятельность мировых и национальных средств массмедиа в виде единой, целостной системы, функционирование которой оказывает существенное влияние на течение и развитие лингвокультурных процессов. В современной науке для обозначения этой новой виртуальной территории без государственных границ и осязаемых барьеров используется целый набор терминов и понятий, относящихся к одному семантическому ряду, и подчеркивающих особенности массовых коммуникационных процессов, как-то: Важнейшей составляющей мирового информационного пространства является его лингвокультурный компонент, значение которого трудно переоценить, поскольку любая словесно выраженная информация является воплощением определенного языка и культуры.

Понимаемая как ареал распространения того или иного языка и культуры в мировом медиаландшафте, концепция лингвокультурного пространства позволяет продемонстрировать фактическое несовпадение территориальных, государственных границ с границами информационных сфер влияния. Так, реальные контуры англо-американского лингвокультурного пространства выходят далеко за пределы территорий соответствующих государств в силу огромного охвата англоязычного медиавещания и распространения Интернета.

Оценивая воздействие современных массмедиа на протекание языковых процессов, следует разграничить три уровня анализа: Геолингвистический уровень предполагает анализ того, как воздействуют СМИ на состояние и развитие общей лингвокультурной ситуации в мире и в регионах. Здесь внимание сосредоточено на таких важнейших количественных и ареальных показателях, как передел языковых сфер влияния: На уровне интерлингвистическом, или межъязыковом, исследователей интересуют вопросы взаимодействия и взаимовлияния языков, изучаются механизмы и способы заимствований, а также функциональные стили и сферы речеупотребления, наиболее подверженные иноязычному влиянию.

Уровень интралингвистический, или внутриязыковой, позволяет сосредоточить внимание на медиаобусловленных языковых процессах в рамках одного лингвокультурного ареала. К ним относятся:

Фундаментальные корпусы. Объем корпуса около 1 млн словоупотреблений. В корпус вошли тексты, впервые вышедшие в г. В г. Он создавался несколько позже Брауновского, но включал тексты того же временного периода и тех же жанров, но британского варианта английского языка. Аннотированная версия корпуса появилась уже в г.

Чтобы ознакомиться с тематической лексикой, я посетила несколько . Управление бизнес-процессами на всех этапах создание .. всё-таки работает он на современном корпусе текстов, а современный, даже.

Сравнение частоты отдельных слов среднее на миллион словоупотреблений. Как видим, теоретические рекомендации относительно достаточного размера корпуса в данном случае оказываются не слишком достоверными. Причина этого кроется в исходных допущениях на нормальное Гауссово распределение частоты слов, в соответствии с которым каждое слово встречается с одинаковой частотой во всех текстах. Если слово встретилось в тексте один раз, то при нормальном распределении это не влияет на вероятность его употребления там во второй раз.

Но в реальности это не так. Каждый текст имеет некоторую собственную тему, слова которой в этом тексте будут употребляться намного чаще среднего. В тексте про хоббитов слово хоббит будет употребляться так же часто, как и многие служебные слова, что существенно повысит его частоту в корпусе, который будет включать хотя бы один такой текст [1]. В результате частотный список, построенный на основе корпуса, отражает специфику тех текстов, которые попали в него при его составлении.

Таблица 2 показывает несовершенство частотных словарей, построенных на относительно небольших корпусах, но простое увеличение размера корпуса также не гарантирует стабильности результатов. При интерпретации списков частотного словаря надо помнить, что любой корпус, каким бы большим он ни был, является конечным подмножеством потенциально бесконечного множества текстов на данном языке. Любая другая выборка этого подмножества породит несколько другой список, который будет отличаться в своих менее частотных элементах.

Корпус большего размера, отражающий большее количество тем и функциональных стилей корпус типа или НКРЯ , обеспечивает хорошую надежность для наиболее частотных элементов. Тем не менее, дальнейшее увеличение объема текстов в ущерб их разнообразию см. Поскольку задачей частотного словаря является не просто ранжировать слова по их частоте в отдельном корпусе, но и определить лексическое ядро языка, необходимо отделить слова, часто встречающиеся во многих текстах, от тех, чье лексическое поведение подобно словам Норьега или хоббит, и которые случайно оказались в той или иной позиции частотного списка.

Лексика экономического текста в переводческой практике

Вся моя жизнь связана с английским языком: В студенческие годы я работала письменным переводчиком, а сразу после выпуска — устным. С тех пор как я устроилась маркетологом в международную -компанию, ко мне все чаще обращаются с просьбами написать или отредактировать англоязычные тексты -тематики. Если бы не опыт работы переводчиком, меня такие просьбы поставили бы в ступор. Ведь мой текст увидят иностранцы — клиенты компании, руководители! Для этого расскажу о 5 основных ошибках, которые мешают написать нормальный англоязычный текст.

Изучение бизнес-лексики, делового общения, стандартов сокращения. обобщать и критически интерпретировать содержание текста; делать обзоры.

Введение В последние годы создание корпусов и корпусно-ориентированные исследования стали неотъемлемой частью деятельности лингвистов. В мире корпусная лингвистика как особое направление сложилась к началу х годов. Безусловно, ключевым моментом стало создание Национального корпуса русского языка г. О востребованности корпуса свидетельствуют многочисленные публикации, подготовленные на корпусе.

Часть из них находится на сайте корпуса в разделе . Начинают выходить учебные пособия по корпусной лингвистике - см. Первые корпусы русского языка Первый русскоязычный корпус был создан в е гг.

2.2.1. Общеоценочная лексика в тексте литературной сказки

О словаре Словарь включает наиболее употребительные слова современного русского языка 2-я половина — начало вв. Словарь основан на текстах Национального корпуса русского языка объемом млн. Разработка концепции словаря и его подготовка к изданию осуществлена О. Ляшевской и С.

Словарь основан на текстах Национального корпуса русского языка объемом слова в общем корпусе и в подкорпусе текстов определенного функционального корпуса, словаря французской лексики в области бизнеса).

Бизнес курс немецкого языка рассчитан на широкий круг слушателей: Содержание курса Изучение бизнес-лексики, делового общения, стандартов сокращения. Знакомство с лексикой в профессиональной области студента. Изучение правил веденя деловой переписки. Формирование навыков составления презентаций на немецком языке.

Программа имеет несколько уровней по окончании уровня вы сможете полностью понимать содержание устного или письменного сообщения выражать собственное мнение делать развернутое сообщение на основе услышанного или прочитанного вести деловую переписку средней сложности читать адаптированную литературу на немецком языке. 1 М1 сможете без предварительной подготовки общаться по телефону с иностранными партерами вести переговоры средней сложности вести деловую переписку любой сложности составлять презентации на немецком языке читать адаптированную литературу на немецком языке.

3 М3 вы сможете свободно владеть немецким языком в различных ситуациях в том числе нестандартных, стрессовых сможете без подготовки общаться с носителями языка вести переговоры любой сложности читать неадаптированную литературу на немецком языке обобщать и комментировать содержание текста делать обзоры прочитанного выполнять переводы любой сложности составлять материалы на немецком языке любой сложности отчеты, бизнес-планы и т. Средняя продолжительность каждого уровня — 96 ак.

Начать заниматься можно в любое время.

Как пользоваться новым частотным словарем русской лексики

Санкт-Петербургский государственный университет Филологический факультет Кафедра математической лингвистики В. Беляева Рос. Герцена канд. Коваль С. З Корпусная лингвистика: Предлагаемое пособие содержит описание предмета и основного содержания корпусной лингвистики — нового направления в лингвистике.

экономическом университете, корпус инженерных текстов на . ния отобранной профессиональной лексики английского языка; по различным темам (биографии, бизнес, экономика, искусство, история, циви-.

Для этого определяются четыре дополнительные эмоциональные метки: Первая соответствует положительным эмоциям, которые определяются как эмоциональные состояния, характеризующиеся наличием положительных гедонистических сигналов или удовольствия. Она включает в себя такие синсеты как радость 1 или увлечение 1. Аналогично негативная метка идентифицирует негативные эмоции, характеризующиеся отрицательными гедонистическими сигналами или болью , например, гнев 1 или печаль 1.

Синсеты, представляющие эмоциональные состояния, валентность которых зависит от семантического контекста например, удивление 1 помечаются как неоднозначные. Наконец, синсеты, определяющие психологические состояния и всегда рассматривающиеся как неоднозначные, но при этом не характеризующиеся валентностью, являются нейтральными [21]. Синсеты, помеченные эмоциональными метками, дополнительно переразмечаются шестью эмоциональными категориями:

Бизнес английский для начинающих. Разговорный деловой английский язык. Уроки английского языка