От корпуса к словарю.
7. Почему частотность важна?
Считается, что чем чаще встречается то или иное слово, тем полезнее его учить. Например, слова ‘ameliorate’ и ‘improve’ значат примерно одно и то же, но ‘improve’ встречается в 250 раз чаще. Выучить слово ‘improve’ стоит в первую очередь (но выучить – это не просто запомнить значение, а ещё и знать правила согласования и устойчивые выражения с этим словом), потому что оно входит в «ядро» английского языка: вы будете его часто видеть, слышать, да и нередко использовать. Со словом ‘ameliorate’ всё иначе: если вы вдруг на него наткнётесь, что маловероятно из-за его редкости, вы всегда сможете найти его в словаре (однако это не значит, что стоит пренебрегать запоминанием редких слов!).
Работая с очень объёмным корпусом, мы с лёгкостью определяем частотность не только отдельных слов, но и грамматических моделей (‘decide’ + инфинитив) или устойчивых выражений (‘crucial’ + ‘importance’). В словаре Macmillan на основе критерия частотности словам присваивается определённый цвет: красным выделены 7 500 самых часто встречающихся в корпусе слов, а чёрным – более редкие и узкоспециализированные слова.
7. Почему частотность важна?
Считается, что чем чаще встречается то или иное слово, тем полезнее его учить. Например, слова ‘ameliorate’ и ‘improve’ значат примерно одно и то же, но ‘improve’ встречается в 250 раз чаще. Выучить слово ‘improve’ стоит в первую очередь (но выучить – это не просто запомнить значение, а ещё и знать правила согласования и устойчивые выражения с этим словом), потому что оно входит в «ядро» английского языка: вы будете его часто видеть, слышать, да и нередко использовать. Со словом ‘ameliorate’ всё иначе: если вы вдруг на него наткнётесь, что маловероятно из-за его редкости, вы всегда сможете найти его в словаре (однако это не значит, что стоит пренебрегать запоминанием редких слов!).
Работая с очень объёмным корпусом, мы с лёгкостью определяем частотность не только отдельных слов, но и грамматических моделей (‘decide’ + инфинитив) или устойчивых выражений (‘crucial’ + ‘importance’). В словаре Macmillan на основе критерия частотности словам присваивается определённый цвет: красным выделены 7 500 самых часто встречающихся в корпусе слов, а чёрным – более редкие и узкоспециализированные слова.
👍1
От корпуса к словарю.
8. Корпус как источник примеров.
Пользователи словарей очень ценят примеры-предложения. Хороший пример-предложение показывает, как слово работает в контексте, и дополнительно объясняет его значение. Примеры в словаре должны отражать реальное и наиболее частотное употребление слова, поэтому мы берём предложения из корпуса, а не просто придумываем.
Чтобы описать, как происходит выбор примера-предложения, вернёмся к слову ‘importance’, словарную статью которого мы уже приводили выше. Очевидно, что словарная заметка и список устойчивых выражений уже иллюстрируют самые важные факты о данном слове. Так ли уж нужно занимать пространство статьи примером-предложением? Обратим внимание на первый пример: By 1800, the monarchy had declined in importance.
Мы выбрали именно этот пример, потому что в корпусе можно найти около тысячи примеров с постановкой глагола перед существительным ‘importance’ – значит, такова базовая грамматическая модель данного слова. Дальнейшее изучение корпусного материала показывает, что в этой позиции чаще всего встречаются глаголы ‘increase’, ‘grow’ и ‘gain’ или ‘decline’, ‘decrease’ и ‘diminish’. Из всех примеров с этой моделью многие иллюстрируют последовательность By + дата + X + had declined in importance.
Например, один из примеров гласит: By the early 12th century, the monasteries, which had been the focal points of religious life, had declined in importance and the way was ready for the introduction of the diocesan system.
Однако такое предложение слишком длинно для словаря и содержит много лишней информации. Поэтому его изменяют и сокращают до тех пор, пока пример не приобретёт самый краткий, понятный и легко запоминающийся вид: By 1800, the monarchy had declined in importance.
Источник цикла статей: http://www.macmillandictionaries.com/features/from-corpus-to-dictionary/
8. Корпус как источник примеров.
Пользователи словарей очень ценят примеры-предложения. Хороший пример-предложение показывает, как слово работает в контексте, и дополнительно объясняет его значение. Примеры в словаре должны отражать реальное и наиболее частотное употребление слова, поэтому мы берём предложения из корпуса, а не просто придумываем.
Чтобы описать, как происходит выбор примера-предложения, вернёмся к слову ‘importance’, словарную статью которого мы уже приводили выше. Очевидно, что словарная заметка и список устойчивых выражений уже иллюстрируют самые важные факты о данном слове. Так ли уж нужно занимать пространство статьи примером-предложением? Обратим внимание на первый пример: By 1800, the monarchy had declined in importance.
Мы выбрали именно этот пример, потому что в корпусе можно найти около тысячи примеров с постановкой глагола перед существительным ‘importance’ – значит, такова базовая грамматическая модель данного слова. Дальнейшее изучение корпусного материала показывает, что в этой позиции чаще всего встречаются глаголы ‘increase’, ‘grow’ и ‘gain’ или ‘decline’, ‘decrease’ и ‘diminish’. Из всех примеров с этой моделью многие иллюстрируют последовательность By + дата + X + had declined in importance.
Например, один из примеров гласит: By the early 12th century, the monasteries, which had been the focal points of religious life, had declined in importance and the way was ready for the introduction of the diocesan system.
Однако такое предложение слишком длинно для словаря и содержит много лишней информации. Поэтому его изменяют и сокращают до тех пор, пока пример не приобретёт самый краткий, понятный и легко запоминающийся вид: By 1800, the monarchy had declined in importance.
Источник цикла статей: http://www.macmillandictionaries.com/features/from-corpus-to-dictionary/
👍1
The most complete dictionary sources: #faq
• lingvodics.com
• dadako.narod.ru
• dic.1963.ru
• 4pda.ru
• rutracker.org
• mega.nz
• dictionaries goldendict channel
Как установить словари / How to install dictionaries
• lingvodics.com
• dadako.narod.ru
• dic.1963.ru
• 4pda.ru
• rutracker.org
• mega.nz
• dictionaries goldendict channel
Как установить словари / How to install dictionaries
👍14❤3👎1
Этот словарь вышел из печати в 1951 году и включал всего лишь около 5 тысяч слов. Долгожданное «дитя», обрадовавшее своим появлением всех радиоработников нашей тогда необъятной Родины, назвали просто – «В помощь диктору». Жизнь книге дала картотека дикторской группы Центрального радиовещания. Еще до Великой Отечественной войны на карточках стали записывать слова, которые могли вызвать затруднения у дикторов. Руководил этой работой член-корреспондент Академии наук СССР Д. Н. Ушаков. В 1942 году все «богатство» перешло в руки другого видного языковеда – профессора МГУ К. И. Былинского, впоследствии консультантом дикторской группы стал известный ученый С. И. Ожегов.
Редактировал книгу профессор К. И. Былинский, позже взял над ней шефство профессор Д. И. Розенталь. 1960-й, 1967-й, 1984-й... Словарь пополнялся и менялся по велению времени. Изменилось и его название: «Словарь ударений для работников радио и телевидения». С 1960 года это сочетание слов известно миллионам людей, но обладателями Словаря, несмотря на его многократное переиздание, были немногие.
Новый словарь вобрал в себя самое нужное (самое трудное для понимания и произнесения) из толковых словарей, начиная со словаря В. И. Даля, до современных терминологических словарей. Значительно увеличился его словник (состав лексики). Теперь в нем уже не 5, а 50 тысяч лексических единиц – и исконных русских, и заимствованных из многих других языков. Однако жаргонные, сленговые слова здесь искать бесполезно. Многие слова рекомендуется произносить слова не так, как принято в той или иной профессиональной среде (например, не компа/с, как принято у моряков, а ко/мпас и т. д.). Словарь по-прежнему не выходит за рамки литературной нормы. В нем появилось много новых терминов из биологии и археологии, анатомии и астрономии, а также экономических, политических, исторических, химических, технических и т.п.
Особая ценность Словаря заключается в том, что в нем отражены трудные случаи постановки ударения, касается ли это существительных или наречий, глагольных форм или кратких форм страдательных причастий и прилагательных.
«Живой как жизнь», наш язык постоянно преображается. Изменения происходят не только в лексическом составе, но и в произношении. Если вчера что-то считалось орфоэпической нормой, то сегодня уже устарело. Эта динамика отражена в Словаре – для этого потребовались особое внимание и дополнительные исследования. Конечно, основные принципы, лежавшие в основе прежних изданий, были сохранены. И главный из них, как и прежде, заключается в том, чтобы среди вариантов ударения того или иного слова выбрать только один, наиболее распространенный в сегодняшней языковой практике, что должно способствовать устранению разнобоя и установлению однообразия в произношении. Это облегчит труд журналистов, ведущих радио- и телепрограмм, политиков, юристов, менеджеров и вообще всех, чья деятельность так или иначе связана с русским языком, и от кого в значительной степени зависит правильное его использование.
Н. И. Маркин
Редактировал книгу профессор К. И. Былинский, позже взял над ней шефство профессор Д. И. Розенталь. 1960-й, 1967-й, 1984-й... Словарь пополнялся и менялся по велению времени. Изменилось и его название: «Словарь ударений для работников радио и телевидения». С 1960 года это сочетание слов известно миллионам людей, но обладателями Словаря, несмотря на его многократное переиздание, были немногие.
Новый словарь вобрал в себя самое нужное (самое трудное для понимания и произнесения) из толковых словарей, начиная со словаря В. И. Даля, до современных терминологических словарей. Значительно увеличился его словник (состав лексики). Теперь в нем уже не 5, а 50 тысяч лексических единиц – и исконных русских, и заимствованных из многих других языков. Однако жаргонные, сленговые слова здесь искать бесполезно. Многие слова рекомендуется произносить слова не так, как принято в той или иной профессиональной среде (например, не компа/с, как принято у моряков, а ко/мпас и т. д.). Словарь по-прежнему не выходит за рамки литературной нормы. В нем появилось много новых терминов из биологии и археологии, анатомии и астрономии, а также экономических, политических, исторических, химических, технических и т.п.
Особая ценность Словаря заключается в том, что в нем отражены трудные случаи постановки ударения, касается ли это существительных или наречий, глагольных форм или кратких форм страдательных причастий и прилагательных.
«Живой как жизнь», наш язык постоянно преображается. Изменения происходят не только в лексическом составе, но и в произношении. Если вчера что-то считалось орфоэпической нормой, то сегодня уже устарело. Эта динамика отражена в Словаре – для этого потребовались особое внимание и дополнительные исследования. Конечно, основные принципы, лежавшие в основе прежних изданий, были сохранены. И главный из них, как и прежде, заключается в том, чтобы среди вариантов ударения того или иного слова выбрать только один, наиболее распространенный в сегодняшней языковой практике, что должно способствовать устранению разнобоя и установлению однообразия в произношении. Это облегчит труд журналистов, ведущих радио- и телепрограмм, политиков, юристов, менеджеров и вообще всех, чья деятельность так или иначе связана с русским языком, и от кого в значительной степени зависит правильное его использование.
Н. И. Маркин
🔥2
Словарь ассоциаций
Весьма любопытный словарь, содержащий ассоциации к словам и выражениям русского языка, придуманные реальными людьми. Кроме общего набора публикуются данные срезов по гендеру, т.е. включающие частоты ассоциаций, подсчитанные отдельно для мужчин и для женщин.
Полное описание датасета, расшифровка значений символов и числовых показателей, сценарии использования - смотрите на github.
Создатель словаря: denskoy.
Весьма любопытный словарь, содержащий ассоциации к словам и выражениям русского языка, придуманные реальными людьми. Кроме общего набора публикуются данные срезов по гендеру, т.е. включающие частоты ассоциаций, подсчитанные отдельно для мужчин и для женщин.
Полное описание датасета, расшифровка значений символов и числовых показателей, сценарии использования - смотрите на github.
Создатель словаря: denskoy.
👍2❤1
Moon Reader_6.1FL3.apk
27.6 MB
Moon+ Reader Pro [Patched] с вшитым каталогом Flibusta.
GoldenDict Channel
GoldenDict можно использовать внутри приложения-читалки. Внутри приложения для чтения книг необязательно выделять слово долгим нажатием и искать среди доступных действий иконку GD, ведь функционал позволяет находить нужное слово значительно быстрее. Например…
Недавно мы писали о том, что GD можно быстро вызвать из читалок, а сегодня я обновил Moon+ Reader и, к своей радости, обнаружил великолепно реализованную поддержку контекстных действий. Теперь можно расставить словари в нужном порядке и вызывать любой из установленных, а не только один, как это было раньше.
Moon+ Reader Pro в Google Play.
Moon+ Reader Pro в Google Play.
Плагиат или научная база?
При составлении новых словарей лексикографы неизбежно опираются на опыт предшественников. Они могут заимствовать систему помет и условных обозначений, воспроизвести некоторые грамматические описания или попросту переработать уже некогда описанный языковой материал. Но считается ли плагиатом использование данных предыдущих словарей для создания последующих? И если считается, то в каких пределах?
Среди множества лексикографических злоупотреблений плагиат – не самое страшное и не самое наказуемое преступление. Да и не самое часто встречающееся, если честно. А вот, например, фальсификация количества данных, манипуляция именем автора, продажа одного и того же словаря под двумя названиями воспринимаются и учёными, и пользователями гораздо хуже.
Объективно невозможно каждый раз составлять новый, абсолютно независимый словарь, ведь словари описывают некий общий материал – язык. Кроме того, любые словари опираются на существующие лексикографические традиции и принципы: экономности, стандартности, простоты, семантической ступенчатости описания и т.д. Сегодня эти правила очевидны, но оттачивались на практике и формулировались они столетиями. Кроме того, нередко происходит так, что изначально неудачные и слабо проработанные словари служат важным источником материала для дальнейших исследователей.
К счастью, научному сообществу удалось создать «золотое правило», которое диктует границы использования предыдущего лексикографического опыта. Приемлемым считается творческое, индивидуально-стилистическое заимствование лучших достижений прошлого с учётом современного состояния языка и науки.
При составлении новых словарей лексикографы неизбежно опираются на опыт предшественников. Они могут заимствовать систему помет и условных обозначений, воспроизвести некоторые грамматические описания или попросту переработать уже некогда описанный языковой материал. Но считается ли плагиатом использование данных предыдущих словарей для создания последующих? И если считается, то в каких пределах?
Среди множества лексикографических злоупотреблений плагиат – не самое страшное и не самое наказуемое преступление. Да и не самое часто встречающееся, если честно. А вот, например, фальсификация количества данных, манипуляция именем автора, продажа одного и того же словаря под двумя названиями воспринимаются и учёными, и пользователями гораздо хуже.
Объективно невозможно каждый раз составлять новый, абсолютно независимый словарь, ведь словари описывают некий общий материал – язык. Кроме того, любые словари опираются на существующие лексикографические традиции и принципы: экономности, стандартности, простоты, семантической ступенчатости описания и т.д. Сегодня эти правила очевидны, но оттачивались на практике и формулировались они столетиями. Кроме того, нередко происходит так, что изначально неудачные и слабо проработанные словари служат важным источником материала для дальнейших исследователей.
К счастью, научному сообществу удалось создать «золотое правило», которое диктует границы использования предыдущего лексикографического опыта. Приемлемым считается творческое, индивидуально-стилистическое заимствование лучших достижений прошлого с учётом современного состояния языка и науки.
👍3👏1
Установка словарей / Installing Dictionaries
#faq
После того, как вы скачали архив со словарём, необходимо распаковать его в папку GoldenDict в корне внутреннего хранилища устройства, а затем запустить GD. Если все сделано верно, программа подхватит данные и предложит их проиндексировать. После индексации словарём можно будет пользоваться.
After you have downloaded the archive with the dictionary, you have to unpack it to the GoldenDict folder in the root of the internal storage of the device, and then run GD. If everything is done correctly, the program will pick up the data and offer to index it. After indexing, the dictionary can be used.
Поддерживаемые форматы / Supported formats:
• ABBYY Lingvo .LSD, .DSL, .LSA .DAT
• Lingoes .LD2
• Babylon .BGL
• StarDict-файлы
• Dictd-файлы
• Hunspell морфология
#faq
После того, как вы скачали архив со словарём, необходимо распаковать его в папку GoldenDict в корне внутреннего хранилища устройства, а затем запустить GD. Если все сделано верно, программа подхватит данные и предложит их проиндексировать. После индексации словарём можно будет пользоваться.
After you have downloaded the archive with the dictionary, you have to unpack it to the GoldenDict folder in the root of the internal storage of the device, and then run GD. If everything is done correctly, the program will pick up the data and offer to index it. After indexing, the dictionary can be used.
Поддерживаемые форматы / Supported formats:
• ABBYY Lingvo .LSD, .DSL, .LSA .DAT
• Lingoes .LD2
• Babylon .BGL
• StarDict-файлы
• Dictd-файлы
• Hunspell морфология
👍4