Создать словарь по тексту

Создать словарь по тексту

Главный успех изучения любого языка — максимально быстрое пополнение словарного запаса: повторение, и еще раз повторение слов. Данное приложение полиглот поможет выучить слова быстро и эффективно.
В приложение входит 90 различных видов словарей с самыми известными мировыми языками, такими как английский, немецкий, французский, испанский, итальянский, китайский, португальский. Как следствие, можно последовательно или одновременно научиться говорить на нескольких языках.

7 различных видов тренировок помогут запомнить слова быстро и менее утомительно чем при обычной зубрежке. Транскрипция, картинки и примеры использования слов увеличат эффективность и ускорят процесс запоминания слов. С каждой тренировкой изменяется уровень изученности пройденных слов.
В список тренировок входят: зрительный поиск подходящего слова и перевода, правильное написание слова, сопоставление слов и переводов, запоминание произношения слов в автоматически меняющихся карточках, в случае если заняты руки (например, за рулем).

При добавлении нового слова автоматически ищется его перевод, транскрипция, примеры использования и картинки. База слов постоянно пополняется.
Добавлять слова можно через Excel файл (например, полученный из программы Lingvo), либо скачать уже готовые наборы слов из сервера.

К словам можно добавлять неограниченное количество картинок. Кроме этого можно добавить фотографию или картинку из устройства (из галереи). Так же с помощью встроенного редактора можно нарисовать свою картинку, либо изменить добавленную фотографию. Данная функция особенно удобна для сложных слов, которые никак не получается изучить, в этом случае зрительная память увеличит эффективность запоминания.

С помощью настраиваемых оповещений вы сможете изучать слова даже не открывая приложения. Просто настройте график прихода оповещений и выберите слова о которых будет вам напоминать ваше устройство. Например вы можете выставить напоминания через каждый час в течении дня с 10 утра до 23 вечера. Если у вас есть "Умные часы" то оповещения будут приходить и на них, что еще больше упростит изучение и повторение слов.

У каждого слова есть уровень изученности, меняющийся в зависимости от прохождения как в большую так и в меньшую сторону. С помощью уровня изученности вы сможете узнать какие слова более или менее изучены, скрыть изученные слова, отфильтровать слова по уровню изученности в тренировках и оповещениях (например, повторять только наименее изученные).
Кроме этого в приложении есть статистика тренировок, с помощью которой можно следить за ежедневной активностью прохождения тренировок и количеству изученных слов.

Сайт ВИО (vio. *****) – электронный журнал «Вопросы Интернет-образования»

Выдержки из статьи http://vio. *****/vio_28/cd_site/Articles/art_2_3.htm

Составление частотного словаря слов средствами Microsoft Office

Написать эту статью побудили три материала, опубликованные в журнале.

1. Замечательная статья Ирины Алексеевны Морозовой «Коллективное лингвистическое исследование» о составлении частотного словаря букв русского алфавита [1]. На основе этой статьи можно организовать увлекательный урок, внеклассное мероприятие, она может стать основой исследовательской работы. Так что, если у статьи могут быть фанаты, то мы относимся к их числу.

2. Константин Алексеевич Попов «Использование частотных словарей при изучении иностранных языков» [2]. В этой статье рассматривается использование генераторов частотных словарей в учебном процессе.

3. «Все на борьбу с рутиной!» Павла Юрьевича Белкина и дальнейшее обсуждение этой статьи, в которой рассматривается проблема поиска и замены символов в MS Word [3]-[5].

Как у нас, так и у учеников, возник вопрос: «А можно ли средствами стандартных программ, без обращений к специальным, составить частотный словарь слов одного или нескольких произведений?»

В результате совместных изысканий появился способ, прямо скажем, не лишенный недостатков, который, однако, работает. Он может служить хорошей иллюстрацией глубокой интеграции офисных программ пакета Microsoft Office и хорошим практикумом для уроков компьютерных технологий.

Как можно использовать частотный словарь? Увлекательный рассказ о статистическом лексическом анализе можно найти по адресу http://euro. svoboda. org/programs/sc/2001/sc.062601.asp. Там же есть и предостережение от излишнего увлечения такими методами.

Итак, наша идея состоит в следующем: удалить из текста все знаки кроме букв русского языка, получив, таким образом, список слов, а затем отсортировать его и, сгруппировав одинаковые слова, подсчитать количество слов в каждой группе.

Читайте также:  Караоке и вновь продолжается бой

Далее, собственно, сам способ:

Сначала откроем анализируемый текст в Microsoft Word.

Шаг 1. Уберем из текста точки, запятые, цифры, латинские буквы и… В принципе, избавимся от всего, кроме букв русского алфавита. Это можно сделать с помощью пункта меню ПравкаЗаменить. При поиске необходимо использовать отрицание [!] и подстановочные знаки [А-я]. Запрос на все символы, кроме букв русского алфавита, будет выглядеть так [!А-я]. Заменять будем на пробел, хотя это и необязательно. Можно использовать на любой другой символ, например, @ или специальный символ ^p («символ абзаца»). Нажимаем кнопку Заменить все.

Шаг 2. Убираем из текста лишние пробелы, заменяя двойные на одиночные до тех пор, пока двойные еще встречаются [5].

Шаг 3. Преобразуем весь текст к верхнему регистру ФорматРегистрВСЕ ПРОПИСНЫЕ, предварительно выделив весь текст ПравкаВыделить все.

Шаг 4. Преобразуем текст в таблицу ТаблицаПреобразоватьтекст в таблицу. В качестве разделителя используем пробел. Данная таблица характерна тем, что у нее один столбец и в каждой ячейке стоит отдельное слово.

Шаг 5. Выделяем полученную таблицу и копируем в буфер обмена.

Далее можно воспользоваться одной из двух других знаменитых офисных программ: Microsoft Excel или Microsoft Access.

Шаг 6. Создаем новую книгу Excel.

Шаг 7. В ячейке A1 пишем заголовок: «Частотный анализ слов в произведении «Полтава».

Шаг 8. Вставляем таблицу из буфера обмена, начиная с ячейки A2.

Шаг 9. На отдельном листе создаем сводную таблицу ДанныеСводная таблица. Это ли не повод рассказать ученикам о сводной таблице!

Шаг 10. Нажмите клавишу Поместить в. Мы увидим отчет из слов встречающихся в произведении. Для того чтобы вывести количество вхождений данного слова в текст, достаточно перетащить элемент в сводную таблицу. По умолчанию будет как раз вычисляться количество повторений этого слова, что собственно нам и нужно. Таким образом, мы получили частотный словарь. Далее его можно изменять по своему усмотрению. Изменяя свойства поля можно отсортировать сводную таблицу по убыванию, подсчитать долю слов в произведении, добавить столбец с длиной слов и т. п.

Для Microsoft Access:

Шаг 6. Создаем новую базу данных. В режиме конструктора создаем таблицу «Слова» с полем [Слово].

Шаг 7. Переходим в режим таблицы и Вставляем таблицу из буфера обмена.

Шаг 8. Создаем запрос на выборку, используя групповые операции и функцию Count, подсчитывающую сумму по группе. При необходимости сортируем по нужному полю.

Замечание: можно решить эту задачу только с помощью Word и макросов на языке Visual Basic for Application (VBA), но это не совсем соответствует поставленной задаче. С другой стороны, при таком подходе можно автоматизировать описанные выше действия. Можно также попробовать составить частотный словарь с учетом словоформ, правда, только для английского языка.

Последовательность действий будет примерно такой:

Шаг 1. Удаляем из текста все знаки, кроме букв русского языка.

Шаг 2. Удаляем из текста лишние пробелы.

Шаг 3. Устанавливаем один шрифт для всего текста. Выделяем и переводим в верхний регистр.

Шаг 4. Заменяем пробелы на символ конца абзаца.

Шаг 5. Сортируем по возрастанию.

Шаг 6. Составляем частотный словарь и вычисляем длину слов.

Шаг 7. Преобразуем в таблицу с тремя столбцами.

Шаг 8. Выводим во второй столбец количество вхождений данного слова, а в третий — его длину.

Шаг 9. Добавляем заголовок.

Большинство описанных выше операций можно просто записать в макросы с помощью режима «Запись макроса» (СервисМакросНачать запись).

Пример этих макросов находится в документе Частотный анализ слов_А_С_ Пушкин_ ПОЛТАВА. doc. Для выполнения макросов необходимо установить в пункте меню СервисМакросБезопасность уровень безопасности: «Низкий» или «Средний».

После изменения уровня безопасности — перезапустите MS Word.

Запустите форму my_form, нажав кнопку Составление словаря на панели Частотный анализ.

Если вы хотите, чтобы макросы были доступны для других документов, просто скопируйте их и панель с кнопкой с помощью «Организатора» в шаблон Normal. dot (СервисШаблоны и надстройки…).

Аннотация: Эта программа написана как продолжение работы над Японско-Русским словарем. Я несколько раз писал программы-переводчики с английского, восполняя пробелы своих знаний. На определенном этапе понял, что без хорошего словаря хорошую программу переводчик не написать. Писать программу работы со словарем под один язык не имеет смысла. В силу этих причин и родилась идея в написании универсальной программы работы со словарями.

Читайте также:  Интерфейс lpt что это

Описание программы

Программа позволяет создавать, проверять, редактировать словари для любых целей и для любых национальных языков и пользоваться созданными словарями. Основные функции:

Создание пустого словаря.

Наполнение словаря содержанием.

Выгрузка созданного словаря в текстовый (windows и unicode) или Word файл с возможностью взаимной конвертации кодов.

Загрузка словаря (из "txt",".doc" файлов) для проверки на наличие повторяющихся слов, с возможностью редактирования.

Загрузка словаря для его редактирования.

Использования созданного словаря как электронного словаря (аналогичного Lingvo).

Программа имеет множество настроек, позволяющих приспособить настройки "под себя".

Автор рекомендует пользоваться при создании и редактировании словарей текстовым форматом, и лишь на заключительном этапе, сохранять файл в формате Word (если это Вам требуется). Причина — загрузка 1 000 записей потребует 1секунды, соответственно 50 000 записей — 50 секунд. В тоже время, использование Unicode в текстовом файле позволяет работать с записями в различных национальных кодировках, а загрузку словаря выполнять за 1-2 секунды.

Установленные соглашения

Словарь формируется по принципу "одна строка-одна запись" (в Word — "один параграф-одна запись").

До первого разделителя расположено переводимое (трактуемое) слово или группа слов. Вид разделителя задается на закладке "Настройки". Далее, через второй разделитель, вид которого также можно задать на страничке "Настройки", идут слова перевода. В примере ниже, в качестве разделителей выбраны ";", что говорит о допустимости одинаковых разделителей. В квадратных скобках размещаются пояснения.

Соглашения о разделителях и пояснениях, позволяют в дальнейшем упростить создание программ электронных переводчиков .

Заставка программы

Программа при старте отображает заставку программы, которая находится в файле ("zast.jpg") в директории, где и ".exe" файл.

На исходной закладке представлено множество обложек словарей, по мнению автора, программа может бать использована для составления любого подобного словаря .

Вы легко можете поменять заставку, заменив этот файл или воспользоваться меню "View", группа пунктов "Действия по смене заставки" (выполняются последовательно). Кроме того, Вы можете вообще отказаться от показа заставки, поставив галочку в меню "View" — пункт "Не отображать/отображать заставку". Тогда при следующем запуске стартовой будет закладка "Проверка словарей".

Рис.1. Заставка программы

Закладка "Редактирование словарей"

На данной закладке имеется возможность (Рис.2,3.):

Создать новый словарь (кнопка "Создать словарь").

Загрузить словарь (кнопка "Загрузить проверенный словарь для редактирования).

Выгрузить словарь без сохранения (кнопка "Сброс").

Сохранить словарь (кнопка "Сохранить словарь") — после загрузки словаря данная кнопка появляется вместо кнопки "Загрузить проверенный словарь для редактирования".

Добавлять новые записи в словарь. Внести в окно "Переводимое (трактуемое) слово (группа слов)" соответственно переводимое (трактуемое) слово или группу слов, а в окно "Слова перевода/Слова поиска" слова перевода через выбранный разделитель (он отображается на кнопке над окном "Слова перевода/Слова поиска" справа) и нажать кнопку "Внести в словарь". Если слова в словаре нет, то оно (вместе с трактовкой) будет добавлено в словарь. Не забывайте сохранять словарь после добавления слов.

Быстро вносить комментарии в слова перевода, заключая их квадратные скобки. Набор слов комментариев настраивается под Ваши нужды (Закладка "Настройки").

Изменить любую запись, выбрав ее (кнопка "Найти перевод слова"), далее внести изменения и нажать кнопку "ИзменитьДобавить перевод".

Удалить любую запись, выбрав ее (кнопка "Найти перевод слова") и нажать кнопку "Удалить".

Использовать буфер обмена Windows для выборки, как переводимых слов, так и слов перевода (три кнопки со стрелочками). Причем, при занесении слов перевода можно использовать занесение из буфера без предварительной обработки и с использованием подстановки разделителей, заданных в программе (соответственно левая и правая кнопка со стрелочкой над окном).

Использовать обратный поиск. Например, введем в поле слова перевода "кричать" и нажмем кнопку "Найти переводимое слово для слова перевода". Программа последовательно будет выводить подходящие слова из словаря (например, у меня "shout", "yell") вместе с их словами перевода.

Читайте также:  Программа для удаления текста с картинки

Рис.2. Закладка "Редактирование словарей"

Рис.3. Закладка "Редактирование словарей"

Закладка "Работа со словарем"

Закладка предназначена для использования словаря в двух режимах:

Режим простого перевода. Набрать слово в окне "Переводимое слово (группа слов)" и нажать кнопку "Найти перевод слова".

Режим расширенного перевода. При наборе слова в окне "Переводимое слово (группа слов)" после ввода каждой буквы выводится все слова, начинающиеся с уже введенных букв. Причем первым выводится слово, точно соответствующее введенным буквам (если оно есть, Рис.4.), вторым, слово, имеющее минимальное число букв, из имеющихся в словаре с уже введенным началом, и, далее, по алфавиту. Строки перевода разделяются разделителем, символ которого и число повторений задается на страничке "Настройки".

Странички "Редактирование словарей" и "Работа со словарем" синхронизированы. Это означает, что словарь, загруженный на любой из этих закладок доступен на другой. Это дает возможность, при использовании словаря, перейти на страницу редактирования, внести изменения, которые становятся доступными на обоих страничках.

Рис.4. Запись и просмотр результатов

Закладка "Проверка словарей"

На данной закладке выполняется проверка словарей на наличие совпадений (Рис.5.,6.) и удаление повторяющихся слов. Редактирование выполняется с учетом разделителей, заданных на закладке "Настройки". После редактирования словарь может быть сохранен в одном из четырех форматов.

Результат введения данной закладки — возможность составителя словарей добавлять новые слова в конец словаря (word, text) и затем, выполнив проверку, найти все повторения, отредактировать перевод слов, сохранить словарь в отсортированном виде в любом из указанных форматов .

Рис.5. Закладка "Проверка словарей", выбор словаря

Рис.6. Закладка "Проверка словарей", устранение совпадения

Закладка "Настройки"

Позволяет выполнять основные настройки работы со словарем, которые описаны выше.

Рис.7. Закладка "Настройки"

Настройка программы также включает выбор цветовой палитры рабочих панелей, текстов, оформленя кнопок.

Особенности работы с программой

Программа запоминает свои размеры и установки на момент закрытия — при старте их восстанавливает.

Программа требует для работы Windows XP SP2 и выше.

Программа создана с расчетом на то, что Ваш монитор имеет разрешение экрана не менее 1024*768 и цветовую палитру не ниже "True Color" (можно играть и при 800*600).

Данная программа — демоверсия ! Демоверсия имеет ограничение — работает со словарями до 500 записей . Если Вас заинтересовала программа — пишите автору и Вы сможите составлять словари любого размера.

Автор принимает пожелания по усовершенствованию программы по электронной почте (см.Главная страница сайта, "Об авторе")

Программа поставляется как zip архив. Распакуйте "setupDictMaster.zip" в любое место жесткого диска. Запустите setupDictMaster.exe, отвечайте на вопросы и программа будет уcтановлена. Не ставьте лишних галочек при инсталляции, за исключением "Поместить иконку на рабочем столе" — ее поставьте обязательно.

После установки программы вы найдете в меню "Пуск", "Все программы" папку с программой и иконку программы на рабочем столе.

Испытание словаря

При распаковке программы у Вас будет, как сказано выше, второй файл — "samples.txt". Это образец небольшого словаря. Поместите его в любое место и:

загрузите сначала на закладке "Проверка словарей" и устраните имеющийся в словаре повтор, затем сохраните под другим именем и в другом формате;

загрузите сохраненный Вами словарь на закладке "Работа со словарем", наберите букву "a" на английском языке — освойте работу со словарем;

загрузите сохраненный Вами словарь на закладке "Редактирование словарей" и освойте возможности, предоставляемые на данной закладке.

Зайдите на страничку "Настройки" и ознакомьтесь с возможностями настроек.

Молчанов Владислав 29.12.2008г. — последняя модификация 2013г.

Еcли Вы пришли с поискового сервера — посетите мою главную страничку

На главной странице Ва узнаете, как я могу помочь Вам в написании офисной программы любой сложности в соответствии с Вашими запросами . И найдете ряд програм или ссылок на образцы.

Ссылка на основную публикацию
Создать новую электронную почту на яндексе бесплатно
Всем привет! С вами снова я, Алексей. В этом посте я расскажу вам о том, как создать электронную почту на...
Сколько человек сидит в одноклассниках
Mail.Ru Group исследовала и сравнила аудитории самых популярных в России социальных сетей — «Одноклассники», «Мой Мир», «ВКонтакте», Facebook и Twitter....
Сколько четырехзначных чисел можно составить из нечетных
Условие Решение 1 Решение 2 Решение 3 Поиск в решебнике Популярные решебники Издатель: Н. Я. Виленкин, В. И. Жохов, А....
Создать канал на ютубе регистрация бесплатно
Добрый день, уважаемые читатели и гости моего блога! Если вы попали на эту статью, значит хотите узнать, как зарегистрироваться в...
Adblock detector