№10 Обработка текстовой информации

Обработка текстовой информации для ЕГЭ по информатике (Задание 10)

1. Основные понятия

Задание 10 ЕГЭ по информатике проверяет умение работать с текстовыми редакторами (LibreOffice Writer, OpenOffice Writer) для поиска и подсчёта вхождений подстрок в тексте. Это задание требует внимательности и понимания особенностей работы поиска в текстовых редакторах.

Важно: На экзамене ЕГЭ 2026 используются только форматы .odt, .txt (LibreOffice/OpenOffice). Microsoft Office не используется.


Задания: N10.Обработка текста


2. Типы задач задания 10

2.1. Поиск комбинации букв в словах

Формулировка: "Определите, сколько раз встречается комбинация букв 'по' или 'По' в составе других слов (включая сложные слова, соединённые дефисом), но не как отдельное слово."

Особенности:

  • Ищется подстрока внутри слов
  • Учитываются оба регистра (строчные и заглавные буквы)
  • Не учитываются отдельные слова (например, слово "по" само по себе не считается)
  • Учитываются сложные слова, соединённые дефисом

Пример: В тексте: "пополнение", "По-русски", "по дороге", "по"

  • "пополнение" содержит "по" → считается
  • "По-русски" содержит "По" → считается
  • "по дороге": "по" как отдельное слово → не считается
  • "по" как отдельное слово → не считается

2.2. Поиск с учётом регистра

Важно: В большинстве задач нужно учитывать оба варианта написания:

  • Строчные буквы: "по", "на", "в"
  • Заглавные буквы: "По", "На", "В"

В LibreOffice Writer:

  • Использовать функцию "Найти и заменить" (Ctrl+H)
  • Установить флажок "Учитывать регистр" если нужно искать только один вариант
  • Обычно нужно искать оба варианта, поэтому выполнить поиск дважды

2.3. Поиск в составе слов vs отдельные слова

Ключевое различие:

  • В составе слов: подстрока является частью другого слова
    • Пример: "пополнение" содержит "по"
  • Отдельное слово: подстрока является самостоятельным словом
    • Пример: "по дороге", здесь "по" отдельное слово

Как определить:

  • Если перед и после подстроки стоят пробелы, знаки препинания или начало/конец строки → это отдельное слово
  • Если перед или после подстроки стоят буквы → это часть слова

3. Алгоритм решения задачи на поиск подстрок

Шаг 1: Открыть текстовый редактор

  1. Открыть LibreOffice Writer
  2. Открыть файл с текстом (формат .odt, .txt, .doc, .docx, .rtf)

Шаг 2: Использовать функцию "Найти и заменить"

  1. Нажать Ctrl+H (или меню Правка → Найти и заменить)
  2. В поле "Найти" ввести искомую подстроку
  3. Важно: НЕ заполнять поле "Заменить"

Шаг 3: Настроить параметры поиска

Основные настройки:

  • "Только целые слова": НЕ устанавливать (иначе будет искать только отдельные слова)
  • "Учитывать регистр": устанавливать только если нужно искать конкретный регистр
  • "Регулярные выражения": обычно НЕ использовать

Шаг 4: Выполнить поиск

  1. Нажать кнопку "Найти все" или использовать "Найти далее" (F3)
  2. Подсчитать количество найденных вхождений
  3. Проверить: убедиться, что найденные вхождения действительно в составе слов, а не отдельные слова

Шаг 5: Учесть оба регистра

Если нужно искать и "по", и "По":

  1. Выполнить поиск для "по" (учитывая регистр или нет)
  2. Выполнить поиск для "По" (учитывая регистр)
  3. Сложить результаты (если нет пересечений)

Альтернатива: Использовать поиск без учёта регистра, но тогда нужно вручную проверить, что найденные вхождения действительно в составе слов.


4. Типичные формулировки задач

Формулировка Что искать
"в составе других слов" Подстрока внутри слов
"не как отдельное слово" Исключить случаи, когда подстрока является отдельным словом
"включая сложные слова, соединённые дефисом" Учитывать слова типа "по-русски"
"учитывая регистр" Различать "по" и "По"
"не учитывая регистр" Искать "по" и "По" одновременно

5. Особенности работы в LibreOffice Writer

5.1. Функция "Найти и заменить"

Горячие клавиши:

  • Ctrl+H: открыть диалог "Найти и заменить"
  • F3: найти следующее вхождение
  • Ctrl+F: быстрый поиск

Параметры поиска:

  • "Только целые слова": искать только отдельные слова (границы слова)
  • "Учитывать регистр": различать строчные и заглавные буквы
  • "Регулярные выражения": использовать шаблоны поиска

5.2. Подсчёт вхождений

Способ 1: Вручную

  • Использовать "Найти далее" (F3) и считать количество нажатий
  • Внимательно проверять каждое вхождение

Способ 2: Через замену (для проверки)

  • Временно заменить искомую подстроку на уникальную метку
  • Подсчитать количество замен
  • Отменить замену (Ctrl+Z)

Важно: На экзамене лучше использовать ручной подсчёт через "Найти далее".


5.3. Работа с различными форматами файлов

Поддерживаемые форматы на ЕГЭ 2026:

  • .odt: OpenDocument Text (LibreOffice)
  • .txt: простой текст
  • .doc, .docx, .rtf: могут быть предоставлены для чтения, но работа ведётся в LibreOffice

Важно: Все файлы открываются и обрабатываются в LibreOffice Writer.


6. Пример решения задачи

Условие: "Определите, сколько раз встречается комбинация букв 'по' или 'По' в составе других слов (включая сложные слова, соединённые дефисом), но не как отдельное слово, в тексте глав XII и XIV третьей части второго тома романа Л. Н. Толстого 'Война и мир'."

Алгоритм решения:

  1. Открыть файл с текстом в LibreOffice Writer

  2. Выполнить поиск для "по":

    • Нажать Ctrl+H
    • Ввести "по" в поле "Найти"
    • НЕ устанавливать "Только целые слова"
    • Нажать "Найти все" или использовать F3 для последовательного поиска
    • Подсчитать вхождения, которые находятся в составе слов
  3. Выполнить поиск для "По":

    • Ввести "По" в поле "Найти"
    • Установить "Учитывать регистр"
    • Подсчитать вхождения в составе слов
  4. Сложить результаты:

    • Количество "по" + количество "По" = ответ
  5. Проверить:

    • Убедиться, что не учтены отдельные слова "по" и "По"
    • Убедиться, что учтены слова с дефисом

Ссылки на подборку заданий

Подборка заданий в Яндекс Учебнике: №10. Обработка текстовой информации