Технологии работы с текстом
Основные типы программ для работы с текстом
Основные типы программ для работы с текстом:
просмотрщики;
программы распознавания символов (OCR);
текстовые редакторы:
простые;
специализированные;
текстовые процессоры;
полиграфические системы (настольные издательства).
Назначение программ-просмотрщиков текста – просмотр на экране содержимого текстовых файлов и электронных книг, возможность создания просмотровых структур (оглавления, указатели, закладки). Главные характеристики - поддерживаемые форматы файлов, наличие дополнительных возможностей (копирование и защита от копирования, конверсия формата).
Программы OCR предназначены для распознавания текста из графического образа (файла). Основные задачи:
определение символов языка или группы языков, выбранных для распознавания текста;
распознавание штрих- и QR-кодов;
распознавание структуры таблиц и их содержимого;
конвертирование результатов в редактируемые форматы текста.
Назначение текстовых редакторов – работа с текстовыми файлами. Можно выделить подтипы таких программ в зависимости от типа обрабатываемого содержимого. Если осуществляется работа с текстом вне зависимости от его форматирования (пример – Блокнот Windows), то программа о носится к классу простых редакторов. Если программа используется для редактирования текстов компьютерных программ или разметки документа, то это специализированный редактор. Если осуществляется обработка не очень больших документов со сложным форматированием, комбинированным содержимым (текст, иллюстрации, таблицы, формулы и т.п.), то программа относится к классу текстовых процессоров.
Настольные издательства предназначены для разработки макетов полиграфических изданий любой сложности.
Основные термины, связанные с обработкой текста
Шрифт (от нем. schreiben — писать) – это графический рисунок начертания букв и знаков, составляющих единую стилистическую и композиционную систему. Шрифты создаются художниками в соответствии с образным замыслом, требованиями единства стиля и графической композиции, прикладными задачами, а также в соответствии с конкретными смысловыми и художественно-декоративными задачами.
Гарнитура - это совокупность шрифтов, объединенных общими стилевыми признаками, отличными от других шрифтов. Иногда понятие гарнитуры заменяется термином семейство шрифтов.
Основные характеристики шрифтов:
Базовая линия
Кегль (размер)
Ширина
Начертание
Насыщенность
Контрастность
Гарнитура
Засечки
Комплектность
Кернинг
Трекинг
Воображаемая линия, проходящая по нижнему краю основного элемента символа, называется базовой линией.
Кегль – величина площадки, на которой отображается символ. Размер кегля определяется в пунктах (0,352 мм).
По ширине шрифт бывает нормальный, узкий, широкий. Различают также пропорциональные и моноширинные шрифты. Пропорциональный шрифт отображает символы разной ширины, тогда как непропорциональный, или моноширинный, шрифт использует знаки постоянной фиксированной ширины.
Начертания шрифтов отличаются насыщенностью, пропорциями, контрастностью и наклоном знаков. Наиболее распространенные начертания (встречаются в названиях шрифтов) - Normal (обычный), Bold (полужирный), Italic (курсив или наклонный), Bold Italic (полужирный курсив или наклонный), Condensed (узкий) и Extended (широкий).
Насыщенность шрифта определяется изменением толщины основных и соединительных штрихов одноименных знаков в различных начертаниях и может меняться от светлой (Light) до сверхжирной (Ultra Bold).
Контрастность - один из основных признаков шрифта. Определяется отношением толщины соединительных и основных штрихов знаков.
Засечки представляют собой небольшие элементы на концах штрихов букв. Существует большое разнообразие шрифтов как с засечками, так и без них. Обе группы содержат как гарнитуры, разработанные для набора больших объемов текста, так и предназначенные в основном для декоративных целей. Наличие или отсутствие засечек является лишь одним из многих факторов, которые учитываются при выборе шрифта. Считается, что в длинных текстах легче читать шрифты с засечками, чем без них, тогда как на компьютерных экранах с низким разрешением шрифты без засечек читать легче.
Комплектность определяется полнотой знаков, необходимых для набора текста: строчных, прописных, цифр, знаков препинания и проч.
Кернингом называется изменение ширины пробела для конкретных пар литер. Обычно кернинг делается в сторону уменьшения пробела таким образом, что выступающие части одной литеры пары заходят в пространство второй литеры. Результат - размещение символов становится зрительно более равномерным.
Трекинг, в отличие от кернинга, задается не для пары, а для нескольких символов и в данной программе характеризует величину межсимвольного пробела в группе символов. Пробелы меняются одинаково для всех выделенных символов.
Эффекты (видоизменение) – верхний и нижний индексы, прописные и малые прописные, контур, скрытый, уплотненный, приподнятый, с тенью.
Шрифты подразделяются по своему назначению и области применения на книжные, рекламные, газетные, плакатно-афишные, декоративные, картографические.
Символ (знак) – минимальный элемент текста документа.
Непечатаемые (служебные) знаки – специальные символы-маркеры, появляющиеся в рабочем окне документа при выполнении команд или нажатии некоторых клавиш клавиатуры, при печати документа не выводятся. Знакоместо – часть строки, отведенная для вставки символов без дополнительных подчеркиваний.
Абзац – фрагмент текста между двумя маркерами конца абзаца (служебный непечатаемый символ (знак) ¶).
Страница – отдельный фрагмент документа, размер которого определяется параметрами страницы: размером бумаги, верхним, нижним, левым и правым полями.
Колонтитул – текст, печатающийся вверху (верхний колонтитул) или внизу (нижний колонтитул) каждой станицы раздела.
Раздел – независимая часть документа, отличающаяся от других частей своим форматированием или макетом. Именно благодаря разбиению на разделы можно изменить размеры полей, колонтитулы, ориентацию и ряд других параметров для отдельной страницы или определенного их количества. Форматирование страниц одного раздела документа будет происходить независимо от остальных разделов этого же документа.
Макет – совокупность параметров полей, размера и ориентации страницы, правил размещения текста на странице (выравнивание текста по вертикали, число текстовых колонок, расстановка переносов). Правка (редактирование) документа – изменение его содержания при помощи перемещения, копирования или удаления и добавления фрагментов текста.
Форматирование документа – изменение внешнего вида документа с использованием различных шрифтов, эффектов отображения символов и псевдографики, междустрочных интервалов, отступов относительно границ текста и т. д. Для символов и отдельных слов используются шрифтовые эффекты, выделение цветом символа (цвет шрифта) и знакоместа (выделение цветом).
Выравнивание текстовых строк относительно границ – по левому и правому краю, по центру и по ширине.
Псевдографика – оформление текста при помощи рамок и цветового фона.
Список – последовательность абзацев, вначале каждого из которых размещены номера (нумерованный список) или маркеры (маркированный список).
WYSIWYG - свойство прикладных программ или веб-интерфейсов, в которых содержание отображается в процессе редактирования и выглядит максимально близко похожим на конечную продукцию, которая может быть печатным документом, веб-страницей или презентацией. В настоящее время для подобных программ также широко используется понятие «визуальный редактор».
В WYSIWYM-редакторе пользователь задаёт только логическую структуру документа и собственно контент. Оформление документа, его итоговый внешний вид возложено на отдельное ПО, либо, во всяком случае, вынесено в отдельный блок. Таким образом достигается полная независимость содержания документа от его формы.
Редактирование текста - процесс внесения изменений в контент или форматирование.
Верстка текста - процесс формирования страниц путем компоновки текстовых и графических эементов для формирования макета.
В WYSIWYG системах редактирование и верстка объединены. Поэтому внесение любых изменений в документ вызывает его перерисовку. Для “тяжелых” элементов (иллюстрации, таблицы, динамические элементы) это приводит к зависанию текстового процессора. WYSIWYM-системы и полиграфические системы свободны от этого недостатка.