Svoboda | Graniru | BBC Russia | Golosameriki | Facebook
Перейти к содержанию

Участник:Hinote/Тулбар-хелпер для OCR

Материал из Викитеки — свободной библиотеки

Тулбар предназначен для убыстрения работы на страницах индексов (в пространстве Страница).

Отклик (feedback о пользовании, дальнейшие идеи о развитии функционала, обнаруженные ошибки при работе) приветствуется; добро пожаловать на страницу обсуждения этой страницы!

Подключение

[править]

importScript('Участник:Hinote/OCR-toolbar.js');

  • Перейдите в режим редактирования какой-либо страницы-OCR индекса (т.е. страницы из пространства Страница).
  • Раскройте крыжик "Инструменты корректора".
  • После стандартных кнопок инструментов корректора, должна появиться группа кнопок "Доп. инструменты OCR" с 4-мя кнопками -- тремя красно-синими стрелками и кнопкой "ять".

Кнопка 1: слепка строк

[править]

Как пользуемся: на отобразившейся "грязной" странице (т.е. на странице с "необработанным" текстом, подставленным из djvu или pdf) разделяем сначала вручную абзацы 2-мя переводами строки, как обычно. Это, увы, за нас автоматически никто не сделает. Жмем эту первую кнопку. Строки в абзацах слепляются, переносы удаляются...

Можно перед нажатием этой кнопки выделить текст, для которого это будет сделано. Если текст не выделен -- будет обработан весь имеющийся в поле редактирования текст.

В чем ускорение и упрощение работы: не надо делать "обезьянью работу", слеплять все строки абзацев вручную, удалять переносы и т. п.

Также, будут удалены начальные и финальные пробелы и пустые строки, если они были. Если страница начинается с нового абзаца -- добавьте обратно 2 начальные пустые строки вручную.

Кнопки 2 и 3: вставка Перенос и Перенос2

[править]

Не переходя курсором в начало или конец текста, жмем соотв. кнопку на той странице, где нужно добавить шаблон Перенос и/или Перенос2...

В чем ускорение и упрощение работы: не нужно выделять первое или последнее слово на странице и затем оформлять его соотв. шаблоном вручную, листать поле редактирования в начало или в конец, устанавливать курсор на первое или последнее слово.

Кнопка 4 ("ять"): вставка шаблона ВАР

[править]

Применяется при работе с дореформенными (ДО) источниками, когда нужно текст "обернуть" шаблоном ВАР или ВАР2.

Жмем кнопку "ять" -- выделенный текст (или весь, если ничего не выделено) обрамляется шаблоном ВАР, текст дублируется в оба параметра шаблона...

В чем ускорение и упрощение работы: после нажатия этой кнопки и вставки шаблона ВАР, сразу выделяется второй параметр. Можно (нужно) ничего не трогая, нажать кнопку деятификатора.

Как всегда: Mind the gap! Следите за пограничными (лишними или не лишними) пробелами и пустыми строками. Помните, что, выделяя абзац или строку целиком, вы также часто выделяете и последний перевод строки. Это будет влиять на то, какой текст будет обработан кнопкой -- с этим переводом или без.

Можно ВАР поменять на ВАР2 (вручную, добавить символ "2" в имя шаблона), если этот шаблон вам больше нравится или если он больше подходит для оформления этой страницы...