Как оценить качество сканирования

Что такое сканирование

Сканирование — это перевод физического носителя в электронный формат. При сканировании происходит считывание информации с реального носителя, а затем создается аналогичная по содержанию электронная копия, которая сохраняется в виде файла разных форматов с возможностью дальнейшей обработки, копирования и отправки. Сканирование документов, изображений, книг и других материалов давно уже является повсеместно распространенным в различных сферах.

Что определяет качество сканирования

Цифровое изображение при сканировании формируется из крошечных элементов, называемых пикселами. Для оценки качества такого изображения используют понятие «разрешение», которое обозначает количество пикселей, содержащихся в изображении. Чем выше разрешение, тем из большего количества пикселей сформировано изображение и тем выше его качество. Поэтому изображение с более высоким разрешением характеризуется большим количеством деталей, что при увеличении позволяет рассмотреть его мельчайшие элементы. На качество изображения, полученного в результате сканирования, влияют характеристики оптической системы сканера/фотокамеры.

Для захвата изображения в сканирующих устройствах используются сенсоры — микросхемы со светочувствительными элементами, которые могут быть реализованы в виде линеек или матриц. Чем больше светочувствительных элементов в сенсоре, тем большее разрешение он обеспечивает при формировании цифровой копии оригинала. В качестве единиц, определяющих разрешение сканера, используют количество точек на дюйм — dpi (dots per inch), т. е. оптическое разрешение сканера, это реальное количество светочувствительных элементов в квадратном дюйме (1 дюйм = 2,54 см). При установке режима сканирования можно задавать разрешение сканера в этих единицах, например, 300 или 600 dpi.

Сенсоры с небольшим количеством светочувствительных элементов не могут обеспечить высокого разрешения для полученного изображения. В большинстве офисных сканеров используются простые сенсоры, т.к. для бытовых задач не требуется высокой детализации изображения, достаточно просто обеспечить читаемость текста копии.

Поэтому в офисном оборудовании используется метод интерполяции, который сглаживает эффект пикселизации — размытости изображения, недостаточной четкости копий. Интерполяционное разрешение компенсирует недостаток физических характеристик сенсора с помощью программных алгоритмов. При интерполяции происходит искусственное увеличение числа пикселей с целью получить более высокое их значение по сравнению с оптическим разрешение. Но поскольку при интерполяции алгоритм «придумывает» искусственные пиксели, такое изображение сильно проигрывает в качестве цифровым копиям, полученным на сканере с высоким оптическим разрешением.

Сканеры с высокими характеристиками оптического разрешения используются для профессиональных задач. Так, например, планетарные сканеры могут обеспечивать разрешение свыше 1000 DPI. Подобное оборудование используется для сканирования носителей формата А3, А2, А1 и А0, при оцифровке архивов, библиотек, музейных коллекций, а также схем, карт, чертежей, планов, документов с пометками, ветхих и ценных оригиналов.

Профессиональный подход к оценке качества сканирования

При проведении профессионального контроля качества сканирования для оценки применяются специальные средства: технические миры и шкалы, используемые в составе мишеней (тест-объектов) или отдельно, и графические программы, позволяющие проводить необходимые измерения значений пикселей растрового изображения. Мира (от французского mire, от mirer — рассматривать на просвет, прицеливаться, метить) тест-объект, предназначенный для определения характеристик качества изображения. Представляет собой плотный бумажный лист с нанесённой на него совокупностью линий или фигур установленного размера и начертания, сгруппированных и расположенных в определенном порядке.

Определение качества электронных образов происходит путем оцифровки физической тестовой мишени (тест-объекта, миры, шкалы) с известными (измеренными) параметрами и дальнейшего визуального и программного контроля полученного тестового изображения.

К примеру, с помощью специального тест-объекта ТО-2 по ГОСТ 13.1.701-87 производится визуальный контроль, который предполагает оценку наибольшего числа пар линий на миллиметр (пл/мм), различимых на изображении. Чем больше пл/мм различимо на изображении, тем выше оптическое разрешение.

Ниже представлен результат сканирования с разрешением 1000 DPI и можно увидеть, что при приближении легко различимы линии тест-объекта (12,5 пл/мм) толщиной в несколько раз меньше человеческого волоса:

Для автоматизированного измерения качества изображений применяется специализированное программное обеспечение (ПО). С помощью тест-объекта QA-62 вычисляются пространственно-частотные характеристики (Spatial Frequency Response — SFR, измерение способности системы сканирования сохранять относительный контраст для наиболее мелких деталей изображения). Тест-объект сканируется, затем полученное изображение загружается в ПО, которое производит автоматизированную оценку характеристик.

Система проводит анализ разрешающей способности и выдает результат с показателями концентрации пикселей на дюйм и градацией эффективности изображения. Чем выше процент эффективности по горизонтали и вертикали, тем четче изображение.

На сегодняшний день существует ряд международных стандартов по оценке качества сканирования, которые довольно схожи между собой и разработаны на основе мировой практики оцифровки материалов. Эти стандарты не являются обязательными на территории РФ, но могут использоваться в качестве рекомендации при выборе сканирующего оборудования или услуг оцифровки.

Основным является международный стандарт качества сканирования ISO 19264, который опирается на национальные технические руководства по оцифровке FADGI — Agency Digitization Guidelines Initiative (США) и METAMORFOZE — стандарты оцифровки в рамках совместного предприятия Национальной библиотеки и Национального архива Нидерландов. Хотя руководства FADGI и METAMORFOZE концептуально эквивалентны, между ними существуют небольшие различия в алгоритмах и критериях оценки, в том, как оцениваются целевые показатели, а также в подходе к градации полученных результатов. Поэтому, чтобы избежать возможной путаницы и различного толкования результатов, в апреле 2017 года были опубликованы руководящие принципы ISO 19264-1.

Стандарт ISO 19264 определяет три уровня качества изображения: A, B и C. Уровень A обозначает наиболее высокое качество изображения, и для его достижения требуется наиболее высокая техническая производительность как оператора, так и системы визуализации. Концептуально эти три уровня соответствуют звездной системе оценки FADGI (4, 3 и 2 звезды) и трехуровневой градации METAMORFOZE.

Ниже в таблице представлено соответствие по уровням качества, задаваемым в рамках стандартов ISO 19264-1, FADGI и METAMORFOZE:

Градация качества цифровой копии Стандарт ISO 19264-1 Стандарт FADGI Стандарт METAMORFOZE

Низкое качество

уровень C

** (2 звезды)

Extra Light (базовый)

Хорошее/среднее качество

уровень B

*** (3 звезды)

Light (легкий)

Наивысшее качество

уровень A

**** (4 звезды)

Metamorfoze*

* Этот уровень у Metamorfoze логично назвать "Strict«(строгий) — наивысший, но в градации он называется просто «Metamorfoze»

  • Визуализация уровня C подходит в тех случаях, когда при сканировании нет возможности достижения производительности уровня B или A. Изображения такого уровня качества будут иметь только информационную ценность (например, когда нужно показать превью документа/изображения с указанием места хранения оригинала) и не подходят для работы с текстом и его распознавания.
  • Визуализация уровня B определяет очень хорошее профессиональное качество изображения, подходящее под все основные варианты дальнейшего использования. Это может быть распознавание и чтение текста в электронном виде, а также транслирование на стандартных мониторах и перепечатка на офисных принтерах.
  • Уровень А определяет наилучшее качество визуализации. Изображения, отвечающие требованиям качества на уровне А, представляют собой по сути полностью эквивалентную оригиналу копию с возможностью практически любого применения, трансляции и распечатки в любом формате без каких-либо ограничений.

Представленная ниже таблица отражает полный список характеристик, на основе измерения которых и происходит оценка с присвоением полученной скан копии определенного уровня качества с соответствием по стандартам ISO 19264-1, FADGI, METAMORFOZE.

Стандарт ISO 19264-1 FADGI METAMORFOZE
Уровень качества A B C **** *** ** Strict Light Extra lite
Resolution (claimed sampling rate) ppi 400 300 300 300 300 300
Bit Depth (minimum) 8 8 8 16 or 8 (1) 8 8 16 or 8 (2) 8 8
Tone Reproduction (of gray scale @ image center) ΔL* ± 2 ± 3 ± 4 ± 5 ± 8 ± 2 ± 2 ± 2
Gain Modulation (Patches 95 and 85) Gain 0,8-1,1 0,7-1,2 0,6-1,3 0,8-1,08 0,8-1,08 0,8-1,08
Gain Modulation (All other patches) visual 0,7-1,3 0,6-1,4 0,3-1,6 0,6-1,4 0,6-1,4 0,1-2,0
Noise (visual noise) RMS < 5 < 6 < 7
Noise < 1 < 2 < 3 < 1,6 < 1,6 < 1,6
Dynamic Range (of gray scale @ image center) D ≥ 2,3 ≥ 2,1 ≥ 1,9
Banding (visual inspection) none none slight none none none
Defect Pixels (visual inspection) ppm none 0,1 1
White Balance (over field) ΔC* ≤ 2 ≤ 3 ≤ 5 ≤ 2 ≤ 4 ≤ 6 ≤ 2 ≤ 2 ≤ 2
Color Reproduction (Max) ΔE* ≤ 10 CIE ≤ 15 CIE ≤ 15 CIE ≤ 10 CIE ≤ 18 CIE ≤ 18 CIE
Color Reproduction (Mean) ΔE* ≤ 4 CIE ≤ 5 CIE ≤ 5 CIE ≤ 3 CIE ≤ 5 CIE ≤ 8 CIE ≤ 4 CIE ≤ 5 CIE ≤ 5 CIE
Sampling Rate (claimed/obtained) % ≤ 2 ≤ 3 ≤ 4 ≤ 2 ≤ 2 ≤ 2
Resolution @ MTF 10 (claimed/obtained) % ≥ 85 ≥ 80 ≥ 70 > 90 > 80 > 70 ≥ 85 ≥ 85 ≥ 85
MTF @ Nyquist (50% sampling frequency) % < 20 < 30 < 40
MTF 50 (frequency @ MTF 10) f ≥ 0,5 ≥ 0,45 ≥ 0,45 ≥ 0,5 ≥ 0,45 ≥ 0,45
MTF 50 (MTF @ 25% sampling) ≥ 45 ≤ 65 ≥ 35 ≤ 75 ≥ 25 ≤ 85
Sharpening (max. SFR contrast value) ≤ 1,05 ≤ 1,1 ≤ 1,2 ≤ 1,0 < 1,1 < 1,2 ≤ 1,05 ≤ 1,05 ≤ 1,05
Illumination non-uniformity (≤ DINA3) ΔL* ≤ 3 ≤ 3 ≤ 3 ≤ 1% ≤ 3% ≤ 5% ≤ 3 ≤ 3 ≤ 3
Illumination non-uniformity (> DINA3 and ≤ DINA2) ΔL* ≤ 4 ≤ 5 ≤ 5 ≤ 1% ≤ 3% ≤ 5% ≤ 4 ≤ 4 ≤ 4
Illumination non-uniformity (> DINA2 and ≤ DINA1) ΔL* ≤ 5 ≤ 6 ≤ 6 ≤ 1% ≤ 3% ≤ 5% ≤ 5 ≤ 5 ≤ 5
Illumination non-uniformity (> DINA1 and ≤ DINA0) ΔL* ≤ 5 ≤ 6 ≤ 6 ≤ 1% ≤ 3% ≤ 5% ≤ 6 ≤ 6 ≤ 6
Color misregistration pixels ≤ 0,40 ≤ 0,70 ≤ 1,0 < 0,33 < 0,50 < 0,80 < 0,33 < 0,50 < 0,80
Distortion % ≤ ±1,5 ≤ ±2 ≤ ±5 ≤ ±1 ≤ ±2 ≤ ±3 ≤ ±2 ≤ ±2 ≤ ±2

(1) Для некоторых оригиналов требуется 16 бит.
(2) Оригиналы с плотностью >1,5 требуют 16 бит.

Обеспечивать максимально лучшее возможное качество изображения при сканировании далеко не всегда экономически целесообразно и технически возможно. С другой стороны, при низком качестве оцифровки может потребоваться повторное сканирование на технически более продвинутом оборудовании, что также негативно отразится на итоговых экономических и трудозатратах. Поэтому необходимо четко понимать какой уровень качества является приемлемым с учетом того, для решения каких задач производится сканирование. Так, например, в руководстве FADGI не рекомендуется оцифровывать документы с качеством менее, чем три звезды (что соответствует уровню B по стандарту ISO 19264-1), чтобы избежать повторного сканирования в будущем с учетом высоких затрат и усилий для проектов оцифровки.

К примеру, отечественные сканеры ЭларСкан, включенные в реестр РЭП, соответствуют стандартам ISO, FADGI, Metamorfoze. В линейке большое количество моделей с российскими камерами собственной разработки на 50, 100 и 150 Мп, которые соответствуют самым высоким критериям международных стандартов и предоставляют пользователям выбор различных модификаций, подходящих для конкретных задач оцифровки.