Сканирование — это перевод физического носителя в электронный формат. При сканировании происходит считывание информации с реального носителя, а затем создается аналогичная по содержанию электронная копия, которая сохраняется в виде файла разных форматов с возможностью дальнейшей обработки, копирования и отправки. Сканирование документов, изображений, книг и других материалов давно уже является повсеместно распространенным в различных сферах.
Цифровое изображение при сканировании формируется из крошечных элементов, называемых пикселами. Для оценки качества такого изображения используют понятие «разрешение», которое обозначает количество пикселей, содержащихся в изображении. Чем выше разрешение, тем из большего количества пикселей сформировано изображение и тем выше его качество. Поэтому изображение с более высоким разрешением характеризуется большим количеством деталей, что при увеличении позволяет рассмотреть его мельчайшие элементы. На качество изображения, полученного в результате сканирования, влияют характеристики оптической системы сканера/фотокамеры.
Для захвата изображения в сканирующих устройствах используются сенсоры — микросхемы со светочувствительными элементами, которые могут быть реализованы в виде линеек или матриц. Чем больше светочувствительных элементов в сенсоре, тем большее разрешение он обеспечивает при формировании цифровой копии оригинала. В качестве единиц, определяющих разрешение сканера, используют количество точек на дюйм — dpi (dots per inch), т. е. оптическое разрешение сканера, это реальное количество светочувствительных элементов в квадратном дюйме (1 дюйм = 2,54 см). При установке режима сканирования можно задавать разрешение сканера в этих единицах, например, 300 или 600 dpi.
Сенсоры с небольшим количеством светочувствительных элементов не могут обеспечить высокого разрешения для полученного изображения. В большинстве офисных сканеров используются простые сенсоры, т.к. для бытовых задач не требуется высокой детализации изображения, достаточно просто обеспечить читаемость текста копии.
Поэтому в офисном оборудовании используется метод интерполяции, который сглаживает эффект пикселизации — размытости изображения, недостаточной четкости копий. Интерполяционное разрешение компенсирует недостаток физических характеристик сенсора с помощью программных алгоритмов. При интерполяции происходит искусственное увеличение числа пикселей с целью получить более высокое их значение по сравнению с оптическим разрешение. Но поскольку при интерполяции алгоритм «придумывает» искусственные пиксели, такое изображение сильно проигрывает в качестве цифровым копиям, полученным на сканере с высоким оптическим разрешением.
Сканеры с высокими характеристиками оптического разрешения используются для профессиональных задач. Так, например, планетарные сканеры могут обеспечивать разрешение свыше 1000 DPI. Подобное оборудование используется для сканирования носителей формата А3, А2, А1 и А0, при оцифровке архивов, библиотек, музейных коллекций, а также схем, карт, чертежей, планов, документов с пометками, ветхих и ценных оригиналов.
При проведении профессионального контроля качества сканирования для оценки применяются специальные средства: технические миры и шкалы, используемые в составе мишеней (тест-объектов) или отдельно, и графические программы, позволяющие проводить необходимые измерения значений пикселей растрового изображения. Мира (от французского mire, от mirer — рассматривать на просвет, прицеливаться, метить) тест-объект, предназначенный для определения характеристик качества изображения. Представляет собой плотный бумажный лист с нанесённой на него совокупностью линий или фигур установленного размера и начертания, сгруппированных и расположенных в определенном порядке.
Определение качества электронных образов происходит путем оцифровки физической тестовой мишени (тест-объекта, миры, шкалы) с известными (измеренными) параметрами и дальнейшего визуального и программного контроля полученного тестового изображения.
К примеру, с помощью специального тест-объекта ТО-2 по ГОСТ 13.1.701-87 производится визуальный контроль, который предполагает оценку наибольшего числа пар линий на миллиметр (пл/мм), различимых на изображении. Чем больше пл/мм различимо на изображении, тем выше оптическое разрешение.
Ниже представлен результат сканирования с разрешением 1000 DPI и можно увидеть, что при приближении легко различимы линии тест-объекта (12,5 пл/мм) толщиной в несколько раз меньше человеческого волоса:
Для автоматизированного измерения качества изображений применяется специализированное программное обеспечение (ПО). С помощью тест-объекта QA-62 вычисляются пространственно-частотные характеристики (Spatial Frequency Response — SFR, измерение способности системы сканирования сохранять относительный контраст для наиболее мелких деталей изображения). Тест-объект сканируется, затем полученное изображение загружается в ПО, которое производит автоматизированную оценку характеристик.
Система проводит анализ разрешающей способности и выдает результат с показателями концентрации пикселей на дюйм и градацией эффективности изображения. Чем выше процент эффективности по горизонтали и вертикали, тем четче изображение.
На сегодняшний день существует ряд международных стандартов по оценке качества сканирования, которые довольно схожи между собой и разработаны на основе мировой практики оцифровки материалов. Эти стандарты не являются обязательными на территории РФ, но могут использоваться в качестве рекомендации при выборе сканирующего оборудования или услуг оцифровки.
Основным является международный стандарт качества сканирования ISO 19264, который опирается на национальные технические руководства по оцифровке FADGI — Agency Digitization Guidelines Initiative (США) и METAMORFOZE — стандарты оцифровки в рамках совместного предприятия Национальной библиотеки и Национального архива Нидерландов. Хотя руководства FADGI и METAMORFOZE концептуально эквивалентны, между ними существуют небольшие различия в алгоритмах и критериях оценки, в том, как оцениваются целевые показатели, а также в подходе к градации полученных результатов. Поэтому, чтобы избежать возможной путаницы и различного толкования результатов, в апреле 2017 года были опубликованы руководящие принципы ISO 19264-1.
Стандарт ISO 19264 определяет три уровня качества изображения: A, B и C. Уровень A обозначает наиболее высокое качество изображения, и для его достижения требуется наиболее высокая техническая производительность как оператора, так и системы визуализации. Концептуально эти три уровня соответствуют звездной системе оценки FADGI (4, 3 и 2 звезды) и трехуровневой градации METAMORFOZE.
Ниже в таблице представлено соответствие по уровням качества, задаваемым в рамках стандартов ISO 19264-1, FADGI и METAMORFOZE:
Градация качества цифровой копии | Стандарт ISO 19264-1 | Стандарт FADGI | Стандарт METAMORFOZE |
---|---|---|---|
Низкое качество |
уровень C |
** (2 звезды) |
Extra Light (базовый) |
Хорошее/среднее качество |
уровень B |
*** (3 звезды) |
Light (легкий) |
Наивысшее качество |
уровень A |
**** (4 звезды) |
Metamorfoze* |
* Этот уровень у Metamorfoze логично назвать "Strict«(строгий) — наивысший, но в градации он называется просто «Metamorfoze»
Представленная ниже таблица отражает полный список характеристик, на основе измерения которых и происходит оценка с присвоением полученной скан копии определенного уровня качества с соответствием по стандартам ISO 19264-1, FADGI, METAMORFOZE.
Стандарт | ISO 19264-1 | FADGI | METAMORFOZE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Уровень качества | A | B | C | **** | *** | ** | Strict | Light | Extra lite | |
Resolution (claimed sampling rate) | ppi | 400 | 300 | 300 | 300 | 300 | 300 | |||
Bit Depth (minimum) | 8 | 8 | 8 | 16 or 8 (1) | 8 | 8 | 16 or 8 (2) | 8 | 8 | |
Tone Reproduction (of gray scale @ image center) | ΔL* | ± 2 | ± 3 | ± 4 | ± 5 | ± 8 | ± 2 | ± 2 | ± 2 | |
Gain Modulation (Patches 95 and 85) | Gain | 0,8-1,1 | 0,7-1,2 | 0,6-1,3 | 0,8-1,08 | 0,8-1,08 | 0,8-1,08 | |||
Gain Modulation (All other patches) | visual | 0,7-1,3 | 0,6-1,4 | 0,3-1,6 | 0,6-1,4 | 0,6-1,4 | 0,1-2,0 | |||
Noise (visual noise) | RMS | < 5 | < 6 | < 7 | ||||||
Noise | < 1 | < 2 | < 3 | < 1,6 | < 1,6 | < 1,6 | ||||
Dynamic Range (of gray scale @ image center) | D | ≥ 2,3 | ≥ 2,1 | ≥ 1,9 | ||||||
Banding (visual inspection) | none | none | slight | none | none | none | ||||
Defect Pixels (visual inspection) | ppm | none | 0,1 | 1 | ||||||
White Balance (over field) | ΔC* | ≤ 2 | ≤ 3 | ≤ 5 | ≤ 2 | ≤ 4 | ≤ 6 | ≤ 2 | ≤ 2 | ≤ 2 |
Color Reproduction (Max) | ΔE* | ≤ 10 CIE | ≤ 15 CIE | ≤ 15 CIE | ≤ 10 CIE | ≤ 18 CIE | ≤ 18 CIE | |||
Color Reproduction (Mean) | ΔE* | ≤ 4 CIE | ≤ 5 CIE | ≤ 5 CIE | ≤ 3 CIE | ≤ 5 CIE | ≤ 8 CIE | ≤ 4 CIE | ≤ 5 CIE | ≤ 5 CIE |
Sampling Rate (claimed/obtained) | % | ≤ 2 | ≤ 3 | ≤ 4 | ≤ 2 | ≤ 2 | ≤ 2 | |||
Resolution @ MTF 10 (claimed/obtained) | % | ≥ 85 | ≥ 80 | ≥ 70 | > 90 | > 80 | > 70 | ≥ 85 | ≥ 85 | ≥ 85 |
MTF @ Nyquist (50% sampling frequency) | % | < 20 | < 30 | < 40 | ||||||
MTF 50 (frequency @ MTF 10) | f | ≥ 0,5 | ≥ 0,45 | ≥ 0,45 | ≥ 0,5 | ≥ 0,45 | ≥ 0,45 | |||
MTF 50 (MTF @ 25% sampling) | ≥ 45 ≤ 65 | ≥ 35 ≤ 75 | ≥ 25 ≤ 85 | |||||||
Sharpening (max. SFR contrast value) | ≤ 1,05 | ≤ 1,1 | ≤ 1,2 | ≤ 1,0 | < 1,1 | < 1,2 | ≤ 1,05 | ≤ 1,05 | ≤ 1,05 | |
Illumination non-uniformity (≤ DINA3) | ΔL* | ≤ 3 | ≤ 3 | ≤ 3 | ≤ 1% | ≤ 3% | ≤ 5% | ≤ 3 | ≤ 3 | ≤ 3 |
Illumination non-uniformity (> DINA3 and ≤ DINA2) | ΔL* | ≤ 4 | ≤ 5 | ≤ 5 | ≤ 1% | ≤ 3% | ≤ 5% | ≤ 4 | ≤ 4 | ≤ 4 |
Illumination non-uniformity (> DINA2 and ≤ DINA1) | ΔL* | ≤ 5 | ≤ 6 | ≤ 6 | ≤ 1% | ≤ 3% | ≤ 5% | ≤ 5 | ≤ 5 | ≤ 5 |
Illumination non-uniformity (> DINA1 and ≤ DINA0) | ΔL* | ≤ 5 | ≤ 6 | ≤ 6 | ≤ 1% | ≤ 3% | ≤ 5% | ≤ 6 | ≤ 6 | ≤ 6 |
Color misregistration | pixels | ≤ 0,40 | ≤ 0,70 | ≤ 1,0 | < 0,33 | < 0,50 | < 0,80 | < 0,33 | < 0,50 | < 0,80 |
Distortion | % | ≤ ±1,5 | ≤ ±2 | ≤ ±5 | ≤ ±1 | ≤ ±2 | ≤ ±3 | ≤ ±2 | ≤ ±2 | ≤ ±2 |
(1) Для некоторых оригиналов требуется 16 бит.
(2) Оригиналы с плотностью >1,5 требуют 16 бит.
Обеспечивать максимально лучшее возможное качество изображения при сканировании далеко не всегда экономически целесообразно и технически возможно. С другой стороны, при низком качестве оцифровки может потребоваться повторное сканирование на технически более продвинутом оборудовании, что также негативно отразится на итоговых экономических и трудозатратах. Поэтому необходимо четко понимать какой уровень качества является приемлемым с учетом того, для решения каких задач производится сканирование. Так, например, в руководстве FADGI не рекомендуется оцифровывать документы с качеством менее, чем три звезды (что соответствует уровню B по стандарту ISO 19264-1), чтобы избежать повторного сканирования в будущем с учетом высоких затрат и усилий для проектов оцифровки.
К примеру, отечественные сканеры ЭларСкан, включенные в реестр РЭП, соответствуют стандартам ISO, FADGI, Metamorfoze. В линейке большое количество моделей с российскими камерами собственной разработки на 50, 100 и 150 Мп, которые соответствуют самым высоким критериям международных стандартов и предоставляют пользователям выбор различных модификаций, подходящих для конкретных задач оцифровки.