Интерполяция просмотров: 1360
Интерполяция
Подробная процедура для получения масштабного инвариантного представления может быть представлена по следующему алгоритму:
Шаг 1. Интерполяция: для интерполяции оригинальные границы с линейной интерполяцией фильтра h1(n), заданы уравнением
. . 1 − | n|M (j, x, y)=L |n| < L, в противном случае 0
где L является интерполяцией длины между оригинальными образцами.
Шаг 2. Инициализация: для применения расширенного кубического B-сплайнового фильтра с целью инициализации для получения границ низкого разрешения в масштабах 0,5<s<1. Граница низкого разрешения интерполированного сигнала задаётся
Rs(k)= [r(t) · 2sβ3(−2st)]t=2−s k .
Шаг 3. Разложение: чтобы получить границу низкого разрешения путём использования ДВП, представленного ниже:
Rs(k)=[Rs−1· β2 (k)]↓2, где дискретный фильтр β3(k) является биномиальным.
a) б)
Рис. 1.33 Пример аппроксимации стволовой границы
Шаг 4. Построение масштабно-инвариантного представления: для вычисления функций кривизны и нахождения нулевых пересечений функций кривизны в нужных масштабах. Кроме того, для построения масштабно-инвариантного представления делается нулевое пересечение на плоскости t − k.
Эксперименты проводились в [Юн и соавт., 1998]. Используется несколько изображений, такие как ствол, инструменты, карты и т.д. Некоторые объекты взяты из съёмок камеры, а некоторые, например, ствол, из X-Ray. Карты взяты из коммерческой базы изображений. Результаты показывают, что предлагаемые представления являются надёжными и последовательными.
1.2.1 Распознавание рукописных и печатных символов
Распознавание символов, включая выявление рукописных и печатных символов, является важнейшей отраслью в области распознавания шаблонов. Был опубликован целый ряд статей, имеющих отношение к этой отрасли. Тем не менее, волны использовались лишь немногими [Ли и др., 1996; Тан и др., 1996b; Тан и др., 1998d;Тан и др., 1998а; Вунш и Лэйн, 1995]. В этом подразделе кратко представлены две публикации [Ли и др., 1996; Вунш и Лэйн, 1995]. Кроме этого, в доступе имеется специальная глава из этой книги, обеспечивающая подробное описание распознавания символов в волновой теории.
1. Волновые дескрипторы для распознавания рукописных символов.
В работе [Вунш и Лэйн, 1995] описывается система распознавания символов, которая основана на волновых дескрипторах, одновременно анализирующих форму символа на нескольких уровнях разрешения. Система опробована и тестирована на большой базе данных более 6000 образцов рукописных алфавитно-цифровых символов. Результаты показывают, что волновые дескрипторы являются эффективным представлением, которое может обеспечивать надёжное распознавание в задачах с большой изменчивостью входа.
2. Извлечение кратномасштабных особенностей в распознавании рукописных цифрами с помощью двумерных волн Хаара.
Известные волны Хаара являются достаточными для местного обнаружения линейных сегментов и общего обнаружения линейных структур с помощью быстрого вычисления. [Ли и соавт., 1996] развивают метод, основанный на волнах Хаара. Это позволяет нам иметь инвариантную интерпретацию изображения символа в разных разрешениях и представляет кратномасштабный анализ в виде матрицы коэффициентов. Поскольку детали изображения символа в разных разрешениях обычно характеризуют различные физические структуры символа, и к тому же коэффициенты, полученные из волновых преобразований, являются очень полезными в распознавании неограниченных рукописных цифр. Таким образом, в [Ли и соавт., 1996], волновое преобразование с множеством волн Хаара используется в распознавании рукописного текста для кратномасштабного извлечения признаков.
Таким образом, мы берём
1 = cos2 ω + sin2 ω.
Давайте напишем
2 |
|H(ω)|2 = cos2 ω =2 2 1+ cos ω 2 = 1 .1+2 cos ω + cos2 ω + sin2 ω. = 1 .(1 + cos ω)2 + sin2 ω4
. 1+cos ω− i sin ω.2
. 1 + e−iω .2
Итак,
. . . .
= |
= |
. |
, |
. . .
2 |
2 |
. . . .
1 − cos ω
1 − e−iω .2
2 |
|H(ω + π)|2 = sin2 ω =
Таким образом, мы можем взять
1 = cos2 ω + sin2 ω .
где
H (ω) =2к = 0
1√ 2 HK е, 1h0 = √ 2, H1 = √ 2.
Φункция масштабирования ϕ(x) и волновая функция ψ(x) могут быть представлены
. 1, если 0 <х <1
φ (х) =0, в противном случае (1.14)
и ψ (х) = c1φ (2x) - c0φ (2x - 1) (1.15)
= Φ (2x) - φ (2x - 1)
1, если 0 <х <1
2
=
-1, если 1 ≤ X <1
0 в противном случае
Изображение рукописных символов может быть разложено на свои волновые коэффициенты с помощью пирамидального алгоритма Малла. С помощью волн Хаара изображение F разлагается следующим образом:
F =
Ш х
Y Z
П
С Т
|
|
F =
w x
y z
p q
s t
|
(1.16)
(1.16)
В уравнении (1.16), изображение {W, X, Y, Z} распадается на изображение {A}, {B},
{C} и {D} с разрешением 2-1. Изображение {} соответствует низким частотам (D1), {B} даёт вертикальные высокие частоты (D2), {C} горизонтальные высокие частоты (D3), и {D} высокие частоты в горизонтальном и вертикальном направлениях (D4). Кроме того, изображение {P, Q, R, A} с разрешением 2-1 разлагается на изображение {S}, {T}, {U} и {V} с разрешением 2-2. Это разложение можно архивировать путём свёртки 2 × 2 матрицы изображения с
масками Хаара следующим образом:
к = 1
J +1
⊗ Нк к = 1, 2, 3, 4 (1.17)
k |
где ⊗ является оператором свёртки, Dj - разложенными изображениями при разрешении 2j , Ij+1 - изображением 2 × 2 при разрешении 2j+1, а Hk являются масками Хаара, определёнными на рис. 1.34.
1 |
1 |
|
|
|
|
1 |
1 |
|
|
|
|
Рис. 1.34. Маски Хаара (а) низкие частоты, (б) вертикальные высокие частоты, (в) в горизонтальной плоскости высоких частотах, (г) высокие частоты в горизонтальном и вертикальном направлениях.
Рис. 1.35. Обзор кратномасштабного выделения признаков.
В этом приложении разлагаются результаты на разрешение 2-1 и 2-2 и используются в качестве кратномасштабных характеристик. Рис. 1.35 показывает процесс выделения кратномасштабных признаков. Рис. 1.35 (а) даёт входное изображение рукописного числа «8», его цифровое изображение показано на рис. 1.35 (б). Разложение вектора признаков с разрешением 2-1 показано на рис. 1,35 (с), в то время как вектор признаков с разрешением 2-2 разложен на рис. 1,35 (д). Эти функции используются для безусловного распознавания рукописных цифр из базы данных Университета Конкордия Канады (рис. 1.36), Японской Электротехнической Лаборатории (рис. 1.37), а также Корейского Научно-Исследовательского Института Электроники и Телекоммуникаций (рис. 1.38). Ошибка ставки соответственно 3,20%, 0,83% и 0,75%. Эти результаты показали, что предложенная схема является очень надёжной с точки зрения различных стилей, письменной формы и размеров. Подробное описание этого приложения может быть передано в [Ли и соавт., 1996].
3. Волновые дескрипторы для распознавания текста на каннада, напечатанного на индейских языках
Система OCR для индейских языков, особенно для каннада, популярного южноиндейского языка, тема которого развивается в [Кунте и Самуэль, 2007]. Некоторые примеры языка каннада представлены на рис. 1.39.
Рис. 1,36. Рукописные цифровые данные Канадского Университета Конкордия.
Рис. 1,37. Рукописные цифровые данные Японской Электротехнической лаборатории.
Одномерное дискретное волновое преобразование (ДВП) используется для выделения признаков. Рассматриваются волны Добеши из разряда ортонормированых волн. ДВП, когда оно применяется к последовательности координат из контуров символов, возвращает множество коэффициентов аппроксимации и множество подробных коэффициентов. Коэффициенты аппроксимации соответствуют основным формам контура (низкочастотным компонентам), а коэффициенты детализации соответствуют данным контура (высокочастотным компонентам), которые отражают направление контура, кривизну и т. д. Нейронные классификаторы эффективно используются для классификации символов на основе волновых функций. Система может быть расширена для распознавания других южноиндейских языков, особенно для телугу.
Рис. 1,38. Рукописные цифровые данные Корейского Исследовательского института электроники и телекоммуникаций.
Рис. 1.39. Некоторые примеры текста каннада на индейских языках [Кунте и Самуэль, 2007].