Технологии

КОМПЬЮТЕР ИЗУЧАЕТ ОБРАЗЫ

Наверное, из всех чувств, данных человеку, наиболее полную информацию об окружающем мире несет зрение. Причем изображение различных объектов мы получаем, не только непосредственно рассматривая их, но и изучая фотографии, при просмотре кинофильмов, телепередач или видеозаписей. И с самого возникновения отображающих устройств перед учеными и инженерами возникла конкретная цель - улучшить качество картинки. До недавнего времени ее решали совершенствованием оптических систем. Однако после появления компьютеров в оптике произошла революция, связанная с проникновением в нее цифровых методов. О проблемах и достижениях этого направления рассказал член-корреспондент РАН, директор Института систем обработки изображений Самарского научного центра РАН В. А. Сойфер.

Публикации по цифровой обработке информации изображений появились в 60-е годы XX в. применительно к решению задач астрономии, ядерной физики, биофизики, радиофизики и в основном касались усовершенствования устройств ввода-вывода. В дальнейшем оказалось: оптические поля - изображения - можно представить в виде массивов данных в памяти компьютера. А это не только открыло новые возможности для их обработки, но и привело к формированию ряда новых научных направлений на стыке информатики и оптики и прежде всего - компьютерного, где российским ученым принадлежит мировой приоритет.

Здесь в первую очередь следует отметить Институт проблем передачи информации РАН, являющийся пионером в области обработки изображений, Вычислительный центр РАН и Научный совет по комплексной проблеме "Кибернетика", внесших выдающийся вклад в решение задач по распознаванию образов. Институт радиотехники и электроники РАН совместно с отраслевым центром "Комета" и Государственным научно-производственным ракетно-космическим центром "ЦСКБ-Прогресс" трудились над совершенствованием сбора и обработки космической информации, а в Институте математического моделирования РАН создали теорию разностных схем, позволяющую решать задачи дифракции, лежащие в основе компьютерной оптики. Следует отметить Институты общей физики им. П. Н. Лебедева, оптико- нейронных технологий РАН, автоматики и электрометрии СО РАН и физический факультет Московского государственного университета им. М. В. Ломоносова за достижения в области компьютерной оптики. В 1993 г. к ним присоединился организованный в Самаре Институт систем обработки изображений РАН.

Во многом исследования отечественных ученых связаны с получением, обработкой, хранением и изучением изображений, передаваемых авиационными и космическими аппаратами дистанционного зондирования Земли, которые широко используют в метеорологии, геологии и картографии, океанографии, геоботанике, сельском и лесном хозяйстве, при решении задач землепользования и гидростроительства, экологического мониторинга и т.д. Скажем, на основе изображений можно формировать компьютерную пространственно-распределенную информационную модель территории. А она, в свою очередь, способствует контролю за протекающими там техногенными и природными процессами, вариантному прогнозу развития экономики, социальной сферы, состояния окружающей среды и т.д.

Модель формируют поэтапно, с постепенным усложнением и расширением поставленных задач. Ее, как правило, рассматривают на трех масштабных уровнях: мелком (обзорном) - 1 : 100 000- 1 : 200 000; среднем (плановом) - 1 : 10 000 - 1 : 25 000 и крупном (кадастровом) - 1 : 500-1 : 2 000. Причем изучение идет в двух временных вариантах: статистическом, когда измерение информации накапливается месяцами и годами, и динамическом, т.е. при суточном или даже часовом обновлении данных. Каждый этап расширяет круг решаемых геоинформационно-аналитических задач и требует привлечения иного, более высокого качественного уровня. Поэтому кроме аэрокосмических изображений для формирования модели используют другие источники информации, в частности, картографические материалы, данные измерений координат с помощью глобальной спутниковой навигационной системы "Global Positioning System" (GPS-измерения) и т.д.

Системы дистанционного зондирования Земли космических комплексов насчитывают примерно 40-летнюю историю. Соответствующие аппараты ныне широко распространены и различаются по сложности и кругу решаемых задач, степени автоматизации, условиям эксплуатации и техническим характеристикам. Наиболее простые из них - с фотографической регистрацией изображений, - хотя и обеспечивают высокое пространственное разрешение, однако оно недостаточно для современных требований (1-5 м и выше). Попытки получить искомое привели к радикальному пересмотру принципов построения и функционирования указанных систем, их значительному усложнению, к использованию алгоритмов глубокой математической обработки и анализа изображений.

На смену традиционным сканерам с механической разверткой пришли оптико-механические системы с линейными или твердотельными полупроводниковыми датчиками. Последние экономичны, надежны и в сочетании с высококачественной оптикой обеспечивают необходимую разрешающую способность. А ее повышение приводит к резкому увеличению объема информации, собираемой системами видеоизмерений, что позволяет перейти от сплошного зондирования земной поверхности к выборочной съемке отдельных участков. В свою очередь, это диктует особо тщательный подход к планированию работы системы видеоизмерений, расширению базы картографических сведений, к бортовой обработке изображений с целью их координатной увязки. Затем выделенные фрагменты до передачи на Землю подвергают еще одной операции - "сжатию" данных; таким образом объем транслируемых сообщений сокращается в несколько раз. Аналогичную компрессию информации осуществляют на наземных приемных станциях: в итоге емкость запоминающих устройств для хранения изображений в специализированной базе данных используется более эффективно.

Однако все преимущества перечисленных новшеств имеют и оборотную сторону. Оказывается, с повышением разрешения и скорости передачи видеоинформации происходит значительное искажение оптического сигнала. Ликвидировать этот недостаток нельзя без разработки компенсирующих систем.

Дело в том, что наземную обработку изображений, получаемых аэрокосмическими средствами дистанционного зондирования, разделяют на предварительную и окончательную. Первая включает в себя перечисленные выше технологии и завершается размещением изображений в базе данных, предназначенных для дальнейшего применения по тематическим направлениям. Ко второй прибегают при решении конкретных прикладных задач. Она может включать в себя классификацию элементов и областей земной поверхности с использованием яркостных, спектральных и пространственных признаков. В некоторых случаях нужна коррекция изображений и их приведение к картографическим проекциям, в других - их векторизация, т.е. преобразование в тематические цифровые карты, передаваемые в геоинформационные системы. Наконец, для выявления изменений изображений во времени необходимо сравнить вновь поступившие данные с собранными в ходе предыдущих видеосъемок. Все это, разумеется, требует применения высокоэффективных специализированных вычислительных комплексов.

Как уже говорилось, большой объем цифровых данных, соответствующих передаваемым изображениям, ставит перед разработчиками ряд серьезных проблем. Требования быстрой передачи информации по телекоммуникационным сетям, их оперативной обработки и регистрации вступают в противоречия с техническими характеристиками используемой аппаратуры. Прежде всего пропускная способность передающих каналов ограничена. Кроме того, даже самые современные вычислительные средства не обладают должным быстродействием и емкостью запоминающих устройств. В такой ситуации большое значение приобретает специальный вид обработки изображений - компрессия или сжатие данных.

Существует много способов его реализации, но всех их характеризует отношение исходного объема данных к полученному (коэффициент сжатия). Чем выше этот показатель, тем эффективнее примененный метод. Иногда первоначальный объем информации удается сократить в 10-50 раз.

Однако рост коэффициента сжатия, в принципе, ограничивают несколько объективных факторов, в частности, уровень искажений, вносимых в изображение при его компрессии. Вот почему выбор допустимого уровня искажений имеет важное значение. Скажем, при обработке "видовых" изображений учитываются особенности их зрительного восприятия (здесь искажения должны быть малозаметны для наблюдателя), однако в других случаях данный критерий непригоден. Например, при дистанционном зондировании земной поверхности информационная ценность картинки настолько велика, что выдвигает самые высокие требования к точности регистрации каждой точки поля яркости. Фиксацию таких изображений обычно проводят для последующего многоцелевого использования и производят под жестким контролем с использованием малоискажающих или вовсе не искажающих методов: дифференциального кодирования; кодирования с преобразованием; интерполяционных, основанных на содержательной сегментации. Каждый из них имеет свои преимущества и недостатки, поэтому исследования в этой области до сих пор актуальны.

Аналогичными проблемами занимаются в Институте систем обработки изображений РАН и достигли значительных успехов. Удалось разработать алгоритмы и методы компрессии/декомпрессии изображений, существенно превосходящие известные. Они обеспечивают повышенный коэффициент сжатия, позволяют контролировать искажения по наиболее строгому критерию максимальной ошибки восстановления каждой точки (пиксела) цифрового изображения, дают возможность "мультиразрешения", т.е. быстрого восстановления уменьшенных копий и т.д. Этот вид обработки информации применяют во многих прикладных исследованиях. На нем базируется цифровое телевидение и компьютерные полиграфические системы, базы изобразительных данных (космоснимков, произведений искусства, товарных знаков и т.п.) с удаленным доступом через Интернет, интеллектуальные робототехнические комплексы и т.д.

А вот совсем иная и, казалось бы, неожиданная сфера использования компьютерной обработки образов - медико-биологические исследования и диагностика. Речь идет о рентгенографических снимках (легких, суставов, других внутренних органов), томографических данных (ультразвуковых, рентгенографических, полученных методом ядерного магнитного резонанса и т.д.), изучении препаратов тканей и крови, а также радужной оболочки глаза (для иридодиагностики) и многое другое. Даже сугубо "одномерные" диагностические сигналы - кардиограммы или энцефалограммы - иногда целесообразно вводить в ЭВМ и обрабатывать как изображения, поскольку тогда их анализ и интерпретация позволяет врачу поставить более правильный диагноз. Рассмотрим несколько конкретных примеров использования таких систем.

Одним из наиболее развитых направлений в этом плане, как уже отмечалось, стало решение задач иридодиагностики. Дело в том, что глазное дно - единственный участок в организме, где сосудистая система доступна прямому неинвазивному (без проникновения вовнутрь) наблюдению в полном объеме. Самыми ранними признаками ее поражения при таких заболеваниях, как диабет, артериальная гипертензия, атеросклероз, являются изменение соотношения диаметра артерий и вен, локальные "скачки" диаметра сосудов, повышенная их извилистость и другие. Отсюда ясно, как важна разработка методов количественной оценки патологии сосудов сетчатки. Однако перед разработчиками соответствующих систем возникает ряд трудностей, в частности им нужны цифровые изображения высокого разрешения и очень большой точности при измерении диаметров сосудов, поскольку именно они дают возможность оценить локальную гемодинамику сетчатки.

Ныне в Институте систем обработки изображений РАН разработан оригинальный комплекс по исследованию глазного дна, с помощью которого можно количественно выявить его патологию. В ней сначала трассируется (определяется средняя линия каждого сосуда) вся сосудистая система, на основе чего затем определяют геометрические характеристики артерий и вен. Сюда входят длина сосуда и параметры, описывающие каждую отдельную его точку. При этом выявляют координаты точки сканирования русла на каждом шаге трассировки; локальную ширину сосуда; направление на следующую точку трассировки; количество разветвлений сосуда в данной точке. Сумма всех этих данных позволяет диагностировать состояние всей сетчатки и глазного дна по одиннадцати параметрам. На этой основе составляется база данных, куда входит и общая клиническая информация о пациентах. На заключительном этапе работы системы включается программа автоматизированного расчета степени патологии на основании экспертных оценок.

Кстати, данный уникальный комплекс можно применять и в общетерапевтической, акушерской практике для ранней диагностики и эффективного лечения сосудистых заболеваний. В отличие от европейских аналогов она позволяет анализировать субклинические морфологические изменения.

Другое направление в контроле за состоянием органов зрения строится на цифровом анализе кристаллограмм слезной жидкости (последняя является индикатором нарушения обменных процессов при различных патологиях). С биохимической точки зрения они представляют собой многокомпонентную систему, для исследования которой традиционными способами требуется большое количество самой жидкости, дорогостоящие лабораторное оборудование и реактивы. Причем даже при наличии всего перечисленного нельзя одновременно протестировать слезу на наличие всех входящих в нее компонентов.

Далее была предложена новая диагностика, в основу которой взят кристаллографический метод (он дает представление о фундаментальной структуре веществ). Сотрудники кафедры офтальмологии Волгоградской медицинской академии, проанализировав изображения кристаллограмм, априори разделенных врачами на нормальные и имеющие патологии, выделили глобальные диагностические признаки, способствующие их классификации (при отсутствии глазных заболеваний кристалл слезы должен быть прозрачным, содержать длинные, тонкие, преимущественно одного направления лучи, имеющие четкие границы и выходящие из одного центра; в остальных случаях он выглядит иначе, что и позволяет выявить патологию).

Сейчас обработкой изображений занимаются во всем мире. Она является неотъемлемым разделом информатики и опирается на математику, физику, биологию и т.д. И чем глубже мы, говорит В. А. Сойфер, изучаем информационную природу изображений, тем шире поле деятельности открывается перед нами.


Материал подготовил А. К. МАЛЬЦЕВ, Сойфер В. А.

Шерстяные пледы купить шерстяной плед.
Авторские права на статьи принадлежат их авторам
Проект компании Kocmi LTD