머신 비전이 자동화를 이끌어가고 있는 방식

작성자: Jody Muelaner

머신 비전은 자동화 장비(산업용 또는 기타)가 이미지를 통해 근접 환경을 높은 수준으로 이해할 수 있도록 해주는 다양한 기술의 집합체입니다. 머신 비전 소프트웨어가 없다면, 자동화 장비에 있어 디지털 이미지란 다양한 색상 값과 톤의 강도를 가진, 연결성이 없는 단순한 픽셀의 모음에 지나지 않을 것입니다. 머신 비전을 사용하면 컴퓨터(일반적으로 머신 컨트롤에 연결됨)로 이미지 내의 가장자리와 모양을 감지한 후, 상위 단계의 처리 루틴을 통해 미리 정의된 관심 개체를 식별할 수 있습니다. 이러한 의미의 이미지란 가시 스펙트럼의 사진 이미지에만 국한되지 않고, 적외선, 레이저, X선 및 초음파 신호를 사용하여 얻은 이미지도 포함할 수 있습니다.

'보다 정교한 로봇 공학 응용 분야를 위한 머신 비전 사용' 이미지그림 1: 보다 정교한 로봇 공학 응용 제품을 위해 머신 비전의 사용이 증가하고 있습니다. (이미지 출처: John6863373 | Dreamstime.com)

산업 환경에서 흔히 볼 수 있는 머신 비전 응용 제품 중 하나는 무작위로 배열된(뒤섞인) 부품들이 혼합되어 담긴 보관함에서 특정 부품을 식별하는 응용 제품입니다. 여기에서 머신 비전은 집어서 놓는 작업을 하는 로봇이 자동으로 옳은 부품을 선택할 수 있도록 도울 수 있습니다. 물론 이러한 부품들이 트레이에 모두 가지런히 배열되고 같은 방향으로 정렬되어 있다면, 영상 피드백을 통해 부품을 인식하는 일은 비교적 간단한 작업일 것입니다. 하지만 강력한 머신 비전 알고리즘은 카메라와 떨어진 거리가 달라도(그러므로 이미징 센서에 다른 크기로 나타남), 또한 대상의 방향이 달라도 대상의 인식이 가능합니다.

최첨단 머신 비전 시스템은 부품 보관함에서 부품 고르기 같은 것보다 훨씬 더 정교한 최신 설계를 가능하게 합니다. 예를 들어, 가장 눈에 띄는 설계는 자율 주행 차량에서 물체 인식일 것입니다.

'머신 비전은 시스템이 주변 환경에 대해 높은 수준의 이해를 가능하도록 합니다.' 이미지그림 2: 머신 비전은 시스템(산업 또는 기타)이 이미지를 통해 주변 환경 설정에 대한 높은 수준의 이해를 가능하도록 합니다. (이미지 출처: Wikimedia)

머신 비전과 관련된 기술

머신 비전이라는 용어는 때로는 이미지로부터 정보를 추출하는 기존의 정립되고 효율적인 수학적 방법을 지칭하는 것에 국한되어 있기도 합니다. 이에 비해 컴퓨터 비전이라는 용어는 머신 러닝 또는 인공 지능(AI)을 사용하는 블랙박스 접근 방식을 포함하는, 더욱 현대적이고 까다로운 계산을 요하는 시스템을 지칭하는 경우가 많습니다. 그러나 머신 비전은 이미지로부터 높은 수준의 정보를 추출하는 모든 방법을 망라하는 포괄적인 용어로도 쓰일 수 있습니다. 이러한 맥락에서 컴퓨터 비전은 머신 비전의 근원이 되는 작동 이론으로 설명할 수도 있습니다.

이미지로부터 높은 수준의 의미를 추출하는 기술은 아주 많습니다. 연구 커뮤니티 내에서, 이러한 기술들은 머신 비전과 다르다고 보통 여겨집니다. 하지만 실질적으로는, 이런 기술 모두는 머신 비전을 달성하는 여러 방법 중의 하나일 뿐이며, 대부분의 경우 이들은 서로 겹치는 부분이 많습니다.

디지털 이미지 처리는 디지털 신호 처리의 한 형태로 이미지 화질 향상, 복원, 인코딩 및 압축이 이에 포함됩니다. 디지털 이미지 처리는 아날로그 이미지 처리에 비해 훨씬 더 많은 알고리즘을 사용할 수 있을 뿐만 아니라 노이즈와 왜곡을 최소화할 수 있다는 장점이 있습니다. 이미지 화질 향상의 초기 사용 사례 중 하나는 최초로 근거리 달 표면 이미지를 수정하는 작업이었습니다. 이 작업에는 사진 측량 매핑뿐만 아니라 노이즈 필터, 달 표면과 촬영 카메라의 정렬에서 발생하는 기하학적 왜곡 보정도 사용되었습니다.

'Texas Instruments DLPC350 집적 회로(IC) 컨트롤러' 이미지그림 3: DLPC350 집적 회로(IC) 컨트롤러는 화면에 표시되는 패턴과 카메라를 동기화하기 위한 입력 및 출력 트리거 신호를 제공합니다. 이는 산업, 의료 및 보안 장비에 3D 머신 비전을 부여하도록 설계된 디지털 마이크로 미러 장치(DMD)와 함께 작동합니다. 실제로 응용 제품에는 계측 시스템뿐만 아니라 3D 스캐닝도 포함됩니다. (이미지 출처: Texas Instruments)

디지털 이미지 화질 향상은 대비(콘트라스트) 강화를 포함하기도 하며, 시야각 및 렌즈 왜곡에 대한 기하학적 보정도 포함될 수 있습니다. 이미지 압축은 통상적으로 복잡한 신호를 코사인 함수의 조합으로 근사화함으로써 이루어지는데, 코사인 함수는 이산 코사인 변환 또는 DCT로 알려진 푸리에 변환의 한 유형입니다. JPEG 파일 형식은 가장 널리 사용되는 DCT 응용 분야입니다. 이미지 복원은 노이즈와 블러링을 제거하기 위해 푸리에 변환을 사용할 수도 있습니다.

사진 측량은 이미지로부터 측정치를 추출하기 위해 일종의 특징 감지법을 사용합니다. 동일한 장면을 다양한 위치에서 촬영한 여러 이미지가 확보된 경우, 이러한 측정치에는 3D 정보가 포함될 수 있습니다. 가장 간단한 사진 측량 시스템은 축척을 적용하여 이미지에서 두 점 사이의 거리를 측정하는 것입니다. 이를 위해 일반적으로는 이미지 안에 축척의 기준치가 포함되어 있어야 합니다.

특징 감지를 통해 컴퓨터가 이미지의 가장자리와 모서리 혹은 꼭짓점을 식별할 수 있습니다. 이는 개체와 동작의 식별뿐만 아니라 사진 측량에 필요한 첫 번째 단계입니다. 덩어리 탐지 기능을 통해, 가장자리나 모서리 감지를 하기에는 너무 매끄러운 가장자리를 가진 영역을 식별할 수 있습니다.

패턴 인식은 특정 물체를 식별하는 데 사용됩니다. 가장 간단한 패턴 인식으로는, 컨베이어 벨트 상에 놓여 있는 뚜렷이 구분되는 특정 기계 부품을 찾는 것을 들 수 있습니다.

3D 재구성은 2D 이미지로부터 물체의 3D 형태를 결정하며, 공통된 특징점들(서로 다른 관측 지점에서 촬영한 이미지를 통해 식별됨)의 높이를 삼각측량법으로 계산하는 사진 측량 방법이 여기에 사용됩니다. 한 개의 2D 이미지를 사용한 3D 재구성도 가능합니다. 이를 위해서는 소프트웨어가 가장자리 또는 음영 영역 간의 기하학적 관계 등 여러 가지를 해석하여 재구성합니다.

'3D 스캐너는 개체의 2D 이미지를 캡처합니다.' 이미지그림 4: 3D 스캐너는 개체의 2D 이미지를 캡처하여 3D 모델을 생성합니다. 그 후, 생성된 디지털 모델을 사용하여 3D 프린트 사본을 제작하기도 합니다. (이미지 출처: Shenzhen Creality 3D Technology Co.)

인간은 단순한 선으로 표현된 예술만을 보고 머리 속에서 정육면체를 쉽게 재구성할 수 있으며, 음영 처리된 원을 보고 구를 머리 속에서 재구성할 수 있습니다. 음영은 표면의 기울기를 나타냅니다. 그러나 음영은 1차원적 파라미터이지만 기울기는 2차원에서 발생하기 때문에 이러한 추론 과정은 생각보다 복잡합니다. 이는 모호성으로 이어질 수 있는데, 이는 물리적으로 불가능한 물체를 묘사하는 예술 작품이 있다는 것에 의해 입증됩니다.

'컴퓨터를 통해 가공물의 2D 이미지로부터 3D 형태를 확인' 이미지그림 5: 컴퓨터를 통해 가공물의 2D 이미지로부터 3D 형태를 확인하는 작업을 위해서는 해결되어야 할 과제가 아주 많습니다.

머신 비전 작업의 순서

대부분의 머신 비전 시스템은 낮은 수준의 작업으로 시작한 다음 하나씩 높은 수준의 작업으로 진행하여 상위 기술과 점진적으로 결합합니다. 가장 낮은 수준에서는, 이미지의 모든 픽셀이 고 대역폭 데이터로 유지됩니다. 그런 다음 시퀀스의 각 작업은 이미지 특징을 식별하고 상대적으로 적은 양의 데이터로 대상 개체에 대한 정보를 표시합니다.

낮은 수준의 이미지 화질 향상과 복원과 같은 작업이 먼저 시작되고, 특징 감지가 뒤따릅니다. 센서가 여러 개 사용되는 경우, 각 센서가 전담하는 분산 프로세스를 통해 낮은 수준의 작업을 수행할 수 있습니다. 일단 개별 이미지의 특징이 감지되면 더 높은 수준의 사진 측량이 가능하게 됩니다. 또한 물체 식별 또는 기타 작업과 같이 여러 이미지 및 센서의 결합된 데이터에 의존하는 작업도 가능하게 됩니다.

직접 계산 및 학습 알고리즘

머신 비전 맥락에서 직접 계산은 인간인 프로그래머가 수동으로 정의하는 수학적 함수의 집합입니다. 이들은 이미지 픽셀 값과 같은 입력을 받아들여 물체의 가장자리 좌표와 같은 출력값을 산출해 냅니다. 이와는 달리 학습 알고리즘은 인간이 직접 작성하지 않으며, 입력과 원하는 출력값을 연결하는 예제 데이터 세트를 통해 교육됩니다. 그러므로 이들은 블랙박스와 같은 기능을 합니다. 그러한 머신 러닝의 대부분은 요즘은 자체적인 계산을 하기 위해 인공 신경망을 기반으로 한 딥 러닝을 사용합니다.

'Banner Engineering iVu 계열 이미지 센서' 이미지그림 6: iVu 계열{의 이미지 센서는 가공물을 유형, 크기, 위치, 방향, 색상별로 식별할 수 있습니다. 머신 비전의 구성품은 통합 화면, 원격 HMI 또는 PC의 구성 및 모니터링을 수용할 수 있습니다. 카메라, 컨트롤러, 렌즈 및 조명이 모두 사전 통합되어 있습니다. (이미지 출처: Banner Engineering Corp.)

산업용 응용 제품을 위한 간단한 머신 러닝은 직접 계산을 기반으로 하는 경우에 더 신뢰할 수 있고 계산 요구 사항이 적을 때가 많습니다. 물론 직접 계산으로 달성할 수 있는 것에는 한계가 있습니다. 예를 들어, 직접 계산으로는 개인의 얼굴을 식별하는 데 필요한 고급 패턴 인식을 결코 기대할 수 없으며, 특히 혼잡한 공공장소에서 찍힌 비디오 피드에서 식별하기는 더욱 불가능합니다. 반면 머신 러닝은 그러한 작업을 능숙하게 처리합니다. 이미지 화질 향상, 복원, 기능 감지를 비롯한 하위 수준의 머신 비전 작업에 머신 러닝이 점점 더 많이 사용되고 있는 것은 당연한 일입니다.

알고리즘 개선이 아닌 교수법의 개선

딥 러닝 기술이 발전함에 따라, 개선이 필요한 영역은 학습 알고리즘 자체가 아니라 훈련받는 방식이라는 사실이 분명해졌습니다. 이와 같이 개선된 훈련 루틴 중 하나는 데이터 중심형 컴퓨터 비전입니다. 여기서 딥 러닝 시스템은 수천, 수백만, 심지어 수십억 개의 이미지로 구성된 매우 큰 훈련 세트를 수용한 다음 알고리즘이 각 이미지에서 추출한 결과 정보를 저장합니다. 알고리즘은 실제 작업했던 예제를 연습한 다음 올바른 값에 도달했는지 확인하기 위해 '답안지'를 참조하여 효과적으로 학습합니다.

디지털 패턴 인식의 초기 시절에 대한 오래 전 이야기는 교훈을 줍니다. 미군은 표적 인식을 위해 머신 비전을 사용할 계획이었고, 방위 계약 업체의 시연에서는 머신 비전은 미국산과 러시아산 탱크를 확실하게 식별했습니다. 공급업체의 항공사진으로부터 다양한 탱크들이 차례로 정확하게 구별되었습니다. 그러나 미국 국방성의 자체 사진 라이브러리로 다시 테스트했을 때 시스템은 계속해서 오답을 제공했습니다. 문제는 방위 산업 계약 업체가 사용한 모든 이미지에서 미군 탱크는 사막에 있고, 러시아 탱크는 녹지에 있었다는 것입니다. 이 시스템은 다른 탱크를 구분하기는커녕, 다른 색깔의 배경만을 인식하고 있었다는 것입니다. 교훈 유용한 학습 알고리즘을 위해서는 신중하게 선별된 훈련 데이터가 제공되어야 합니다.

결론: 로봇 워크셀 안전에 대한 비전

머신 비전은 더 이상 틈새 기술이 아닙니다. 산업 응용 분야에서의 배치가 가장 많이 증가하고 있습니다. 여기에서 가장 극적인 발전은 공장 작업자가 안전모, 마스크 또는 기타 올바른 보호 장비의 착용 없이 작업 구역에 들어갈 때 경보음을 울리거나 음성 안내를 실행하는 산업 공장 안전 시스템을 머신 비전이 어떻게 보완하는지입니다. 머신 비전은 지게차와 같은 이동식 기계가 사람과 너무 가까워지면 이를 알리는 시스템을 완성하게 할 수도 있습니다.

이런 머신 비전과 이와 유사한 머신 비전 시스템은 산업용 로봇 주변에 설치하는 고정된 분리대보다 효율적인 작업을 가능하게 할 수도 있습니다. 이러한 머신 비전은 또한 공장 작업자가 작업실에 들어가면 기계를 손쉽게 정지시키는 가변적인 분리대를 기반으로 한 안전 시스템을 교체하거나 강화시킬 수 있습니다. 머신 비전이 워크셀 주변의 작업 현장을 모니터링하는 경우, 이러한 워크셀에서의 로봇은 사람이 접근함에 따라 점차 진행 속도를 늦추는 것이 가능합니다.

산업 환경의 설계가 장비가 작동 중일 때에도 공장 작업자들이 공장 내에서 안전하게 이동할 수 있도록 하는 협업 로봇이나 다른 워크셀 장비를 수용하도록 진화함에 따라, 머신 비전을 기반으로 하는 이러한 시스템은 공장 공정의 흔한 일부가 될 것입니다.

면책 조항: 이 웹 사이트에서 여러 작성자 및/또는 포럼 참가자가 명시한 의견, 생각 및 견해는 DigiKey의 의견, 생각 및 견해 또는 DigiKey의 공식 정책과 관련이 없습니다.

작성자 정보

Image of Dr. Jody Muelaner

Jody Muelaner

Dr. Jody Muelaner는 제재소 및 의료용 장치를 설계하고, 항공 우주 제조 시스템의 불확실성을 처리하며, 혁신적인 레이저 기기를 만들어온 엔지니어입니다. 그는 여러 동료 평가 저널과 정부 요약을 발표했으며 Rolls-Royce, SAE International 및 Airbus를 위한 기술 보고서를 작성했습니다. 그는 현재 전기 자동차 개발 프로젝트를 이끌고 있습니다(자세한 내용은 betterbicycles.org 참조). Muelaner는 또한 탈탄소 기술과 관련된 개발도 다룹니다.