머신 러닝으로 인해 산업용 시스템이 해커에게 노출됩니까?

작성자: Carolyn Mathas

DigiKey 북미 편집자 제공

2019-12-02

모든 컴퓨팅 방법은 고유의 보안 문제를 안고 있으며 머신 러닝(ML)도 예외는 아닙니다. 다행히 이 인공 지능(AI) 부문의 취약점은 쉽게 예측할 수 있습니다. 하지만 취약점을 찾아내기는 쉽지 않습니다.

포함되는 방대한 양의 데이터와 데이터의 세분성 그리고 시간이 지나면서 머신 러닝이 학습하고 발전한다는 사실을 고려할 때 그 안에 어려운 과제가 있습니다. 머신 러닝은 자산과 취약성 모두 인간이 감지할 수 없는 패턴으로 데이터를 처리합니다.

인공 지능의 각 영역은 높은 효율성, 우수한 품질, 전례 없는 혁신을 촉진합니다. 예를 들어, 제조 공정에서 AI를 활용하면 문제를 쉽게 찾아서 해결하고 AI 기반 보안 방법을 통해 관련 공정을 보호할 수 있습니다.

머신 러닝은 교육 알고리즘을 통해 “학습”하고 상황에 따라 가능한 결과를 결정하는 반면, AI 알고리즘의 다른 부문인 딥 러닝(DL)을 활용하면 소프트웨어가 스스로 학습하여 작업을 수행할 수 있습니다. 이 경우 다층 신경망을 수백만 개의 데이터 요소에 노출하여 패턴을 인식하고 정보를 분류하고 파악하는 인간 두뇌의 기능을 미러링합니다.

머신 러닝의 취약점

그렇다면 이전 질문으로 돌아가 보겠습니다. 머신 러닝으로 인해 산업용 시스템이 해커에게 노출됩니까? 대답은 특히 빠르게 진화하는 기술에서 위험하지 않은 것은 아무것도 없다는 것입니다. 즉, 머신 러닝/딥 러닝 시스템이 체계적으로 설계된 경우도 있고 그렇지 못한 경우도 있으므로 일부 시스템은 다른 시스템에 비해 해킹에 더 취약할 수 있습니다.

Gartner는 2025년까지 머신 러닝이 모든 보안 솔루션에 일부가 될 것으로 예측합니다. 그사이에 해결해야 하는 보안 위반 문제는 두 배로 증가할 것입니다. 몇 가지 효과적인 노력을 기울인 예가 있습니다. Google은 머신 러닝을 사용하여 스팸 이메일을 약 99% 차단하고 있습니다. IBM의 Watson은 2017년에 윔블던을 대상으로 하는 2억 건의 사이버 공격을 차단했습니다. 클라우드 기반 플랫폼을 보호하고 로그인 및 기타 이상 상황을 비롯한 의심스러운 활동을 분석하는 데 머신 러닝 알고리즘이 중요한 역할을 하고 있습니다.

가장 일반적으로 사용되는 공격 모드는 악의적인 입력을 통해 모델이 실수를 하도록 하여 모델에 잠입하려고 시도하는 대립 기술입니다. 미묘하지만 악의적으로 조작된 데이터가 포함된 새로운 내용이 입력될 경우 모델은 올바르게 동작하지 않습니다. 그러나 모델의 통계적 성능은 손상되지 않을 수 있습니다. 또한 머신 러닝 모델은 다음과 같은 방법으로 공격받을 수 있습니다.

하나는 무결성 훼손입니다. ML 모델이 하나 이상의 부정적 사례를 필터링하지 못하여 시스템에 침투한다면 해킹을 당할 수 있습니다.
실험적 공격은 입력 기록값에 따라 모델이 어떻게 예측하는지를 파악하기 위해 실시됩니다.
원인 공격은 교육 데이터와 모델을 변경합니다. 시스템을 통과하는 입력 기록 중에는 잘못된 기록이지만 몰래 들어가는 경우도 있고, 정상적인 기록이지만 차단되는 경우도 있습니다.
무결성 공격을 실시하여 잘못된 입력이 통과할 경우 해커가 정기적으로 입력을 시도하면, 시스템에서 잘못된 입력을 정상 입력이라고 레이블을 지정할 수 있습니다.
가용성 공격은 공격자의 데이터로 모델을 교육하고 정상 입력을 시스템에서 필터링할 때 사용됩니다. 이 시나리오의 경우 합법적인 기록이 제거될 수 있습니다.

범죄 활동으로 인해 머신 러닝에 대한 공격이 강화되고 있는 것도 사실이지만 말처럼 간단한 일은 아닙니다. 다행히 보안 강화를 위해 고급 기술을 추가하기 전에 시스템을 보호하기 좋은 위치가 있습니다. 예를 들어, 시스템 소프트웨어가 오래되어 패치가 제공되더라도 다운로드할 수 없으면 공격이 시작되기 쉽습니다. 강력한 자격 증명과 다단계 인증은 모두 중요합니다. 또한 네트워크에서 단순한 사용자 이름/비밀번호 이상의 보안을 구현해야 합니다.

시작 위치

AI 응용 제품 개발을 지원하기 위해 다음과 같은 키트가 제공됩니다.

Seeed Technology의 NVIDIA Jetson Nano 개발자 키트는 딥 러닝, 컴퓨터 비전, GPU 컴퓨팅, 멀티미디어 처리와 같은 AI 워크로드에 필요한 성능을 제공합니다(그림 1). 이 키트를 사용하면 이미지 분류, 물체 감지, 구분, 음성 처리와 같은 응용 분야를 위한 AI 프레임워크 및 모델을 실행할 수 있습니다. 결과적으로 다양한 센서를 연결하여 다양한 AI 응용 분야를 쉽게 지원할 수 있습니다.

Seeed Technology의 JetPack 이미지 그림 1: Jetson Nano는 AI 앱을 위한 기판 지원 패키지, Linux OS, NVIDIA CUDA, cuDNN 및 TensorRT 소프트웨어 라이브러리를 포함하는 Seeed Technology의 JetPack에 의해 지원됩니다. (이미지 출처: Seeed)

Adafruit와 DigiKey는 최근에 BrainCraft EDGE BADGE 내장형 평가 기판(그림 2)을 발표했습니다. 이 기판은 미니어처 버전 TensorFlow Lite를 실행하여 소형 마이크로 컨트롤러를 통해 머신 러닝을 에지로 확장합니다. 그림 2에 표시된 대로 신용카드 크기의 이 기판은 512KB 플래시 메모리와 192KB RAM이 탑재된 Microchip의 ATSAMD51J19에 의해 구동됩니다. 이 키트에는 음성 인식을 위한 마이크 입력과 다양한 단어 쌍 및 제스처 인식을 위한 데모를 갖춘 Arduino 라이브러리가 내장되어 있습니다.

Adafruit의 Supercon 배지 이미지 그림 2: 이 Supercon 배지는 CircuitPython으로 프로그래밍된 이름 배지일 수도 있습니다. 이 배지는 USB 드라이브로 표시되며 이름, QR 코드 또는 기타 정보를 표시하기 위해 IDE가 필요하지 않습니다. (이미지 출처: Adafruit)

마지막으로 STMicroelectronics LSM6DOX와 같은 고급 센서는 머신 러닝 코어, 유한 상태 신호 발생기 및 고급 디지털 기능을 결합하여, AI 기능의 성능 및 정확성 요구 사항을 충족할 수 있도록 회사 STM32 마이크로 컨트롤러 제품군의 성능을 강화합니다.

향후 동향

오늘날에는 인지 컴퓨팅, 자동화된 머신 러닝, ML 모델 관리, ML 모델 서비스, GPU 기반 컴퓨팅을 통해 제공되는 머신 러닝 플랫폼을 포함하는 클라우드 기반 컴퓨팅 모델이 있습니다. 하지만 ML 및 딥 러닝 응용 분야에 필요한 풍부한 데이터를 고려할 때 훨씬 중대한 클라우드 해킹 사건들로 헤드라인이 장식될 것이 분명합니다.

기업은 데이터에 AI/ML이 포함된 경우 민감한 데이터를 클라우드로 이동하는 데 신중을 기합니다. 민감한 데이터를 실질적으로 보호하는 데 필요한 보안 정책과 해킹을 제어하는 수단이 항상 필요한 만큼 신뢰할 수 있는 것은 아닙니다.

IoT에 의해 생성되는 데이터의 양은 상상을 초월할 정도입니다. AI, 자동화, 머신 러닝 등을 시작하는 데 필요한 데이터는 특히 레거시 데이터가 포함되어 있는 경우 반드시 응용 분야에 적합한 데이터여야 합니다.

다음은 AI/ML을 구현할 때 개발자가 수행해야 하는 간단한 단계 목록입니다.

기존 데이터에서 격차 파악 및 이해
잠재적 AI 프로젝트의 영향을 받는 워크플로 이해
확립되고 소통된 최종 게임에 대한 전체 기업 매입을 확인하고 해당 공정에 대한 각각의 참여 방법 파악
경비 절감에 착수하는 대신 기술 및 기회 활용
손상되거나 잘못된 기록을 감지, 수정, 제거하기 위한 데이터 정리 착수

요약

AI 및 머신 러닝을 구현하려면 데이터 구동 알고리즘과 의사결정 품질이 우수해야 합니다. 인공 지능, 머신 러닝 및 딥 러닝은 어떤 의미에서 대부분 기업의 미래에 중요한 영향을 미칠 수 있습니다. 머신 러닝 알고리즘은 이미 파일 기반 맬웨어를 감지하여 차단하는 중요한 수단으로 사용되고 있습니다. 또한 머신 러닝 알고리즘은 사용하기에 안전하지 않은 응용 제품을 입증하여 프로덕션 시스템에서 분리합니다. AI는 금융 서비스, 의료, 보험 등에서 매우 중요한 데이터를 보호하는 데에도 사용되고 있습니다.

AI/머신 러닝의 개념이 우리를 사로잡았다는 것은 명백한 사실입니다. AI/머신 러닝은 최대한 활용될 경우 놀라운 도구가 될 것입니다. 해킹의 지뢰밭을 통과하기 위해 충분한 사내 지식을 갖추고 클라우드 또는 구현 파트너를 확보해야 합니다.