리소스 제약이 있는 응용 제품에서 FPGA를 사용하는 방법

작성자: Kenton Williston

DigiKey 북미 편집자 제공

리소스가 제한된 임베디드 시스템의 경우, 구성 가능한 논리에 대한 요구가 증가하고 있습니다. 에지 AI, 머신 비전, 산업 자동화와 같은 응용 분야는 엄격한 전력, 크기, 비용 제한 내에서 작동하면서 진화하는 성능 요구를 충족하기 위해 응용 제품별로 유연한 논리가 필요합니다. 최신의 현장 프로그래밍 가능 게이트 어레이(FPGA)로 이러한 경쟁적인 요구 사항을 해결할 수 있습니다.

이 기사에서는 리소스 제약이 있는 응용 제품을 위한 FPGA를 선택할 때 고려해야 할 주요 설계 기준을 검토합니다. 그런 다음 Altera전력 및 비용 최적화된 FPGA 포트폴리오의 예를 사용하여 시나리오별로 적합한 다양한 제품 라인을 살펴봅니다. 설계 개념을 프로토타이핑하고 검증하는 데 사용할 수 있는 개발 키트와 평가 기판을 중점으로 살펴본 후 마무리합니다.

FPGA 선택 시 고려 사항

리소스가 제한된 시스템을 위한 FPGA를 선택하려면 여러 설계 요구 사항을 고려하고 솔루션에 맞게 선택해야 합니다. 다음과 같은 몇 가지 주요 FPGA 특성을 고려해야 합니다.

논리 소자(LE) 용량: FPGA의 기본 구성 요소인 LE의 수에 따라 구현할 수 있는 맞춤형 논리의 양이 결정됩니다. 개수가 많을수록 더 복잡한 설계가 가능하지만 전력, 비용, 패키지 크기가 증가한다는 단점이 있습니다.

I/O 및 메모리: FPGA는 시스템 내에서 서로 다른 구성 요소를 연결하는 데 자주 사용되므로 I/O 핀 수가 중요한 고려 사항입니다. I/O 성능을 향상시키기 위해 많은 FPGA의 경우 PCI Express(PCIe), 고속 메모리 및 멀티 기가비트 트랜시버와 같은 인터페이스를 위한 강화된 고정 논리 블록을 통합합니다.

또한 일부 FPGA는 아날로그-디지털 컨버터(ADC) 및 플래시 메모리와 같은 기능을 통합하기도 합니다. 이러한 개선 사항을 통해 컴패니언 칩의 필요성을 줄여 기판 공간을 절약하고 전력 효율을 개선할 수 있습니다.

프로세서 통합: 외부 프로세서를 사용하는 대신 FPGA 내에서 '소프트' 마이크로 프로세서 유닛(MPU)을 구현할 수 있습니다. 이 방식은 시스템 설치 공간을 줄일 수 있지만 MPU 워크로드가 덜 까다로운 응용 제품에 가장 적합합니다.

더 빠르고 효율적인 MPU가 필요한 응용 제품의 경우 설계자는 FPGA 내에서 고정 논리 블록으로 MPU를 구현하는 하드 프로세서 시스템(HPS)이 포함된 FPGA를 고려할 수 있습니다.

하드웨어 가속기: FPGA에는 일반적으로 동작 제어와 같은 연산 집약적인 작업을 효율적으로 처리하는 전용 디지털 신호 처리(DSP) 블록이 포함되어 있습니다. 하이엔드 장치에는 AI 워크로드에 특화된 텐서 블록이 탑재될 수 있습니다. 이러한 가속기 블록의 기능은 FPGA 제품군마다 크게 다르며 전체 시스템 성능에 큰 영향을 미칠 수 있습니다.

패키지 및 전력 최적화: 일부 FPGA는 물리적 및 전기적 실장 면적을 최소화하도록 특별히 설계되었습니다. 예를 들어 저전력 절전 모드를 제공할 수 있습니다.

도구: 사용자 지정 논리를 제작하는 것은 특히 프로세스를 처음 접하는 설계자에게는 어려운 과제일 수 있습니다. Altera의 Quartus Prime 설계 소프트웨어와 같은 도구가 등장하여 프로세스를 간소화했습니다.

FPGA 설계의 접근성을 높이기 위해 제작된 Quartus Prime은 개발자 친화적인 환경, 사전 구축된 광범위한 논리 블록 카탈로그, 이러한 논리 블록을 자동으로 상호 연결할 수 있는 기능을 제공합니다. 이 도구는 널리 사용되는 AI 및 머신 러닝(ML) 워크플로와 통합되어 개발자가 Linux 및 Zephyr와 같은 인기 있는 운영 체제(OS)를 FPGA에 배포할 수 있도록 지원합니다.

이러한 기능은 FPGA 설계를 크게 가속화할 수 있으므로 장치를 선택할 때 도구의 기능을 중요하게 고려해야 합니다.

고급 임베디드 워크로드를 위한 고성능 컴퓨팅

설계 요구 사항이 FPGA 선택에 어떤 영향을 미치는지 설명하려면 뛰어난 컴퓨팅 밀도, 대역폭 및 통합이 필요한 하이엔드 응용 제품부터 시작하는 것이 좋습니다. 고급 에지 AI 응용 제품과 고성능 산업용 게이트웨이를 예로 들 수 있습니다.

Agilex 3 FPGA(그림 1)는 이러한 응용 제품 요구 사항을 충족하도록 설계되어 최대 135,000개의 LE를 제공합니다. 이 칩은 FPGA 전용 및 시스템 온 칩(SoC) 버전으로 제공됩니다. 이 SoC 장치는 듀얼 코어, 800MHz Arm® Cortex®-A55를 통합하여 FPGA가 인간-기계 인터페이스(HMI) 또는 네트워크 스택과 같은 복잡한 소프트웨어 스택을 처리할 수 있도록 지원합니다.

프로그래밍 가능 패브릭으로, 초당 최대 2.8 INT8 테라 연산(TOPS)을 처리할 수 있는 AI 텐서 블록을 갖추고 있습니다. 이 블록은 FP16, FP19, FP32, BFLOAT16 등 다양한 컴퓨팅 포맷을 지원하며, AI 워크로드의 효율적인 실행에 최적화되어 있습니다. 가변 정밀도 DSP 블록도 포함되어 있어 범용 신호 처리를 위한 초당 최대 180기가 부동 소수점 연산(GFLOPS) 성능을 제공합니다.

고성능 DSP 및 AI 텐서 블록과 같은 주목할 만한 기능을 갖추고 있는 Altera Agilex 3의 이미지그림 1: Agilex 3는 고성능 DSP 및 AI 텐서 블록과 같은 주목할 만한 기능을 갖추고 있습니다. (이미지 출처: Altera)

고속 연결성은 Agilex 3 아키텍처의 또 다른 강점입니다. 트랜시버는 최대 초당 12.5기가비트(Gbits/s)의 데이터 속도를 지원하며 PCIe 3.0, 10기가비트 이더넷(GbE) 및 LPDDR4 메모리 인터페이스에 사용할 수 있는 강화된 I/O 블록을 갖추고 있습니다. IEEE 1588 정밀 시간 동기화 지원으로 실시간 산업용 네트워킹에 대한 적합성이 더욱 향상되었습니다.

A3CZ135BB18AE7S 장치는 이 제품군의 기능을 잘 보여주며, 135K LE, 184개의 DSP 블록을 포함하며 2.54 TOPS를 제공합니다.

복잡한 시스템을 위한 우수한 통합 기능

산업 자동화 및 미드레인지 비전 시스템과 같은 응용 제품의 경우, 원시 컴퓨팅 성능은 대량의 사용자 지정 논리 및 I/O가 포함된 복잡한 구성을 지원하는 기능보다 덜 중요할 수 있습니다. Cyclone V FPGA는 이러한 시나리오에 매우 적합하며 최대 300K LE와 광범위한 고속 인터페이스를 제공합니다. Agilex 3와 마찬가지로 이 칩은 FPGA 전용 및 SoC 변형으로 제공됩니다. 이 경우 SoC 장치에는 듀얼 코어 Arm Cortex-A9가 통합됩니다.

이 칩의 프로그래밍 가능 패브릭에는 트리플 9 × 9 및 듀얼 18 × 18 고정 소수점 곱셈과 27 × 27 고정 소수점 또는 부동 소수점 곱셈을 지원하는 가변 정밀도 DSP 블록이 포함되어 있는데, 이러한 블록은 고급 신호 처리 및 AI에 사용할 수 있습니다.

다양한 전압 레벨과 인터페이스 유형을 지원하는 다양한 I/O 조합이 있습니다. 강화된 논리 블록은 PCIe 2.0, DDR3 컨트롤러, 최대 6.144Gbits/s로 작동하는 트랜시버 등 고급 고속 연결을 지원합니다.

개발자는 DK-DEV-5CSXC6N-B 개발 키트를 사용하여 Cyclone V SoC 제품군을 평가할 수 있습니다(그림 2). 이 키트는 복잡하고 처리량이 많은 시스템의 신속한 프로토타입 제작을 위해 설계되었습니다.

Altera DK-DEV-5CSXC6N-B Cyclone V 개발 키트 이미지그림 2: DK-DEV-5CSXC6N-B Cyclone V 개발 키트는 우수한 성능의 프로토타이핑을 지원합니다. (이미지 출처: Altera)

이 키트에 포함된 몇 가지 주목할 만한 기능은 다음과 같습니다.

  • 이중 이더넷 포트, PCIe x4 커넥터, 각 방향에 16개의 LVDS 채널이 있는 고속 메자닌 카드(HSMC)를 제공
  • USB 2.0 OTG, CAN, UART 및 2줄 텍스트 LCD 인터페이스
  • FPGA 및 HPS 측에 각각 1기가바이트(Gbyte) DDR3 SD램, 128메가바이트(Mbyte) 쿼드 SPI 플래시, 4기가바이트 microSD 카드

이 기판에는 600MHz로 실행되는 듀얼 코어 Arm Cortex-A9 프로세서와 31mm × 31mm, 896-FBGA 패키지에 85K LE, 87개의 DSP 블록, 288개의 I/O 핀이 포함된 5CSXFC5D6F31C8N 장치가 탑재되어 있습니다.

전력 효율적이며 구성 가능 한 논리가 콤팩트한 패키지로 제공됨

공간과 전력 소비에 엄격한 제약이 있는 경우 많은 응용 제품에 제한이 발생합니다. 센서 인터페이스, 전원 시퀀싱, 주변기기 제어 등이 그 예입니다. MAX 10 제품군과 같은 FPGA는 이러한 경우 효과적인 솔루션을 제공합니다. 최대 10개의 장치가 2K ~ 50K LE의 구성과 3mm × 3mm의 작은 패키지로 제공됩니다.

주요 기능으로는 최대 2개의 통합 12비트 ADC, DDR3 메모리 인터페이스, 18×18 및 듀얼 9×9 고정 소수점 모드를 지원하는 배율기 블록이 있습니다. 듀얼 이미지 스토리지를 지원하는 온칩 플래시를 사용하면 외부 메모리 장치 없이도 FPGA를 자체적으로 구성할 수 있습니다.

절전 기능은 MAX 10 제품군의 가장 두드러진 특징 중 하나입니다. 내장된 절전 모드를 사용하면 동적 전력 소비를 최대 95%까지 줄일 수 있습니다. 온칩 플래시 기능이 있어 장치의 전원이 완전히 꺼졌다가 10밀리초(ms) 이내에 다시 작동할 수도 있습니다.

단일 공급 옵션으로 전원 공급이 더욱 간편해집니다. 따라서 MAX 10 장치는 전원 도메인을 나머지 시스템보다 먼저 온라인 상태로 만들어야 하는 감독 역할에 특히 적합합니다.

MAX 10에 관심이 있는 개발자는 EK-10M08E144 MAX 10 FPGA 평가 기판을 사용하여 제품군을 평가할 수 있습니다(그림 3). 이 기판은 ADC 성능 및 전반적인 전력 동작 측정을 지원하도록 레이아웃이 설계되어 Arduino UNO R3 커넥터 및 테스트 포인트를 통해 외부 신호에 액세스할 수 있습니다.

Altera EK-10M08E144 MAX 10 FPGA 평가 기판 이미지그림 3: EK-10M08E144 MAX 10 FPGA 평가 기판은 주요 I/O에 쉽게 액세스할 수 있습니다. (이미지 출처: Altera)

이 기판에는 144핀 LQFP 패키지에 8K LE와 단일 ADC가 포함된 10M08SAE144C8G 장치가 탑재되어 있습니다. 이 FPGA는 내장된 하드웨어 리소스 외에도 RISC-V 기반 Nios V 소프트 프로세서를 지원하므로 설계자는 외부 마이크로 컨트롤러 유닛(MCU) 없이도 경량의 제어 기능을 구현할 수 있습니다.

미드레인지급 응용 제품을 위한 균형 잡힌 성능

일부 응용 제품에는, 엔트리 레벨 FPGA가 제공할 수 있는 수준 이상의 논리와 I/O 용량이 필요합니다. 센서 퓨전, 동작 제어, 칩 간 브리징 등이 그 예입니다. Cyclone 10 LP FPGA는 비용에 민감한 응용 제품에서 균형 잡힌 전력 및 대역폭에 최적화된 장치에서 최대 120K LE와 525개의 I/O 핀을 제공하여 이러한 요구 사항을 해결합니다.

MAX 10과 마찬가지로 이 제품군에는 필터링, 제어 루프, 기본 AI 추론과 같은 워크로드에 적합한 DSP 블록이 포함되어 있습니다. MAX 10과 달리 Cyclone 10 LP 장치는 고속 디지털 인터페이스를 지원하기 위해 진정한 LVDS 트랜시버와 온칩 터미네이션(OCT)을 통합합니다.

Cyclone 10 LP에 관심이 있는 개발자는 EK-10CL025U256 Cyclone 10 평가 기판을 사용하여 제품군을 평가할 수 있습니다(그림 4). 이 기판은 손쉬운 확장을 위해 Arduino UNO R3 및 Digilent Pmod 커넥터를 제공합니다. 기타 기능으로는 GbE, USB 2.0, 128메가비트(Mbit) SDRAM, 64메가비트 플래시 메모리가 있습니다.

Altera EK-10CL025U256 Cyclone 10 평가 키트 구성도(확대하려면 클릭)그림 4: EK-10CL025U256 Cyclone 10 평가 기판을 손쉬운 주변 장치 확장을 지원합니다. (이미지 출처: Altera)

14mm × 14mm 패키지에 25K LE, 66개의 DSP 블록, 150개의 I/O 핀이 포함된 10CL025YU256C8G 장치가 특징인 기판입니다. MAX 10과 마찬가지로 Cyclone 10 LP 제품군도 Nios V 소프트 프로세서를 지원합니다.

결론

이제 임베디드 시스템에서 맞춤형 논리를 구현할 때 설계자는 그 어느 때보다 유연하게 작업할 수 있습니다. 고성능 응용 제품은 AI 가속기가 통합된 FPGA의 이점을 누릴 수 있으며, 저전력 설계로 절전 모드가 있는 장치를 활용할 수 있습니다. I/O 집약적인 시스템은 핀 수가 많고 고속 인터페이스를 갖춘 칩을 활용할 수 있습니다. 중요한 것은 이러한 모든 기능을 사용하기 쉬운 키트를 통해 리소스가 제한된 임베디드 시스템의 엄격한 제한 내에서 구현할 수 있다는 점입니다.

DigiKey logo

면책 조항: 이 웹 사이트에서 여러 작성자 및/또는 포럼 참가자가 명시한 의견, 생각 및 견해는 DigiKey의 의견, 생각 및 견해 또는 DigiKey의 공식 정책과 관련이 없습니다.

작성자 정보

Image of Kenton Williston

Kenton Williston

Kenton Williston은 2000년에 전기 공학 학사 학위를 받았으며, 프로세서 벤치마크 분석가로 커리어를 시작했습니다. 그 후 EE Times 그룹에서 편집자로 일하면서 전자 산업을 위한 여러 간행물 및 컨퍼런스의 시작과 진행을 도왔습니다.

게시자 정보

DigiKey 북미 편집자