'Network Compression for AI' 카테고리의 글 목록

Q1. 딥러닝 관점에서 왜 Network Compression 기술들이 필요한지?

Memory Limitation
- 가끔씩 성능을 높이기 위해 굉장히 큰 딥러닝 모델을 사용하는 경우가 있습니다.
- 이런 경우 멀티GPU 또는 분산시스템 기반의 학습기법을 사용해야합니다.
- 하지만, GPU 가격이 싼 것도 아니고, 분산 시스템을 구축하는 것도 쉬운게 아니기 때문에 큰 딥러닝 모델을 학습시키거나 사용하는건 (실용적인 관점에서) 문제가 됩니다.
Worse Performance
- 딥러닝 모델이 크다는 것은 굉장히 많은 모수(parameter)들이 존재한다는 것입니다.
- 딥러닝 이론에서 보면 알 수 있듯이 parameter(weight)가 지나치게 많다면, curse of dimension에 빠질 수 있습니다.
- 그러므로, 충분한 학습 데이터가 없다면 마냥 큰 모델을 이용하는 것은 좋지 않습니다.
Training/Inference Speed
- 연구를 하다보면 새로운 모델링을 하는 것도 중요하지만 hyper parameter를 최적으로 setting 해주는 것도 필요합니다.
- 오히려, 산업에서는 빠르게 모델을 적용해야 하기 때문에 hyper-parameter를 튜닝해서 기존 모델을 최적화 시키는 작업을 진행하는 경우가 더 많죠.
- 하지만, 딥러닝 모델이 크다면 다양한 조합의 hyper-parameter들을 테스트 해보기 힘들어지는 경우가 발생합니다.

Q2. Network Compression에 쓰이는 기술들에는 무엇이 있는지? (해당 내용들은 관련 카테고리에서 자세히 설명하도록 하겠습니다)

Pruning
Weight Factorization
Knowledge Distillation
Weight sharing
Quantization

이미지 출처: https://www.researchgate.net/figure/Different-types-of-compression-techniques-for-DNN-and-traditional-ML-methods-Here-the_fig1_339129502

(↓↓↓위의 내용들은 아래 블로그를 기반으로 작성했습니다↓↓↓)

https://blog.est.ai/2020/03/%EB%94%A5%EB%9F%AC%EB%8B%9D-%EB%AA%A8%EB%8D%B8-%EC%95%95%EC%B6%95-%EB%B0%A9%EB%B2%95%EB%A1%A0%EA%B3%BC-bert-%EC%95%95%EC%B6%95/

딥러닝 모델 압축 방법론과 BERT 압축

딥러닝(Deep Learning)은 뛰어난 성능과 높은 모델의 확장성(Scalability)으로 인해 많은 주목을 받았고, 요즘 산업계에서도 활발하게 적용되고 있습니다. 하지만 모델의 높은 확장성은 또 다른 문제를

blog.est.ai

저작자표시 (새창열림)

'Network Compression for AI' 카테고리의 다른 글

2. Edge Computing이란? (0)	2021.06.04
1. AIoT란? (Feat. IoT 개발 프로세스) (0)	2021.06.04
이 글을 쓰게 된이유 (0)	2021.06.04

안녕하세요

이번 글에서는 Edge Computing에 대해 설명드리려고 합니다.

1. Edge Computing 등장 배경

1-1. 클라우드 서버의 과부하

지난 AIoT 글에서 언급했던 것 처럼, "5G 기슬의 발전 + AI 기술(영상처리, 음성처리)과 접목한 IoT"로 인해 대용량 데이터들이 빠르게 클라우드 서버로 전송된다고 말씀드린바 있습니다.

https://89douner.tistory.com/243

1. AIoT란? (Feat. IoT 개발 프로세스)

안녕하세요. 이번 글에서는 제 경험을 먼저 이야기한 후, AIoT에 대해서 설명해보려고 합니다. 0. AIoT에 관심을 갖게 된 계기 제가 전기전자컴퓨터(EECS) 소속으로 석사를 할 당시에 다양한 연구실

89douner.tistory.com

이미지 출처: https://medium.com/gowombat/iot-simple-iot-with-free-cloud-solutions-tutorial-76ac5cf6e5a0

기본적으로 AI 기반 모델들은 연산량이 많아 고성능 컴퓨터 기반으로 모델링 되었습니다.

그렇기 때문에, device(하드웨어: 센서 등)에서 얻은 데이터들은 클라우드에 위치한 고성능 서버 컴퓨터로 전송되고, 전송된 데이터는 해당 컴퓨터에 탑재된 AI 모델을 이용해 처리하게됩니다.

물론 Cloud에서 데이터 과부하가 발생하는 것을 막기위해 FOG라는 것을 두어, 중요한 데이터를 선별하는 변화를 꾀했지만, 이 역시 완전한 해결책은 아니었습니다. → Fog 컴퓨팅 관련링크

이미지 출처: https://www.imagimob.com/blog/edge-computing-needs-edge-ai

결국, 클라우드 서버에 몰리는 방대한 데이터로 인해 발생하는 트래픽 문제를 해소하기 위해 Edge Computing이라는 용어가 등장하게 됩니다.

1-2. 느린 Response time

기본적으로 데이터 양이 많으면 클라우드까지 왔다갔다 하기에 시간이 오래 걸릴 수 있습니다.

이미지 출처: https://www.researchgate.net/figure/Computing-devices-accessing-cloud-applications-may-face-slow-response-time_fig1_301784764

그런데, 단말기(edge)에서 AI 기법을 적용시키는 경우 고속 reponse time이 필요합니다.

예를들어, 아이의 이상행동을 감지하거나, 자율주행자동차의 경우 기기 자체에서 AI모델을 training(학습)하고 inference(추론)할 수 있게 해주어야 합니다.

이미지 출처: https://www.banggood.com/Xiaovv-C1-1080P-WIFI-H_265-IP-Camera-Baby-Infants-Monitor-2MP-150-Super-Wide-Angle-Baby-Sleep-Care-Crying-Alarm-Push-Two-way-Audio-IP-Camera-p-1765180.html

이미지 출처: https://www.dreamstime.com/stock-illustration-autonomous-driverless-car-automobile-sensors-use-self-driving-cars-camera-data-pictures-radar-lidar-image69567133

2. Edge Computing 이란

위에서 언급한 것처럼, edge device 자체에서 AI모델을 training(학습)하고 inference(추론)할 수 있게 해주는 기술을 edge computing이라고 합니다.

이러한 Edge computing을 가능하게 했던건 역시 하드웨어 기술의 발달 때문이었습니다.

집적기술의 발달로 인한 AI chip 발전이 가능해짐
IoT와 같은 Device에 AI chip (ex; Tegra X)이 들어갈 수 있기 때문에, 머신러닝이 가능
이러한 추세는 sensing과 관련된 IoT 디바이스들을 좀 더 intelligent하게 만들 수 있게 됨
Smart phone에서는 GPU, CPU 통합 개념인 AP(Application Processor)라는 on-device가 있다.
Qualcomm, Apple, Samsung, TSMC, NVIDIA 같은 회사들이 얽히고 얽혀 있으며, 이러한 회사들의 기술개발 트렌드를 따라가지 못하면 결국 Edge computing을 연구하려는 연구자들은 엉뚱한 연구를 할 가능성이 높아짐

(↓↓↓ 위의 회사들 간의 관계가 궁금하다면↓↓↓)

https://89douner.tistory.com/category/%EC%BB%B4%ED%93%A8%ED%84%B0%20%ED%95%98%EB%93%9C%EC%9B%A8%EC%96%B4

'컴퓨터 하드웨어' 카테고리의 글 목록

#Interest: World History (The past) #Work: Deep Learning (The future) #Hobby: Music, Sports

89douner.tistory.com

위와 같은 하드웨어의 발전은 더욱 Edge computing 기술을 앞당기고 decentralization을 가속화 시키고 있습니다.

이러한 Edge computing 덕분에 클라우드 뿐만 아니라 기계자체(edge or on-device)에서 AI 기술(ex; CNN)을 적용시킬 수 있게 되었습다.

또한, 딥러닝 학계에서도 고성능 PC를 기반으로 만든 딥러닝 모델을 축소시키려는 network compression 분야에 많은 노력을 기울이고 있습니다.

현재는 Jetson Nano와 같은 디바이스에서 딥러닝을 구현하는 edge computing 교육이 보편적으로 자리잡고 있습니다. Edge Computing API도 보기 쉽게 구성함으로써 많은 개발자들이 해당 기술을 배우는데 진입 장벽을 낮추고 있습니다.

(↓↓↓Edge computing과 Jetson Nano↓↓↓)

https://www.youtube.com/watch?v=VKufXL4FVLA

최근에는 DPU라는 개념도 등장했으니 한 번 참고해보세요!

(↓↓↓DPU↓↓↓)

https://www.youtube.com/watch?v=G-Cd50OVcyc

3. Edge Computing을 주목해야 하는

가트너(Gartner) 주식회사는 미국의 정보 기술 연구 및 자문 회사입니다.

가트너의 고객은 정부기관 및 IT 기업, 투자 회사 등 다양한데,

매해 가트너에서 전략 기술 트렌드(Gartner Top Strategic Technology Trends)를 발표할때면,

제시된 기술 트렌드를 놓치지 않기 위해 세계적인 IT 회사들이 노력을 기울입니다.

이미지 출처: https://www.gartner.com/smarterwithgartner/gartner-top-10-strategic-technology-trends-for-2020/

가트너는 2018, 2019, 2020 3년 연속으로 Edge Computing을 주요 키워드로 뽑을 정도로 중요한 기술이라고 주장했습니다.

때문에 많은 IT 기업들이 edge computing을 주목하고, edge computing으로 인해 파생될 효과들을 선점하기 위해 지속해서 주목 할거라 생각합니다.

저작자표시 (새창열림)

'Network Compression for AI' 카테고리의 다른 글

3. Network Compression 기술 (0)	2021.06.04
1. AIoT란? (Feat. IoT 개발 프로세스) (0)	2021.06.04
이 글을 쓰게 된이유 (0)	2021.06.04

안녕하세요.

이번 글에서는 제 경험을 먼저 이야기한 후, AIoT에 대해서 설명해보려고 합니다.

0. AIoT에 관심을 갖게 된 계기

제가 전기전자컴퓨터(EECS) 소속으로 석사를 할 당시에 다양한 연구실들이 있었습니다.

보통 딥러닝이나 인공지능 연구를 하는 랩실들은 따로 모여 있는 경우가 많았죠.

하지만, 저희 랩실은 교수님께서 오래전부터 하드웨어도 같이 하고 있으셔서 광학, 센서, 집적기술을 다루는 랩실들과 같이 있었습니다. 이러한 랩실들이 보통 하드웨어 장비를 만들어내는 원천 기술들을 연구개발 하고 있었죠.

특정 도메인(의료, 패션 등)에서 딥러닝을 수단으로만 사용하는 경우나 딥러닝 자체만 연구하는 경우에는 앞서 언급한 하드웨어 장비들의 필요성을 못느끼는 경우가 대부분입니다 (자체 연구만 하기도 바쁘니까요;;ㅎ)

저 또한 하드웨어 장비에는 크게 관심을 갖지 않았죠.

그런데, 석사를 졸업하고 딥러닝을 이용해 사업을 한다는 마인드를 가지고 연구를 해보려고 했을 때 처음 부딪힌 것이 하드웨어 장비였습니다.

연구실에서는 이미 갖춰진 장비로 실험하면 됐지만, 아무것도 갖춰지지 않은 밑바닥 상태에서부터 시작하려니까 하드웨어에 대한 이해가 필수더라구요.

(↓↓↓제가 하드웨어 관련 장비들을 정리한 내용들 입니다↓↓↓)

https://89douner.tistory.com/category/%EC%BB%B4%ED%93%A8%ED%84%B0%20%ED%95%98%EB%93%9C%EC%9B%A8%EC%96%B4

'컴퓨터 하드웨어' 카테고리의 글 목록

#Interest: World History (The past) #Work: Deep Learning (The future) #Hobby: Music, Sports

89douner.tistory.com

또한 IoT 기기에서 얻는 데이터를 기반해 딥러닝을 접목하는 연구를 해보려고 했을 때, IoT(하드웨어) 장비들로부터 얻는 데이터가 굉장히 중요하다는 것을 알게 됐습니다.

하드웨어 장비들이 좋지 않으면 데이터의 상태가 좋지 않기 때문에 전처리 하는데 대부분의 시간을 보내게 된다는 점을 깨달았죠. (이러한 점을 미리 알았다면 하드웨어 연구실에 있던 연구원 분들과 더 많은 이야기를 하면서 더 친하게 지낼 수 있었을 텐데...)

하드웨어 소재와 같은 것을 공부하는건 시간 상 불가능했지만, IoT에 쓰이는 하드웨어 장비가 무엇이 있고, 내 아이디어를 위해서는 어떤 장비들을 쓰면 좋은지 알아가는 것만으로 충분하다고 판단했습니다.

이미지 출처: https://towardsdatascience.com/a-comprehensive-guide-to-start-building-an-iot-product-ba32dfb91c7a

이 과정에서 집적기술의 발달로 AI를 뒷받침 해주는 하드웨어 장비들이 점점 등장하기 시작했고, 이러한 장비들과 인공지능 기술을 이용해 데이터들을 분석하는 붐이 일어나기 시작했죠.

AIoT라는 기술이 위에서 언급한 개념들을 총괄할 수 있을 겁니다.

하지만, AIoT라는 개념을 이해하기 위해서는 IoT에 대한 전반적인 이해가 선행되어야 합니다.

그럼, 지금부터 IoT에 대한 개념을 먼저 살펴보고, AIoT가 무엇인지 알아보도록 하겠습니다.

이미지 출처: https://www.datadriveninvestor.com/2019/12/10/aiot-the-new-technology-powerhouse-for-new-age-businesses/

1. IoT란?

IoT는 Internet of Things의 약자로 센서가 부착된 사물들을 인터넷 통신 기능을 통해 연결하는 기술을 의미합니다.

여기서 말하는 사물은 device, 객체, object라는 용어와 혼합해서 사용하기도 합니다.
센서의 종류로는 조도센서, 습도센서, 감지센서 등이 있습니다.
보통 IoT에서 통신기능은 무선통신(wireless)을 의미합니다

이미지 출처: https://www.pinterest.co.kr/pin/432767845444273959/

이미지 출처: https://www.istockphoto.com/kr/%EC%9D%B4%EB%AF%B8%EC%A7%80/smart-home

정말 간단한 예시를 들면, 아래와 같은 흐름으로 IoT가 실행된다고 할 수 있습니다. (굳이 Node-RED를 이해하지 않으셔도 됩니다!)

2. IoT 개발 프레임워크

여러분이 IoT를 이용해서 어떤 서비스를 제공한다고 가정해보겠습니다.

그렇다면 어떤 순서로 IoT를 개발해야 할까요?

물론 동시에 다양한 관점이 필요할 수 있겠지만, 굳이 순서를 나누자면 아래와 같다고 할 수 있습니다.

2-1. 하드웨어장비 선별하기

제일 먼저 해야할 일은 나의 아이디어를 구현시켜줄 적합한 IoT 장비를 선별하는 것입니다.
IoT 장비들은 여러가지가 있는데 일반적으로 나누자면 메인보드 역할을 하는 부품과 메인보드에 연결된 센서(sensor) 또는 액츄에이터(actuator) 장비들이 있습니다.
- 메인보드 장비: 아두이노, 라즈베리 파이
- 센서: 조도센서, 열센서, 감지센서, 등....
- 액츄에이터: LED, Fan 등...

① 먼저, 아두이노와 센서장비를 연결 시킵니다. (보통 브레드보드를 사용하여 테스트하기도 하지만, 여기에서는 아두이노와 관련된 설명은 최대한 자제하도록 하겠습니다)

② 센서(오른쪽에 있는 기기)는 지속해서 아두이노(왼쪽에 있는 기기)에게 온도 정보를 전달합니다.

이미지 출처: https://create.arduino.cc/projecthub/TheGadgetBoy/ds18b20-digital-temperature-sensor-and-arduino-9cc806

③ 컴퓨터와 아두이노는 USB로 연결할 수 있습니다.

④ 컴퓨터에서 프로그래밍을 작성해줍니다 (아두이노로부터 전달되는 온도 정보를 화면에 출력하는 프로그램)

⑤ 해당 프로그램을 컴파일시켜주고, 아두이노에 이식시켜줍니다.

(좀더 정확한 순서 "프로그래밍 입력" → "컴파일러를 통해 기계어로 변환" → "기계어를 하드웨어에 임베딩")

이미지 출처: https://www.instructables.com/Arduino-Temperature-Sensor-Using-LM35/

정리하자면, 아두이노 또는 라즈베리 파이는 센서 또는 액추에이터와 상호작용하면서 서로 정보를 주고 받게 됩니다.

이미지 출처: https://codedragon.tistory.com/7083

위에서 언급한 장비들은 아래 사이트에서 찾아볼 수 있습니다. (아래 사이트 외에 다양한 사이트들이 있으니 비교해보고 구매 사이트를 결정하시면 될 것 같아요!)

※ 좋은 장비일 수록 비싸겠지만, 그만큼 더 좋은 데이터들을 받아볼 수 있는 것 또한 사실입니다!

https://www.icbanq.com/#

전자부품쇼핑몰 아이씨뱅큐 - 전자부품, 오픈소스 하드웨어의 모든 것

국내 최대 전자부품 쇼핑몰. 아두이노/마이크로비트/라즈베리파이 등 오픈 H/W , LCD,리튬배터리, 반도체 부품, 코딩교육키트 등 판매 및 PCB/SMT/아트웍 임가공 서비스 제공. 다양한 마케팅 채널(블

www.icbanq.com

※ 아두이노 프로그래밍 관련 내용은 추후에 따로 업로드 하도록 하겠습니다. (정리는 되어 있는데 옮길 시간이ㅜㅜ;;;;)

2-2. QoS(Quality of Service)와 MQTT(Message Queing Telemetry Transport) 통신

보통 PC에서는 TCP/IP라는 통신 프로토콜이 존재하지만 IoT 환경은 고성능 PC 환경과는 조금 다르기 때문에, MQTT라는 별도의 프로토콜을 이용해 IoT 기기간의 통신을 지원합니다.

ⓐ TCP/IP 프로토골에서도 Packet format이 있듯이 MQTT 프로토콜에서도 아래와 같은 Packet format이 있습니다.

이미지 출처: https://openlabpro.com/guide/mqtt-packet-format/

흔히 IoT에서 적용하는 QoS 에는 MQTT 프로토콜(=protocol: 합의된 규약)이 있습니다.

Q. Qos란?

QoS(Quality of Service)는 다른 응용 프로그램, 사용자, 데이터 흐름 등에 우선 순위를 정하여, 데이터 전송에 특정 수준의 성능을 보장하기 위한 능력을 말합니다.
이러한 우선순위는 국제표준기관에서 표준으로 정하며, 모든 국가가 해당 표준을 따릅니다.
QoS가 구현되지 않아서 TV나 전화, 그리고 인터넷이 똑같은 우선순위로 케이블망을 사용하게 되면 인터넷 사용자가 다운로드를 동시에 여러 개 시도할 경우, TV는 당장 볼 수 없는 지경에 이르고, 전화는 불통에 이르고 맙니다

※MQTT에 대한 더 자세한 설명은 추후 아두이노 편에서 다로도록 하겠습니다 (이 역시 옮길 시간이 없어서..ㅜㅜ;;;;;)

이미지 출처: https://wnsgml972.github.io/mqtt/2018/03/05/mqtt/

그렇다면, IoT 환경에는 어떤 특징들이 있을까요?

[IoT 환경]

IoT 환경에서는 무선과 같은 단거리 통신 (Bluetooth, Zigbee 등..)을 사용하기 때문에, 유선 통신에 비해 연결이 비교적 불안정하다.
IoT 기기들은 전원을 통해 상시 충전되는 경우보다 배터리를 통해 기기들 작동시키는 경우가 많습니다. 그렇기 때문에, 종종 연결이 끊기기도 합니다. 이러한 문제들을 해결하기 위해 저전력으로 IoT 시스템을 운용해야할 필요가 있다.
IoT 기기들은 수집한 데이터들을 서로 공유하기도 하며, 실시간으로 보내는 데이터 양이 많기 때문에 이를 처리하기 위해 많은 시간이 소모될 가능성이 높다.
이러한 불안정함을 프로토콜 상에서 안정적으로 보내주기 위해 별도의 QoS 기술(=MQTT)적용이 필요하다

위와 같은 문제들을 극복하고자 IoT 환경에 적합한 MQTT라는 프로토콜을 이용해 기기들간의 통신을 지원해줍니다.

이미지 출처: https://velog.io/@bmh8993/MQTT-%ED%86%B5%EC%8B%A0-PubSub-python%EC%9C%BC%EB%A1%9C-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0

2-3. Cloud server and IoT data

앞서 언급한 내용을 토대로 데이터가 어떤 흐름으로 흘러가는지 알아보도록 하겠습니다.

프로그램을 만들고, 컴파일을 한다.
- 프로그램 내용: MQTT 통신을 이용해 해당 정보(data)들을 클라우드 서버에 전송
컴파일을 통해 번역된 기계어를 아두이노에 이식시킨다.
아두이노에 해당 정보(data)와 관련된 센서를 연결시킨다.
해당 센서로부터 실시간 정보(data)가 아두이노에게 전송된다.
아두이노에 탑재된 통신장비(기기)가 해당 데이터를 와이파이로 전송한다.
전송된 데이터는 클라우드 서버에 저장된다.

이 후, 클라우드 서버에 모인 방대한 데이터들을 기반으로 분석합니다. (보통 이렇게 모인 데이터를 기반으로 데이터 사이언스 기술을 적용시킵니다)

그리고, 분석한 내용들을 user들에게 전송하게 됩니다.

이미지 출처: https://www.avsystem.com/blog/iot-cloud-platform/

이미지 출처: https://www.youtube.com/watch?v=SIn917VvkmE

https://www.youtube.com/watch?v=LlhmzVL5bm8

AWS, GCP와 같은 기업에서는 IoT 환경에 최적화된 클라우드 서비스를 제공해주기도 하고, 관련 경험들을 매년 개발자회의 같은 곳에서 공유하기도 합니다.

https://www.youtube.com/watch?v=aVe4LfSSe2E

https://www.youtube.com/watch?v=yqneDmw_HL8

※ 최근에는 아래와 같은 두 가지 요소로 인해 클라우드 서버를 대체할 만한 방법을 찾고 있습니다.

IoT가 방대한 데이터들(ex: 멀티미디어 데이터)을 다루기 시작했다. → 데이터 용량 증가
5G와 집적기술이 지속적으로 발달하고 있다 → 한 번에 방대한 데이터를 빠른속도로 보내는 것이 가능

즉, 클라우드 서버가 너무 많은 데이터를 받아야 하기 때문에, 과부하 상태에 걸릴 것이라는 우려가 나오고 있습니다.

그래서, 몇 년 전부터는 Edge Computing과 같은 용어도 나오게 됐는데, 해당 내용은 다음글에서 다루도록 하겠습니다.

3. IoT 플랫폼 (user 관점)

앞서 언급한 내용들이 IoT 생태계를 만들어 나가는 내용들이라면,

이제부터는 연구자들이 만들어 놓은 IoT 생태계를 어떻게 이용하고 사용하는지 user 관점에서 알아보도록 하겠습니다.

IoT 제조사들은 한 분야에만 특화 되어있는 경우가 많습니다. 그렇기 때문에, 소비자들은 불필요하게 다양한 기기들을 사야되는 경우가 발생하죠.

예를 들어, IoT를 이용해 스마트 홈을 구성할 때, 커튼이나 조명을 핸드폰 어플로 조절할 수 있습니다. 그런데 이러한 경우 커튼과 조명의 제조사가 다르면 각각 다른 2개의 어플로 따로 조절해줘야하죠.. 여간 불편한 일이 아닐 겁니다.

그렇기 때문에 이러한 IoT 기기들을 어떻게 통합하고 관리할건지도 사용자 측면에서 굉장히 중요한 요소가 됩니다.

이러한 개념들을 잘 설명해주는 영상을 아래 첨부하도록 하겠습니다.

https://www.youtube.com/watch?v=FoTZkjuKZ_Q

제 개인적으로는 윗 영상을 보고나서 느낀 점은 아래와 같습니다.

“통합플랫폼을 구축하는 것을 봤을 때 IoT의 가장 큰 적은 폐쇠성이다!”

“통합플랫폼의 trend가 어떻게 변화하는가, 어떤 통합플랫폼을 이용하는 것이 좋은가에 대한 질문을 지속적으로 던지는 것이 좋으며, 관련 학회를 예의 주시 해야한다!”

[학회예시1 - Consumer Electronics Show(CES)]

CES에서 선정한 키워드로 가전 Trend를 알 수 있음
2019 CES가 선정한 5가지 키워드 중 하나가 smarthome
이번 기조연설에는 Samsung, 아방카, Quibi, Delta, Daimler, 미국 교통부가 발표

[학회예시2 - 사물인터넷 학회(ICIoTC: International Conference on IoT&Convergence)]

또한 연구자들은 아래 영상에서 처럼 사용자들이 불편해 할 만한 부분들이 무엇인지 파악하는 것이 굉장히 중요할거에요!

https://www.youtube.com/watch?v=pKFI4btN6zY

※ IoT 기기들을 이용해 스마트 홈을 구축하고 싶으신 분들은 아래 유튜브 채널을 구독하시면 좋을 것 같습니다~

https://www.youtube.com/watch?v=8Hu1KNPubJE&list=PLdmN8aAKRnIy3lgei1YNrOdlazt1wnaDv

4. AIoT

AIoT(=AI+IoT)는 AI와 IoT의 합성어입니다.

간단히 말해, 앞서 말한 IoT와 AI 기술 (machine learning, deep learning)들을 접목시킨 것이죠.

지난 몇 년간 사물인터넷(IoT)으로 집, 자동차, 가전제품 등이 서로 연결된 스마트 홈 구축에 쏠렸던 관심이 지금은, 서로 연결된 각각의 제품에 인공지능 기술을 탑재하는 방향으로 변하고 있는 추세입니다.

예를 들어, 클로바 같은 것도 딥러닝을 이용한 음성인식 기술을 IoT 기기에 탑재한 케이스이고, 딥러닝 모델을 CCTV에 인식시킨 후 이상감지가 발생하면 실시간으로 알려줄 수 있게 됩니다.

(↓↓↓Smart home 예시↓↓↓)

https://www.youtube.com/watch?v=909Nn9_hrlM

이렇게 딥러닝 기술들을 IoT 기기에 올리기 위해서는 큰 딥러닝 모델(network)를 압축(compression) 시켜야할 기술이 꼭 필요하겠죠? (굳이 IoT 기기가 아니더라도, 드론, 위급상황시 투입되는 로봇들 등에 딥러닝 모델을 올리기 위해 network compression 기술이 필요하기도 합니다)

(↓↓↓JTBC에서 소개된 신동의 스마트홈, 3:30초 부터↓↓↓)

https://www.youtube.com/watch?v=UyogFYk_7Mg

https://www.youtube.com/watch?v=sYqjs8TKkOE

5. Smart 시장

이 글을 마무리하면서 AIoT가 가장 활발하게 적용될 만한 Smart 시장의 예시들을 다룬 영상들을 첨부하면서 마무리 하도록 하겠습니다!

1) Smart Farm

https://www.youtube.com/watch?v=zj1EUhGizxc

2) Smart City

https://www.youtube.com/watch?v=mV31yAAncAg

3) Smart Factory

https://www.youtube.com/watch?v=r3dAZnztn-Q

4) Smart home

https://www.youtube.com/watch?v=qR3vACJnkFA

https://www.youtube.com/watch?v=chOWxkUOgVA

[참고 래퍼런스]

https://dalkomit.tistory.com/111

저작자표시 (새창열림)

'Network Compression for AI' 카테고리의 다른 글

3. Network Compression 기술 (0)	2021.06.04
2. Edge Computing이란? (0)	2021.06.04
이 글을 쓰게 된이유 (0)	2021.06.04

안녕하세요.

"Network Compression for AI" 카테고리에서는 AI 모델을 압축시키는 여러 방법에 대해서 이야기 하려고 합니다.

실제로 AI모델 (ex:딥러닝, 머신러닝 모델 등) 들은 하드웨어에 임베딩 하기 힘든 큰 용량을 갖고 있습니다.

그래서 몇 년전부터 이러한 AI 모델을 압축시키는 여러 기술들 ("Knowledge distillation, Pruning, etc.) 이 출현하고 있었죠.

이미지 출처: https://blog.est.ai/2020/03/%EB%94%A5%EB%9F%AC%EB%8B%9D-%EB%AA%A8%EB%8D%B8-%EC%95%95%EC%B6%95-%EB%B0%A9%EB%B2%95%EB%A1%A0%EA%B3%BC-bert-%EC%95%95%EC%B6%95/

그렇다면 왜 AI 모델을 하드웨어에 올려서 사용하려는 노력이 왜 필요할까요?

이미지 출처: https://kr.mathworks.com/company/events/webinars/upcoming/deep-learning-with-raspberry-pi-and-matlab-3251374.html

그 이유는 당연히 산업에 적극적으로 활용하기 위해서 입니다.

https://www.youtube.com/watch?v=vzBpSlexTVY

딥러닝 모델이 실제 하드웨어 기기에 배포되는 프로세스 예시

딥러닝 연구를 하다보면 드는 아래와 같은 생각들 종종 하게 됩니다.

"아카데믹하게 공부하는 거 같긴한데, 이게 그래서 상업적으로 가치가 있는건가?"

예를 들어, 굉장히 좋은 저널과 학회에 논문들이 쏟아져 나오고 있지만, 종종 "이러한 기술들이 우리 일상생활을 어떻게 바꿀 수 있을까?"라는 생각이 드는 경우가 있습니다. 물론, 논문에서 introduction을 읽다보면 어느 분야에 기여할 수 있는지 파악할 수 있지만, 개인적으로는 내 일상에서 너무 멀리 떨어진 것 같다는 생각을 하기도 합니다.

연구라는 것이 굉장히 독창적인 측면도 좋지만,

결국 산업에 기여하고 투자를 받아야 오래 동안 할 수 있습니다.

또한, 바로 내 주위 사람들에게 영향을 미칠만한 연구를 하고 있다는 느낌을 받아야 동기부여도 더 잘 될거라고 생각합니다.

이미지 출처: https://journals.plos.org/plosmedicine/article/figure?id=10.1371/journal.pmed.1001953.g001

이미지 출처: https://aeneas-office.org/2018/11/20/penta-project-creates-secured-digital-connected-healthcare-devices/

이러한 노력의 일환으로 딥러닝 분야에서는 큰 딥러닝 모델 용량을 하드웨어 수준에 맞추도록 줄여주는데, 이를 Network Compression 이라 합니다.

우선 Network Compression 기술들에 대해 알아보기 전에, 이러한 기술들의 needs가 커질 수 밖에 없었던 여러 현상들과 관련 용어들을 다루는 글을 기재하도록 하겠습니다. 왜냐하면...

"기술을 배운다라는 것은 주변 산업의 트랜드를 따라가는 것부터 시작이기 때문이죠!"

저작자표시 (새창열림)

'Network Compression for AI' 카테고리의 다른 글

3. Network Compression 기술 (0)	2021.06.04
2. Edge Computing이란? (0)	2021.06.04
1. AIoT란? (Feat. IoT 개발 프로세스) (0)	2021.06.04

안녕하세요~

이번글은 Knowledge distillation이라는 개념에 대해서 간단하게 소개해드리려고해요!

Q1. Distillation이 무엇인가요?

Knowledge distillation에 대해서 알아보기전에 "distillation(증류)"라는 단어부터 알아보고 갈게요.

Distillation이란 액체상태의 혼합물을 분리하는 방법이에요. 쉽게 말해서 A+B의 혼합물이 있으면 특정 기법을 이용하여 A 또는 B를 따로 추출하는 방법이에요. 그래서 Distillation이라는 용어를 인지할때는 '복잡하게 섞인 물체에서 필요로 하는 부분만 따로 추출하는 것'이라고 이해하고 있으면 좋습니다.

<사진1. Distillation>

Q2. 딥러닝에서 사용되는 knowledge distillation이라는 용어는 무엇인가요?

Distillation을 알아보았으니 knowledge라는 개념이 딥러닝에서 어떻게 사용되었는지 이해하면 되겠죠?

딥러닝 모델이 발달됨에 따라 모델이 점점 복잡해졌데요. 이렇게 복잡해진 딥러닝 모델 중에서 정말 필요한 지식들만 따로 가벼운 모델에 distillation(or transfer) 할 순 없을까?라는 질문에서 시작된 학습 방법론이라고 할 수 있어요.

Q3. 예를 들어주세요!

일반화 성능을 높이기 위해서 자주 쓰이는 방법은 더 깊고 복잡한 네트워크를 구성하거나, 여러 네트워크들의 결과를 조합하여 사용하는 ensemble 기법을 사용하는데요.

<사진2. Ensemble 기법>

만약 이러한 ensemble 모델의 결과값(softmax)을 작은 크기의 single neural network 학습에 적용시킬 순 없을까요? 예를들어, 작은 CNN 모델 같은 경우는 마지막 feature map을 이용해 FC layer (MLP 과정)를 거쳐 classification하게 되는데요.

만약에 "마지막 feature map+ensemble 모델의 softmax 결과"를 통해 학습한다면 어떨까요?

작은 CNN 모델이 거대한 ensemble CNN 모델과 비슷한 성능을 낸다면 결과적으로 작은 CNN 모델이 ensemble CNN에서 필요한 부분만 증류시킨 것이라고 볼 수 있겠죠?!

<사진3. CNN 기본구조>

정리해보자면 아래와 같이 요약 할 수 있겠어요!

"Knowledge Distillation이란

크고 무거운 모델의 정보(Knowledge)를 작고 가벼운 모델로 전달하여

작고 가벼운 모델이 더 정확한 추론을 하도록 학습시키는 방법론"

이번장에서는 Knowledge Distillation이라는 개념에 대해 추상적으로 이해해보았으니

다음장부터는 본격적으로 논문을 통해 구체적으로 살펴보도록 할게요!

[사진 래퍼런스]

사진1

https://www.scienceall.com/%EB%B6%84%EB%B3%84-%EC%A6%9D%EB%A5%98fractional-distillation/

사진2

https://pythonkim.tistory.com/42

사진3

https://towardsdatascience.com/a-comprehensive-guide-to-convolutional-neural-networks-the-eli5-way-3bd2b1164a53

[글 래퍼런스]

https://blog.lunit.io/2018/03/22/distilling-the-knowledge-in-a-neural-network-nips-2014-workshop/

https://seongkyun.github.io/study/2019/04/16/model_comp_1/

저작자표시 (새창열림)

Time Traveler