융합보안대학원 포커스
HOME > 커뮤니티 > 융합보안대학원 포커스
융합보안대학원 포커스
융합보안대학원 포커스
Home / 융합보안대학원 포커스
글보기
제목최윤호 교수연구팀, 딥러닝 모델 적대적 공격(Adversarial Attacks) 방어 기술 개발2021-11-18 13:28
작성자 Level 10

정보컴퓨터공학부 최윤호 교수 연구실(사진: 왼쪽부터 최석환 연구원, 최윤호 교수)과 미국 펜실베니아주립대학교 LIONS센터 연구팀이 공동 연구한 딥러닝 모델 성능을 저하시키는 적대적 공격(Adversarial Attacks) 방어 기술에 대한 연구 결과가 SCI(E) 저명학술지인 IEEE Transactions on Network Science and Engineering (impact factor: 5.213)에 출판 확정되었다.


부산대학교 정보컴퓨터공학전공 석박사통합과정에 재학 중인 최석환 학생이 제 1저자, 신진명 학생이 공동저자인 이번 논문에는 연구책임자인 최윤호 교수가 교신저자, 펜실베니아주립대학교 Peng Liu 교수가 공동 저자로 참여하였다.

(관련 논문 링크: https://ieeexplore.ieee.org/abstract/document/9138779)

 '적대적 공격(Adversarial Attacks)' 기술은 입력 데이터에 육안으로는 구분할 수 없는 크기의 노이즈를 추가해 딥러닝 모델이 잘못된 결과를 산출하도록 하는 공격 방법으로 최근들어 세계 최고 권위의 인공지능학술대회 중 하나인 AAAI 2020 등에서 Ian Goodfellow, Yoshua Bengio 교수님 등에 의해 관련 방어 기술 개발의 중요성이 강조되어 왔다. 이번 연구에서는 Conversion 함수와 Inversion 함수를 이용한 이미지 이중 변환 과정을 통해 정상적인 입력에 대한 딥러닝 모델의 성능 손실 없이 딥러닝 모델 성능 저하를 위한 적대적 공격을 효율적으로 방어할 수 있는 기술이 개발되었다.


본 연구에서 개발한 딥러닝 모델 성능 저하를 위한 적대적 공격 방어 기술의 특징은 다음과 같이 요약 가능하다. 첫째, 이미지 Conversion함수와 Inversion함수의 대응 관계를 이용하여 정상적인 입력 데이터에 대한 딥러닝 모델의 성능 보존이 가능하다. 둘째, 최신의 적대적 공격 기법에 대해 기존의 방어 기술보다 뛰어난 방어 성능을 제공한다. 셋째, 제안하는 방어 메커니즘을 적용하는 과정에서 기존 딥러닝 모델 재학습 등을 통한 기존 모델의 변경을 필요로 하지 않는다.

 

 관련 연구 결과는 국내 특허 출원을 위한 심의 중이며, 향후 딥러닝 알고리즘 성능(robust) 개선을 위한 대표 연구 결과물로서 국내외 산업계 관련 실무 기술 경쟁력을 강화할 것으로 기대된다. 이번 연구는 연구재단 개인연구지원사업지원을 받아 수행되었다.

 

* 최윤호 교수 연구실(스프트웨어 및 시스템 보안 연구실 (S3Lab))에서는 현재 안전한 인공지능 및 블록체인 관련 연구를 진행 중이다. 구체적으로는 기계학습 알고리즘 성능 개선을 위한 adversarial example 방어 기법, 기계 학습 기반의 anomaly detection algorithm, 기계학습을 활용한 secure coding, 안전한 블록체인 플랫폼 및 스마트 계약 작성 방법을 연구하고 있다.



 

부산대학교 바로가기 입학안내 바로가기