IT의 힘으로, AI의 미래로!

숭실대학교 IT대학 AI융합학부

학부뉴스

지능시스템학과(AI융합학부) 석사과정 송선영 학생, 자연어처리 저명학술대회 EACL에서 <날조된 인용구를 제목에 사용하는 뉴스 기사 탐지> 논문 발표

작성자 :  | 작성일 : 2023.05.23  | 조회수: 41

지능시스템학과(AI융합학부) 석사과정 송선영 학생이 크로아티아 두브로브니크에서 5.2-6 개최된 EACL에서 제1저자로 “Detecting Contextomized Quotes in News Headlines by Contrastive Learning” 논문을 발표했다. EACL은 자연어 처리 분야에서 SCI급으로 인정받는 저명학술대회이며, 초거대 언어 모델, 대화 모델, 기계 번역 등 자연어처리 최신 연구가 발표되는 곳이다.


이 연구에서는 발화자의 의도를 바꾸며 날조하는 인용구를 뉴스 제목에 사용하는 기사를 탐지하기 위한 대조학습 인용구 임베딩 기술을 제안하였다. 대조학습은 최근 주목받는 인공지능 기술로, 유사할 것이라 기대되는 데이터(positive)와의 유사도를 최대화하고, 다를 것이라 기대되는 데이터(negative)와의 유사도를 최소화하는 방식으로 벡터 표현을 학습하는 방법이다. 이 연구에서는 저널리즘 원칙에 기반한 대조학습 방법 QuoteCSE를 제안하였고, 자연어처리 분야에서 높은 성능을 보이는 BERT, SimCSE 등 기존 모델 성능을 상회하였다.


 

이 연구는 저널리즘 문제 해결을 위해, 자연어처리 인공지능 기술과 저널리즘 이론을 융합한 기술을 제안하였다는 데 그 의의가 있다. 이를 위해 자연어처리 전문가 박건우 교수 연구팀과 커뮤니케이션 전문가 카이스트 한지영 교수팀이 협업 연구를 수행하였다. 본 연구를 위해 구축한 코드와 데이터셋은 공개되어 있다.

송선영 학생은 “저널리즘 원칙을 위반하는 기사들을 탐지할 수 있는 인공지능 기술을 개발하고 자연어처리 학술대회에서 발표할 기회를 얻게 되어 영광이었다. 이러한 경험을 토대로 자연어처리 기술로 소셜미디어에서 발생하는 사회 문제를 해결할 수 있는 훌륭한 연구자로 성장하고 싶다” 라는 의견을 밝혔다. 이어 “공저자 분들과 함께 해 좋은 연구를 할 수 있었고, 박건우 교수님의 열정적인 지도에 항상 감사드린다” 라는 감사 인사를 전했다.

이 연구는 IITP 지역지능화혁신인재양성사업, NRF 개인기초연구 지원을 받아 수행되었다.

논문 링크: https://aclanthology.org/2023.findings-eacl.52/
코드 및 데이터셋: https://github.com/ssu-humane/contextomized-quote-contrastive