지능시스템학과(AI융합학부) 송선영 석사생, 자연어처리 저명학술대회 EACL에서 「날조된 인용구를 제목에 사용하는 뉴스 기사 탐지」 논문 발표

2023년 5월 25일
56026

<지능시스템학과(AI융합학부) 송선영 석사생(사진=숭실대)>

 

본교 지능시스템학과(AI융합학부) 송선영 석사생이 5월 2일(화)~5월 6일(토) 크로아티아 두브로브니크에서 개최된 EACL에서 제1저자로 「Detecting Contextomized Quotes in News Headlines by Contrastive Learning」 논문을 발표했다. EACL은 자연어 처리 분야에서 인정받는 저명한 학술대회로, 초거대 언어 모델, 대화 모델, 기계 번역 등 자연어처리에 대한 최신 연구가 발표되는 곳이다.

이 연구는 발화자의 의도를 바꾸며 날조하는 인용구를 뉴스 제목에 사용하는 기사를 탐지하기 위한 대조학습 인용구 임베딩 기술을 제안했다. 대조학습은 최근 주목받는 인공지능 기술로, 유사할 것이라 기대되는 데이터(positive)와의 유사도를 최대화하고, 다를 것이라 기대되는 데이터(negative)와의 유사도를 최소화하는 방식으로 벡터 표현을 학습하는 방법이다. 이 연구에서는 저널리즘 원칙에 기반한 대조학습 방법 QuoteCSE를 제안했고, 자연어처리 분야에서 높은 성능을 보이는 BERT, SimCSE 등 기존 모델 성능을 상회했다.

이 연구는 저널리즘 문제 해결을 위해 자연어처리 인공지능 기술과 저널리즘 이론을 융합한 기술을 제안했다는 점에 그 의의가 있다. 이를 위해 자연어처리 전문가 박건우 교수 연구팀과 커뮤니케이션 전문가 카이스트 한지영 교수팀이 협업 연구를 수행했다. 본 연구를 위해 구축한 코드와 데이터셋은 공개되어 있다.

한편, 이 연구는 IITP 지역지능화혁신인재양성사업, NRF 개인기초연구의 지원을 받아 수행됐다.

 

논문 링크: https://aclanthology.org/2023.findings-eacl.52/

코드 및 데이터셋: https://github.com/ssu-humane/contextomized-quote-contrastive

 

홍보팀 (pr@ssu.ac.kr)