소개
시각적 허위 정보는 이미지와 그 설명 간의 불일치나 이미지 내 위조된 부분을 감지함으로써 주로 탐지됩니다. 하지만 이러한 방법들은 이미지의 원래 메타 컨텍스트를 식별하는 인간의 사실 확인 과정을 간과할 수 있습니다. 원래의 사실을 설명함으로써 사실 확인자는 더 효과적으로 허위 정보를 감지하고, 체크할 가치가 있는 시각적 콘텐츠에 집중하며, 허위 정보가 널리 퍼지기 전에 대응 메시지를 전달하고, 설명을 더 설득력 있게 만들 수 있습니다.
5Pils는 이러한 허점을 메우기 위해 개발된 데이터셋으로, 5가지 기둥(five pillars) 사실 확인 프레임워크를 기반으로 1,676개의 이미지와 그 원래 메타 컨텍스트에 대한 질문-답변 쌍이 포함되어 있습니다. 또한, 이 데이터셋을 활용한 초기 실험을 통해 유망한 결과가 도출되었지만, 정보 검색 및 추론에서 해결해야 할 여러 과제가 여전히 존재함을 보여줍니다.
기존의 시각적 허위 정보 감지 방법은 이미지의 위조된 부분을 찾거나 설명과의 불일치를 확인하는 것에 집중합니다. 그러나 5Pils는 이미지의 원래 메타 컨텍스트를 예측함으로써 더 깊이 있는 사실 확인을 가능하게 합니다. 기존 방법이 단순히 "틀렸다"는 것을 밝혀내는 데 그친다면, 5Pils는 "무엇이 진실인가?"를 설명할 수 있는 데이터를 제공합니다.
5 Pillar Framework 및 5Pils 데이터셋은 Image, Tell me your story! Predicting the original meta-context of visual misinformation 논문에서 소개되었으며, 기존 시각적 허위 정보 탐지 방법의 한계를 보완하기 위해 이미지의 자동 맥락화를 중심으로 연구를 진행하였습니다. 5Pils 데이터셋은 이미지 맥락화를 위한 5 Pillars 프레임워크(5 Pillars framework)를 기반으로 질문-답변 쌍으로 주석이 달린 1,676개의 사실 검증된 이미지를 포함하고 있습니다.
주요 특징
-
5Pils 데이터셋: 1,676개의 이미지와 해당 메타 컨텍스트를 기반으로 한 질문-답변 쌍이 포함된 데이터셋.
-
5 Pillar프레임워크: 이미지의 메타 컨텍스트를 예측하는 데 사용되는 5가지 사실 확인 기둥.
-
실험 코드 제공: 데이터셋과 함께 실험을 수행할 수 있는 코드를 제공, 결과 재현 가능.
-
자동화된 이미지 맥락화: 이미지의 원래 맥락을 자동으로 추론하는 방법을 개발, 허위 정보 탐지에서의 새로운 접근 방식 제시.
5Pils 데이터셋 예시
{
"URL": "https://factly.in/2013-evacuation-image-from-typhoon-hit-philippines-is-passed-off-as-iaf-airlifting-800-people-from-kabul",
"image path": "dataset/processed_img/2013-evacuation-image-from-typhoon-hit-philippines-is-passed-off-as-iaf-airlifting-800-people-from-kabul.png",
"org": "factly",
"publication date": "2021-08-17T12:00:55+00:00",
"claim": "The image shows 800 people airlifted by the Indian Air Force from Kabul.",
"was the photo used before?": "yes",
"source": "US Airforce's official website",
"date": "2013",
"date numeric label": "['2013-01-14T00:00:00+00:00']",
"location": "Tacloban city, Philippines",
"motivation": "To document the US Airforce\u2019s operation Damayan evacuation in 2013",
"type of image": "out-of-context",
"verification strategy": "['reverse image search']",
"verification tool": "['Other/Unspecified']",
"claimed location": "Kabul, Afghanistan",
"claimed date": "2021"
}
라이선스
이 프로젝트는 Apache 2.0 License로 공개 및 배포되며, 데이터셋은 CC-BY-SA-4.0 License로 제공됩니다.
관련 논문
5Pils 데이터셋 저장소
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.
파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~