[230803] 모두의연구소/아이펠이 전해드리는 오늘의 AI소식!

안녕하세요
국내 최대 오프라인 인공지능 커뮤니티 모두의연구소입니다!

오늘은 LLM에 문서화도입, 사람이 사용하는 추론능력을 LLM에 더하기, 마지막으로 LLM 워터마크에 대한 소식입니다!

문서화가 LLM에서도 도움을 준다는 논문이 나와서 공유합니다! 보통 LLM의 경우 데모를 프롬프트 엔지니어링으로 사용하는 경우가 많습니다. 그러나 데모의 경우 잘못된 걸 선택했을 때 작업이 복잡해질 수도 있고 결과값이 이상하게 나올 수도 있습니다. 그렇기에 이 논문에서는 도구를 문서화하는 것을 제안합니다. 여기서 이야기하는 문서화는 단순히 모델에 대한 데모를 정리하는 것이 아닌 프롬프트를 문서화시켜 저장하고 그걸 학습시키는 것을 의미합니다. 이 기법을 활용하면 프롬프트화를 다양하게 할 수 있어 실제 결과 성능이 더 좋아진다고 하네요!


LLM 프롬프트 엔지니어링으로 인간이 사용하는 일반화기법을 활용해 더 좋은 성능을 만든 논문이 공개되었습니다. 인간은 핵심 추론능력으로 어려운 내용을 쉽게 일반화하는 방법을 채택합니다. 이 방식을 그대로 LLM 프롬프트에 사용하는데 바로 복잡한 문제를 해결하기 위한 기본 기술만을 전수하는 것입니다. 그렇게 된다면 동일한 프롬프트 문맥에서 스킬과 구성할때 능력에 대한 시너지 효과가 나와서 추론능력에 도움을 줄 수 있다고 합니다! 점점 LLM도 사람처럼 일반화를 진행할 수 있다는 점이 매우 흥미롭네요!


LLM이 등장하면서 대두되는 이슈는 바로 LLM이 생성한 텍스트와 직접 만든 텍스트를 구별하는 것이 어려워지는 것이빈다. 그렇기에 LLM으로 만든 텍스트에 워터마킹을 넣어 해당 생성된 텍스트를 특정 모델에 귀속하려는 노력을 계속하고 있습니다. 이 논문은 여러가지 사항을 고려해서 LLM에 대한 워터마크를 만들어냅니다. 이 논문에서는 통계적인 텍스트를 도입하기, 고전적인 벤치마크를 사용해 워터마크 효과를 비교하기, LLM에 엑세스할 수 있는 시나리오에 대한 탑지 시스템을 만드는 것입니다. 워터마크가 안정적으로 된다면 기업입장에서는 해당 텍스트가 어디서 만들어졌는지 알 수 있고 소비자입장에서는 생성된 텍스트와 직접 만든 텍스트를 구별할 수 있으니 윈윈일것 같네요!

AI 90% 순도 높은 아이펠만의 커리큘럼으로 배우세요!