[GN] Meta, 외부 소프트웨어 도구를 활용가능한 AI 언어 모델 "Toolformer" 공개

GeekNews 의 xguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. ^^

[소개 글]

  • ChatGPT는 연산 및 팩트체크에서 고생하는 중
  • Meta가 공개한 Toolformer는 외부 검색엔진, 계산기, 달력들을 이용하는 방법을 자신에게 가르칠 수 있음
  • API를 사용하는 것이 핵심으로, 처음에 간단한 사용방법을 알려주는 것 만으로 자신이 학습
  • 6.7b개의 파라미터를 이용한 GPT-J 모델을 기반으로 함
  • 실험에 의하면 다양한 도구 사용 태스크에서 175b 파라미터의 GPT-3 보다 더 좋은 성능을 보였다고

[원문]

[출처/GeekNews]

1개의 좋아요