[GN⁺] OpenAI, ByteDance가 자체 AI 모델 훈련에 GPT를 사용해서 계정 중단

GeekNewsxguru님께 허락을 받고 GN에 올라온 글들 중에 AI 관련된 소식들을 공유하고 있습니다. :smiley_cat:


소개

  • OpenAI가 ByteDance의 계정을 정지시킴
  • ByteDance는 GPT를 사용하여 중국에서 자체 경쟁 모델을 훈련하는 데 사용했다고 함
  • OpenAI 대변인 Niko Felix는 API 고객이 기술을 선한 목적으로 사용해야 한다고 언급하며, ByteDance의 API 사용이 적었지만 조사를 위해 계정을 정지시켰다고 발표함
  • ByteDance는 대부분의 GPT 사용을 Microsoft의 Azure 플랫폼을 통해 진행했으며, Microsoft가 OpenAI와 같이 ByteDance의 접근을 정지할지 여부는 아직 불분명함

GN⁺의 의견

  • 이 기사는 인공지능 기술의 사용과 관련된 윤리적 문제와 지적 재산권의 중요성을 강조함.
  • ByteDance의 행위는 기술 분야에서의 경쟁과 혁신이 어떻게 때로는 법적 및 도덕적 경계를 시험할 수 있는지 보여줌.
  • 이 사건은 다른 기업들에게도 경고의 메시지를 보내며, AI 기술을 사용할 때 명확한 사용 정책과 라이선스 조건을 준수해야 한다는 점을 상기시킴.

Hacker News 의견

  • 저작권 위반에 대한 이중 잣대

한 사용자는 OpenAI가 다른 사람의 저작권이 있는 작업을 사용하면서 자신들의 작업에 대해서는 같은 기회를 부정하는 것이 위선적이라고 지적함. 법적 지식이 없음을 전제로, 도덕과 법의 차이에 대해 혼란을 느낌.

  • 저작권의 극단적 버전

OpenAI가 세계의 이미지와 텍스트를 트레이닝 데이터로 사용할 수 있지만, 그 시스템 내에서는 경쟁자들이 사용할 수 없다는 점을 지적하며, 이를 상상할 수 있는 저작권의 가장 깨진 버전이라고 비판함.

  • 독점금지법 문제 제기

저작권 이외에도 독점금지법 문제가 제기됨. 법원은 일반적으로 역공학 금지 조항을 지지하지만, 인터페이스 복사는 시장 대체품을 장려하기 때문에 더 환영받음. OpenAI가 고객에게 명백히 열려 있는 도구의 출력 사용을 제한할 수 있는지 여부가 새로운 문제임. 또한, 이는 데이터베이스 라이선스가 고객의 비교 출판을 방지하는 것과 유사하며, 이는 반경쟁적일 수 있음. 독점금지 정책은 주로 한 플레이어가 시장을 지배하는 성숙한 시장에서 주로 동기 부여됨. 그러나 성장하는 시장에서는 같은 분석이 적용되는지 의문임. 시장이 빠르게 성장하고 있다면, 지배력이 불확실하기 때문에 우려가 완화될 수 있음. 반면, 시장이 특히 포획에 취약하다면, 초기 리더들은 더 많은 주의를 요할 수 있음. 그러나 독점의 1차 효과가 경쟁 감소에 미치는 영향 외에도, 2차 효과는 경쟁자에 대한 투자 감소로 이어져 반경쟁적 효과를 낳을 수 있음. 이러한 우려는 시장 초기 단계에서 가장 높을 수 있음. 관련된 변호사 블로그가 있는지 궁금함.

  • 경쟁자 차단과 독일 최악의 신문과의 협력

OpenAI가 경쟁자를 차단하고 독일의 최악의 신문과 협력하며, MS가 OpenAI 이사회에 자리를 가지고 있음을 지적함. Altman의 복귀가 정말 잘 풀리고 있음을 암시함.

  • API 사용 정책과 '선한' 기술 사용

ByteDance가 OpenAI의 API를 최소한으로 사용했지만, OpenAI가 추가 조사를 위해 그들의 계정을 정지시킴을 언급함. OpenAI는 모든 API 고객이 기술을 '선한' 목적으로 사용하도록 하는 사용 정책을 준수해야 함을 강조함. '선한'이라는 말은 많은 사람들에게 좋은 것으로 들리지만, 다른 사람들에게는 악으로 보일 수 있는 회색 영역이 항상 존재함을 지적함.

  • 내부 커뮤니케이션 플랫폼에서의 부정 사용 논의

ByteDance 직원들이 내부 커뮤니케이션 플랫폼인 Lark에서 '증거를 희석화하는 방법'에 대해 논의하는 것을 목격함. 부정 사용이 만연하여 Project Seed 직원들이 정기적으로 API 접근 한도에 도달함을 언급함. 다른 모델들이 GPT-3.5를 빠르게 따라잡는 것처럼 보이지만 GPT-4를 능가하지 못하는 것에 대해 의문을 가질 때, 그들이 단순히 GPT-3.5의 출력을 트레이닝하는 것이 아닌지, 혹은 거짓말을 하고 있는 것은 아닌지 기억해야 함을 조언함.

  • 큰 플레이어들의 모델을 이용한 부트스트랩

IBM Watson이 새롭고 뜨거운 것이었을 때, 큰 플레이어들의 모델을 사용하여 자신의 모델을 부트스트랩하는 것이 얼마나 쉬울지 궁금해했음. OpenAI가 등장하면서 더 이상 필요하지 않을 것 같았지만, 그들이 더 이상 모델을 공개하지 않기로 결정했을 때 상황이 바뀜. 그러나 Llama와 많은 다른 사람들이 그 횃불을 이어가고 있음. 모델을 향상시키는 흥미로운 방법으로 보임.

  • 모델 추출 방지의 불가능성

ByteDance나 다른 누구라도 OpenAI의 모델을 추출하려는 충분한 동기가 있다면, 이를 방지할 수 없음을 지적함. 다른 사람들에게 데이터 수집을 위임할 수 있음.

  • API를 통한 모델 훈련과 복제 방법에 대한 질문

사용자는 API 접근만 가능한 기존 모델인 ChatGPT를 사용하여 자신의 모델을 훈련하고 어떻게 그것의 측면을 복사할 수 있는지에 대해 설명해달라고 요청함. 모든 지식을 다루는 프롬프트 목록을 어떻게 시작하고, 유용한 출력과 말도 안 되는 환각을 어떻게 구별할 수 있는지에 대한 직관적 이해가 부족함을 표현함. 기사와 링크에서 설명하지 않는 중요한 세부 사항을 놓치고 있다고 느낌.

  • OpenAI가 ByteDance의 계정을 정지시킨 이유에 대한 풍자

OpenAI가 GPT를 사용하여 자체 AI 모델을 훈련한 ByteDance의 계정을 정지시킨 것에 대해, 이는 사탕 가게에서 사탕을 훔친 아이가 자신의 동생이 그 사탕을 훔치는 것에 대해 불평하는 것과 유사하다고 풍자적으로 표현함.

원문

출처 / GeekNews