어쩌나! 규제에 발목 잡힌 'AI 챗' OpenAI’s hunger for data is coming back to bite it
OpenAI의 갈망...하지만
이탈리아 데이터보호청(GPDP)로부터
챗GPT 일시적 사용 금지 처분
유럽연합(EU) 국가들도 잇따른 조사 착수
회사의 AI 서비스는 데이터 보호법을 위반하고 있을 수 있으며 해결책이 보이지 않는다.
OpenAI는 이탈리아에서의 일시적인 금지와 다른 EU 국가에서의 많은 조사에 따라 유럽 데이터 보호법을 준수할 수 있는 시간이 일주일이 조금 넘었다. 실패할 경우 막대한 벌금을 물거나 데이터를 삭제해야 하거나 금지될 수 있다.
하지만 전문가들은 MIT 테크놀로지 리뷰에 OpenAI가 이 규칙을 따르는 것은 거의 불가능할 것이라고 말했다. 그것은 AI 모델을 훈련하는 데 사용된 데이터가 수집된 방식, 즉 인터넷에서 콘텐츠를 말굽으로 이동하는 방식 때문이다.
AI 개발에서 지배적인 패러다임은 훈련 데이터가 많을수록 좋다는 것이다. OpenAI의 GPT-2 모델은 40기가바이트의 텍스트로 구성된 데이터 세트를 가지고 있었다. ChatGPT가 기반으로 하는 GPT-3는 570GB의 데이터를 기반으로 교육되었다. OpenAI는 자사의 최신 모델인 GPT-4의 데이터 세트가 얼마나 큰지는 공유하지 않았다.
하지만 더 큰 모델에 대한 갈망이 이제 회사를 괴롭히고 있다. 지난 몇 주 동안 여러 서방 데이터 보호 당국은 OpenAI가 ChatGPT의 전원을 공급하는 데이터를 수집하고 처리하는 방법에 대한 조사를 시작했다. 그들은 그것이 이름이나 이메일 주소와 같은 사람들의 개인 정보를 스크랩해서 그들의 동의 없이 사용했다고 믿는다.
이탈리아 당국은 예방 조치로 ChatGPT 사용을 차단했으며, 프랑스, 독일, 아일랜드, 캐나다 데이터 규제 당국도 OpenAI 시스템이 데이터를 수집하고 사용하는 방법을 조사하고 있다. 데이터 보호 당국의 최고 조직인 유럽 데이터 보호 위원회도 ChatGPT에 대한 조사와 집행을 조정하기 위해 EU 전역의 태스크포스를 구성하고 있다.
이탈리아는 4월 30일까지 이 법을 준수하도록 OpenAI를 부여했다. 이는 OpenAI가 데이터를 스크랩하기 위해 사람들에게 동의를 구하거나 데이터 수집에 "정당한 관심"이 있음을 증명해야 한다는 것을 의미한다. OpenAI는 또한 사람들에게 ChatGPT가 그들의 데이터를 어떻게 사용하는지 설명하고 챗봇이 뱉어내는 그들에 대한 실수를 바로잡을 수 있는 힘을 주고, 원한다면 그들의 데이터를 지우도록 하고, 컴퓨터 프로그램이 그것을 사용하도록 하는 것에 반대할 수 있는 힘을 주어야 할 것이다.
OpenAI가 당국의 데이터 사용 관행이 합법적이라고 확신할 수 없다면 특정 국가 또는 유럽 연합 전체에서 금지될 수 있다. 프랑스 데이터 보호 기관 CNIL의 AI 전문가인 Alexis Leautier는 또한 막대한 벌금에 직면할 수 있으며 심지어 모델과 모델 교육에 사용된 데이터를 삭제해야 할 수도 있다고 말한다
황기철 콘페이퍼 에디터 국토부 인플루언서
Ki Chul Hwang Conpaper editor influencer
OpenAI’s hunger for data is coming back to bite it
(Source: technologyreview.com/2023/04/19/1071789/openais-hunger-for-data-is-coming-back-to-bite-it/)
kcontents