[AI데이터 JOB 시대] 데이터 일자리로 각광받는 `AI 데이터 라벨링` China’s Massive AI Data Labeling Workforce Comes From Its Small Towns


AI가 배울 자료 만드는 `뉴 잡`…알리바바에만 20만명 있다


데이터 일자리로 각광받는 `AI 데이터 라벨링`


데이터 1차 가공·정제 과정

사람 노동력 반드시 필요해

아마존도 데이터일꾼 50만명


中 안면인식기술 라벨링 덕

일자리 문제도 해결 `두 토끼`


우리 정부도 예산 15배 늘려

데이터 가공인력 대거 확충


AI데이터 JOB 시대 (上) 


애플, 마이크로소프트, 아마존, 알파벳(구글 지주회사), 페이스북, 알리바바, 텐센트.


시가총액 글로벌 10대 기업(2019년 기준) 중 무려 7곳이 데이터를 대규모로 다루는 글로벌 정보기술(IT) 기업이다. 전 세계 기업들은 데이터 산업의 패권을 쥐기 위해 매일 쏟아지는 엄청난 데이터 처리에 고심하고 있다. 세계적으로 `데이터 일자리`가 급증하고 있는 배경이다. 특히 고무적인 것은 `세상에 없던 직업`들이 속속 생겨나고 있는 것이다.



 

China’s Massive AI Data Labeling Workforce Comes From Its Small Towns


As China’s artificial intelligence industry explode, the need for data labeling grew exponentially. Every year, more than 2 million hours of voice data and more than hundreds of millions of picture data need to be labeled so that machines can learn how to recognize them.




The service of collecting, sorting, cleaning, and labeling these basic data is a prerequisite for training artificial intelligence models. According to a recent report, the size of China’s artificial intelligence data service market in 2018 was RMB2.586 billion yuan, of which 86% was the data resource customization service. It is expected that the market size will exceed RMB11.3 billion yuan in 2025.


View full text

https://www.chinamoneynetwork.com/2020/03/03/chinas-massive-ai-data-labeling-workforce-comes-from-its-small-towns


edited by kcontents


정부는 `디지털 뉴딜`에 5년간 76조원을 투자하고 문재인 대통령 임기 내에 55만개 일자리를 만들겠다고 밝혔다. 특히 `한국판 뉴딜 사업`으로 3차 추경을 통해 2925억원을 추가 마련하고 인공지능(AI) 학습용 데이터 150종을 구축하기로 했다. 이는 작년 예산 대비 15배 급증한 것으로, AI 데이터 라벨링 분야에서 많은 일자리가 창출될 것으로 정부는 기대하고 있다. 진정한 AI 시대가 열리려면 양질의 데이터가 필요하다. 흔히 데이터를 4차 산업혁명 시대의 쌀이나 원유에 비유한다. 정부가 올해 AI 학습용 데이터 예산을 작년보다 대폭 늘리고 일자리를 창출하겠다고 공언한 이유다. 수집된 데이터를 AI가 인식할 수 있도록 가공·정제하는 과정에서 사람의 힘이 필요하다. AI 학습용 데이터가 증가하는 과정에서 다양한 일자리도 함께 증가할 수 있다.


미국과 중국, 호주 등은 이미 `크라우드 소싱`으로 데이터 산업의 씨앗을 촘촘하게 뿌리고 있다. 미국 아마존 웹서비스가 자사 고객들의 데이터 처리를 위해 만든 아마존 메커니컬 터크(Amazon Mechanical Turk)는 190개국에 걸쳐 50만명의 크라우드 소싱 인력을 보유하고 있다. 번역 작업에 특화된 미국 라이언브리지 AI는 100만명의 준전문가를 고용했다. 이 회사는 한국에서도 음성, 손글씨, 얼굴 샘플 데이터를 크라우드 소싱으로 수집하고 있는 것으로 알려졌다. 자율주행차량 운행 데이터를 전문으로 수집하는 마이티 AI는 차량센서 데이터 라벨링을 전문적으로 하는 작업인력 40만명 이상의 풀을 구축했고, 2019년 우버에 전격 인수됐다.




중국도 데이터 라벨러를 잘 키워 대량의 일자리 창출과 AI 산업 육성이라는 `두 마리 토끼`를 잡았다. 몇 년 전부터 데이터 라벨링 산업을 키운 중국은 저렴한 노동력과 집중작업으로 `AI 시대`를 선점하는 데 성공했다. 중국에서 가장 큰 데이터 가공공장으로 알려진 MBH는 30만명의 데이터 라벨러를 고용하고 있다. 이들의 평균 임금은 약 3000위안, 425달러 수준인데 중국 극빈 지역의 평균임금보다 세 배나 많아 일하려는 사람들이 줄을 선다. 중국이 세계적인 안면인식 기술을 확보할 수 있었던 것은 MBH 같은 데이터 가공공장과 이곳에서 일하는 근로자들이 있었기 때문이다. 중국의 AI 데이터 서비스 시장 규모는 2018년 약 4400억원이었는데, 2025년에는 2조원에 달할 것으로 전망된다. 일자리위원회에 따르면 중국 최대 전자상거래 업체 알리바바에서는 약 20만명의 AI 데이터 전문가들이 라벨링 작업을 담당하고 있으며, 2022년까지 관련 직원이 약 500만명에 이를 것으로 추산된다. 작업 난이도가 높지 않은 초기 AI 라벨링은 중국의 청년실업난 해소에도 기여했다.


한국도 AI 학습용 데이터 구축을 통한 일자리 창출에 속도를 내고 있다.


 과학기술정보통신부는 21일 AI 개발에 필수적인 양질의 데이터를 대규모로 구축·개방하는 내용의 `AI 학습용 데이터 구축 사업` 20개 과제를 발표했다. 10개 지정과제로는 매일방송 등이 운영하는 국내 첫 민간 데이터거래소 KDX의 대용량 동영상 콘텐츠를 비롯해 자율주행드론 비행 영상, 시각 정보 기반 질의응답, 수어 영상, 딥페이크 방지 영상, 사람 인체 자세 3D, 전문 분야 한영 말뭉치 등이 포함됐다. 이번 과제 선정을 통해 다양한 데이터 라벨링 일자리가 창출될 것으로 기대된다.


<용어 설명>

▷AI 데이터 라벨링 : 사진·문서 등 사람이 만든 데이터를 인공지능(AI)이 인식할 수 있도록 재가공하는 작업. AI가 학습할 데이터를 수집·가공해 고품질의 데이터셋을 구축한다.

[신찬옥 기자]매일경제




 케이콘텐츠

댓글()