본문 바로가기

AI/데이터라벨링

크라우드웍스, 인공지능 개발을 위한 데이터라벨링 전문업체(쉽게설명!)

크라우드웍스 사업

데이터라벨링(46%, 수집-가공-전달 for 모델), 데이터라벨러 교육(47%, B2C), 라벨러 인력매칭(2%, 거래처에 라벨러 매칭&파견), 라벨링 도구(1%, 라벨링 툴 제공 for 거래처=데이터 유출 원치x), 기타(4%)

1. 인공지능 데이터솔루션(데이터라벨링) : 데이터 수집-가공-전달 for 모델 

* 모델(Model) : 데이터를 갖고 학습

--------------------------------

2. 데이터라벨러 교육(Crowd Academy) : 개인 데이터 라벨러 육성 

--------------------------------

3. 라벨러 매칭 & 파견(Crowd jobs) : 라벨러 파견 for 거래처 

-------------------------------- 

4. 라벨링 툴 : 라벨링 도구 제공 for 거래처=데이터 유출 원치x 

 

 

23.3분기 기준 / 단위 : 백만원

 

 

 

기회

·

·

 

리스크

·

·

 

 


 

 

업데이트

 

 

주주구성(24.3월 기준) : 

 

 

 


 

 

크라우드웍스 

 

 

 

 

  크라우드웍스는 인공지능 개발에 필요한 데이터솔루션을 판매하는 업체에요. 우선, 인공지능 개발의 간단한 원리부터 설명할게요. 우선, '모델(Model)'이 필요해요. 모델은 직접 데이터를 갖고 학습을 하는 학생입니다. 여기서, 책의 역할을 하는 것이 '데이터(Data)'이죠. 데이터를 그냥 주면 안되고 어느 정도 필터링을 거쳐야하는데요. '수집-가공-전달' 순서이죠. 예를 들면, 사람의 얼굴인식을 하는 인공지능 모델을 개발하려고 한다면, 데이터는 '얼굴'일 것이에요. 얼굴들을 우선 '수집'을 합니다. 그리고, 파일사이즈, 색상 등을 학습하기 편하게 일체화시켜요. 이를 '가공'이라고 부르죠. 그리고, '전달'하면 끝입니다. 참고로, 이러한 데이터를 구축하는 것을 '라벨링(Labeling'이라고 불러요. 

 

 

정리 

인공지능 데이터솔루션 : 데이터 수집-가공-전달 for 모델 

* 모델(Model) : 데이터를 갖고 학습

 

  크라우드웍스는 인공지능 학습을 위한 데이터솔루션을 판매한다고 했죠. 이때, 데이터를 라벨링하는 것이 중요한데, 다양한 방식으로 판매를 하고 있어요. 

 

1) 직접 모든 것을 다해줌 : Croudworks(동사 자칭 사업명 이름, 이하 같음) 

 

  동사가 직접 프로젝트PM이 되어 데이터 구축에 필요한 모든 것을 합니다. 즉, 필요한 모델을 기획하고 라벨링까지 해주는 것이죠. 

 

2) 라벨러 인력파견 : Croudjobs 

 

  아직까지는 데이터라벨링 작업을 사람이 직접 or 반자동으로 하고 있는데요. 그러다 보니, 라벨러들의 인력풀을 넓게 보유하고 있는 것이 굉장히 중요해요. 크라우드웍스는 보유한 라벨러들을 거래처에 매칭시켜 파견근무 시키는 일도 하고 있습니다. 

 

3) 거래처가 직접 데이터라벨링 : Workstage 

 

  기업은 자신들의 데이터가 외부로 빠져나가기를 원치 않을 것이에요. 이러한 니즈를 충족시키기 위해 동사는 데이터라벨링위한 도구 같은 것들만 거래처에 납품하기도 합니다. 즉, 직접 거래처가 라벨링, 모델링을 하는 것이죠. 

  

 

4) 전문 데이터라벨러 육성 : Crowd Academy 

 

  데이터라벨링 작업이 여전히 사람의 손으로 대부분 이루어지고 있다고 했죠. 그래서, 데이터라벨러의 인력풀 관리가 중요해요. 동사는 인력풀을 직접 관리하기 위해 직접 교육과정을 운영하고 있어요. 

 

 

연구실적으로 보는 크라우드웍스의 현 주소

 

  개인적으로 크라우드웍스의 연구실적과 연구계획을 보면 동사의 현 상황과 미래 비전이 보인다고 생각을 하는데요. 같이 몇 개만 샆펴볼까요. 

 

 

  동사는 2021년부터 데이터라벨러 육성을 위해 Crowd Academy라는 교육과정을 오픈하였는데요. B2C 사업인 것이죠. 이는 데이터라벨링이 아직 사람 손이 필요하다는 뜻이에요. 반대로 얘기하면, 이러한 데이터라벨링 작업을 기계학습을 통해 스스로 할 수 있는 연구개발이 필요하다고도 할 수 있습니다. 동사는 머신러닝기반 데이터라벨링 자동화작업에 투자하고 있습니다. 

 

맨 우측 : 23.3분기 기준(R&D 투자비율)


 

 

크라우드웍스에 대한 지속적인 업데이트는 맨 위 상단을 참고하면 유익합니다 :)