Data Engine
기업 맞춤형 LLM에 필요한 고품질 데이터를 구축합니다
구축 문의
Why Crowdworks
크라우드웍스를 선택하는 데는 이유가 있습니다
01
데이터가 좌우하는 기업 맞춤형 LLM의 성능
파운데이션 모델의 성능이 아무리 뛰어나더라도 기업이 사용할 LLM은 각 기업의 Private Data를 충분히 학습해야 효과적인 활용이 가능합니다. 크라우드웍스는 기업 맞춤형 LLM을 위한 다양한 데이터 구축 경험을 가지고 있습니다.
02
글로벌 대표 AI 데이터 전문 기업
국내 1위 AI 데이터 전문 기업인 크라우드웍스는 미국 가트너 사, CB인사이트 보고서에 데이터 가공 글로벌 대표 기업으로 등재됐습니다.
03
500개 이상의 AI 선두기업이 선택
코스피 Top30 IT기업의 70% 이상이 AI 개발에 크라우드웍스의 데이터 솔루션을 선택했습니다.
04
데이터 설계, 가공, 구축에 대한 높은 이해도
누적 2억 5천만 건 이상의 데이터 구축, 1천 건 이상의 기업 프로젝트 경험을 바탕으로 AI 데이터에 대한 높은 이해도를 가진 전문가가 프로젝트에 참여합니다.
네이버
D2SF 리더 양상환
“크라우드웍스에서 AI 개발 전처리에 드는 막대한 시간과 비용을 줄일 수 있었습니다. 오늘날의 Clova나 파파고의 성능을 크라우드웍스가 만들었다고 해도 과언이 아닙니다.”
How We Work
기업 맞춤형 LLM에 특화된 데이터를 구축합니다
1
파인튜닝용 데이터셋 구축
데이터 전문가들이 기업의 활용 목적에 맞게 기존 LLM 모델을 파인튜닝할 때 필요한 특화된 데이터셋을 구축해 드립니다.
표현 역량 극대화를 위한 데이터셋
모델의 답변이 특정 비즈니스 환경의 니즈를 반영하도록 설계
산업 특화용 데이터셋
모델의 답변이 특정 산업의 고도화된 지식을 반영하도록 설계
2
RLHF, DPO 등 강화학습용 휴먼 피드백 데이터 구축
인간 피드백 기반 강화학습(Reinforcement Learning from Human Feedback), 직접 선호 최적화(Direct Preference Optimization) 등 강화학습을 위한 데이터를 구축합니다.
모델 답변을 평가한 데이터 구축을 통해 맞춤형 LLM의 품질 향상
LLM 목적에 따른 자체 평가 항목을 기준으로 피드백
검증된 작업자 참여
크라우드소싱을 통해 다양하면서도 검증된 작업자 모집 및 참여
3
기업 내부 데이터 자산화
RAG를 통해 내부 데이터를 가장 효과적으로 활용할 수 있도록 데이터를 가공하고, 구조화합니다.