플리토는 전세계 1,000만 이상의 사용자들과 함께 집단지성 번역 서비스를 제공하는 플랫폼으로서 실제 현지인들이 사용하는 표현의 다국어 말뭉치, 음성 등의 데이터와 손글씨 이미지 데이터를 수집 및 제공합니다.
집단지성을 활용해 신속한 구축 기간과 효율적인 대량 데이터 관리 노하우를 바탕으로 다양한 조건의 언어 데이터를 수집하며 메타데이터(성별, 연령대, 지역 등)와 함께 제공합니다.
다국어 병렬 코퍼스
집단지성 플랫폼을 통해 수집한 다국어 말뭉치 데이터는 전문가의 검수를 거쳐 제공됩니다.
플리토의 텍스트 코퍼스는 인공신경망 기반 기계번역, 챗봇 등 NLP 엔진, 알고리즘 학습에 사용됩니다.
다국어 음성 데이터
NLP, STT, TTS 엔진을 위한 다국어 음성 데이터를 수집 및 구축합니다.
세부적인 조건에 따라 음성 데이터를 수집하고 메타 데이터(예: 연령, 성별, 지역 등)를 부여하거나 생성합니다.
이미지 데이터
이미지 내 텍스트 등 다양한 조건의 이미지를 수집 및 제공합니다.
메뉴판부터 다국어 손글씨 등 이미지를 수집하며 해당 이미지에 대한 소셜 태깅을 통해 동일한 이미지에 대한 다양한 태그를 생성합니다.
데이터 어노테이션
다양한 콘텐츠에 대해 감정 분석, 사물 판별, 태그 생성 등 다양한 메타 데이터를 부여하거나 생성합니다.
플리토 언어 데이터에 대한 자세한 내용은 아래의 URL에서 확인해 주세요.