고품질 데이터 구축을 위한 기술력과 운영 경험을 바탕으로,
다양한 산업에서 신뢰 받는 파트너로 자리잡았습니다
프리먼데이터가 걸어온 오디오 데이터 혁신의 발자취
프리먼은음성 데이터 편집 및 검수 기술로 고품질의 데이터를 만들어 인공지능 생태계가 발전하고 더 나은 삶을 만들어 가는데 기여 합니다 | ![]() |
프리먼이 가지고 있는 기술과
고객 맞춤형 서비스 제공
고객의 요구 품질을 넘어 그 이상의 기준을
제시합니다. 더 높은 품질 목표를 세우고 실행하여
고객을 만족시키고 프로젝트를 성공으로 이끌어냅니다.
새로운 기준을 제시하는 파트너
AI 음성데이터 구축에 집중하여 전문성을 갖추고
노하우와 경험을 바탕으로 고객이 필요로 하는
고품질의 데이터를 만드는 기술력을 확보합니다.
전문성과 기술력을 겸비한
음성데이터 구축을 위한 소프트웨어를 자체 개발하여
대량 작업 시 발행하는 문제점들을 극복하고
품질의 균일성과 작업 효율성을 높입니다.
프로젝트를 이끄는 소프트웨어 파워
2020 |
인공지능 스피커, 음성 합성 오디오 데이터 가공 작업 인공지능 음성 데이터 가공 작업 프로그램 서비스 개시 (EasyQA – Labelling Software System) 인공지능 활용을 위한 음성 인식용 코퍼스 데이터 수집 작업 (130카테고리, 18,000문장, 크라우드 소싱 방식) 크라우드 소싱 활용 텍스트 수집 플랫폼 제작 인공지능 활용 특수 현장 노이즈 녹음 작업 (50개소, 총 50시간) 음성 합성 데이터 가공 전용 프로그램 제작 2020년 6월 프리먼 설립 |
2021 |
모바일 음성 호출 키워드 데이터 편집 및 검수 (61,500 단어) 음성 합성용 음성 데이터 편집 및 검수 (10,000,000문장, 4300명 화자 ) 콜센터 상담원 음성 합성 오디오 데이터 가공 작업 모바일 제조사 음성인식 모듈 신규 호출 엔진DB 음원 편집 작업 (3,576,000단어, 거리별(3m/1m/30cm) 통합 데이터) 인공지능 학습용 대용량 음원 데이터 편집 및 검수 프로그램 서비스 개시 (EasyQA – Observer / Inspector) 음성 미들웨어 중 음성 합성 외국어 튜닝 및 다국적 원격교육 한국어 음절, 음소의 음성 특성을 분석한 인공지능 음성 라벨링 기준 확립 화자 발화 립모션 영상의 음성 라벨링 작업 (50,242영상, 인공지능 비쥬얼 인식 및 멀티 모달용) 인공지능 스피커, 음성합성 오디오 데이터 가공 작업 |
2022 |
2023 녹취록 음성 데이터 화자별 분리 편집 가공 작업 통신사 영상 합성음성 데이터 구축을 위한 오디오 데이터 가공 작업 멀티모달 영상, 음성 데이터 편집 및 검수 프로그램 서비스 개시 (EasyQA - Vision) 영상대화 기반 AI튜터링 데이터 구축 작업(편집, 발음전사, 어노테이션) - 2022년 데이터바우처 지원사업 유튜브 영상 음성 전처리 가공 작업(화자별, 특성구간별 분리편집, 복합발성구간 테깅) |
2023 |
안면 영상 및 음성 동기화 프로젝트 낙상 감지 관련 오디오 구간 편집 프로젝트 응급/비상 상황 관련된 소리 수집 프로젝트 (사람, 물체) 외국인 한국어 발음평가 모델 개발 데이터셋(어절, 음절, 음소 단위 평가) 구축 녹취록 음성 데이터 화자별 분리 편집 가공 작업 프로젝트 (복합화자 발성 오디오 분리 편집) |
2024 |
한국어 발음평가 모델 개발 데이터셋 구축_2차 로봇시나리오 다양화를 위한 화자음성분리용 다채널 학습데이터 수집(600시간, 250명) 다화자-다감정 영어 음성 발화데이터 구축(5가지 감정, 100명, 130,000문장, 성우/원어민) 표준 자연어데이터셋 음성구축 총 (100명 122,525단어) 표준 자연어데이터셋 음성구축_성우 (42,080단어) 음성호출 데이터셋 구축 사업 (950명) |
프리먼이 함께한 프로젝트를 살펴 보세요.

음성 합성용 다화자 녹음 데이터
데이터량: 10,000,000문장(4300명)
데이터 종류: 오디오, 스크립트
대용량 음성합성 데이터를 구축하기 위해 다양성과 일관성 있는 음성 데이터를 문장별, 화자별 데이터를 제공하는 프로젝트입니다.
데이터 가공을 위해 전문 매니저와 크라우드소싱 기반의 라벨러로 구성하여 특정 기간 동안 안정적으로 데이터를 제공하였습니다.

영상대화 기반 AI 튜터링 오디오 데이터
데이터량: 33,265문장
데이터 종류: 오디오, 발음 전사, 형태소 분석
영상 속 아동 음성 데이터만을 추출하여 오디오 분리, 표준전사, 발음전사, 형태소 분석의 품사 태그까지 제공하는 프로젝트입니다.
부정확한 아동 발음을 판단하고, 전사하는 작업은 어려운 작업이라 소수의 엄선된 전문 작업자로 구성하여 오류 없는 데이터를 제공하였습니다.

유튜브 영상의 음성 데이터
데이터량: 150시간(541개 영상)
데이터 종류: 오디오, 화자 분리, 발성 구간 라벨링
유튜브 영상의 데이터를 이용하여 다화자의 발성 구간, 발화 겹침 구간을 분리하고 편집하여 데이터를 제공하는 프로젝트입니다.
영상에서 최대 22명의 화자가 발성하고 음절 기준으로 발화 겹침 화자를 라벨링하는 고난이도 작업입니다.
장시간의 오디오 청취능력과 화자분리 능력을 갖춘 전문작업자로 구성하여 멀티모달에 사용되는 오디오, 화자 라벨링 데이터를 제공하였습니다.

인공지능 스피커, 음성합성 오디오 데이터
데이터량: 61,500문장
데이터 종류: 오디오, 음소단위 라벨링, 발음전사
전문 성우가 녹음한 오디오 데이터를 문장 단위로 분리하고 음소 단위 라벨링과 발음 전사까지 제공하는 프로젝트입니다.
음절, 음소 단위 라벨링은 음성 스펙트럼뷰를 보고 판단할 수 있는 고도로 숙련된 작업자가 필요합니다. 프리먼은 음성분석 노하우와 경험을 바탕으로 인공지능 음성합성 데이터를 제공하였습니다.

특정 환경 소음 녹음 데이터
데이터량: 50시간(50개 현장)
데이터 종류: 오디오
특정 현장의 음성인식 키오스크용 환경 노이즈 수집 데이터를 제공하는 프로젝트입니다.
지정된 공간에서 소음 데이터를 수집하는 일은 쉬운 일이 아닙니다. 장소 섭외와 특정 지을 수 있는 사람 목소리가 포함되지 않아야 합니다. 오디오 데이터의 전 구간 검수를 통해 양질의 데이터를 제공하였습니다.

모바일 음성인식 호출 데이터
데이터량: 3,576,000단어
데이터 종류: 거리별 싱크 오디오
모바일 또는 산업기기의 새로운 호출 엔진 개발에서 다양한 거리에서도 음성을 잘 인식할 수 있도록 데이터를 구축하는 프로젝트입니다.
특히, 인공지능을 활용한 음성인식 기능의 성능을 향상시키고자 음성 데이터를 편집, 싱크 맞춤, 노이즈 제거, 검수 그리고 인공지능 학습 데이터를 구축하여 제공하였습니다.

오디오북 음성 데이터
데이터량: 4시간(5권)
데이터 종류: 오디오
녹음된 음성 데이터를 오디오북 구성에 맞게 편집, 검수, 노이즈 제거, 챕터/문단 분리, 무음 구간 확보 등 완성도 높은 데이터를 구축하는 프로젝트입니다. 오디오북은 책에 소리를 더하는 작업입니다. 완성도 높은 오디오 북 편집은 뛰어난 스킬과 깊은 노하우가 데이터의 성능을 좌우합니다. 데이터 구축을 위해 프로세스의 자동화와 누락 방지용 검수 시스템을 적용하여 완성도 높은 오디오 북 데이터를 제공하였습니다.

립모션 영상의 발성 라벨링 데이터
데이터량: 50,242영상
데이터 종류: 오디오, 발성구간 라벨링
영상 속 사람의 입 모양과 실제 발성 음성의 타임 테이블 데이터를 구축하기 위한 프로젝트입니다.
가상 공간에서 이루어지는 모션과 음성의 자연스러움을 위한 데이터 작업으로 영상 속 음성 추출과 오디오 편집, 라벨링, 검수를 통해 인공지능 데이터를 제공하였습니다.

음원 비트 라벨링 데이터
데이터량 : 159,030라벨
데이터 종류: 오디오, 시간축에 정렬된 라벨링
음원 비트 라벨링은 오디오의 박자와 리듬 구조를 정밀하게 재현하기 위한 데이터 가공 프로젝트입니다. 음원의 박자 구조에 따라 각 비트를 정확히 식별하고, 시간 축에 정렬된 라벨을 부여하는 작업으로서 반복 음원 청취와 검수로 정확도 높은 라벨 데이터를 제공하였습니다.

지시•명령 발화 중심 다화자 음성 데이터
데이터량: 100시간 이상
데이터 종류: 오디오
지시•명령 발화 중심 다화자 음성 데이터 구축은 관련 지식에 관한 교육•훈련용 음성 설명 데이터 수집 프로젝트입니다. 다양한 연령과 성별을 가진 화자들이 시나리오•상황 시뮬레이터 등 교육 및 훈련 상황에서 사용되는 명령형 문장을 발화하도록 설계된 스크립트 기반으로 데이터를 수집하였습니다.
발화문, 화자 정보 등을 세분화하여 오인식 가능 구간과 불완전 발화를 반복 검수함으로써, 실제 교육 및 훈련
환경을 충실히 반영하는 고품질 지시•명령 다화자 음성 데이터를 제공하였습니다.
다채널 마이크 어레이 기반 단일 화자 수음 데이터
데이터량: 489,430문장
데이터 종류: 오디오
공간 음향 정보를 활용한 고정밀 음성 인식•원음 추출
및 서비스 시나리오 다양화를 향상시키기 위한 프로젝트입니다.
각각의 성별•연령별로 4개로 구성된 마이크로 화자가
다양한 각도에서 발화하도록 설계된 환경에서 각 채널별로 동기화된 다채널 음성 데이터를 수집하였습니다. 수집된 데이터는 채널 정보 및 각도 정보를 세분화하여
메타데이터로 함께 라벨링하고, 채널 간 레벨 이상 여부와 오발성을 검수함으로서 다채널 처리 학습에 적합한 구조화된 단일 화자 수음 데이터를 제공하였습니다.
다채널 마이크 어레이 기반 마우스 시뮬레이터
스피커 녹음
데이터량: 46.2시간
데이터 종류: 오디오
다채널 마이크 어레이와 실제 사람의 발성과 흡사한 시뮬레이터 스피커를 활용해 음성 분리 기술과 서비스 시나리오 다양화를 위한 데이터 구축 프로젝트입니다. 지정된 공간에서 소음을 재생하고, 서로 다른 각도에 각 2조1세트, 3조1세트 세팅 스피커를 각도마다 배치해 한국어•영어 버전의 발화 데이터를 동시 수음을 진행하여 방향•거리 조건이 다른 음성을 한 번에 수집했습니다. 이를 통해 다각도 음장 정보가 포함된 AI 음성 분리용 학습 데이터를 제공하였습니다.

상황별 다국어 화자 녹음
데이터량: 75,495문장
데이터 종류: 오디오
글로벌 AI 음성 인식 및 합성 모델의 성능을 고도화하기 위한 프로젝트입니다.
15개국 언어를 대상으로 성별•연령대•지역•억양을
세분화한 화자 풀을 설계하고, 각 그룹에 일상생활에 기반한 스크립트를 제공하여 언어별로 발화를 수집하였습니다. 연령대와 각 지역의 억양을 고려하며 다국어 화자
음성 데이터를 제공하였습니다.(가안)
COMPANY
업체명 프리먼 | 대표자명 이세민
사업자등록번호 762-42-00563 |
연락처 070-7718-7378 |
이메일 contact@premandata.com
주소 서울 강남구 선릉로93길 54, 6층
프리먼 데이터의 소식 보기
페이지 바로가기