프리먼은
음성 데이터 편집 및 검수 기술로 고품질의 데이터를 만들어
인공지능 생태계가 발전하고 더 나은 삶을 만들어 가는데 기여 합니다

음성 데이터 편집 및 검수 기술로 고품질의 데이터를 만들어
인공지능 생태계가 발전하고 더 나은 삶을 만들어 가는데 기여 합니다
프리먼은음성 데이터 편집 및 검수 기술로 고품질의 데이터를 만들어 인공지능 생태계가 발전하고 더 나은 삶을 만들어 가는데 기여 합니다 | ![]() |
프리먼이 가지고 있는 기술과
고객 맞춤형 서비스 제공
고객의 요구 품질을 넘어 그 이상의 기준을
제시합니다. 더 높은 품질 목표를 세우고 실행하여
고객을 만족시키고 프로젝트를 성공으로 이끌어냅니다.
새로운 기준을 제시하는 파트너
AI 음성데이터 구축에 집중하여 전문성을 갖추고
노하우와 경험을 바탕으로 고객이 필요로 하는
고품질의 데이터를 만드는 기술력을 확보합니다.
전문성과 기술력을 겸비한
음성데이터 구축을 위한 소프트웨어를 자체 개발하여
대량 작업 시 발행하는 문제점들을 극복하고
품질의 균일성과 작업 효율성을 높입니다.
프로젝트를 이끄는 소프트웨어 파워
프리먼이 가지고 있는 기술과
고객 맞춤형 서비스 제공
고객의 요구 품질을 넘어 그 이상의 기준을 제시합니다.
더 높은 품질 목표를 세우고 실행하여 고객을 만족시키고
프로젝트를 성공으로 이끌어냅니다.
새로운 기준을 제시하는 파트너
AI 음성데이터 구축에 집중하여 전문성을 갖추고
노하우와 경험을 바탕으로 고객이 필요로 하는
고품질의 데이터를 만드는 기술력을 확보합니다.
전문성과 기술력을 겸비한
음성데이터 구축을 위한 소프트웨어를 자체 개발하여
대량 작업 시 발행하는 문제점들을 극복하고
품질의 균일성과 작업 효율성을 높입니다.
프로젝트를 이끄는 소프트웨어 파워
서비스 실적
2020 |
인공지능 스피커, 음성 합성 오디오 데이터 가공 작업 인공지능 음성 데이터 가공 작업 프로그램 서비스 개시 (EasyQA – Labelling Software System) 인공지능 활용을 위한 음성 인식용 코퍼스 데이터 수집 작업 (130카테고리, 18,000문장, 크라우드 소싱 방식) 크라우드 소싱 활용 텍스트 수집 플랫폼 제작 인공지능 활용 특수 현장 노이즈 녹음 작업 (50개소, 총 50시간) 음성 합성 데이터 가공 전용 프로그램 제작 2020년 6월 프리먼 설립 |
2021 |
모바일 음성 호출 키워드 데이터 편집 및 검수 (61,500 단어) 음성 합성용 음성 데이터 편집 및 검수 (10,000,000문장, 4300명 화자 ) 콜센터 상담원 음성 합성 오디오 데이터 가공 작업 모바일 제조사 음성인식 모듈 신규 호출 엔진DB 음원 편집 작업 (3,576,000단어, 거리별(3m/1m/30cm) 통합 데이터) 인공지능 학습용 대용량 음원 데이터 편집 및 검수 프로그램 서비스 개시 (EasyQA – Observer / Inspector) 음성 미들웨어 중 음성 합성 외국어 튜닝 및 다국적 원격교육 한국어 음절, 음소의 음성 특성을 분석한 인공지능 음성 라벨링 기준 확립 화자 발화 립모션 영상의 음성 라벨링 작업 (50,242영상, 인공지능 비쥬얼 인식 및 멀티 모달용) 인공지능 스피커, 음성합성 오디오 데이터 가공 작업 |
2022 |
2023 녹취록 음성 데이터 화자별 분리 편집 가공 작업 통신사 영상 합성음성 데이터 구축을 위한 오디오 데이터 가공 작업 멀티모달 영상, 음성 데이터 편집 및 검수 프로그램 서비스 개시 (EasyQA - Vision) 영상대화 기반 AI튜터링 데이터 구축 작업(편집, 발음전사, 어노테이션) - 2022년 데이터바우처 지원사업 유튜브 영상 음성 전처리 가공 작업(화자별, 특성구간별 분리편집, 복합발성구간 테깅) |
2023 |
안면 영상 및 음성 동기화 프로젝트 낙상 감지 관련 오디오 구간 편집 프로젝트 응급/비상 상황 관련된 소리 수집 프로젝트 (사람, 물체) 외국인 한국어 발음평가 모델 개발 데이터셋(어절, 음절, 음소 단위 평가) 구축 녹취록 음성 데이터 화자별 분리 편집 가공 작업 프로젝트 (복합화자 발성 오디오 분리 편집) |
2024 |
한국어 발음평가 모델 개발 데이터셋 구축_2차 로봇시나리오 다양화를 위한 화자음성분리용 다채널 학습데이터 수집(600시간, 250명) 다화자-다감정 영어 음성 발화데이터 구축(5가지 감정, 100명, 130,000문장, 성우/원어민) 표준 자연어데이터셋 음성구축 총 (100명 122,525단어) 표준 자연어데이터셋 음성구축_성우 (42,080단어) 음성호출 데이터셋 구축 사업 (950명) |
2020 |
인공지능 스피커, 음성 합성 오디오 데이터 가공 작업 인공지능 음성 데이터 가공 작업 프로그램 서비스 개시 (EasyQA – Labelling Software System) 인공지능 활용을 위한 음성 인식용 코퍼스 데이터 수집 작업 (130카테고리, 18,000문장, 크라우드 소싱 방식) 크라우드 소싱 활용 텍스트 수집 플랫폼 제작 인공지능 활용 특수 현장 노이즈 녹음 작업 (50개소, 총 50시간) 음성 합성 데이터 가공 전용 프로그램 제작 2020년 6월 프리먼 설립 |
2021 |
모바일 음성 호출 키워드 데이터 편집 및 검수 (61,500 단어) 음성 합성용 음성 데이터 편집 및 검수 (10,000,000문장, 4300명 화자 ) 콜센터 상담원 음성 합성 오디오 데이터 가공 작업 모바일 제조사 음성인식 모듈 신규 호출 엔진DB 음원 편집 작업 (3,576,000단어, 거리별(3m/1m/30cm) 통합 데이터) 인공지능 학습용 대용량 음원 데이터 편집 및 검수 프로그램 서비스 개시 (EasyQA – Observer / Inspector) 음성 미들웨어 중 음성 합성 외국어 튜닝 및 다국적 원격교육 한국어 음절, 음소의 음성 특성을 분석한 인공지능 음성 라벨링 기준 확립 화자 발화 립모션 영상의 음성 라벨링 작업 (50,242영상, 인공지능 비쥬얼 인식 및 멀티 모달용) 인공지능 스피커, 음성합성 오디오 데이터 가공 작업 |
2022 |
2023 녹취록 음성 데이터 화자별 분리 편집 가공 작업 통신사 영상 합성음성 데이터 구축을 위한 오디오 데이터 가공 작업 멀티모달 영상, 음성 데이터 편집 및 검수 프로그램 서비스 개시 (EasyQA - Vision) 영상대화 기반 AI튜터링 데이터 구축 작업(편집, 발음전사, 어노테이션) - 2022년 데이터바우처 지원사업 유튜브 영상 음성 전처리 가공 작업(화자별, 특성구간별 분리편집, 복합발성구간 테깅) |
2023 |
안면 영상 및 음성 동기화 프로젝트 낙상 감지 관련 오디오 구간 편집 프로젝트 응급/비상 상황 관련된 소리 수집 프로젝트 (사람, 물체) 외국인 한국어 발음평가 모델 개발 데이터셋(어절, 음절, 음소 단위 평가) 구축 녹취록 음성 데이터 화자별 분리 편집 가공 작업 프로젝트 (복합화자 발성 오디오 분리 편집) |
2024 |
한국어 발음평가 모델 개발 데이터셋 구축_2차 로봇시나리오 다양화를 위한 화자음성분리용 다채널 학습데이터 수집(600시간, 250명) 다화자-다감정 영어 음성 발화데이터 구축(5가지 감정, 100명, 130,000문장, 성우/원어민) 표준 자연어데이터셋 음성구축 총 (100명 122,525단어) 표준 자연어데이터셋 음성구축_성우 (42,080단어) 음성호출 데이터셋 구축 사업 (950명) |
프리먼이 함께한 프로젝트를 살펴 보세요.
음성 합성용 다화자 녹음 데이터
데이터량: 10,000,000문장(4300명)
데이터 종류: 오디오, 스크립트
대용량 음성합성 데이터를 구축하기 위해 다양성과 일관성 있는 음성 데이터를 문장별, 화자별 데이터를 제공하는 프로젝트입니다.
데이터 가공을 위해 전문 매니저와 크라우드소싱 기반의 라벨러로 구성하여 특정 기간 동안 안정적으로 데이터를 제공하였습니다.
영상대화 기반 AI 튜터링 오디오 데이터
데이터량: 33,265문장
데이터 종류: 오디오, 발음 전사, 형태소 분석
영상 속 아동 음성 데이터만을 추출하여 오디오 분리, 표준전사, 발음전사, 형태소 분석의 품사 태그까지 제공하는 프로젝트입니다.
부정확한 아동 발음을 판단하고, 전사하는 작업은 어려운 작업이라 소수의 엄선된 전문 작업자로 구성하여 오류 없는 데이터를 제공하였습니다.
유튜브 영상의 음성 데이터
데이터량: 150시간(541개 영상)
데이터 종류: 오디오, 화자 분리, 발성 구간 라벨링
유튜브 영상의 데이터를 이용하여 다화자의 발성 구간, 발화 겹침 구간을 분리하고 편집하여 데이터를 제공하는 프로젝트입니다.
영상에서 최대 22명의 화자가 발성하고 음절 기준으로 발화 겹침 화자를 라벨링하는 고난이도 작업입니다.
장시간의 오디오 청취능력과 화자분리 능력을 갖춘 전문작업자로 구성하여 멀티모달에 사용되는 오디오, 화자 라벨링 데이터를
제공하였습니다.
인공지능 스피커, 음성합성 오디오 데이터
데이터량: 61,500문장
데이터 종류: 오디오, 음소단위 라벨링, 발음전사
전문 성우가 녹음한 오디오 데이터를 문장 단위로 분리하고 음소 단위 라벨링과 발음 전사까지 제공하는 프로젝트입니다.
음절, 음소 단위 라벨링은 음성 스펙트럼뷰를 보고 판단할 수 있는 고도로 숙련된 작업자가 필요합니다. 프리먼은 음성분석 노하우와 경험을 바탕으로 인공지능 음성합성 데이터를 제공하였습니다.
특정 환경 소음 녹음 데이터
데이터량: 50시간(50개 현장)
데이터 종류: 오디오
특정 현장의 음성인식 키오스크용 환경 노이즈 수집 데이터를 제공하는 프로젝트입니다.
지정된 공간에서 소음 데이터를 수집하는 일은 쉬운 일이 아닙니다. 장소 섭외와 특정 지을 수 있는 사람 목소리가 포함되지 않아야 합니다. 오디오 데이터의 전 구간 검수를 통해 양질의 데이터를 제공하였습니다.
모바일 음성인식 호출 데이터
데이터량: 3,576,000단어
데이터 종류: 거리별 싱크 오디오
모바일 또는 산업기기의 새로운 호출 엔진 개발에서 다양한 거리에서도 음성을 잘 인식할 수 있도록 데이터를 구축하는 프로젝트입니다.
특히, 인공지능을 활용한 음성인식 기능의 성능을 향상시키고자 음성 데이터를 편집, 싱크 맞춤, 노이즈 제거, 검수 그리고 인공지능 학습 데이터를 구축하여 제공하였습니다.
오디오북 음성 데이터
데이터량: 4시간(5권)
데이터 종류: 오디오
녹음된 음성 데이터를 오디오북 구성에 맞게 편집, 검수, 노이즈 제거, 챕터/문단 분리, 무음 구간 확보 등 완성도 높은 데이터를 구축하는 프로젝트입니다. 오디오북은 책에 소리를 더하는 작업입니다. 완성도 높은 오디오 북 편집은 뛰어난 스킬과 깊은 노하우가 데이터의 성능을 좌우합니다. 데이터 구축을 위해 프로세스의 자동화와 누락 방지용 검수 시스템을 적용하여 완성도 높은 오디오 북 데이터를 제공하였습니다.
립모션 영상의 발성 라벨링 데이터
데이터량: 50,242영상
데이터 종류: 오디오, 발성구간 라벨링
영상 속 사람의 입 모양과 실제 발성 음성의 타임 테이블 데이터를 구축하기 위한 프로젝트입니다.
가상 공간에서 이루어지는 모션과 음성의 자연스러움을 위한 데이터 작업으로 영상 속 음성 추출과 오디오 편집, 라벨링, 검수를 통해 인공지능 데이터를 제공하였습니다.
COMPANY
업체명 프리먼 | 대표자명 이세민
사업자등록번호 762-42-00563 |
연락처 070-7718-7378 |
이메일 contact@premandata.com
주소 서울 강남구 선릉로93길 54, 6층
프리먼 데이터의 소식 보기
페이지 바로가기
COMPANY
업체명 프리먼 | 대표자명 이세민
사업자등록번호 762-42-00563 | 연락처 070-7718-7378 | 이메일 contact@premandata.com
주소 서울 강남구 선릉로93길 54, 6층
프리먼 데이터의 소식 보기
페이지 바로가기