녹음된 음성을 텍스트로 변환하는 프로그램?
2017.01.12 11:30
안녕하세요.
한글로 말하는 방송이나 MP3 녹음을 텍스트로 변환해주는 프로그램이 있는지 궁금합니다.
구글 클라우드 API 가 상당히 저렴해서 구글 API 를 이용하는 무료 프로그램이 있으면 좋겠는데
다른 회사 프로그램은 딱히 신뢰하기 어렵고 특히 한글 지원이 안되는 경우가 많아서
어느 걸 써야 할지 모르겠네요.
코멘트 10
-
생각난 김에 해봤습니다.
공기계 한 대에서 MP3 강좌를 재생하면서 다른 기기에서 메모장 열어서 키보드 마이크 작동 시키니까 입력 잘 되네요.^^
-
음.... 대량의 음성이라 실시간이라는 게 압박입니다만 무료라는게 좋네요.
가상머신을 한번에 여러개 돌려서 할 수 있으려나;
-
야호
01.12 22:46
제가 아는 건 주로 영어 Speech to text이긴 하지만 영어든 우리말이든 대부분 이쪽 계통의 제품들은 상용인 것으로 알고 있습니다. 이미 찾아 보셔서 아시겠지만 상용이 아닌 건 그 수준이 한참 떨아지는 것으로 알고 있고요.
현재의 발전 속도로 수년내엔 엄청 정확하면서도 저렴한 버전이 빨리 나오기를 바라는 1인이긴 합니다만 음성인식 쪽에 있는 친구들 이야기를 들으면 일반인들이 생각하는 것보다 발전 속도가 느리다고 하네요.
-
제이크스태덤
01.13 00:04
크롬 앱으로 voicenote 2 라는 게 있긴 합니다만...마이크로 들리는 걸 텍스트로 변환해주는 거라....
-
구글이나 시리 같은 것들 전부 성능이 괜찮은 수준입니다만 실시간이라는게 압박이더군요.
-
그린
01.14 12:17
speech to text앱 인식율이 좋은것이 나온다면 학습에 획기적인 변화가 있을텐데....녹음보다는 이런 dictation machine으로 필기를 대신할수있을텐데...인공지능이 나오는 세상에도 음식인식하여서 글자로 만들어주는 기술은 인공지능보다 발전이 더 느린것같습니다...
-
야호
01.17 02:43
좀 더 알아 보고 답장을 드리려고 했는데 요즘 일이 많아서 일단 답장을 드리고 추후에 좀 더 보완해보도록 하겠습니다. (언제 될지 모르겠습니다만.. 게다가 저의 지식도 일천해서요)
제가 아는 (영어 등의 언어 중에서) speech to text 프로그램 중에 가장 유명한 것은 Nuance라는 업체의 Dragon Naturally Speaking이라고 있습니다. 꽤 오래된 업체라서 누적 knowhow도 꽤 되고 오래 버틴 것을 보면 나름 구매가치가 있어서 버티지 않나 생각합니다. (저도 실험은 제대로 안 해 봤네요. 제 자료와 잘 안 맞는 것 같아서요. 혹시 실험해 보게 되면 나중에라도 말씀 드려보겠습니다).
iPhone의 경우엔 실험적인 차원의 한국어 앱도 있기는 한 것 같습니다 (http://whatsnext.nuance.com/connected-living/speaking-korean-with-dragon-dictation-search/). 그런데 이 외의 한국어 지원은 없지 않나 생각이 됩니다.
Google에서도 Youtube등에 자동으로 closed caption을 올려 주는 음성인식 정도는 돌리는 것 같기는 합니다만 정확성이 너무 많이 떨어지는 것 같더군요. 간단한 명령어나 문장을 인식하는 수준이 아닌 자연발화를 transcribe하는 건 아직 공짜로 풀리기엔 쉽지 않은 기술이라고 생각합니다.
우리말의 speech to text 쪽은 제가 잘 모르겠습니다만 좀 더 고수분들께서 답을 해 주실 수 있지 않을까 생각합니다. 저도 지인들에게도 문의해 보도록 하겠습니다.
-
음... Nuance 쪽은 알아보니 제가 바라는 PC 용 소프트웨어는 한국어 안되네요.
역시 UX 쪽은 맨날 한국이 가장 뒤쳐지는 듯 합니다.
-
야호
01.17 02:48
Dragon Naturally Speaking의 미래 등에 대한 논의가 여기에 있네요. 몇몇 관련 글이나 사용기도 살펴 보시면 어떨까 합니다.
문득 든 생각...^^
기계 한 대에서 음성출력하고 스마트폰 키보드의 마이크입력을 선택해도 되지 않을까요?^^