MacWhisper는 내가 기다려온 무료 전사 소프트웨어입니다.

오디오 파일을 서면 텍스트 파일로 변환하는 Mac 소프트웨어를 찾고 계십니까? Otter.ai 및 Trint와 같이 너무 많이 사용하기 시작하면 실제 비용이 들 수 있는 유료 도구가 많이 있습니다. 하지만 맥위스퍼 인터넷이 기다려온 무료 솔루션입니다. 아니면 적어도 내가 기다려온 것.

OpenAI는 2022년 XNUMX월에 기술에 정통한 사람들이 오디오 및 비디오 파일을 매우 정확한 대본으로 변환할 수 있는 매우 강력한 무료 프로그램을 출시했습니다. 문제는 터미널 앱에서 명령을 사용하는 데 익숙해져야 했기 때문에 일반 사용자가 쉽게 접근할 수 없다는 점이었습니다.

그러나 MacWhisper는 9to5Mac, 누군가 마침내 OpenAI의 Whisper 위에 구축된 GUI 또는 그래픽 사용자 인터페이스를 개발했으며 모든 혼란스러운 기술 항목을 후드 아래에 남겨두고 오디오 파일을 끌어다 놓고 매우 빠르게 전사를 얻을 수 있습니다. 그리고 MacWhisper는 OpenAI의 Whisper가 680,000 시간 웹상의 오디오 데이터.

MacWhisper의 좋은 점 중 하나는 녹음하려는 오디오 또는 비디오 파일을 인터넷에 업로드하지 않는다는 것입니다. 이는 민감한 기사를 다루는 저널리스트나 개인 파일을 클라우드에 업로드하는 것을 일반적으로 경계하는 모든 사람에게 중요합니다. 파일은 바탕 화면에 남아 있으므로 다른 사람이 오디오를 가로챌 가능성이 없습니다.

다시 말하지만, MacWhisper는 작년 말에 OpenAI에서 소개한 무료 프로그램의 새로운 사용자 인터페이스일 뿐이지만 실제로는 거의 모든 사람이 오디오 전사를 쉽게 만들 수 있습니다. 저는 Whisper를 사용해 왔으며 그것이 출시된 이후로 매우 유용하다는 것을 알았기 때문입니다. 그리고 이제는 MacWhsiper를 사용하게 될 것입니다. 작업 속도를 확실히 높일 수 있기 때문입니다.

한 가지 예를 들면, 암호화폐 회사 FTX의 붕괴 소식 이후 저는 Whisper를 사용하여 회사 창립자 Sam Bankman-Fried와의 수십 시간 분량의 오래된 YouTube 인터뷰를 기록했습니다. 거기에서 저는 성적표를 검색하고 기사 작성에 대한 이상하고 흥미로운 아이디어를 찾을 수 있었습니다. 예를 들어 SBF는 2021년 XNUMX월에 블록체인은 Enron을 고쳤을 것입니다.. SBF와 Enron의 비교는 FTX가 어떻게 붕괴했는지에 대해 현재 우리가 알고 있는 모든 것을 고려할 때 이상한 우연의 일치였습니다. 하지만 검색할 수 있는 수십 개의 녹취록이 없었다면 오래된 모호한 인터뷰에서 그 순간을 결코 발견하지 못했을 것입니다. 그리고 그 과정은 몇 시간 동안 테이프를 듣는 것보다 쉬웠지만 여전히 투박하고 자동화되지 않았습니다.

내 컴퓨터에 Whisper를 설치한 후 파일을 복사하고 싶을 때마다 Mac의 터미널 앱에 "whisper audiofilename.mp3 —model tiny.en"을 입력했습니다. WhisperMac을 사용하면 오디오 파일을 드래그 앤 드롭하기만 하면 추가 입력 없이 마법처럼 작동합니다.

YouTube에서 다운로드한 NBC Nightly News 에피소드로 MacWhisper를 테스트했습니다. 그리고 "windchills"라는 단어를 "windshills"로 해석하고 Lester Holt를 "Lester Hold"로 듣는 것과 같은 몇 가지 오류를 제외하고는 녹취록이 매우 정확했습니다. MacWhisper는 무료이지만 OpenAI의 보다 집중적인 교육 모델을 사용하기 때문에 약간 더 정확할 수 있는 소프트웨어의 유료 계층이 있지만 무료 버전은 대부분의 사람들에게 적합합니다.

MacWhisper를 사용하면 일반 텍스트, CSV 또는 SRT 및 VTT와 같은 자막 파일 형식을 포함하여 몇 가지 다른 형식으로 전사된 단어를 내보낼 수 있습니다.

그리고 MacWhisper는 영어만을 위한 것이 아닙니다. 100가지 언어로 오디오를 전사할 수 있어 매우 편리합니다. MacWhisper에 없는 유일한 기능은 터미널 앱의 Whisper에서 즐겨 사용했던 기능으로 언어 번역입니다. 저는 러시아어와 중국어로 바이럴 비디오를 번역했으며 트위터에서 해당 언어를 사용하는 사람들로부터 번역이 훌륭하다는 말을 들었습니다. 정확한.

MacWhisper에 없는 다른 기능은 OpenAI의 Whisper에서도 사용할 수 없지만 화자를 구별하는 기능입니다. 예를 들어 두 명의 화자와의 인터뷰를 기록하는 경우 한 화자가 중지되고 다른 화자가 시작되었음을 나타내는 명확한 표시가 없습니다. 그러나 나는 누군가가 결국 그 능력을 구축할 것이라고 생각합니다. Trint와 같은 유료 서비스는 이 작업을 자동으로 수행하며 궁극적으로 무료로 제공되는 것이 좋지만 지불한 만큼 얻게 됩니다.

또한 MacWhisper에는 컴퓨터 마이크의 음성을 텍스트로 변환할 수 있는 기능이 있어 즉석에서 무언가를 기록하려는 경우 편리할 수 있습니다.

나는 몇 달 동안 누군가 Whisper용 GUI를 마침내 개발할지 궁금해했습니다. 소수의 사람들이 시도했지만 매우 사용자 친화적인 것을 만들지 않았기 때문입니다. 그러나 Jordi Bruin이 개발한 MacWhisper는 제가 기다려온 소프트웨어입니다. Bruin은 다음과 같은 소프트웨어도 개발했습니다. 맥GPT, 사용자가 메뉴 모음에서 ChatGPT에 액세스할 수 있습니다.

MacWhisper를 다운로드할 수 있습니다. 무료로, 이메일 등록, Bruin의 웹사이트에서.

출처: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/