Whisper를 써봤다...
Written by
Keith
on
on
분량이 매우 긴 회의인데 참여하진 못하고 recording만 있길래 다 볼 생각도 없고 해서 그냥 whisper로 내용만 긁어다가 요약해서 확인했다.
물론 모임에 참여하는 시간만큼 whisper setting하고 음성 뜯어내기를 했는데, 한 두 번 해보고 자동화시키면 다음부터는 시간이 크게 절약 될 거라 이렇게 해본 거다.
base 모델이 빠르긴 한데 놓치는 내용이 굉장히 많고 medium도 제법 내용이 왜곡되게 나타난다. 어쩔 수 없이 시간과 에너지가 많이 들더라도 large-v2 모델을 쓰게 된다.
개인적으로 녹음한 내용도 스크립트로 바꿔봤는데 내가 받아적거나 하는 것 보단 훨씬 결과가 빠르고 정확하게 나온다.
편하게 생각하고 떠든 이야기를 transcribe를 해보면 뭐랄까 나란 사람의 사고 행태, 언어 구사 능력, 말하려는 주제에 얼마나 충실하게 머물고 있는지 등등이 한눈에 다 드러난다. 수준이 내가 생각했던 것보다 꽤나 처참하다.
녹음하거나 녹화해서 보는 것도 의미가 있지만 transcribe해서 보는 것도 의미가 있는 것 같다.