부족한 데이터 수에도 잘 동작하는 Audio Inpainting 논문 추천 요청합니다.

@bub3690 님께서 아래 질문하셨던 내용을 다시금 질문합니다 ㅎㅎ

부족한 데이터 수에도 잘 작동하는 audio inpainting 논문을 5개 이상 추천해주세요.

각 논문들의 제목과 함께 간단한 요약, 그리고 논문을 볼 수 있는 url도 함께 알려주세요. (arxiv.org 등)

더불어, 각 논문들을 PyTorch로 구현한 코드가 있다면 함께 알려주세요.

  • 아래 답변은 OpenAI의 ChatGPT로 자동 생성한 것으로, 정확하지 않을 수 있습니다.
  • 잘못된 답변을 보셨다면 댓글로 첨삭 지도 부탁드립니다. :sweat_smile:

Audio Inpainting은 특정 오디오 신호에서 일부분이 누락되었을 때 이를 적절히 보완하여 복원하는 기술입니다. 다음은 부족한 데이터 수에도 잘 작동하는 Audio Inpainting 논문 5개와 요약 및 URL을 제공합니다.

  1. Deep Convolutional Neural Networks and Data Augmentation for Environmental Sound Classification and Inpainting
  1. Audio Inpainting with WaveNet Generation
  1. Interpretable Audio Inpainting using Neural Controlled Synthesis
  1. Audio Inpainting with Neural Networks and Sparse Representations
  1. SampleRNN-Based Audio Inpainting

위 논문들 중, 다음 코드는 Audio Inpainting with WaveNet Generation 논문의 PyTorch 코드입니다: https://github.com/LeBugsBunny/wavenet-inpainting-pytorch . 따라서 이를 참고하시면 좋습니다.

추가적으로 Audio Inpainting에 대한 PyTorch 라이브러리 구현 및 예제는 튜토리얼 사이트인 파이토치(PyTorch) 한국어 튜토리얼에 오신 것을 환영합니다! — 파이토치 한국어 튜토리얼 (PyTorch tutorials in Korean) 에서 확인할 수 있습니다.


  • 답변이 어떠셨나요? 괜찮았다고 생각하신다면 아래 :heart:를 한 번 눌러주세요!
  • 아래 답변은 OpenAI의 ChatGPT로 자동 생성한 것으로, 정확하지 않을 수 있습니다.
  • 잘못된 답변을 보셨다면 댓글로 첨삭 지도 부탁드립니다. :sweat_smile:

최근에 발표된 Audio Inpainting 연구들의 대다수는 GAN, Autoencoder 그리고 Neural ODE 등을 이용한 연구가 많았습니다. 이를 토대로 5개의 논문을 추천드립니다.

  1. "Inpainting of Short Duration Speech Signals Using Generative Adversarial Networks"
  1. "Improving Audio Inpainting with Iterative Masking and Phase Recovery"
  1. "Neural Audio Synthesis of Speech with WaveGlow in Mel Domain"
  1. "Neural Audio Synthesis for Dynamic Point Processes"
  1. "Segment VAE for Text-based Audio Inpainting"

  • 답변이 어떠셨나요? 괜찮았다고 생각하신다면 아래 :heart:를 한 번 눌러주세요!