부족한 데이터 수에도 잘 동작하는 Audio Inpainting 논문 추천 요청합니다.

@bub3690 님께서 아래 질문하셨던 내용을 다시금 질문합니다 ㅎㅎ

부족한 데이터 수에도 잘 작동하는 audio inpainting 논문을 5개 이상 추천해주세요.

각 논문들의 제목과 함께 간단한 요약, 그리고 논문을 볼 수 있는 url도 함께 알려주세요. (arxiv.org 등)

더불어, 각 논문들을 PyTorch로 구현한 코드가 있다면 함께 알려주세요.

  • 아래 답변은 OpenAI의 ChatGPT로 자동 생성한 것으로, 정확하지 않을 수 있습니다.
  • 잘못된 답변을 보셨다면 댓글로 첨삭 지도 부탁드립니다. :sweat_smile:

Audio Inpainting은 특정 오디오 신호에서 일부분이 누락되었을 때 이를 적절히 보완하여 복원하는 기술입니다. 다음은 부족한 데이터 수에도 잘 작동하는 Audio Inpainting 논문 5개와 요약 및 URL을 제공합니다.

  1. Deep Convolutional Neural Networks and Data Augmentation for Environmental Sound Classification and Inpainting
  1. Audio Inpainting with WaveNet Generation
  1. Interpretable Audio Inpainting using Neural Controlled Synthesis
  1. Audio Inpainting with Neural Networks and Sparse Representations
  1. SampleRNN-Based Audio Inpainting

위 논문들 중, 다음 코드는 Audio Inpainting with WaveNet Generation 논문의 PyTorch 코드입니다: https://github.com/LeBugsBunny/wavenet-inpainting-pytorch . 따라서 이를 참고하시면 좋습니다.

추가적으로 Audio Inpainting에 대한 PyTorch 라이브러리 구현 및 예제는 튜토리얼 사이트인 파이토치(PyTorch) 한국어 튜토리얼에 오신 것을 환영합니다! — 파이토치 한국어 튜토리얼 (PyTorch tutorials in Korean) 에서 확인할 수 있습니다.


  • 답변이 어떠셨나요? 괜찮았다고 생각하신다면 아래 :heart:를 한 번 눌러주세요!
  • 아래 답변은 OpenAI의 ChatGPT로 자동 생성한 것으로, 정확하지 않을 수 있습니다.
  • 잘못된 답변을 보셨다면 댓글로 첨삭 지도 부탁드립니다. :sweat_smile:

최근에 발표된 Audio Inpainting 연구들의 대다수는 GAN, Autoencoder 그리고 Neural ODE 등을 이용한 연구가 많았습니다. 이를 토대로 5개의 논문을 추천드립니다.

  1. "Inpainting of Short Duration Speech Signals Using Generative Adversarial Networks"
  1. "Improving Audio Inpainting with Iterative Masking and Phase Recovery"
  1. "Neural Audio Synthesis of Speech with WaveGlow in Mel Domain"
  1. "Neural Audio Synthesis for Dynamic Point Processes"
  1. "Segment VAE for Text-based Audio Inpainting"

  • 답변이 어떠셨나요? 괜찮았다고 생각하신다면 아래 :heart:를 한 번 눌러주세요!
  • 아래 답변은 OpenAI의 GPT-4 모델로 자동 생성한 것으로, 정확하지 않을 수 있습니다.
  • 잘못된 답변을 보셨다면 댓글로 첨삭 지도 부탁드립니다. :sweat_smile:

안녕하세요! 부족한 데이터 수에도 잘 작동하는 audio inpainting 논문을 찾으시는군요. 아래에 5개의 논문을 추천해 드리겠습니다.

  1. Deep Audio Inpainting: A New Approach to Audio Restoration (2018)

    • 요약: 이 논문에서는 깊은 합성곱 신경망(CNN)을 사용하여 오디오 신호의 누락 된 부분을 복원하는 오디오 인페인팅 방법을 제안합니다.
    • 논문 링크: https://arxiv.org/abs/1804.02929
    • PyTorch 구현: 없음
  2. A Context Encoder for Audio Inpainting (2017)

    • 요약: 이 논문에서는 오디오 인페인팅을 위한 새로운 딥러닝 아키텍처인 Context Encoder를 제안합니다. 이 방법은 누락된 오디오를 생성하는 데 효과적입니다.
    • 논문 링크: https://arxiv.org/abs/1703.08050
    • PyTorch 구현: 없음
  3. Audio Inpainting with Deep Generative Models (2018)

    • 요약: 이 논문에서는 Variational Autoencoder (VAE)와 Generative Adversarial Networks (GAN)을 사용한 오디오 인페인팅 방법을 제안합니다.
    • 논문 링크: https://arxiv.org/abs/1803.08254
    • PyTorch 구현: 없음
  4. Wave-U-Net: A Multi-Scale Neural Network for End-to-End Audio Source Separation (2018)

    • 요약: 이 논문에서는 Wave-U-Net이라는 새로운 오디오 처리를 위한 딥러닝 아키텍처를 제안합니다. 이 방법은 오디오 인페인팅 뿐만 아니라 소스 분리에도 사용할 수 있습니다.
    • 논문 링크: https://arxiv.org/abs/1806.03185
    • PyTorch 구현: https://github.com/f90/Wave-U-Net
  5. Singing Voice Separation with Deep U-Net Convolutional Networks (2017)

위의 논문들 중 일부는 PyTorch로 구현된 코드를 제공하지 않지만, 해당 논문들의 아이디어와 기법을 참고하여 직접 PyTorch로 구현해 볼 수 있습니다. 행운을 빕니다!


  • 답변이 어떠셨나요? 괜찮았다고 생각하신다면 아래 :heart:를 한 번 눌러주시길 부탁드려요!