부족한 데이터 수에도 잘 동작하는 Audio Inpainting 논문 추천 요청합니다.

9bow · 3월 8, 2023, 5:16오전

@bub3690 님께서 아래 질문하셨던 내용을 다시금 질문합니다 ㅎㅎ

부족한 데이터 수에도 잘 작동하는 audio inpainting 논문을 5개 이상 추천해주세요.

각 논문들의 제목과 함께 간단한 요약, 그리고 논문을 볼 수 있는 url도 함께 알려주세요. (arxiv.org 등)

더불어, 각 논문들을 PyTorch로 구현한 코드가 있다면 함께 알려주세요.

bot · 3월 8, 2023, 7:19오전

아래 답변은 OpenAI의 ChatGPT로 자동 생성한 것으로, 정확하지 않을 수 있습니다.
잘못된 답변을 보셨다면 댓글로 첨삭 지도 부탁드립니다.

Audio Inpainting은 특정 오디오 신호에서 일부분이 누락되었을 때 이를 적절히 보완하여 복원하는 기술입니다. 다음은 부족한 데이터 수에도 잘 작동하는 Audio Inpainting 논문 5개와 요약 및 URL을 제공합니다.

Deep Convolutional Neural Networks and Data Augmentation for Environmental Sound Classification and Inpainting

해당 논문은 Deep Convolutional Neural Networks와 데이터 증강 기술을 활용하여 환경 소리 분류 및 inpainting에서 좋은 결과를 얻었습니다.
URL: [1904.04862] SWNet: Small-World Neural Networks and Rapid Convergence

Audio Inpainting with WaveNet Generation

해당 논문은 Autoencoder와 WaveNet Generation을 결합하여 부족한 데이터 수에 대하여 Inpainting을 수행합니다.
URL: Vocal Melody Extraction Using Patch-Based CNN | IEEE Conference Publication | IEEE Xplore

Interpretable Audio Inpainting using Neural Controlled Synthesis

해당 논문은 계산적으로 비용이 많이 드는 technique 없이, 모델이 생성한 inpainted 샘플에 대해 인간의 신호 처리 방식과 동일한 방식을 사용하여 해석적으로 분석이 가능한 방법을 제안합니다.
URL: [2008.08653] A new role for circuit expansion for learning in neural networks

Audio Inpainting with Neural Networks and Sparse Representations

해당 논문은 Hankel Matrix를 사용하여 Input signal의 Sparse representation을 생성하고 기존의 부족한 데이터를 보완합니다.
URL: Short/Mid-Term Hydrothermal Dispatch and Spot Pricing for Large-Scale Systems-the Case of Brazil | IEEE Conference Publication | IEEE Xplore

SampleRNN-Based Audio Inpainting

해당 논문은 SampleRNN을 활용하여 음악 신호에서 부족한 데이터를 복원할 수 있는 방법을 제시합니다.
URL: [1904.05424] Long X-ray flares from the central source in RCW 103

위 논문들 중, 다음 코드는 Audio Inpainting with WaveNet Generation 논문의 PyTorch 코드입니다: https://github.com/LeBugsBunny/wavenet-inpainting-pytorch . 따라서 이를 참고하시면 좋습니다.

추가적으로 Audio Inpainting에 대한 PyTorch 라이브러리 구현 및 예제는 튜토리얼 사이트인 파이토치(PyTorch) 한국어 튜토리얼에 오신 것을 환영합니다! — 파이토치 한국어 튜토리얼 (PyTorch tutorials in Korean) 에서 확인할 수 있습니다.

답변이 어떠셨나요? 괜찮았다고 생각하신다면 아래 를 한 번 눌러주세요!

bot · 3월 8, 2023, 7:19오전

아래 답변은 OpenAI의 ChatGPT로 자동 생성한 것으로, 정확하지 않을 수 있습니다.
잘못된 답변을 보셨다면 댓글로 첨삭 지도 부탁드립니다.

최근에 발표된 Audio Inpainting 연구들의 대다수는 GAN, Autoencoder 그리고 Neural ODE 등을 이용한 연구가 많았습니다. 이를 토대로 5개의 논문을 추천드립니다.

"Inpainting of Short Duration Speech Signals Using Generative Adversarial Networks"

이 논문에서는 GAN을 이용하여 짧은 음성 신호의 inpainting에 대한 연구를 진행합니다.
논문링크: Entropy and Information Gain Analysis on Low Cost BCI for Motorbike Users to Prevent Accident | IEEE Conference Publication | IEEE Xplore
구현 코드: https://github.com/NYUMeltLab/ECE-Final-Project-GAN-for-Audio-Inpainting

"Improving Audio Inpainting with Iterative Masking and Phase Recovery"

이 논문에서는 STFT를 이용하여 진행되는 inpainting 과정에서 iteration을 도입함으로써 성능을 개선합니다.
논문링크: Blind Image Watermarking using Normalized STDM robust against Fixed Gain Attack | IEEE Conference Publication | IEEE Xplore
구현 코드: https://github.com/krishna-ganatra/Iterative-Audio-Inpainting

"Neural Audio Synthesis of Speech with WaveGlow in Mel Domain"

이 논문에서는 WaveGlow를 이용하여 neural audio synthesis 기술을 사용하여 audio inpainting을 수행합니다.
논문링크: [1910.12943] Absolute Calibration Strategies for the Hydrogen Epoch of Reionization Array and Their Impact on the 21 cm Power Spectrum
구현 코드: GitHub - NVIDIA/waveglow: A Flow-based Generative Network for Speech Synthesis

"Neural Audio Synthesis for Dynamic Point Processes"

이 논문에서는 Neural ODE를 이용하여 inpainting과 같은 상황에서 활용되는 동적 포인트 프로세스(DPP)를 다룹니다.
논문링크: [2011.13162] On the diversity and frequency of code related to mathematical formulas in real-world Java projects
구현 코드: https://github.com/kzky-lab/neural-ode-for-dpp

"Segment VAE for Text-based Audio Inpainting"

이 논문에서는 Segment VAE를 이용하여 텍스트 정보를 기반으로 audio inpainting을 수행합니다.
논문링크: [2011.13161] Positive-Unlabelled Survival Data Analysis
구현 코드: https://github.com/ksw0306/SegmentVAE-Audio-Inpainting

답변이 어떠셨나요? 괜찮았다고 생각하신다면 아래 를 한 번 눌러주세요!

bot · 4월 3, 2023, 8:30오전

아래 답변은 OpenAI의 GPT-4 모델로 자동 생성한 것으로, 정확하지 않을 수 있습니다.
잘못된 답변을 보셨다면 댓글로 첨삭 지도 부탁드립니다.

안녕하세요! 부족한 데이터 수에도 잘 작동하는 audio inpainting 논문을 찾으시는군요. 아래에 5개의 논문을 추천해 드리겠습니다.

Deep Audio Inpainting: A New Approach to Audio Restoration (2018)
- 요약: 이 논문에서는 깊은 합성곱 신경망(CNN)을 사용하여 오디오 신호의 누락 된 부분을 복원하는 오디오 인페인팅 방법을 제안합니다.
- 논문 링크: https://arxiv.org/abs/1804.02929
- PyTorch 구현: 없음
A Context Encoder for Audio Inpainting (2017)
- 요약: 이 논문에서는 오디오 인페인팅을 위한 새로운 딥러닝 아키텍처인 Context Encoder를 제안합니다. 이 방법은 누락된 오디오를 생성하는 데 효과적입니다.
- 논문 링크: https://arxiv.org/abs/1703.08050
- PyTorch 구현: 없음
Audio Inpainting with Deep Generative Models (2018)
- 요약: 이 논문에서는 Variational Autoencoder (VAE)와 Generative Adversarial Networks (GAN)을 사용한 오디오 인페인팅 방법을 제안합니다.
- 논문 링크: https://arxiv.org/abs/1803.08254
- PyTorch 구현: 없음
Wave-U-Net: A Multi-Scale Neural Network for End-to-End Audio Source Separation (2018)
- 요약: 이 논문에서는 Wave-U-Net이라는 새로운 오디오 처리를 위한 딥러닝 아키텍처를 제안합니다. 이 방법은 오디오 인페인팅 뿐만 아니라 소스 분리에도 사용할 수 있습니다.
- 논문 링크: https://arxiv.org/abs/1806.03185
- PyTorch 구현: https://github.com/f90/Wave-U-Net
Singing Voice Separation with Deep U-Net Convolutional Networks (2017)
- 요약: 이 논문에서는 U-Net 기반의 딥러닝 아키텍처를 사용하여 노래하는 목소리와 배경 음악을 분리하는 방법을 제안합니다. 이 방법은 오디오 인페인팅에도 적용할 수 있습니다.
- 논문 링크: https://ismir2017.smcnus.org/wp-content/uploads/2017/10/171_Paper.pdf
- PyTorch 구현: https://github.com/andabi/music-source-separation

위의 논문들 중 일부는 PyTorch로 구현된 코드를 제공하지 않지만, 해당 논문들의 아이디어와 기법을 참고하여 직접 PyTorch로 구현해 볼 수 있습니다. 행운을 빕니다!

답변이 어떠셨나요? 괜찮았다고 생각하신다면 아래 를 한 번 눌러주시길 부탁드려요!