두대의 컴퓨터에서 rpc를 이용하고 싶습니다.

안녕하세요, 파이토치 뉴비입니다.

컴퓨터 2대가 있는데 각각 A, B, 그리고 IP가 1.1.1.1, 2.2.2.2라고 하겠습니다. (공유기 없습니다.)

파이토치로 image 모델을 러닝 시키는데 image를 augmentation 할때 좀 빡쎄게 해서
cpu가 많이 힘들어합니다.
그래서 컴퓨터 2대에서 cpu로 image를 augmentation을 하고 그것을 모아서 A 컴퓨터로 모아 A에 gpu로 러닝을 시키려고 하면 어떨까 해서 찾아보니 rpc라는게 있더라구요.
많은 예제와 documentation이 있는건 아니지만 찾아 찾아 해보니 잘 안되어 질문드립니다.
A computer:

os.environ['MASTER_ADDR'] = 'localhost'
os.environ['MASTER_PORT'] = '8998'
rpc.init_rpc("worker0", rank=0, world_size=2)

B computer:

os.environ['MASTER_ADDR'] = '1.1.1.1'
os.environ['MASTER_PORT'] = '8998'
rpc.init_rpc("worker1", rank=1, world_size=2)

이렇게 initialize를 하려고 하면 아래와 같은 오류가 납니다.
RuntimeError: […/third_party/gloo/gloo/transport/tcp/pair.cc:799] connect [127.0.1.1]:14237: Connection refused
포트포워딩 후 모두 localhost로 바꿔보기도 해보고, option도 여러가지 해보다가 삽질을 포기하고 질문을 올립니다.
해결책을 알 수 있을까요?

위의 링크가 그나마 비슷한 질문 같은데, 비슷하게 따라해도 안되네요.

좋아요 1