pyTorch 설치해보기...

pytorch는 간단하게 deep learning 관련된 실험을 할 수 있게 만들어진 python module이다. 어떤 분야에 응용을 하려고 하든 일단 python와 pytorch는 설치해줘야 간단한 실험이나마 할 수 있다.

그게 아니면 자신이 행렬 계산, 활성화함수 계산 등등을 전부 구현해야 실험할 수 있는 것이니까 이런 머리아픈 것들 하지 않으면서도 신경망에 뭘 학습시키고 학습시킨 뒤에 인식률이 얼마나 좋은가 등등을 실험할 수 있다.

그러니까 너무 낮은 레벨의 것들에 집중해서 하다보면 원리를 학습한다든가 큰 그림을 그리기 너무 어려우니 이 모듈을 쓰는 거라고 보면 된다. 마치 matlab을 쓰듯.

문제는 대부분의 text가 nvidia gpu가 달려있는 intel mac/linux/window PC를 기본 가정으로 하고 있다. 그래서 그곳에서 알려준대로 설치했을 때 별 문제가 없으려면 이런 사양의 PC가 있어야 되는 거다.

그러니까 이 조건에서 빗나가는 상황이면 나름 괜찮은 성능을 낼 수 있는 HW라도 거기에 미치지 못하는 성능을 내거나 설치시에 에러가 나도록 되어있는 거다.

내 조건을 보면 AMD GPU가 붙어있기도 하고 MacOS인데 Ryzen CPU가 붙어있기도 하고 그렇다. 또 M1 pro macbook도 있다.

요점만 말하자면,

대충 benchmark test를 해보면 m1 pro도 나름 못 쓸 수준의 하드웨어는 아닌 것으로 보여진다. 물론 최신의 NVIDIA GPU가 설치되어있다면 좋긴 하겠는데 가격이 너무 비싸서 차라리 GPU가 아니라 CPU를 openMPI로 돌릴 수 있다면 나는 차라리 이 옵션이 더 좋을 것 같다고 생각한다. 실제로 openMPI를 쓸 수는 있지만 그게 무슨 GPU 돌 듯 하게 되는 게 아니라 일반적인 OpenMPI의 응용방법, 이를테면 같은 내용을 여러 대에 돌려놓고 평균을 구한다거나 합을 구한다거나 하는 식으로 돌게 되는 거다.

리눅스 상에서 AMD GPU를 쓰면 생각할 수 있는 옵션이 vulkan이라든가 openCL, openGL등일 것 같은데 구체적으로 그둘 중에서 누가 좋았다거나 뭘 어떻게 써야 된다 그런 얘기가 없다. 그래서 직접해보는 수 밖엔 없는데, 사실 CUDA를 쓰는 옵션이 가장 결과가 좋아서 deep learning하겠다는데 괜히 AMD GPU로 어떻게 하면 성능 올리나 그 궁리만 하게 되느니 그냥 NVIDIA GPU를 살 수 밖엔 없곘구나 하게 되는 거다.

Apple silicon의 경우도 NPU가 별도로 달려있긴 한데, 내부에서 어떻게 쓰여지고 있는 것인지 pyTorch에서 볼 수 있는 건 그냥 MPS다.

사실상 Deep learning 가속기가 행렬연산기면 참으로 좋은데, 그것도 내가 다룰 network의 크기가 어느 정도냐에 따라서 또 문제가 여러가지로 달라지기 때문에 뭐든 쉬운 게 없는 거다. 누군가 그 행렬 연산기에 맞춰서 돌릴 수 있도록 pyTorch를 적절히 바꿔서 만들어줄 것도 아니고. 그러다보니 결국 쥐뿔 든든한 HW 뒷배가 없는 이들은 그냥 CUDA로 가게 되는 거구나 하는 거다. 반대로 훌륭한 HW를 만들었다 하더라도 좋은 pyTorch backend를 누가 만들어주지 못하면 그나마도 무용지물인 거다. 아니면 아주 한정적인 분야에만 써야 된다든가.