AI/ML 공부하기 가장 좋은 책?...
내가 서점에서 거의 여러 날 죽치면서 AI/ML 책들을 봤다. 뭘 사야 좋을지 몰라서. 결론은 한권도 없다. 책 살돈으로 ChatGPT라든가 Claude을 구독해서 질문해가며 공부하는 게 훨씬 빠르다. 몇권이나 봤냐고? 응 30권...
저널을 쓰지 않는 이유...
기록을 보니 4월 9일부터 이틀간 저널을 쓰지 않았다. 내가 판단해 보기에 저널을 쓰지 않은 시절엔 바쁜 일이 있거나 아니면 불안하지 않았다는 (살만했단) 거다. 어쨌든 좋은 징조니까 그렇게 살아가야지 한다. 제...
너무 일을 열심히 하지 말자...
대개 일을 많이 하고 있다는 것의 한계는 일을 하다 화가 날 때다. 뭔가 강한 짓누름이 있는데 그걸 이겨내면서까지 일한다는 기분이 들 때다. 이 상황을 넘겨서까지 계속 일을 하면 감정이 망가진다....
arch linux와 NVIDIA gpu...
arch linux를 잘못 업데하다가 드라이버가 죄다 꼬여서 부팅도 안되는 상태에 이르렀다. 어쩔 수 없이 OS까지 재설치 해야한다. OS 재설치에 이은 드라이버 재설치 CUDA를 쓰려면, 그것도 최신 GPU로 CUDA를 arch linux에서...
어깨 쑤실 때...
대개 어깨가 쑤신다 어깨가 굳었다 하면 승모근이 딱딱해져서 통증이 오는 경우다. 대개 스트레스를 많이 받을 때 뒷목과 승모근 모두 긴장하다보니 뭉치게 되는 게 아닐까 한다. 나란 사람을 요새 관찰해보니 HSP로...
Low Rank Adaptation(LoRA)...
LoRA라는 용어에서 느껴지는 위압감(?) 때문에 처음엔 꽤 어려운 기술이 아닐까 생각했지만, 실제로는 그렇게까지 복잡하지 않다는 인상을 받았다. 요약하자면, 기존 모델의 파라미터는 그대로 둔 채, Q, K, V 행렬이나 기타 Linear...
LLM: summarizing long paragraphs...
llm이 요약을 하는 기능에 대해서 알아보았다. GPT 모델의 경우는 transformer가 미래의 token을 쳐다보지 않기 때문에 오직 prediction을 위해서 동작한다고 한다. 이 특징 때문에 요약을 하는 것에 별로 유리하지 않은데, 많은...
감정적 타격의 연속이다...
12월 3일, 평생 다시는 겪지 않을 거라 생각했던 일이 터졌고, 2월 말부터는 주식이 미친 듯이 추락하기 시작했다. 그 여파로 직업의 안정성도 크게 흔들리고, 오랫동안 나의 힘이 되어주었던 누군가와도 멀어졌다. 3월은...
기왕 이렇게 된 김에: Deepseek model...
DeepSeek이 나와서 주식이 떡락하던 날을 나는 기억한다. 정말로 무력하게 느껴진 것은 DeepSeek이 엄청난 장점이 있어서….블라블라….그래서 주식이 떡락했다 라는 말을 제대로 이해할 수 없었다는 거다. 왜!!??? 왜 좋은지 알 수 없었다…...
GPT model...
요즘 Transformer 모델을 일주일 정도 집중해서 들여다보고 있다. 개념이나 데이터의 흐름으로 먼저 이해해보려 하기보다는, 논문을 먼저 읽고 개념을 받아들이려 하는데, 내면의 저항이 꽤 심해서 적지 않은 노력이 들어간다. 아마 그...