안녕하세요. 저번에는 우울한 내용으로 회고록을 가져왔다면, 이번에는 다소 긍정적인 내용으로 소식을 전하고자 합니다. 앞서, A 스타트업으로부터 경영 악화로 인해 해고당하며, 밀린 월급에 대한 처리를 하고, 이직을 위해 이력서를 다시 작성하고, 여러 기업에 지원서를 내미는 상황이었습니다. 처음에는 아는 형과 호기롭게 규모가 큰 기업에 이력서들을 내밀었습니다. 저는 데이터 사이언티스트로써 모델을 연구하고, 형은 A 스타트업에서 MLOps 포지션으로 모델을 배포해주기에 같은 회사에 입사하면 서로 좋은 시너지가 날 것이라 생각해서 같이 지원을 했습니다. 하지만, 보기 좋게 대기업들에서는 서류 광탈 메일만 날라오고 저희는 점점 말수가 적어져갔습니다. 결국 같이 지원하기 시작한지 2주쯤 되자 각자도생으로 서로 언젠간 다시 만날 날을 기약하며 갈라섰습니다.
여기서부터 점점 지옥이 시작된 것 같습니다. 더운 여름날 집에 있으면 점점 무기력해지고 아무것도 하기 싫어졌습니다. 1분 1초가 매우 느리게 지나가며 제 커리어는 여기서 끝나나 싶었습니다. 그러던 와중 지원한 기업들중에서 외국계 B 유니콘 스타트업에서 면접일을 제안해왔습니다. 저는 매우 기쁜 마음으로 들떠 바로 수락 버튼을 눌렀습니다.
B 스타트업은 1XXX억 투자 유치를 받은 규모로 농수산물 관련 기업이었습니다. 당시 저는 머신러닝 엔지니어로 지원했으며, 제 면접을 봐주실 분은 외국인 분이셨습니다. 대략 1시간 30분동안 면접을 진행하면서 초중반 까지는 괜찮았던 면접이 점점 갈수록 영어 울렁증 스택이 누적되며 서서히 망해가는 전조를 느꼈습니다. 최종적으로 간단한 코딩 테스트까지 한 자리에서 마치며 면접은 종료가 되었습니다. 하지만, 그 이후로도 총 2번의 면접이 더 남아있다는 말에..
그치만 걱정할 필요가 없었습니다! 결국 B 스타트업에서도 다음 여정을 같이 할 수 없다는 메일을 받고 더욱 무기력해졌습니다.
.
.
.
전 직장에서 같이 일하시던 분들께서 창업을 제안해오셨습니다. 내용을 들어보니 비즈니스에 대한 방향성 혹은 확장성은 논리적이긴 하였으나, 현실적으로 당장 자금이 없는 상황이기에 창업 지원 혹은 SI 형태의 프로젝트를 수주받아야하는 상황이었습니다. 그래서, 잠깐동안이지만 프로젝트에 참여하기 위해 JAVA Spring을 몇년만에 손대면서 공부했습니다. 그러나, 마음 한켠으로는 "나는 개발이 재밌어. 하지만, 내가 결국 하고싶은 것은 인공지능이자 연구야."라는 외침이 계속 들려왔습니다. 현실적으로는 높은 페이와 함께 법인 설립 후에는 머신러닝을 병행할 수 있다는 말에 조인을 하긴 했지만, 점점 갈수록 "이 길이 맞나?" 라는 생각이 들었습니다. (아무래도 A 스타트업에서 단독적으로 딥러닝 연구를 했기에, 대다수의 인원과 연구를 하고 싶었던 열망도 컸습니다.) 그렇게 시간이 흐르고,,
.
.
.
여느날처럼 Spring을 깨작거리던중 C 스타트업으로부터 딥러닝 엔지니어 서류 합격 연락이 왔습니다. C 스타트업의 채용 프로세스는 서류 전형 -> 코딩 테스트 -> 기술 면접 -> 경영진 면접 총 4단계로 구성되어 있었습니다. 코딩 테스트 단계는 특정 태스크를 주고, 해당 태스크에 관련된 논문을 분석하고, magenta라는 패키지를 통해 해당 태스크를 수행했습니다. 하지만, magenta 패키지는 생각보다 호환이 되지 않았고, 결국 Docker를 통해 환경을 구성하는 삽질을 거쳐 최종적으로는 Colab에서 dependency를 직접 명시하여 문제를 해결했습니다. (모델보다는 환경에서 더 애를 먹었던 것 같네요.)
그렇게 코딩 테스트까지 무사히 마치고 다음 기술 면접 단계를 진입했습니다. 기술 면접은 약 1시간 가량 진행되었으며, 끝났을 당시 식은땀이 줄줄 내리며, 면접 전에 주었던 보리차 한통을 다 마셨습니다. 무수히 많은 질문이 오갔던 것 같은데, 그중 기억나는 내용들을 적어드리겠습니다.
- Q : Docker에 대한 설명
- Q : A 스타트업에서 연구했던 내용 및 모델을 중점적으로 설명
- 다운스트림 태스크 (e.g. ABSA, NER)에 대한 설명
- XLNet 모델에 대한 설명
- ELECTRA 모델에 대한 설명
- SetFit 아키텍처에 대한 설명
- LLM Optimization (e.g. Prefix-tuning, AdapterFusion ..)
- Q : Transformer에 관한 질문
- Positional Encoding에 대한 설명
- Multi-head에 대한 설명
- Transformer에서 모든 Attention 종류에 대한 설명
- Decoder에서 Attention은 Self-attention 여부
- Q : Sigmoid 대신 ReLU를 사용하는 이유
- Q : Gradient Descent에 대한 질문
- Q : Batch Normalization, Layer Normalization에 대한 질문
- Q : Local optima에 빠지더라도 학습이 잘 될 수 있는 이유
- Q : Local optima에서 빠져나오기 위한 optimizer의 발전 순서 (간단하게)
- Q : 자신 있는 논문에 대해 디테일하게 전부 설명
사실 딥러닝 기초 지식에서 심도있는 답을 하지 못해 개인적으로 매우 아쉬웠고, 떨어질 것이라고 생각했습니다. 동시에 평소에 그냥 지나치던 것들을 유심히 봐야겠다는 인사이트를 재차 느끼게 되었습니다. (이러한 인사이트를 처음 느끼는 것은 아니지만, 똑똑하신 분들을 볼때마다 느낀다. 언제 한번 "피상적인 현상에 그치지 말고 본질을 보라"라는 말을 들어본 적도 있다.)
그렇게 떨어진 줄만 알았던 C 스타트업에서 1주 뒤에 연락이 왔습니다. 정말 살떨리면서도 1주동안은 영겁이자 지옥같은 시간이었네요.. 그렇게 최종 경영진 면접을 보게되었는데, 대표님께서도 꽤나 심도있는 질문들을 많이 던져주셨고, 아이스 브레이킹이 될 수 있던 시간이었습니다. 그렇게 평화롭게 끝난줄 알았던 면접에서 마지막에 칼같은 질문이 하나 더 들어왔습니다.
"멜로디에 가사를 소리로 덧씌우기 위해서 딥러닝 모델을 어떻게 설계하고, 실험 설계는 어떻게 할 것인지 칠판에 그려서 상세하게 설명해주세요."
순간 내 머릿속에는 갈고리들이 휘몰아쳤습니다...ㅋㅋ (????????) 일단 멍해진 멘탈을 추스리고, 최근에 OpenAI 사이트에서 본 Whisper 아키텍처를 떠올렸습니다. "Encoder 부분을 Transformer-based LM으로 대체하면 되지 않을까?"라는 생각에 일단 그림을 그려 설명을 했습니다. (생각해보니 Encoder와 Decoder도 Whisper 아키텍처의 반대로 그려버렸다..ㅋㅋ)
하지만, 멜스펙토그램의 시간축이랑 자연어의 시간축이 불일치할 것이라는 대답이 돌아오고 거기서는 더 이상 나의 두뇌로는 생각이 나지않았습니다. 그렇게 끙끙 앓고 있는 와중 대표님께서 잘라주셨습니다. (힘이 팍 풀렸다..ㅠ) 또 그렇게 영겁의 하루가 지나고 떨어질줄만 알았던 2차 면접까지 합격을 했습니다.
(왜 항상 이렇게 살이 떨려야 하는것인가..ㅋㅋ) 마지막으로 연봉 협상까지 깔끔하게 마무리하고 출근일을 정했습니다. C 스타트업의 연구 인력들을 보니 똑똑하신 분들이 많은 것 같은데, 잘 따라갈 수 있을지는 모르겠지만, 항상 그래왔던 것처럼 내가 속한 집단에서 최선을 다하려고 합니다. 그러면 내실을 다지고 많은 것을 배울 수 있을 것 같습니다.
.
.
.
이렇게 근 1달 여간의 여정들을 정리해봤습니다..ㅠㅠ 근 2-3주동안 3kg정도 빠진 것 같네요. 이번 이직 여정을 통해 많은 것을 느꼈습니다. 이직 하시는 분들 모두 힘내시고, 끝까지 포기하지 않으셨으면 합니다. 결국에는 어떻게든 되더라구요. 다음에는 더 좋은 내용으로 많이 배워서 돌아오겠습니다. 긴 글 읽어주셔서 감사합니다.
- 하늘이 무너져도 솟아날 구멍은 있다.
- 결과는 어차피 정해져있으니 쓸데없이 불안해하지좀 말자. (그게 말처럼 쉽진 않지만)
- 평소에 보고 지나치는 것들을 무시하지 말자.
- 호랑이 굴에 들어가도 정신만 차리면 산다. (극한의 상황속에서 침착함을 유지하는게 제일 중요한 것 같아요.)
'회고록' 카테고리의 다른 글
2023-06-07 회고록 (3) | 2023.06.07 |
---|
댓글