취미와 분위기(?)에 휩쓸려 머신러닝을 공부한지 꽤 됐습니다
제가 공과계열이 아닌 이과계열이여서 수학부분이 특히 약했어서
본격적으로 해보고자 선형대수도 시간투자 많이해서 공부해보고
통계 미분도 선형대수보단 적지만 투자좀 했습니다.
그런데 정말 폭이 넓더라구요
진입 초기만해도 그냥 scikitlearn에 있는 것들만 활용하면 충분할줄 알았는데
점점 알면 알수록 복잡해져가고
어쩌면 이런 알고리즘을 다 파악하는 것보다 데이터 전처리에 힘쓰는게 나은거 같기도 싶고
아무튼 각설이 길었는데
머신러닝으로 신입을 뽑는다고하면 어느정도 스펙일까요
규모있는 기업은 물론 좀 큰 투자를 받았다고 하면 기본은 석사이상이긴 하더라구요
만약 석사가 아니라면 캐글과같은 데이터 경진대회에서 눈에 띌만한 성과를 낸 사람을 뽑느건지
(예전이야 모르겠는데 지금 캐글은 워낙 빡세져 신입정도가 눈에 띌만한 성과를 내는게 가능할까도 싶네요)
여쭙고자 개발한당에 글 써봅니다
전 당연히 본업은 있고 반 취미 반 회사에서 하라고해서 하고있는건데
취미로 하자니 무조건 데이터 많은게 장땡이니 개인이 뭘 만들어서 할 수 있나 싶기도하구요
사실 각 회사마다 그 회사의 담당자의 변덕(?)이라는 끝판왕이 있습니다.
다만, 누가 보더래도 이 노력은 무시할 수 없는 노력이다 싶은 것을 본인이 골라서 하시는게 좋지 않을까 싶네요.
어떤 평가지점을 가상의 회사를 상정해서 하기보다는 본인이 가볼 수 있는 것에서
(즉 본인이랑 좀 핏이 맞는 쪽을 찾아서)
상당히 높은 곳까지 간 기록을 바탕으로 얘기를 하면 좀 수월하시지 않을까 싶습니다.
BS: 학사, MS: 석사 ,Ph.D: 박사
ML Scientist: MS/Ph.D, 머신 러닝 모델 개발 경험, CVPR, NEURIPS, ICML 같은 최상위 컨퍼런스에 publication. 이 직군은 주로 새로운 모델 개발 및 논문에 집중합니다
ML Engineer: MS/Ph.D, 머신 러닝 모델 개발 경험, 최근에 논문으로 나온 모델들을 직접 코드로 구현 가능해야됨, 데이터 전처리 경험, 클라우드 컴퓨팅 (AWS, SLURM 등등) 경험. 이 직군은 제품에 들어가는 모델 개발을 주로 합니다.
Data Engineer: BS/MS, 데이터 전처리 경험, 머신 러닝 모델에 맞게 데이터 준비 능력, 데이터에 관한 statistical analysis 가능, 데이터 파이프라인 (Apache, Airflow) 경험
Software Engineer, AI: BS/MS 컴공과 선호, 앱이나 웹에 머신 러닝 모델 inference 적용 능력(inference 이후 퍼포먼스 관리 등), 분산 처리 (parellel computing) 경험, 알고리즘 데이터 구조 고수..!
ML Scientist/Engineer 직군을 바라보시면 석사학위 이상에 논문 그리고 캐글 경험 혹은 최신 논문을 직접 구현한 깃헙 기록들이 도움이 많이 됩니다. 캐글도 시도해보시고(개인으로 좋은 성적 내시는 분들도 분명 있습니다) 논문 구현도 하셔서 깃헙에 올리시면 좋은 기록이 됩니다. 모델 구현 가능한가는 인터뷰때 볼 수있습니다.
예를 들어 loss function 이나 metric 을 직접 구현 시키기도하고 (Dice score, mAP) 아니면 간단한게 U-Net 스타일 layer 를 짜보라고 하기도 합니다.
이게 저희 회사에서 머신러닝 관련 직군 요구사항입니다. 글쓴이님의 관심에 맞는 포지션에 맞춰 준비하면 되지 않을까요?