home
🏄‍♂️

사이오닉에서 ML 리서치 인턴으로 살아남기

Author
임예원 (Austin Yewon Lim) / ML Research Intern
Category
Culture
Tags
Culture
Published
2025/07/04
5 more properties

들어가며

안녕하세요! 저는 Sionic AI에서 작년 10월부터 지금까지 (24.10 ~ 25.6) ML/AI Research Intern으로 근무한 임예원이라고 합니다. 대학 생활과 병행하며 이제는 삶의 일부가 된 Sionic 에서의 생활을 마무리하면서, 그 간의 경험을 공유하려고 합니다.
요즈음 시대는 인터넷이 태동하던 시기를 떠올리게 합니다. 5년 뒤 AI 라고 불리우는 보편적인 패턴 매칭 알고리즘은 우리의 삶을 어떻게 송두리째 바꾸어 놓을까요. ChatGPT의 등장이 채 3년이 되지 않았다는 사실은 두려움을 일으키기도 하지만, 앞으로 변화할 사회의 모습을 생각하면 이내 두려움은 기대와 흥분으로 바뀝니다.
Sionic AI는 누구보다 빠르게 이러한 변화의 흐름을 예측하고, 모든 기업이 AI 기업으로 전환되어가는 과정을 이끌어나가는 회사입니다.

어떻게 들어오게 되었나요?

Sionic AI는 설립된지 2년이 되지 않은 신생 스타트업입니다. 사실 저는 이 회사의 탄생부터 이름을 익히 들어왔는데요, GDSC 활동을 하며 알게 된 진형님 께서 사이오닉에서 일하고 있었기 때문입니다.
지인 분의 초대로 24년 1월에 사이오닉 오피스를 방문 했을 때가 아직도 기억이 납니다. 서버와 책상과 GPU, 그리고 비슷한 수의 사람이 한 방에 모여 꽤나 특이한 풍경이었죠. 물론 지금 사이오닉은 역삼에 번듯한 오피스를 갖추고, 일본 법인을 설립하는 등 공격적으로 해외진출도 도전하고 있지만, 그 당시의 오피스 상황은 지금과는 사뭇 달랐습니다.
이후 미국 Purdue 대학에서 방문학생을 마치고 한국으로 돌아온 저는 인턴 포지션을 찾고 있었습니다. 한 방에 모여서 다 같이 문제를 풀던 Sionic은 가장 먼저 연락을 드린 회사였습니다.
쏘 심플.
이후 사이오닉 에서 CDO로 계시는 우명님과 채용관련 커피챗을 진행했습니다. 사실 저는 사이오닉 이전까지 컴퓨터 비전, 특히 이미지/비디오 생성과 관련된 연구를 진행해왔습니다. 그랬기에 RAG와 관련한 질문에 제대로 대답할 수 있을지 의문이었는데요, 우명님과의 커피챗에서는 업무에 대한 관심도를 확인하는 수준의 질문부터 문제 해결 괴정에 대한 깊이 있는 대화까지 오갔습니다.
회사의 연구 역량에 대한 신뢰는 커피챗 이후 무한 상승(?) 하게 되었죠. 지원을 고민하시는 분이 계시다면 커피챗을 우선 신청해보시는 것이 어떨지!
이후 서류와 면접을 거쳐 인턴에 최종 합격했고, 졸업을 앞두고 학교와 함께 인턴 생활을 병행하게 되었습니다.

어떤 일을 했나요?

저는 인턴 생활을 하며 크게 세 가지 업무를 진행했습니다.
먼저 입사 직후 진행한 kaggle의 finance RAG competition이었고, 둘째는 검색 성능을 높이기 위한 연구 및 개발, 그리고 셋째는 검색 성능 평가를 위한 데이터셋 제작입니다.
kaggle competition에 나가게 되면서 처음 RAG라는 개념을 알게 되었습니다. 다양한 실험을 돌리며 열심히 진행했던 기억이 있는데요, 팀원들의 의견을 반영해가면서 재미있게 대회에 참가할 수 있었습니다.
3위까지 달성했다가 결국 최종 5위로 마무리 되어 수상은 불발 됐지만 검색 성능 개선을 위한 다양한 기술들을 탐색해 볼 수 있었던 기회였습니다.
열심히 돌아가는 A100 친구들.. Sionic에는 16 x A100을 비롯한 다양한 GPU 클러스터가 있습니다 (깨알홍보)
검색 성능 개선을 위한 연구는 아직 공개되지 않았기에, 자세히 남기기는 어려울 것 같습니다. 하지만 관련 내용으로 실험을 진행하고 제품에 탑재하였으며, 특허도 냈습니다. 어찌보면 제 인턴 생활의 대부분은 이 업무가 차지하는 것 같네요. 인턴이라 할지라도 명확한 방향과 성과가 있다면 할 수 있는 일의 범위에 제한은 없다고 느꼈습니다.
한 가지 웃긴 이야기가 있는데요 (Ops 하시는 분은 안 웃김), 제가 새롭게 제안한 임베딩 기법은 꽤 GPU intensive한 작업이었습니다. 실제 제품에 탑재했을 때 성능을 평가하기 위해 micro service 서버를 하나 띄워 테스트를 하는 중이었는데, 서버실에서 비행기 엔진소리가 나더군요.
천 페이지 문서 100개를 청킹해서 각각을 임베딩으로 만드는데, 이걸 128 스레드로 던지는 부분이 문제였습니다. ML/DevOps 엔지니어 분께 물리적으로 혼날 거 같아서 다음부터는 초당 한개 문서를 처리하는 방식으로 바꿔서 실험을 진행했던 기억이 있습니다.
데이터셋 제작도 어떻게 보면 이것과 관련있는 업무였습니다. 검색 성능 개선 정도를 벤치마크로 제시해야 하는데, 실무에서 쓸만한 긴 문서로 만들어진 한국어 벤치마크가 없었습니다. 검색 성능 평가 뿐 아니라 Instruction Tuning 등의 다양한 Task에 사용할 수 있도록 데이터를 수집하고 정제하였습니다.
위에서 소개드린 내용들은 RAG 파이프라인에서 Retrieval 기능과 관련된 업무들입니다. 그러나 이 외에도 NVIDIA Hackathon 참가, Diffusion LLM 한국어 모델 학습등의 부수적인 업무들도 진행했습니다.
NVIDIA Hackathon - 애정하는 진형님 이젠 안녕
사이오닉 에서의 일들은 주도성이 필요한 업무가 대부분입니다. 어떤 일이 필요하다고 생각된다면 자유롭게 판단해서 진행할 수 있고, 또 그렇게 하는 편이 권장됩니다. 일을 하면서 리서치 팀원 / 개발 팀원들과 진행상황을 공유하며, 건전한 토론을 통해 프로젝트를 빠르게 발전시킬 수 있는 환경 또한 매력적이었습니다.

사이오닉 팀은 어떤 사람들인가요?

(잘하는)발자. 사업가. 해커하우스.
사이오닉을 생각하면 떠오르는 단어 세 개입니다. 사이오닉은 개발자 중심의 회사입니다. 실제 인력의 대부분은 개발자이고, 영화 소셜 네트워크를 보면 나오는 초창기 페이스북처럼 몇몇 사람들은 회사에서 먹고 잡니다. (진짜임)
소셜 네트워크 영화 중. 이미지 출처: https://www.hankyung.com/article/2020111380511
누구보자 자율적이지만, 열정적으로 일하기에 정말 빠르게 업무가 진행됩니다. 또 뛰어난 동료들 덕분에 여러가지 각종 사업들도 잘 따오시는데요, 빠르게 성장하는 사이오닉의 발자취만 보아도 알 수 있을거라 생각합니다.
제가 가장 인상 깊었던 부분은 대표로 계시는 석현님이 회사에 대해 가지고 계신 비전이었습니다. 모든 회사는 곧 AI 회사가 될 것이고, 사이오닉은 그 전환을 선두하는 회사가 될 것이다 였습니다. -(비슷하게 말씀하신 거 같았는데 아닐수도 있음). 미래에 대한 비전을 팀원들에게 공유하고, 그 팀원들이 이에 깊이 공감하는 일이 얼마나 흔한지는 모르겠습니다. 미래를 함께 그려나가고 싶다면 사이오닉 AI는 최선의 선택이 아닐까요?
암튼 진수성찬
호진님이 좋아하는 오토김밥도 안녕 - 양바오 군생활 화이팅
로즈할인마트에서 야장을 회식으로 가다니 !
NVIDIA Hackathon에 같이 참여했던 양호진님과 한컷
제 ootd인데요.. 아무거나 입고 다녀도 됩니다

나가면서

ML Researcher로서 개발자들이 득실거리는 생태계에서 살아남는 건 쉬운 일은 아니지만 그 가치가 있습니다.

만일 이 글을 보는 당신이…

위 내용 중에 하나라도 해당되는 사항이 있다면 연구가 빠르게 제품에 탑재되어 운영되기 위한 고려를 하고 있지 않다는 걸 의미할 수 있습니다.
git은 push만 한다
Python 3이기만 하면 세부 버전은 내가 좋아하는 숫자로 고른다. (e.g. 나는 3이 좋아 → 3.3을 쓸래~)
나는 Python만 한다.
나는 프로젝트 패키지 관리를 위해 anaconda를 쓴다. (p.s. uv 를 사용하는 걸 추천합니다)
연구와 개발은 점점 빠른 속도로 전환이 이루어지고 있습니다. 연구를 위한 연구가 아니라, 일상을 혁신하는 연구를 하고 싶다면 분명히 사이오닉은 좋은 선택지입니다.
9개월간 사이오닉과 함께했던 저의 경험이 많은 분들의 선택에 도움이 되길 바라며 이만 글을 마칩니다!
Sionic AI 여러분 그동안 함께 일해서 즐거웠습니다- 안녕히 계세요