banner

블로그

Dec 09, 2023

미래의 데이터 과학자를 위한 SQL의 힘

회원전용 스토리

메건 불로

따르다

데이터 중심 투자자

--

공유하다

데이터 과학의 세계로의 전환은 전통적이지 않았습니다. 나는 심리학 학교에 다녔고, 마케팅 분야에서 일하기 시작했으며, 부업으로 글을 쓰다가 27세에 마침내 데이터 과학 BootCamp에 등록했습니다. 즉, 저는 Springboard의 데이터 과학 BootCamp를 정규직으로 취급했습니다.

나는 개념을 더 잘 이해하기 위해 일주일에 최소 40시간을 수업 과정을 완료하고 스스로 추가 연구를 하는 데 보냈습니다. 하지만 해당 프로그램을 졸업한 후에도 데이터 과학자로 취업할 준비가 완전히 되어 있지 않다고 느꼈습니다. 대신 데이터 분석가와 마케팅 분석가 역할을 검색했습니다. 첫 번째 데이터 분석가 역할을 맡으면서 저는 Python, 탐색적 데이터 분석 및 모델링에 능숙하지만 데이터 쿼리에 대해서는 잘 이해하지 못한다는 것을 알게 되었습니다.

이러한 결함을 해결하기 위해 저는 SQL을 연습할 수 있는 리소스를 찾았습니다. 돌이켜보면 이것이 아마도 Python 중심의 데이터 과학 부트 캠프를 마친 후 할 수 있었던 가장 좋은 일이었을 것입니다. 데이터 과학자로 입문하려는 사람들에게 SQL을 배워야 할 아주 좋은 이유가 있다는 것을 알았습니다. SQL을 배우면 SQL이 필수입니다…

제가 과장하고 있다고 생각하실 수도 있지만 사실입니다. 오늘날의 취업 시장에서는 확실한 것은 없습니다. 기술 해고는 운율이나 이유 없이 좌우로 일어나고 있습니다. 이런 일을 걱정하는 사람으로서 저는 직업 안정을 위한 티켓이 될 것이라고 결정한 목표를 향해 노력했습니다. 회사에서 최고의 데이터 과학 분석가가 되는 것입니다.

그러기 위해서는 Python을 알아야 할 뿐만 아니라 SQL에도 능숙해야 한다고 판단했습니다. 내 추론은 다음과 같습니다.

내 자신의 데이터를 가져올 수 있다면 일치하는 학습 모델에 필요한 정보를 얻기 위해 분석가나 엔지니어에게 의존할 필요가 없습니다.

가장 일반적으로 사람들은 데이터 과학의 80%가 데이터를 준비하고 20%가 실제로 분석하고 보고한다는 데이터 과학 80/20 규칙을 알고 있습니다. 물론 데이터 정리 중 일부는 Python을 사용하여 수행할 수 있지만 SQL을 확실히 이해함으로써 데이터를 관리하고, 불일치와 오류를 확인하고, 노트북에 가져오기 전에 정리할 수 있다는 것을 확신했습니다.

공유하다