ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터 분석, 머신러닝 특강
    배움/교육내용 & 요약 2021. 6. 5. 23:58

    정보통계학과 김종현 졸업생(밀버스)
    데이터 시각화 팀(테블로 팀) 근무 중

    다짐

    • 채용 공고를 지금부터 찾아보겠다. 내 자신에 대한 직무 설정이 필요한 시점이다.

    주요 정리

    • 현업에서 R을 많이 사용하지 않는다
      • R의 장점인 시각화도 요새는 다른 훌륭한 시각화 툴이 있다
    • 데이터 시각화 툴인 Tableau를 계속해서 사용하고 있다
    • 프로젝트
      • 원하는 회사에서 관심있어 할 만한 주제에 대한 프로젝트를 하는게 도움이 된다
      • 프로젝트에서 자신이 원하는 직무의 파트를 맡아야 한다! 강력하게 어필!
    • 많은 회사에서 aws 이용하고 있다
    • 영어 능력 중요
    • 특급 선물
      • POWER BI 수업 개설 (8월 첫째 주)
      • 엑셀을 활용한 데이터 분석 개설 (6월 말)

    Q. 질문한 것


    Q. 저는 정보통신공학과이고 통계학적 지식이 거의 없고, 데이터분석 보단 인공지능을 활용한 개발자 직무에 목표를 두고 있는 상황

    • A. 학사 수준에서는 머신러닝을 다루는게 쉽지 않다
    • A. 일하면서 의사결정나무 주로 사용 하고 있음

    Q. 예를 들어, 클릭 수를 알기 위해선 고객이 클릭할 때 데이터를 뽑아오는 소스코드를 개발자가 작성해야 할텐데 그런 개발자와 역할이 어떻게 구분되어 있는가? 그런 개발자들의 직무는 뭐라고 부르는가?

    • A. 본인은 개발자와 자주 협업하는 일이 없다

    Q. 데이터 전처리를 할 때 DB에서 전처리를 하거나 / DB에서 불러와서 R이나 파이썬으로 전처리를 하는 걸로 알고 있는데 주로 어디에서 전처리를 하나요?

    • A. sql로 할 수 있는 건 sql로 작업을 하고 나머지는 파이썬, r 사용

    Q. 파이썬을 많이 사용한다고 하셨는데, 툴은 어떤 것을 사용하나요?

    • A. 주피터 노트북을 주로 사용한다. 파이참도 사용하고 있다

    Q. 인공지능 커리큘럼 : 2주 반 정도가 되는데 사실 이 기간동안 인공지능을 배운다고해서 인공지능 모델을 다룰 수 있다는 확신은 들지 않고 최종 프로젝트에서도 인터넷에서 갖다 쓰는 수준밖에 되지 않을까 생각됩니다

    • A. (선배 현직자_씨이랩 인공지능 개발자) 대부분 현업에서 사용되는 인공지능은 인터넷에 구현된 모델을 사용합니다. 그 이유는 이미 만들어진 모델도 많은데 새로운 모델을 만들어도 기존모델보다 성능이 좋을 가능성이 적고 학습에 필요한 자원(데이터, gpu등)이 부족한 경우가 대부분입니다. 따라서 중요한것은 필요에 따라 적합한 모델을 선택하는 것과 기존의 모델로 새로운 서비스를 만들 수 있는 능력을 필요로 합니다.
    • A. (선배 현직자_데이터 분석) 코드를 인터넷에서 가져다 쓰는 것은 너무 당연한 것이며, 알고리즘을 직접 만드는 것은 저는 다른 세계의 세상이라고 생각합니다. 개발자의 소양은 코드를 얼마나 적절하게 가져다 사용하는 것이라고 생각하고 머신러닝 인공지능으로 관심이 있으시면 아래의 링크를 참고하시기 바랍니다. https://www.youtube.com/watch?v=tu6b3xbTj6M

    Q. 현업에서 통계학적 지식을 많이 사용하는 편인가?

    • A. (선배 현직자_씨이랩 인공지능 개발자) 회사마다 다릅니다. 데이터 분석을 전문으로 하는 회사는 통계적 지식이 필요하겠지만 대부분의 인공지능 관련회사들은 통계적 지식보다 컴퓨터 프로그래밍 직식이 더 필요합니다.
    • A. (선배 현직자_데이터 분석) 원하시는 인공지능 분야가 아니라 정확한 답변이 될지는 모르겠지만 통계적 지식은 당연히 필요하다고 생각됩니다. 일상생활에서도 확률같은 통계적 사고를 가지고 생활하시고 통계학 관련 서적을 몇권 읽어보시길 권장 드립니다. 저의 경우, 회귀분석을 사용하는 빈도가 높아서 강의 중 회귀분석 공부를 열심히 하라고 말씀드린겁니다.

    Q. 데이터 분석 분야에선 어떤 식으로 머신러닝을 활용하나요?

    • A. (선배 현직자_씨이랩 인공지능 개발자) 저는 데이터분석 직무가 아니라 정확한 답변을 드릴 수 없습니다. 하지만 통계에서 사용되는 대부분의 모델들은 머신러닝 모델이기도 합니다. 따라서 이러한 모델들의 어떻게 사용하는냐에 따라 통계적으로 사용할 수 있고 프로그램적으로 사용할 수 있습니다.
    • A. (선배 현직자_데이터 분석) 데이터 분석 분야도 여러가지이며, 현재 제가 속해있는 마케팅 분야에서는 매출을 종속변수 y로 두고 Regression/Decision Tree/RandomFrest 정도를 활용하고 있습니다. 더 높은 수준의 모델이 존재하지만 강의 중 말씀드렸던 것처럼 속도 이슈로 인해 가벼운 모델을 사용하고 있습니다.

    Q. 데이터 분석 직무에선 알고리즘 지식이 필요할 때가 있나요?

    • A. (선배 현직자_씨이랩 인공지능 개발자) 알고리즘 지식이 컴퓨터 공학부분이라 데이터 분석쪽하고 관련없다고 생각하실 수 있는데 현재 대부분의 데이터분석을 컴퓨터로 하기때문에 알고리즘 지식은 필수라고 할 수 있습니다. 여기서 알고리즘 지식은 대회에 사용되는 지식들은 필요가 없습니다. 알고리즘은 문제를 해결하기위한 방법으로 대회에서처럼 빠르고 메모리를 덜 사용하는것은 필요없고 문제를 해결할 수 있기만 하면 충분합니다.
    • A. (선배 현직자_데이터 분석) 알고리즘 지식이라… 범위가 굉장히 넓게 생각되지만 답변드리자면 모델을 사용한다면 사용하는 모델에 대한 이해는 당연히 필요하겠죠?

    생각

    • 원하는 방향인 개발직, 인공지능에 대한 직무 얘기를 들을 순 없었지만, 직무 외적인 부분에서 많은 도움을 받았다!

    추가

    • 서울 밥값, 집값 엄청 ↑
    • 출퇴근 고통 (ex 지하철)
    • 노션 무료로 사용 가능! (요새 핫한 노트 프로그램, 학교계정으로 무료)

    댓글

Designed by Tistory.