Jan 5, 2020 - 200105 Diary

귀찮을땐 초심을 떠올리자

20년 첫 글이당 😎

시간이 지나면서 초심을 잊어버렸고 글을 쓰는 게 엄청 귀찮은 일이 됐다. 왜 그럴까 생각해보면 요즘 검색엔진과 learning to rank를 급하게 공부하다보니 좀 버겁고 스트레스를 많이 받는 것 같다. 이를 핑계삼아 만사를 귀찮아 한다는 걸 인지하고나니 깨닫는 부분이 있다.

내가 처음에 어떤 생각으로 이걸 시작했을까. 글을 쓰는 건 내가 공부하기 위함이 가장 크다. 글 쓰는 공부, 수학 공부를 하고 이걸 open하는 연습을 하고 싶었다. 이걸 잊으면 그저 귀찮은 일이 되는 것 같다.

주식매매에서도 비슷한 작용이 있는데 처음에 주식을 살 땐 기업 재무 분석, 시장 분석을 통해 고르고 고른 탄탄한 기업을 사놓고 막상 주가가 조금 흔들리면 겁에 질려 팔아버리고 급등했을 때 후회한다. 이럴때 다시 초심을 상기해보면 주가가 흔들려도 버틸 수 있다.

오늘도 공부량이 부족할지라도 기쁜 마음으로 공부하게 되어서 다행이다. 꼭 완주하고 내용보강 더해서 깔끔하게 마무리되면 좋겠다. 아직 2, 3탄도 남아 있기 때문에 그냥 천천히해야 지속할 수 있을 것 같다

Dec 22, 2019 - Data Science Lecture Note

data science 개론

data science란

data science는 data에서 pattern을 추출하는 방법이다. 당연히 숨은 전제는 과거 pattern과 미래의 pattern이 유사하다는 것. 통계학 model과 차이점은 더욱 복잡한 non linear model을 쓴다는 것. 통계는 inference가 핵심이라고 생각하는데, data science 또는 machine learning은 computational mathematics에 가깝다. (e.g. deep learning)

data science를 굳이 3개 과목으로 나누어 보면

  • Vector
    • data는 vector, matrix, tensor로 존재한다.
    • data로 뭘 한다면 결국 전부 Linear Algebra 기반.
    • PCA는 Vector 좌표 공간의 원점을 변경하는 것.
  • Function
    • Function은 model과 같은 말.
    • Cost function도 중요.
    • 미분
      • 1차 미분
        • gradient descent
        • taylor expansion
        • jacobian
      • 2차 미분
        • hessian
        • laplacian
  • Optimization
    • 학습은 cost function의 최적화
    • model을 최적화하기 쉽게 설계하는 것도 중요.

아직은 조금 어렵다 더 공부하면서 쓰자

Dec 22, 2019 - 191222 Diary

깨달은 것

요즘 자영업자 이야기에 관심이 있는데 듣다보면 회사는 동물원이고 회사 밖은 야생이라는 체감이 온다. 회사에서 느낀 어려움은 일도 아니라고 생각이 바뀌니 직장에 대한 만족도가 낮아지지 않는다. 😏 하지만 결국 내 스스로 살림을 꾸릴 날이 올 것이고 이를 너무 고통스럽게 두렵게 받아들이지 좋겠다.

어려운 것

요즘은 분석 업무에 욕심이 좀 없어졌고 data engineer로 일하는 게 좋아보인다… 올해 업무에 당장 필요한 engineering skill을 무자비하게 익히다보니 점점 그런 생각이 든다. 시대적으로 점점 auto-ml이 더 성행할 것이고 data scientist의 effort가 적은 xDeepFm과 같은 모델이 더욱 늘어날 것이다.

발성 학원도 생각보다 큰 effort를 요구해서 어렵다. 😓 이게 습관을 바꾸는 일이기 때문에 어쩔 수 없이 시간을 많이 써야만 한다. 정말 쉬운 건 하나도 없다.