Jan 21, 2020 - 200121 Diary

새해 2번째로 글을 쓰기 위해 앉았다. 😎
요즘 회사에선 시스템 cloud 이관을 위해 eks, rancher, elk만 보고 있으려니 수학 공부는 당분간 안할련다.ㅎㅎ

쫄아서 생기는 loss가 이렇게 크다니??

오랜 시간 2가지 문제점이 있었는데,

  1. 말할 때 목이 넘 아프다.
  2. 앉거나 서거나 자세를 보면 배가 앞으로 나온다. 전만증은 아니라함.

이 문제들이 발성 수업 덕에(??) 꽤 호전되고 있다.

호흡 습관의 문제인데 내 습관은 엄청 호흡을 아낀다는 것. 근데 실상은 대충 살짝만 들이마셔도 말하기나 노래에 절대 부족하지 않다. 그냥 쫄아서 호흡을 아끼는게 아니었을까?

이걸 깨닫고나니 목도 엄청 편해지고 자세도 바르게 되는 방법을 저절로 알게된다. 그냥 ‘내 호흡은 충분히 남아돈다’고 인식하면 된다. 차원을 넘어선듯한 느낌에 처음엔 신이 났지만 되돌아보면 목 아프게 살아온 시간이 억울하기도 하다.😥

오늘 다시 한번 느끼지만, 쫄면 손해가 엄청 크다…

요즘 생각

물건은 가만 내비두기만 해도 변한다. 영원한 물체는 없다고 생각한다.
반면 사람 마음은 가만 냅두면 안 변한다. 자기가 부단히 노력해야 바뀐다. 그래서 영원한 마음은 있다.

Jan 6, 2020 - Data Science Lecture Note

vector

모든 data는 vector로 표현된다. vector는 물리학 개념으로 속력+방향을 뜻한다. 또한 (0,0)이라는 원점을 전제로 한 것이다. 이 원점이 data를 연산할 때 중요한 역할을 한다.

vector space로 이해해보자

2개의 설명변수가 있는 회귀분석을 생각해보자.

기본적으로 회귀분석은 에러인 e와 설명변수 X 사이의 연관성이 없도록 fitting 된다. 즉 e가 X에 대한 함수로 표현될 수 없다. 이를 좌표평면으로 그리면 이렇게 된다.

이 그림으로 이해할 수 있는 건

  1. y는 X로 만든 회귀식으로 100% 설명이 되지 않는다. (i.e. 오차 e가 있다)
  2. X는 2차원 평면에 있지만 e는 3차원 z축에 존재한다. (i.e. x1, x2는 e와 직교한다)
  3. taylors expansion처럼 모르는 y를 유추하기 위해 알고 있는 x1, x2를 썼지만 e만큼 오차 존재

Jan 5, 2020 - Data Science Lecture Note

function

non linear 함수를 찾는 법

대부분의 data가 non linear function으로 fitting 잘된다는 사실은 자명하다. 이 function을 찾기 위해 미적분 개념이 필요하다. taylors expansion은 어떤 함수 $f(x)$를 미분할 줄 안다면 근사식을 구할 수 있음을 보여준다.

$sin(x)=x-\frac{x^3}{3!}+\frac{x^5}{5!}-\frac{x^7}{7!}+\cdots $

$e^x=1+x+\frac{x^2}{2!}+\frac{x^3}{3!}+\frac{x^4}{4!}+\cdots $

$f(x+h) = f(x) + f’ (x)h + f’’ (x)\frac{h^2}{2!} + f’’’ (x)\frac{h^3}{3!} $

이렇게 만든 근사식은 오차값이 존재한다. 하지만 modeling 자체가 현실을 function 형태로 유추하는 것이기에 오차값 유무보다는 data pattern을 잘 표현하는 function을 선택했는지에 더 관심을 가지는 게 맞다.