분류 전체보기

    강화학습(Reinforcement Learning) - 2.Q-learning

    # 1. Q-Learning https://repoji-dataengineer.tistory.com/entry/%EA%B0%95%ED%99%94%ED%95%99%EC%8A%B5Reinforcement-Learning 강화학습(Reinforcement Learning) - 1.Value Function # 1. 강화학습이란? 강화학습이란 어떤 Enviroment을 탐색하는 Agent가 현재의 State을 인식하여 어떤 Action을 취하면 그 행동에 대한 Reward가 주어지게 되고, Reward를 최대화하는 Action을 찾는 Policy를 찾 repoji-dataengineer.tistory.com 여기서 Q-Value Function까지 살펴보았다. 이제 모든 {State,Action} Pair에 해..

    강화학습(Reinforcement Learning) - 1.Value Function

    # 1. 강화학습이란? 강화학습이란 어떤 Enviroment을 탐색하는 Agent가 현재의 State을 인식하여 어떤 Action을 취하면 그 행동에 대한 Reward가 주어지게 되고, Reward를 최대화하는 Action을 찾는 Policy를 찾는 학습방법이다. # 2 .Value Function Markov Decision Process란? 순차적 의사결정 과정을 모델링하는 수학적인 틀로서 현재 State에서 이전 이력은 고려하지 않고, 최선의 action을 결정하는 방법을 말한다. 상태(State), 행동(Action), 보상(Reward), 상태 변환 확률(State Transition Probability), 감가율(Discount Factor), 정책(Policy)으로 구성되어 있으며 이를 통..

    Pattern mining

    # Frequent Pattern Mining Association Rule vs Sequential patterns Association rule은 연관 규칙을 찾는 것이지만, 그 순서는 고려하지 않는다. 예를 들어, 치킨과 피자를 산 사람이 콜라를 살 확률 높다는 것은 알 수 있지만, 무엇이 먼저인지는 알 수 없다. 콜라와 피자를 산 사람이 치킨을 많이 산건지 아니면 그 외인지는 알 수 없다. 이런 부분을 보완한 게 Sequential Pattern 분석이다. 이 글에서는 Association Rule에 대해서만 다루겠다. 우선 연관성 분석을 위해서는 주요지표인 Support와 Confidence라는 개념을 먼저 알아야 한다. A,B,C라는 세 물건 사이의 구매 연관성을 파악한다고 생각해보자. Sup..

    주성분분석(Principal Component Analysis)

    # 1 주성분 분석이란? 주성분 분석은 차원 축소(dimensionality reduction)과 변수 추출(feature extraction) 기법으로 널리 사용되고 있다. PCA는 높은 차원의 데이터 분포에서 낮은 차원의 정사영된 축을 찾는 방식으로 차원을 축소시킨다. 이 때 축과 데이터 간의 오차는 최소화 하고, 데이터의 분산은 최대한 유지시킬 수 있는 축을 찾는 걸 목표로 하고, 아래의 그림이 그 과정을 보여준다. # 2 . 공분산(Covariance) 공분산이란? 2개의 확률변수의 상관 정도를 나타내는 값이다. Cov(X,Y) > 0 : 확률변수 X가 증가할 때 Y가 증가하면, 공분산은 0보다 큰 값을 가진다. Cov(X,Y) < 0 : 확률변수 X가 증가할 때 Y가 감소하면, 공분산은 0보다 ..

    카이제곱 검정(Chi Squared Test)

    # 1 .카이제곱 검정이란? $X^2$검정은 카이제곱 분포에 기초한 통계적 방법 _관찰된 빈도가 기대되는 빈도와 유의하게 다른지를 검증_ 범주형 자료로 구성된 데이터 분석에 이용 카이제곱 값은 $X^2 = \sum(관측값 - 기대값)^2/기대값$ 카이제곱 검정의 형태 적합도 검정(Goodness of fit test) 동질성 검정(Test of Homogeneity) 독립성 검정(Test of independence) # 2 . 적합도 검정(One Sample Test) 적합도 검정이란? 단일 표본에서 해당 표본이 유의미한지를 검정하고, 자유도는 "종속변수의 범주 -1"이다. 예를 들자면, 주사위를 120번 던졌다고 했을 때, 1~6번까지 기대값은 각각 20이라고 할 수 있다. 그 때 실제로 나온 데이터..

    Python 함수와 모듈 그리고 Numpy

    1. format 함수 weather = "rain" temp = 30 a = "Weather tomorrow : {}, temp : {}".format(weather,temp) print(a) >>> Weather tomorrow : ra, temp : 30 2. lambda 함수 add = lambda x,y : x+y add(3,5) >>> 8 3.모듈 dir 함수 import math dir(math) >>> [&#39;__doc__&#39;, &#39;__file__&#39;, &#39;__loader__&#39;, &#39;__name__&#39;,,,,,,,, 4. 기본 모듈 import sys import calendar import request # 크롤링할 때 필요한 모듈 import ..