'🗂️Data Science/Aritificial Intelli' 카테고리의 글 목록

강화학습(Reinforcement Learning) - 3.DQN

2022.12.07

# 1. Deep Q network 우선, 지금까지 봤던 Q-learning과 DQN을 비교하면 다음과 같다. Q-Learning에서는 Q-Table을 업데이트 하는 방식으로 Input으로 {State,Action} Pair이 들어오면 그거에 대한 Q-value값을 return했다. 하지만, 이러기에는 State와 Action개수가 많아지면 Q-Table을 관리하기란 불가능에 가깝게 될뿐더러 시간도 오래걸리게 된다. 그리고 경험하지 못한 것에 대한 값은 알 수가 없다.따라서, Q-Learning에서 Q-Table 대신 Neural Network를 사용해서 Q-value를 추정해보는 게 DQN이다. # 2. Naive DQN Neural Network를 학습시키기 위해서는 Loss Function이 필요한..

🗂️Data Science/Aritificial Intelli

강화학습(Reinforcement Learning) - 2.Q-learning

2022.12.07

# 1. Q-Learning https://repoji-dataengineer.tistory.com/entry/%EA%B0%95%ED%99%94%ED%95%99%EC%8A%B5Reinforcement-Learning 강화학습(Reinforcement Learning) - 1.Value Function # 1. 강화학습이란? 강화학습이란 어떤 Enviroment을 탐색하는 Agent가 현재의 State을 인식하여 어떤 Action을 취하면 그 행동에 대한 Reward가 주어지게 되고, Reward를 최대화하는 Action을 찾는 Policy를 찾 repoji-dataengineer.tistory.com 여기서 Q-Value Function까지 살펴보았다. 이제 모든 {State,Action} Pair에 해..

🗂️Data Science/Aritificial Intelli

강화학습(Reinforcement Learning) - 1.Value Function

2022.12.07

# 1. 강화학습이란? 강화학습이란 어떤 Enviroment을 탐색하는 Agent가 현재의 State을 인식하여 어떤 Action을 취하면 그 행동에 대한 Reward가 주어지게 되고, Reward를 최대화하는 Action을 찾는 Policy를 찾는 학습방법이다. # 2 .Value Function Markov Decision Process란? 순차적 의사결정 과정을 모델링하는 수학적인 틀로서 현재 State에서 이전 이력은 고려하지 않고, 최선의 action을 결정하는 방법을 말한다. 상태(State), 행동(Action), 보상(Reward), 상태 변환 확률(State Transition Probability), 감가율(Discount Factor), 정책(Policy)으로 구성되어 있으며 이를 통..

🗂️Data Science/Aritificial Intelli

Pattern mining

2022.11.26

# Frequent Pattern Mining Association Rule vs Sequential patterns Association rule은 연관 규칙을 찾는 것이지만, 그 순서는 고려하지 않는다. 예를 들어, 치킨과 피자를 산 사람이 콜라를 살 확률 높다는 것은 알 수 있지만, 무엇이 먼저인지는 알 수 없다. 콜라와 피자를 산 사람이 치킨을 많이 산건지 아니면 그 외인지는 알 수 없다. 이런 부분을 보완한 게 Sequential Pattern 분석이다. 이 글에서는 Association Rule에 대해서만 다루겠다. 우선 연관성 분석을 위해서는 주요지표인 Support와 Confidence라는 개념을 먼저 알아야 한다. A,B,C라는 세 물건 사이의 구매 연관성을 파악한다고 생각해보자. Sup..

🗂️Data Science/Aritificial Intelli

주성분분석(Principal Component Analysis)

2022.11.22

# 1 주성분 분석이란? 주성분 분석은 차원 축소(dimensionality reduction)과 변수 추출(feature extraction) 기법으로 널리 사용되고 있다. PCA는 높은 차원의 데이터 분포에서 낮은 차원의 정사영된 축을 찾는 방식으로 차원을 축소시킨다. 이 때 축과 데이터 간의 오차는 최소화 하고, 데이터의 분산은 최대한 유지시킬 수 있는 축을 찾는 걸 목표로 하고, 아래의 그림이 그 과정을 보여준다. # 2 . 공분산(Covariance) 공분산이란? 2개의 확률변수의 상관 정도를 나타내는 값이다. Cov(X,Y) > 0 : 확률변수 X가 증가할 때 Y가 증가하면, 공분산은 0보다 큰 값을 가진다. Cov(X,Y) < 0 : 확률변수 X가 증가할 때 Y가 감소하면, 공분산은 0보다 ..

강화학습(Reinforcement Learning) - 3.DQN

강화학습(Reinforcement Learning) - 2.Q-learning

강화학습(Reinforcement Learning) - 1.Value Function

Pattern mining

주성분분석(Principal Component Analysis)

티스토리툴바