Redesign your brain

인공지능, 현대적 접근방식, 스튜어드 러셀, 피터 노빅 본문

읽고 또 읽고/Idea

인공지능, 현대적 접근방식, 스튜어드 러셀, 피터 노빅

bangla 2017. 6. 21. 13:58
728x90

   

   

불확실성하에서의 행동

   

에이전트는 불확실성(uncertainty)을 다루어야 한다. 불확실성은 부분 관잘 기능성이나 비결정론 때문에, 또는 그 들의 조합 때문에 발생한다. 불확실성이 존재한다는 것은 에이전트가 자신이 현재 처한 상태나 일련의 동작들을 실행한 후 빚어질 상태를 확실하게 알 수 없다는 뜻이다.

문제 해결 에이전트(제4장)와 논리적 에이전트(제7장, 제11장)는 믿음 상태 (에이전트가 처할 수 있는 모든 기능한 세계 상태들의 집힘을 표현한 것)를 유지함으로써, 그리고 실행 도중 에이전트의 감지기가 받을 수 있는 모는 가능한 결과를 처리하는 우발성 계획을 생성함으로써 불확실성을 처리하도록 설계되어 있다. 이 접근방식에는 여러 장점이 있지만, 이것을 에이전트 프로그램의 작성을 위한 문자 그대로의 조리법으로 간주할 때에는 다음과 같은 중요한 단점들이 드러나게 된다.

   

   

결정이론(decision theory) = 확률론 + 효용이론

결정이론의 근본적인 착안은, 에이전트는 만일 기대 효용이 가장 높은 동작을 선택한다면, 그리고 오직 그럴 때에만 합리적이라는 것이다. 여기서 동작의 기대 효용(expected utility)은 그 동작의 모든 기능한 결과들의 효용들의 평균이다. 합리적 에이전트에 대한 이러한 정의를 최대 기대 효용(maximum expected utility, MEU) 원리라고 부른다. 여기서 '기대'가

좀 애매모호하고 가설적인 용어로 느껴질 수도 있으나, 여기서 말하는 기대(기댓값)에는 결과들의 '기중 평균'(각 결과의 확률을 가중치로 한)이라는 엄밀한 정의가 있다.

결정이론에 기초한 에이전트의 믿음 상태는 세계 상태들의 기능 여부(possibⅲty)들만이 아니라 그 상태들의 출현 확률도 나타낸다는 것이다.

   

베이즈망을 다중트리 형태로 변환했다면 그런 형태에 맞게 설계된 추리 알고리즘을 적용해야 한다. 보통의 추리 방법은 변수들을 공유하는 메가노드들을 처리할 수 없기 때문이다. 본질적으로, 그러한 알고리즘은 일종의 제약 전파 기법을 사용한다. 이때 제약들은 변수들을 공유하는 인접한 메가노드들이 그 변수들의 사후 확률들에 대해 모순을 일으키지 않게 하는 역할을 한다. 세심한 내부 관리(bookkeeping)를 수반한다면, 이 알고리즘은 베이즈망의 모든 비증거 노드에 대한 사후 확률들을 군집화된 망의 크기에 선형적인 시간으로 계산해 낼 수 있다.

만일 망에 변수 소거를 적용할 때의 시간 및 공간 복잡도가 지수적이면, 군집화된 망의 조건부 확률표들의 크기도 반드시 지수적이다.

   

깁스 표본화의 유효성, 마르코프 연쇄

   

베이즈망에 대한 설명

베이즈망은 한정적 지식에 대한 명제 논리와 대략 비슷한 역할을 한다.

• 베이즈망은 이산적 비순한 그래프로, 노드들은 확률 변수들에 해당한다. 각 노드에는 그 노드의 부모들이 주어졌을 때의 노드의 조건부 분포가 부여되어 있다.

• 베이즈망은 문제 영역 안의 조건부 독립성들을 간결하게 표현하는 수단을 제공한다.

• 베이즈망은 하나의 완전 결합 분포를 명시한다. 각 결합 항목은 국소 조건부 분포의 해당 항목들의 곱으로 정의된다. 베이즈망은 해당 항목들을 명시적으로 나열하는 결합 분포보다 지수적으로 작은 경우가 많다.

• 다양한 조건부 분포를 분포들의 표준 모임을 이용해서 간결하게 표현할 수 있다. 이산 변수와 연속 변수를 모두 포함한 혼성 베이즈망은 다양한 표준 분포들을 사용한다.

• 베이즈망의 추리는 일단의 질의 변수들의, 증거 변수들이 주어졌을 때의 획률분포를 계산함으로써 수행된다. 변수 소거 같은 정확한 추리 알고리즘은 조건부 확률들의 곱들의 합을 최대한 효율적으로 평가한다.

• 다중트리(단일 연결망)에서 정확한 추리에 걸리는 시간은 망의 크기에 선형적이다. 일반적인 경우에서는 문제가 처리 불가능하다.

• 가능도 가중 적용이나 마르코프 연쇄 몬테카를로 같은 확률론적 근사 기법들을 이용하면 베이즈망의 정확한 사후 확률에 대한 적당한 추정치를 얻을 수 있다.

   

   

   

• 베이즈식 학습 방법들은 관찰들을 이용해서 가설들에 대한 사전 분포를 갱신함로써 학습을 일종의 확률적 추리 문제로 형식화한다. 이러한 접근방식은 오컴의 면도날 원리를 실현하는 데 적합하나, 복잡한 가설 공간에 대해서는 금세 처리 불

능한 수준이 된다.

• 최대 사후 확률(MAP) 학습은 주어진 자료에 대해 가장 그릴듯한 가설 하나를 선택한다. 가설 사전 확률이 여전히 쓰이며, 이 방법이 완전한 베이즈식 학습보다 처리 기능성이 좀 더 좋은 경우가 많다.

• 최대 가능도 학습은 그냥 자료의 기능도를 최대화히는 가설들을 선택한다. 사전

를들이 균등 분포일 때에는 MAP 학습과 동치이다. 선형 회귀나 완전 관잘

베이즈망 같은 간단한 경우에는 닫힌 형식의 최대 기능도 해답을 쉽게 찾을 수

다 소박한 베이즈 학습은 규모가변성이 좋은, 특히나 효과적인 기법이다. ]

• 일부 변수가 숨겨져 있을 때에는 최대 기능도 해답을 EM 알고리즘을 이용해세

할 수 있다. EM의 응용 대상으로는 가우스 혼합을 이용한 군집화, 베이즈망

은닉 마르코프 모형 학습이 있다.

   

   

   

   

   

   

   

모형 기반, 효용 기반 에이전트

Comments