! #
!"#"# -
+,
, 22
A,
22 2 2 , := , 6 : : ( := : B, , , 2 = 2 = , :, , 2 $ ( : , : , :. 2 = ' :. , . , C= . = : B , 2 $ =. 2 . . . B = B 2 2 - A, = , 2 2 : , : . 22 : , : 2 = : , : : ( 2 = : , (. = 2 : = C , 6 C :- A, : : 22 , , := , : B: ( $ :B : = -
A,
22 : =
, : := :
. B : , A ,
B, , . , ,
, :
:
: 6
( -
5 4%
; =
= ; -. > # . ?5( #(! ()(@( , 1 - : -
2 , 22 ,- A, B : . : : B C-
,
:
B
&
(
* 2
:
2
R
@ >
;
; ' 2
R
A, P, :, B , 2
=?
; ' 2 B
(
2
H
8 : >
B (
, 6 :
; , 2
@
>
' 2
R
8 : >
&:
, (
. , :( B C , : , C : 2. B, 22 . , , , 2 = . , (. 2 = , , , - A, = 2 = , : 2 : = B= :=; : 2 , =, ,= = 2 $ C C D, ; #%%5 . B =2 2. B, , $ : 6 2 2( C 2 2. , , = 2- A, = 2 , C : 2 = : - A, 2 , := B : : B , := 2 = ' : , $ 2 &: . B 2 , , := = : : , , :, , = , ,= , 2 : = : B -A 2. , :( , , :, , , : . B, , , 2( 2 , , B -
2
+, :
B
: , , , B , , , ,= :=. : B, = , = : B, , , 2 ( B , 2 , 2 : B =. 2 B , 22 2 : = , : :. , B 2 - A, 2 $ 2 - & =. B C B : , . = 6 C :. = , , : . 2 6 . : B , : . ' , #%%# -
(. B
2 H
$2
.
# :
: (
Q
> 2 : , , , ,= = , : (.B C , 2 : : :=- ( . B , , B , 22 : , = 2 = : : , : ( - A, , = : : B H A, =2 2 : = , : ( 2 = : , ( B, , B , - A, =2 2 = : , : ( C = 2 2-
,
B ,
. 5 :( 2 2 : B, , 2 , :( . B, , 2
&:
> , ( 22
$2 B , :,6 2 : , P
#H ) 2
:
: 2
2 ( Q, $2 C : ,
5 = 2( -
( ,
2
.
.
, H :
&:
B
: G
, :
,
#-
: B ,
: B :
.
A, : 2
: C A, ( . :. B :
, :,6 : C : , 2 C : ( P $2
B : A B : 8 :
( B
6 :
,
2. ::
. -
2 =
+,
B , ,
: : , , $ : B : 2Q . B , 2 S A )2 =. B , . - B,
, A ,
, : F2, , : , . , - A,
'
2
,
. B 2 22 := , : : ( 8 : 5 , B 6 C : , , B , = $2 -D : , B : $ :( , 2( . , B 2. , , , . 2 , 2- ( . = , :( = , = , , :, 2D, . , : ( B, , , = , , -
. $ , 2 , $: 2 .B , = = , , $G A, ' : , = = ;(';( T B , 2 : : = : C ; 8 774 22 6 (. ) = 2 22 2 H . + αδ ( . ) . + ( . )←
=2
δ =
+
+
(. ) A, , : :
=
&:
5H @
( , ,
$
: =
=
6
:
C :
,
: (
,
$
: (
$2
.
C C B ,
,
=
2 B
2 ,
6
-
=
=
, $
,
2 : : .
2
, , B , &: -(
, : : =
= 2 2 , 2
Evaluation results of the Learning AI
2
= : (
:
)
.
$2 : 2
' 2
2
,
)− (
C.
-
;
' 2
2
$
>
;
+
, :
=
' 2
.
+
C. : , C= , $:
B
A, , - 2
=
>
;
(
$
-
Average score (100:1)
>
, 2 B
H
, (
,
A, 2
B,
, , &:
B ,
, = , -
.
150 100 50 0 -50 1
,
2 , = A , ., 2 , B : 6 = , : 2 2 : , 2- ( . , : 2B $ G = . , I , , ' .B = = , :: :=- A, =2 = 2 2 . = = = 2 =. , , 2 , - A, 2 2 B : 2 H 2 2 - -H , G . :, : . = :. # , :, = = , 2 G - > :
400 350 300 250 200
3
5
7
9
11
13
15
17
19
21
23
25
Number of learning episodes (x 1000)
&: H : #"%%% 2
, %%
2
:( , %%% 2
:( B , , C 6 2 2( . B , B = 2 = : : , 6 2 2( , : - D, , : : 6 2 . : : , : 5 " 2 : %% %%%% 2 : . B, , 2 , 2 , 2( . 5"%2 : - A, , = , : . , : I I =- A, 2 : 2 2 : 2, , B , &: ":
, :
D , := , 22 . B B, , : = 2
Comparison results Random vs Boots trap AI
Boots trap AI vs Boots trap AI
Number of episodes (%)
70
Learning AI vs Bootstrap AI
Major Defeat: score