Title: Zastosowanie sieci neuronowych do oceny liczby lew w rozdaniach brydzowych
1Zastosowanie sieci neuronowych do oceny liczby
lew w rozdaniach brydzowych
mgr inz. Krzysztof Mossakowski Wydzial Matematyki
i Nauk Informacyjnych Politechniki Warszawskiej
Warszawa, 3 grudnia 2003
2Zagadnienie
- Dane sa rozdania brydzowe z obliczona liczba lew
wzietych przez pare NS (przy zalozeniu optymalnej
gry obu stron) - Stworzyc siec neuronowa, która na podstawie
podanych wszystkich rak poda spodziewana liczbe
lew dla pary NS
3Pochodzenie danych
- GIB (Ginsberg Intelligent Bridgeplayer) -
najsilniejszy program brydzowy
http//www.gibware.com - GIB Library - zbiór rozdan brydzowych z obliczona
liczba lew wzietych przez pare NS przy optymalnej
grze obu stron http//www.cirl.uoregon.edu/ginsbe
rg/gibresearch.html
4Dane
01201203039129128 128120303
wist W wist N wist E wist S
BEZ ATU
- 717102 rozdania
- Pojedyncze rozdanie
- karty wszystkich rak W AT85432.4.J32.K9
N Q6.AJ2.Q98764.JT E KJ.953.T5.AQ8643
S 97.KQT876.AK.752 - liczba lew pary NS dla wszystkich mozliwosci
koloru atutowego i osoby wistujacego
PIKI
KIERY
KARA
TREFLE
5Oczekiwane rezultaty
?
- W ilu procentach przypadków pomylka nie bedzie
wieksza niz 2 lewy? - W ilu procentach przypadków pomylka nie bedzie
wieksza niz 1 lewa? - W ilu procentach przypadków nie bedzie pomylki?
6Wykorzystane narzedzie
- JNNS 1.1 - Java Neural Network Simulator
- nastepca SNNS - Stuttgart Neural Network Simulator
7Testowane sieci neuronowe
- Jednokierunkowe wielowarstwowe
- Losowa inicjalizacja wag z przedzialu -1.0, 1.0
- Neurony
- funkcja aktywacji sigmoidalna unipolarna
(logistyczna) - funkcja wyjsciowa identycznosc
8Algorytm uczacy
- RProp (Resilient Propagation)
- przy zmianie wag uwzgledniany jest tylko znak
skladowej gradientu - wspólczynnik gradientu jest dobierany w kazdym
cyklu dla kazdej wagi na podstawie zmian wartosci
gradientu - zgodny znak zmiany gradientu w dwóch kolejnych
krokach zwieksza wsp. uczenia, przeciwny -
zmniejsza - parametry?0 0.1 ?max 50.0 ? 4.0
9Reprezentacja danych
- Liniowe przeksztalcenie danych do przedzialu
min, max dla danych - wartosc karty dwójka, as
- kolor bez atu, trefle
- wistujacy nie, tak
- liczba lew 0, 13
- Testowane przedzialy
- min 0 0.1 0.2
- max 1 0.9 0.8
10Najczesciej stosowane zbiory danych
- Uczacy - 10 tys. rozdan
- numery od 1 do 10000
- Walidacyjny - 1 tys. rozdan
- numery od 500001 do 501000
- charakter wylacznie informacyjny
- Testowy - 1 tys. rozdan
- numery od 600001 do 601000
11Pierwsza siec neuronowa
- (26x4)-(7x4)-13-1
- Wyniki (37 tys. iteracji)
- uczacy 92, 71, 28walidacyjny 86, 59,
22testowy 87, 63, 23
1
...
13
...
...
...
...
7 x 4
...
...
...
...
26 x 4
W(13 par neuronów)
N
E
S
12PomyslZgrupowac karty
- (26x4)-(13x4)-(7x4)-13-1
- Wyniki (20 tys. iteracji)
- uczacy 95, 78, 32 3,7,4walidacyjny 9
3, 73, 29 7,14,7testowy 93, 76,
33 6,13,10
1
...
13
...
...
...
...
7 x 4
...
...
...
...
13 x 4
...
...
...
...
26 x 4
13PomyslPolaczyc rece parami
- (26x4)-(13x4)-(7x4)-(7x2)-7-1
- Wyniki (20 tys. iteracji)
- uczacy 92, 71, 28 -3,-7,-4walidacyjny 8
8, 64, 24 -5,-9,-5testowy 89, 68,
27 -4,-8,-6
1
...
7
...
...
7 x 2
...
...
...
...
7 x 4
...
...
...
...
13 x 4
...
...
...
...
26 x 4
14PomyslPowiekszyc siec
- (26x4)-(13x4)-(13x4)-26-13-1
- Wyniki (20 tys. iteracji)
- uczacy 95, 77, 31 0,-1,-1walidacyjny 89
, 67, 26 -4,-6,-3testowy 90, 70,
29 -3,-6,-4
1
...
13
...
26
...
...
...
...
13 x 4
...
...
...
...
13 x 4
...
...
...
...
26 x 4
15PomyslZmniejszyc siec
- (26x4)-(13x4)-(3x4)-5-1
- Wyniki (20 tys. iteracji)
- uczacy 94, 75, 29 -1,-3,-3walidacyjny 9
2, 71, 28 -1,-2,-1testowy 91, 73,
28 -2,-3,-5
1
...
5
...
...
...
...
7 x 4
...
...
...
...
13 x 4
...
...
...
...
26 x 4
16Zestawienie wyników
Siec Uczacy Walidacyjny Testowy
(26x4)-(7x4)-13-1 37 tys. iteracji 927128 865922 876323
(26x4)-(13x4)-(7x4)-13-1 20 tys. iteracji 957832 937329 937633
(26x4)-(13x4)-(7x4)-(7x2)-7-1 20 tys. iteracji 927128 886424 896827
(26x4)-(13x4)-(13x4)-26-13-1 20 tys. iteracji 957731 896726 907029
(26x4)-(13x4)-(3x4)-5-1 20 tys. iteracji 947529 927128 917328
17EksperymentMala siec, duzo iteracji
- (26x4)-(13x4)-(3x4)-5-1
- Dla 150 tys. i 175 tys. iteracji nie ma róznic w
wartosciach wyjsciowych
Liczba iteracji Uczacy Walidacyjny Testowy
1 tys. 87, 63, 24 86, 61, 22 86, 61, 23
10 tys. 92, 72, 28 90, 69, 26 90, 69, 27
20 tys. 94, 75, 29 92, 71, 28 91, 73, 28
50 tys. 93, 75, 30 92, 73, 29 94, 73, 29
100 tys. 94, 76, 30 93, 74, 29 93, 73, 30
150 tys. 94, 76, 30 93, 74, 29 93, 73, 30
175 tys. 94, 76, 30 93, 74, 29 93, 73, 30
18EksperymentDuza siec, duzo iteracji
- (26x4)-(13x4)-(13x4)-26-13-1
- Od ok. 55 tys. iteracji maleje blad dla zbioru
uczacego, a wzrasta dla zbioru walidacyjnego
Liczba iteracji Uczacy Walidacyjny Testowy
1 tys. 87, 64, 23 85, 60, 23 85, 61, 21
5 tys. 92, 71, 28 89, 66, 26 90, 67, 25
20 tys. 95, 77, 31 89, 67, 26 90, 70, 29
50 tys. 97, 81, 34 90, 68, 29 91, 72, 28
80 tys. 97, 82, 35 90, 68, 27 91, 70, 29
19EksperymentNajlepsza siec, duzo iteracji
- (26x4)-(13x4)-(7x4)-13-1
- Wykresy bledów dla zbiorów uczacego i
walidacyjnego wciaz mialy tendencje malejaca
Liczba iteracji Uczacy Walidacyjny Testowy
20 tys. 95, 78, 32 93, 73, 29 93, 76, 33
50 tys. 95, 79, 32 93, 75, 30 93, 74, 30
100 tys. 96, 80, 33 94, 75, 30 93, 75, 31
115 tys. 96, 80, 34 94, 76, 30 93, 76, 30
20Eksperyment na danychPrzedzial wartosci danych
- Siec (26x4)-(13x4)-(7x4)-13-120 tys. iteracji
Przedzial Uczacy Walidacyjny Testowy
lt0, 1gt 95, 79, 32 91, 71, 28 93, 75, 29
lt0.1, 0.9gt 95, 78, 32 93, 73, 29 93, 76, 33
lt0.2, 0.8gt 93, 74, 31 91, 71, 28 92, 72, 29
21Eksperyment na danychZamiana rak w parach
- Siec (26x4)-(13x4)-(7x4)-13-120 tys. iteracji
- Podwojenie liczby rozdan - zduplikowanie rozdan
przez zamiane rak w parach
Rozdania Uczacy Walidacyjny Testowy
Pojedyncze(10 tys.) 95, 79, 32 91, 71, 28 93, 75, 29
Podwójne(20 tys.) 95, 77, 31 93, 73, 28 94, 76, 31
22Eksperyment na danychNie tylko bez atu
- Siec (26x4)-(13x4)-(7x4)-13-1
- Siec (26x41)-(13x4)-(7x4)-13-1
- dodatkowe wejscie z wartoscia atu
- pieciokrotne zwiekszenie liczby danych
- 20 tys. iteracji
Rozdania Uczacy Walidacyjny Testowy
bez atu 95, 79, 32 91, 71, 28 93, 75, 29
wszystkie (5) 97, 82, 35 96, 79, 33 96, 81, 35
23AnalizaLiczba punktów na rekach
- Siec (26x4)-(13x4)-(7x4)-13-1
- 115 tys iteracji
- zbiór uczacy 96, 80, 34
- SzacunekLiczbaLew 13/40 punktyNS
- zbiór uczacy 96, 70, 24
24AnalizaPunkty, uklady, wisty
25AnalizaNajgorsze rozdanie
- Rozdanie (S-H-D-C)
- W AT85432 - 4 - J32 - K9
- N Q6 - AJ2 - Q98764 - JT
- E KJ - 953 - T5 - AQ8643
- S 97 - KQT876 - AK - 752
- Liczba lew NS przy grze w bez atu
- wist N lub S 12
- wist E lub W 0
- odpowiedz sieci 6
26Problemy
- Czas
- zbiór uczacy 40 tys. danych
- siec (26,1x4)-(13x4)-(7x4)-13-1
- ? 1 tys. iteracji ? 1 godzina
27PomyslyDyskusja
?