Av Ole Friis Iversen, 21. Mars 2012 14:03 Sist endret 21. Mars 2012 14:04 | |
Fra Norpunkt #12 er det bare én artikkel, og nok en gang er det JellyFish som er temaet, og attpåtil så avsluttes den med "forts neste nummer" så verdien er litt begrenset.
Tilbake til Norpunkt oversikten
JellyFish - styrker og svakheter
Etter at G Tesauro for noen år siden ble berømt for dataprogrammet
TD-gammon (eid av IBM), har backgammonverden ventet på et kommersielt
program med tilsvarende styrke. Det norskutviklede JellyFish
(JF) ble det første og foreløpig eneste tilgjengelige. De
lærde strides, men den meget sterke amerikanske spilleren Kit Woolsey
som har testet dem systematisk, holder en knapp på 'Jelly'.
JellyFish og TD-gammon baserer
seg begge på såkalte 'nevrale nettverk'. Dette er en retning
innen kunstig intelligens som er inspirert av hvordan biologiske hjerner
er bygd opp av nerveceller. De kunstige nettverkene har svært få
'nerveceller', og kan best sammenliknes med laverestående organismer,
som f eks maneter (jellyfish på engelsk).
For å forstå hvordan de virker er det nok mer hensiktsmessig
å se de nevrale nettene som matematiske funksjoner. JellyFish
er faktisk ikke annet enn en stor og stygg formel som regner ut tilnærmede
sannsynligheter som funksjon av egenskaper ved stillinger. Det som er spesielt
med funksjonene nevrale nett representerer er at de har store mengder justerbare
parametre, som bekriver sammenhengen mellom input (stillingen) og output
(tilnærmet gevinstsannsynlighet). Et nevralt nettverk kan ha 10.000-vis
av justerbare parametre, og avanserte matematiske metoder brukes for å
justere disse best mulig for å passe med en 'fasit'. Det praktiske
med JellyFish (og TD), er at den
produserer fasiten selv, som resultatet av partiet. På den måten
lærer den faktisk av å spille med seg selv!
JellyFish har på denne måten
utviklet seg fra å ikke vite noe om backgammon til å bli en
meget sterk spiller, og på det høyeste nivået kan den
etter alt å dømme måle seg med de sterkeste menneskene
i verden. Noen tviler på dette fordi de kan se at den gjør
noen trekk de vet er feil. De tenker at siden den ikke engang behersker
slike enkle ting, kan den umulig være videre god. Her følger
et eksempel på en slik stilling:
24 23 22 21 20 19 18 17 16 15 14 13
------------------------------------------------------
| O O O | O O O X |
| O O O | O X |
| O O | |
| | |
| | |
| | |
| | |
| X X | O |
| X X X | X X O |
| X X X X | X X O |
------------------------------------------------------
1 2 3 4 5 6 7 8 9 10 11 12
JellyFish mener denne stillingen
er så god for svart(X) at hvit(O) skal droppe en dobling. Dette er
feil, og enkle regler for dobling i løp (man kan ta en dobling i
lange løp hvis man ligger mindre enn 12% bak i pips) gir dette.
Svakheten med resonnementet er åpenbar, nemlig at JellyFish
har en annen 'feilprofil' enn mennesker. Den er svak på noe av det
vi kan best, og omvendt. Spesielt tidlig i midtspillet er det mye som tyder
på at JellyFish forstår mer enn de aller fleste mennesker.
(Forts neste nummer)
|