Snowie, Jellyfish og VM i Monte Carlo er hovedpunktene fra dette Norpunkt, som nok kom ut høsten 1998.
Tilbake til Norpunkt oversikten Norpunkt 19 : Snowie
presentert av Eirik Milch Pedersen
For noen år siden var det en student i Sveits som het
Olivier. Som mange andre studenter hadde han mer enn nok av
fritid til alternative sysler. Men Olivier var ikke som andre
studenter. For mens andre studenter løp etter jentene så ville
han skape sin egen. Som sagt så gjort, og hun ble døpt
Snøhvit. Nå var hun kanskje ikke så pen å se på, men spille
backgammon, det kunne hun (og hva mer kunne Olivier egentlig
ønske?).
Noen år og flere tusen arbeidstimer senere har Snøhvit
endelig blitt voksen. Og jammen er hun ikke bare en kløpper i
backgammon, men hun har i sannhet blitt en vakker dame!
Det første som slår en med Snowie er hvor pent utformet og
oversiktlig skjermen er designet. Brettet har behagelige farger
med tretekstur mens brikkene ser ut som de er hugget i stein. Til
venstre for brettet er det ikoner for handlinger (kaste, doble,
etc.), mens til høyre et informasjonsvindu. Info-vinduet er delt
opp i flere sider som en enkelt veksler mellom. En kan blant
annet få informasjon om hva som er riktig flytt med gitt kast,
en liste over alle flytt i matchen så langt, riktig
kubeavgjørelse i stillinga og teoretisk kubevurdering ved den
gitte matchscoren (doblingsvindu etc.). I tillegg finnes en side
for egne notater om stillinga.
Det er tydelig at Snowie er laget med tanke på å være et
hjelpemiddel for å lære backgammon. Før en begynner å spille
lager man seg en bruker-konto. En kan så loggføre alle matcher
en har spilt mot maskina mot denne kontoen. Over tid kan en
dermed se sin egen progresjon (eller degenerering). For å måle
spillestyrke har Snowie innebygget FIBS-ratingsystem. I tillegg
kan man lese ut sin gjennom-snittlige feilrate pr. trekk,
kubefeil (både ved dobling og take) og flaksraten(!).... så her
kan man virkelig finne ut om man er så uheldig som man tror.
Etter at spillet er ferdig og matchen analysert kan man spole
igjennom for å se hva Snowie mener. I infovinduet lister Snowie
opp alle mulige trekk i situasjonen. Brukerens valgte trekk er
markert, samt hvor mye eqity som gikk tapt dersom trekket ikke
var optimalt.
Ved hjelp av knapper hopper en frem til neste brikkefeil,
kubefeil eller brikke-blunder (dvs. stor brikkefeil). Det går
således kjapt å finne de posisjonene som Snowie mener en har
feilspilt, og som en bør konsentrere seg om. Dersom en fremdeles
er uenig med programmet kan en be det om å gjøre en rollout av
stillinga (som om det skulle gjøre det noe bedre).
Snowie støtter import av loggede matcher spilt på FIBS eller
Gamesgrid. Dersom du ønsker det kan du altså spille mot et litt
mindre overmenneske og få analysert matchen av en uhildet 3.
part. At Snowie støtter import fra rivalen JellyFish er vel en
selvfølge all den tid geléfisken har den markedsposisjoenen den
har.
Matcher og posisjoner i Snowie kan enten skrives ut eller
eksporteres. Foruten vanlig tekst støttes rikt tekstformat og
HTML. Dermed blir det den enkleste sak i verden å publisere
matcher på web.
Norpunkt 19 : Snowie - JellyFish test
Nå når JellyFish har fått en kommersiell konkurrent melder
det naturlige spørsmålet seg: Hvilket program er best? Vi vet
fra før at begge spiller meget bra, men det ville jo være
interessant å vite om en av dem likevel er bedre enn den andre,
og eventuelt hvilke typer stillinger de forstår best.
Som alltid i backgammon har vi ingen fasit tilgjengelig, så
det er ikke mulig å få et definitivt svar på spørsmålet, men
vi prøver allikevel å gjøre to små tester. Første test er 9
kube-stillinger fra Robertie’s Advanced Backgammon (nr 20,
22, 51, 94, 143, 171, 201f, 255, 347), hvor vi har målt avviket
i equity mellom programmenes vurderinger og rolloutresultat.
Advanced Backgammon inneholder en rekke typiske stillinger som
viser vanlige temaer, og vi håper at testen gir en pekepinn på
hvor godt programmene vurderer vanlige stillinger.
Andre test er 26 flytteproblemer (hver 4. stilling) fra
Woolsey/Heinrich’s New Ideas in Backgammon som er en samling
vanskelige stillinger. Her har vi notert hvor ofte programmene
finner fram til det som er beste trekk ifølge rollout
Vi har i første rekke brukt den grunnleggende
evalueringsfunksjonen for de to programmene (dvs level 5 for
JellyFish, 1-ply for Snowie). Høyere nivå i spillestyrke for
begge programmene (level 6 og 7, eller 2-ply 3-ply) benytter seg
også av basisevaluering, midlet over alle mulige terningkast ett
eller to trekk framover. Kvaliteten på høyere nivåer avhenger
dermed direkte av kvaliteten på basisevalueringen.
Vi regner rollout som fasit, både fordi vi har stor tro på
at programmene i de fleste typer stillinger gir rolloutresultater
som er svært nær den teoretiske verdien for stillingen, og
fordi vi uansett ikke har noe bedre å sammenligne med. Vi har
benyttet JellyFish level 5 rollouts, hovedsakelig fordi disse
allerede var tilgjengelige for de valgte stillingene, men også
fordi vi da har muligheten til å gjøre tilsvarende rollouts med
Snowie (kommer kanskje i senere Norpunkt). JellyFish level 6
benytter en variansreduksjonsalgoritme, som gjør at rollouts
ikke uten videre kan sammenlignes direkte med en Snowie 2-ply
rollout med samme antall spill.
Stillinger fra Advanced Backgammon
Snowie gjorde det bedre enn JF på denne testen,
gjennomsnittlig equityavvik fra en 7776 spill rollout var
henholdsvis 0.038 og 0.059. Ved å gå til 3-ply/level 7 ble
naturlig nok estimatene bedre, og Snowie gjorde det fremdeles
best, avvikene her var hhv 0.032 og 0.042
Snowie og JF vurderte også stort sett stillingene likt, dvs
begge enten overvurderte eller undervurderte stillingen, bare i
ett tilfelle overvurderte JF stillingen, mens Snowie
undervurderte den.
Stillinger fra New Ideas in Backgammon
I 10 tilfeller var begge programmene enige med
rolloutresultatet, i 10 tilfeller tok begge feil, i 2 tilfeller
hadde Snowie rett og JF feil, og i 4 tilfeller hadde JF rett og
Snowie feil.
På 3-ply hadde Snowie fremdeles 6 feil, mens JF level 7
klarte alle unntatt 1.
Vi har også sammenlignet vurdert equity her, for beste spill
ifølge rollout. Her gjør JF det litt bedre med et snitt avvik
på 0,042 mot Snowies 0,084. For level 7/3-ply var avvikene
henholdsvis 0,042 og 0,069 – vi ser altså at selv om JF her
klarer de relative vurderingene (trekk mot trekk) bedre på level
7, dvs finner rett trekk oftere, er ikke nødvendigvis de
absolutte vurderingene (rent equity-estimat) noe bedre.
Et annet interessant poeng er at i de stillingene hvor
programmene gjør mest feil, både i absolutt og relativ
vurdering er de enige og gjør tilsvarende feil. Et eksempel:
Blå skal spille 62
Denne stillingen ser jo ikke så veldig sær ut, men
programmene har veldig vanskelig for å finne fram til riktig
trekk her. Det beste ifølge rollout er 24/18 7/5 med en equity
på -0,284 for svart. Snowies vurderinger for dette trekket er
henholdsvis –0,540 (1-ply) og –0,372 (3-ply), JellyFish
gjør det ikke stort bedre, vurderingene er henholdsvis
–0,441 og –0,368. Begge programmene liker best 24/22
9/3 etter 1-ply evaluering, og 24/18 9/7 etter 3-ply – begge
med veldig klar margin.
En trøst får være at ingen i bokas ekspertpanel klarte å
finne det beste spillet i denne stillingen heller, og at 24/18
9/7 som ble valgt på 3-ply faktisk er nest best og ikke så mye
dårligere.
Konklusjon
Eller snarere mangel på konklusjon.
Vi fant vel ikke ut mer enn vi forventet på forhånd, at
programmene ihvertfall er så like i spillestyrke, at et så tynt
statistisk materiale ikke kan påvise noen vesentlige
forskjeller. Det mest interessante funnet var at programmene så
ut til å gjøre de samme store feilene, mens de gjorde
forskjellige mindre feil. Det kan være tilfeldig, men det kan
også være et tegn på at de faktisk er nokså like. Etter hvert
som Snowie blir mer brukt, og flere sammenligninger foreligger
vil vi eventuelt ha mulighet for mer underbygde meninger om hvem
som er best, og hvilke forskjeller det eventuelt er mellom
programmene.
Norpunkt 19 : Monte Carlo
Reisebrev fra Arild Idsøe
Det ser ut som om danskene og svenskene har forstått noe som
vi nordmenn ikke har, at VM i Monte Carlo er noe helt spesielt og
en fantastisk opplevelse.
Det var faktisk langt over 50 dansker og ganske mange svensker
i Monte Carlo og kun 2 nordmenn (meg og Dag). Det er helt klart
at mange av disse vil komme tilbake neste år for Monte Carlo er
jo helt nydelig. Man kan komme med innvendinger mot at
registreringsavgiften er høy og sikkert en hel haug med andre
unnskyldninger, men turen er helt klart verdt pengene.
Sammenlignet med Nordic Open som mange har erfaring fra er
dette en mye finere turnering å reise til. Grunnene til det er
at Monte Carlo er en nydelig by, byen er ikke så dyr som folk
tror, flott vær, feriemuligheter, bading, turneringen varer
såpass lenge at du kan gjøre andre ting, spillelokalene på
Loews er tipp topp, god mat, flotte damer (ikke minst!! - dvs.
andre folk, de unge damene til de gamle rikingene og danske BG
spillere). Når det gjelder det sosiale får man god tid til å
bli kjent med andre og det er jo en hel haug med hyggelige
tyskere, amerikanere og dansker og andre der nede.
Hvis jeg skal si noe om innsatsen til de norske så kom Shahab
til 4. runde hvor han tapte svært knepent 19-18 mot en av de
skikkelig sterke danskene - Nøhr - en match hvor forøvrig det
ivrige publikummet - deriblant Shahabs velstående Iranske venner
- ble jaget bort fra brettet. Turneringen ble vunnet av Meyburg -
en tysker - for de som ikke vet det.
Etter at turneringen var ferdig reiste jeg hjem mens de andre
reiste videre for å spille mer backgammon på rivieraen.
Fest og moro
14. august arrangerte forbundets president Vemund Snartland
backgammonfest hvor han åpnet sitt hjem for et snaut tjuetall
feststemte spillere. Med hjelp av Katrine Teigen og Eirik Milch
Pedersen vartet han opp med diverse småretter: Svisker stekt i
bacon, sjampinjong med noe slags hvitløksfyll, loff påsmørt
noe grønt – Norpunkt tar ikke på seg å detaljbeskrive
menyen videre, men kan forsikre om at det var meget
smakelig. Videre ble det prat, musikk, spredt tendens til dans,
og chouette med til tider løs kube. Martha ble redoblet til 8
med 4 mann på 1 og 2-punktene mot motstanderens 6, beavret og
tapte – sånn er spillet! Og kvelden ble tidlig morgen før
de siste deltakerne fant på å reise hjem, vi kommer gjerne
igjen!
|