fbpx

Design Diary – Computer Vision, Giochi da Tavolo e Presupposti Sbagliati

A maggio di quest’anno abbiamo messo a disposizione un nuovo print&play gratuito del gioco Light Speed, supportato da un software di computer vision. Light Speed è uno sparatutto da tavolo in tempo reale in cui i giocatori orientano fisicamente le carte per mirare alle astronavi nemiche. Nella versione originale, la risoluzione della battaglia era gestita con righelli e segnalini, mentre ora è sufficiente inviare una foto del tavolo a un bot sull’app di messaggistica gratuita Telegram.

In questo articolo riorganizzo i tentativi, le considerazioni e le modifiche che hanno influenzato il bot di Light Speed fino alla sua forma attuale. Anche se la tecnologia è un pilastro di questo progetto, accenno soltanto brevemente a come è evoluta la componente tecnica per parlare piuttosto dell’esperienza del giocatore e del flusso di gioco.

Molte delle considerazioni si riducono a come la buona progettazione debba essere in grado di plasmare l’esperienza del giocatore nel suo complesso, che è un argomento di game design e sviluppo universale.

Se hai Telegram, prima di leggere l’articolo, puoi attivare il bot e farti un giro con la foto di prova.

Tecnologia e grafica delle carte

Volevamo identificare la posizione e il tipo di ciascuna carta in una partita di Light Speed analizzando la foto scattata dal giocatore da una qualunque prospettiva e senza fare affidamento su punti di riferimento fissi, come un tappetino o una board.

Riducendo una storia bella e anche un po’ avventurosa all’osso, ci siamo prima concentrati sulla detection delle carte e poi sulla loro classificazione. Come scelta di sviluppo del prototipo, abbiamo deciso di creare un framework di riconoscimento basato su codici e metodi di visione artificiale classica, evitando così di dover passare ad ogni iterazione e nuovo progetto attraverso il training delle reti neurali.

Gran parte dello sviluppo è stato dedicato all’ottimizzazione e al miglioramento dell’affidabilità. Bisognava rendere rarissime le situazioni in cui la foto scattata non funzionasse, e nel caso rendere chiaro il problema per permettere al giocatore di correggerlo nella foto successiva.

Carte da gioco prototipali in bianco e nero
Il primo prototipo

Già in questa fase abbiamo fatto delle scelte che hanno poi influenzato l’esperienza del giocatore. Le componenti di gioco dovevano essere adeguate su tre fronti interconnessi:

  1. leggibilità delle carte, cruciale in ogni gioco e ancora di più in un gioco in tempo reale,
  2. estetica,
  3. affidabilità del software.

Se i primi due punti sono comuni allo sviluppo di ogni buon gioco da tavolo, il terzo è un aspetto nuovo e inesplorato. Come inserire il codice di riconoscimento sulle carte senza farle sembrare un menu ai tempi del covid? Come assicurarsi che il contrasto degli elementi di gioco sul tavolo sia abbastanza netto ma non trasformi la carta in un segnale di lavori in corso? Come evitare che la componente grafica ostacoli la localizzazione della carta da parte del software?

Dopo varie iterazioni supportate dall’autore delle illustrazioni e del layout Alberto Cariati e dagli alphatester, siamo arrivati a una configurazione funzionale. Abbiamo integrato il codice nella carta a mo’ di cartuccia da console vintage e disegnato un un doppio bordo per garantire contrasto indipendentemente dalla tovaglia (non per niente, Light Speed è Club-della-Tovaglia-approved). Per quanto riguarda i raggi laser, il compromesso è stato di troncarli una volta raggiunto il margine più interno della carta.

Un mazzo di carte raffigurante delle astronavi. Logo Tablescope sul dorso
Il mazzo di Light Speed dopo le iterazioni

Se da un lato c’è ancora spazio per migliorare, dall’altro le oltre mille partite giocate con il bot confermano che la soglia di usabilità è stata sicuramente superata.

Presupposto vince, presupposto perde

Veniamo ora alle note dolenti. Sarò il più onesto possibile su quelli che pensavamo essere presupposti sensati e che invece si sono rivelati incompleti, inefficaci o sbagliati.

L’obiettivo che volevamo raggiungere era chiaro: dopo aver affrontato la sfida di calcolare la risoluzione della battaglia a partire da una foto, dovevamo trovare il modo di comunicare questa informazione al giocatore.

Per ogni presupposto, accennerò a come è evoluto il bot sotto quell’aspetto.

1. Rettificazione

No, non è un esame medico, ma l’operazione che trasforma una foto di una superfice piana scattata da una qualunque prospettiva in quella vista dall’alto.

La foto di un tavolo cosparso di carte di Light Speed e la versione rettificata della foto con le carte evidenziate
Il bot rettifica l’immagine e chiede al giocatore se tutte le carte sono state trovate

Siamo partiti con la convinzione che il punto di vista migliore per mostrare la risoluzione della partita al giocatore fosse quello in top view. D’altra parte, in un gioco da tavolo le carte sono piatte sul tavolo e i giocatori le guardano da una posizione elevata.

Ecco, ‘da una posizione elevata’, non da sopra.

Inoltre, pragmaticamente parlando, la versione rettificata di una foto ha una forma trapezoidale che è più difficile da visualizzare su uno schermo rettangolare senza prima lavorarla.

Non rettificare l’immagine offre fra l’altro più controllo al giocatore e lo incentiva a scattare con più attenzione. Se so che è sulla mia foto che verrà visualizzata l’informazione di gioco, tenderò a scegliere una prospettiva adeguata e ad assicurarmi che tutti gli elementi siano ben visibili nell’immagine.

In base a queste considerazioni, tutte le modalità di risoluzione sul bot, sia quelle basate completamente sul feedback visuale, sia quelle che ne sono solo supportate, utilizzano una visualizzazione nella stessa prospettiva della foto scattata.

La foto di un tavolo cosparso di carte di Light Speed con delle grafiche di raggi laser ed esplosioni in realtà aumentata
Risoluzione in prospettiva di uno dei turni di iniziativa

Quindi meglio top view o vista prospettica? Come molte domande di game design, dipende dall’esperienza nel suo complesso. La risposta potrebbe essere diversa se il cellulare rimane in mano al giocatore dopo che ha scattato la foto oppure se lo immagino posizionato in orizzontale al centro del tavolo durante la risoluzione.

2. Rappresentazione per immagini

Avevamo uno schermo: dovevamo usare quello per mostrare il risultato della partita ai giocatori.

Come è venuto ben presto fuori durante i test, la rappresentazione visuale delle informazioni, oltre a non essere l’unica possibile, deve essere adeguatamente supportata. Un playtester ispirato ci ha messo la pulce nell’orecchio di una telecronaca nostalgica nello stile FIFA anni ‘90.

Sviluppare un’esperienza audio di qualità richiede tempo e risorse considerevoli (che non abbiamo escluso di investire nelle prossime iterazioni), ma una direzione simile può manifestarsi attraverso vie intermedie.

Abbiamo seguito questa strada per le modalità ‘Telecronaca completa’ e ‘Commento rapido’ attualmente supportate dal bot. In entrambi i casi, uno dei giocatori descrive l’azione agli altri, leggendo il testo in linguaggio naturale della Telecronaca completa oppure traducendo le icone del Commento rapido. Le immagini possono ancora essere invocate come riferimento e supporto, ma i giocatori decidono come e quando farne uso a secondo delle esigenze che emergono al tavolo.

Screenshot da una chat Telegram di una descrizione della battaglia in un formato esteso e in uno più simbolico.
Telecronaca completa e Commento rapido della stessa situazione di gioco

Il mezzo visuale è chiaramente potentissimo ma utilizzato da solo si rivela difficile da integrare in un’esperienza collettiva ‘da tavolo’. Come assicurarsi che tutti i giocatori stiano seguendo e comprendendo l’azione? Quando passare alla prossima foto/sequenza di animazioni senza un meccanismo che permetta al gruppo di gioco di controllare il ritmo della risoluzione?

3. Completezza della risoluzione

A inizio lavori, abbiamo cominciato a costruire intorno al presupposto che la risoluzione della partita andasse necessariamente descritta, spiegata e mostrata nella sua interezza.

Questa convinzione derivava da come i giocatori gestiscono normalmente un gioco da tavolo. Per determinare e comprendere l’esito di un’azione o il risultato di una meccanica, bisogna prendersi carico e gestire attivamente tutti i suoi aspetti. Infatti, non c’è nessun altro che lo farà per noi e il corretto esito del gioco dipende dall’essere esaustivi e non tralasciare regole o eventi.

Questo non è sempre il caso in un gioco ibrido digitale. Dopo aver scattato una foto del tavolo alla fine di una partita di Light Speed, nel giro di pochi secondi il computer sarà a conoscenza di tutti i dettagli della risoluzione della battaglia.

Tale consapevolezza offre l’opportunità di organizzare retroattivamente quello che vogliamo mostrare al giocatore.

Stiamo ancora esplorando questo aspetto ma abbiamo già provato a sfruttarlo nella modalità ‘Punti e higlights’ attualmente supportata dal bot. Si tratta di un’opzione di risoluzione in cui ai giocatori viene mostrato il punteggio finale (e dunque il vincitore) e la visualizzazione dei due momenti salienti della partita, scelti dal software in base alla quantità di punti totalizzata e all’impatto sugli altri turni di gioco.

La foto di un tavolo cosparso di carte di Light Speed con delle grafiche di raggi laser ed esplosioni in realtà aumentata incorniciato in un layout futuristico che mostra i punti totalizzati e il turno in corso.
In questo highlight, oltre a essere stati totalizzati un bel po’ di punti da entrambi i giocatori, l’astronave Blu 7 distrugge Rossa 9, impedendole di fare fuoco nei round di iniziativa successivi

Se il coinvolgimento e la comprensione dell’azione di gioco non sono negoziabili, la pedanteria nella risoluzione non è più strettamente necessaria. Questa affermazione va maneggiata con cautela ma l’opportunità di distillare un’esperienza di gioco ancor più intensa e sintetica, svincolata dalla gestione esaustiva dei dettagli, è sicuramente allettante.

4. Individuazione delle carte sul tavolo

Più che di un presupposto si è trattato qui di sottovalutare un problema. Senza farci troppe domande, abbiamo dato per scontato che il giocatore sarebbe riuscito a creare una relazione tra quello che il cellulare mostra sullo schermo e quello che c’è sul tavolo, e quindi a orientarsi durante la risoluzione.

Guardando indietro, fa quasi tenerezza l’ingenuità di questo assunto.

Dalle prime partite giocate in fiera, con il software che ancora girava su un laptop, ci siamo resi conto che poco funzionava out-of-the-box. Senza una guida adeguata, i giocatori avrebbero dovuto affidarsi al loro intutito su come gestire le informazioni sullo schermo e molti ne avrebbero ricavato un’esperienza negativa.

Sul posto, abbiamo temporaneamente corretto il tiro, vestendo personalmente i panni di game master (e animatori), ma era chiaro che per rendere l’esperienza riproducibile a prescindere dalla nostra presenza servivano altre idee.

La Telecronaca completa e il Commento rapido contribuiscono a risolvere anche questo aspetto. In particolare, il commento rapido mostra al giocatore, oltre alle icone descrittive del turno di iniziativa corrispondente, anche una raffigurazione astratta delle carte ancora in gioco, una sorta di radar di supporto per trovare gli elementi sul tavolo.

La foto di un tavolo cosparso di carte di Light Speed con delle grafiche di raggi laser ed esplosioni in realtà aumentata affiancato a una rappresentazione astratta delle carte sul tavolo.
Confronto tra la visualizzazione in prospettiva e il radar dal Commento rapido

Recentemente abbiamo riformulato anche la modalità ‘Slideshow’, una galleria di immagini da navigare scorrendo il dito sullo schermo.

Senza guida, i giocatori non sapevano bene cosa fare con questa serie di immagini.

A sistemare le cose è bastato però chiarire esplicitamente che il cellulare andava poggiato sul tavolo e orientato rispetto alle carte nella stessa direzione in cui era stata scattata la foto. In questo modo, un’azione nell’angolo in alto a destra dello schermo corrisponde alle carte in alto a destra del tavolo, facilitando la ricerca delle astronavi coinvolte.

Un cellulare è poggiato su un tavolo e mostra delle grafiche di raggi laser ed esplosioni in realtà aumentata. L'azione sullo schermo è allineata con le carte sul tavolo.
Lo smartphone al centro del tavolo durante la modalità di risoluzione Slideshow

Sviluppare gli strumenti giusti e rendere i giocatori in grado di usarli sono facce della stessa medaglia ed entrambi cruciali nel design dell’esperienza di gioco.

5. Rappresentazione grafica dei risultati

Dopo aver affrontato la sfida tecnica della computer vision, ci siamo convinti che la nostra tech fosse talmente incredibile da giustificare una grafica approssimativa nella rappresentazione dei risultati di gioco.

Nella primissima versione del bot Telegram che abbiamo dato in pasto agli alphatester, la risoluzione consisteva in una sequenza di immagini rettificate, qualche linea spartana a rappresentare i raggi laser, e i punti dei giocatori come didascalia.

Una serie di linee sono disegnate su un immagine rettificate di alcune carte astronave su un tavolo. Una fascia nera in basso mostra i punteggi del giocatore blu e del giocatore rosso.
Prototipo alpha

Fin qui, tutto in ordine. Il prototipo alpha era solo un test preliminare. Allo stesso tempo, trattandosi di un print&play gratuito, la nostra speranza era quella di faticare il meno possibile sull’aspetto grafico del software e di riuscire a far funzionare una versione non troppo distante da quella prototipale.

I nodi sono venuti al pettine piuttosto in fretta quando ci siamo ricordati che quello che stavamo cercando di realizzare non era una proof-of-concept per la tecnologia ma un’esperienza di gioco vera e propria, per quanto dimostrativa.

In base a questo, era evidente la dissonanza tra lo sviluppo avanzato dell’art sulle carte da gioco e la grafica approssimativa del software.
Oltre al fattore estetico, l’interfaccia era appesantita da una moltitudine di elementi ridondanti o irrilevanti. Un incontro fortuito e a tratti mistico con l’esperto di esperienze ludiche interattive Ivan Hamarić allo Spiel di Essen ci ha risvegliato dal nostro sonno, oltre a farci tornare a casa con un amico in più.

Insomma, ci siamo rimessi al lavoro per rendere il contributo del bot più omogeneo, snello ed efficace. Ma soprattutto, abbiamo aggiunto le esplosioni.

La foto di un tavolo cosparso di carte di Light Speed con delle grafiche di raggi laser ed esplosioni in realtà aumentata e una violenta esplosione verde.
Un’astronave esplode e l’onda d’urto distrugge l’unità vicina.

Nel momento in cui il mezzo tecnologico entra a far parte del gioco, ogni sua componente può contribuire all’esperienza così come indebolirla. Quella grafica/estetica non fa eccezione.

Statistiche sull’uso delle modalità di gioco

Un aspetto interessante di un gioco da tavolo ibrido digitale sta nella possibilità di raccoglierne alcuni dati di utilizzo. Al momento in cui scrivo questo articolo, 301 utenti attivi esterni a Tablescope hanno inviato al bot 1307 immagini. Sulle ultime 781 immagini abbiamo tracciato le modalità di gioco scelte dagli utenti con i seguenti risultati:

  • Punti e Highlights: 137 
  • Slideshow: 201 [questa modalità non è sempre stata disponibile]
  • Telecronaca completa: 121
  • Commento rapido: 322

Un grafico a torta con le seguenti percentuali: Punti e Highlights 17,5%, Slideshow 25,7%, Telecronaca completa 15,5%, Commento Rapido 41,2%
Distribuzione nell’utilizzo delle modalità di gioco

I dati sono in linea con le previsioni che avevamo fatto. La telecronaca completa, nonostante sia la modalità che ha richiesto più tempo di sviluppo, è stata pensata per supportare le prime partite e l’onboarding dei nuovi giocatori ed era quindi ragionevole aspettarsi che venisse usata prevalentemente in tali situazioni. Il commento rapido e lo slideshow sono state progettate come modalità di gioco standard e i dati mostrano che i giocatori le hanno usate come tali. In qualche modo è sorprendente il 17,5% della modalità punti e higlights, che conferma la fattibilità di un approccio più distillato e sintetico.

Conclusioni

Una bella sfilza di presupposti che non hanno centrato il bersaglio. Considerato che stiamo cercando di portare al tavolo qualcosa di veramente nuovo, avremmo dovuto preoccuparci del contrario. Anche qui e come sempre, i playtest e i feedback dei colleghi game designer e dei giocatori sono stati la bussola principale dello sviluppo.

Lo strumento del bot Telegram è stato prezioso ma vogliamo ora svincolarci dai limiti che comporta e lavorare su una vera propria app dove continuare a costruire sulle lezioni imparate e i feedback ricevuti.

Stiamo lavorando su una nuova versione commerciale di Light Speed da portare su Kickstarter l’anno prossimo. Se finora è stata soprattutto la tecnologia ad adattarsi al gioco, nei prossimi mesi metteremo in discussione anche diversi aspetti di game design per renderli nativi rispetto alla nuova natura ibrida del gioco e alle possibilità che ne conseguono.

E voi quali presupposti avete dato per scontati nello sviluppo di un vostro progetto per poi trovarvi smentiti?

Contenuti correlati

Potete stampare e giocare gratuitamente il print&play di Light Speed registrandovi alla mailing list di Tablescope. Altri dietro le quinte sul progetto (più dal lato business) li trovate su 2 Pro e 2 Contro per una Start-up che Sviluppa Giochi da Tavolo Ibridi. Se volete invece leggere di un’altra accoppiata insospettabile che coinvolge i giochi da tavolo, andate a Mozart, i Giochi da Tavolo, lo Smartphone.

Share this post

You like our posts? You will love our games.
At Tablescope we make computer vision for tabletop players

INCREDIBLE GAMES ARE COMING SOON!
REGISTER NOW AND GET NOTIFIED

JOIN THE CREW AND GET THE P&P!

JOIN THE CREW AND GET THE P&P!