Segas Dreamcast var i sidste ende en fiasko, da Sony kom til at dominere markedet i begyndelsen af 2000’erne med PlayStation 2. Men Segas maskine efterlod sig et bibliotek med enestående innovativ og indflydelsesrig software. Og måske var ingen titel så mindeværdig som Yutaka “Yoot” Saitos ikonoklastiske Seaman, en virtuel kæledyrssimulator, hvor du skulle bruge en mikrofon til at konversere med en humørsyg og sarkastisk menneskefisk med hjælp fra en fortæller med Leonard Nimoy som stemme.

Yoot Saito var tidligere bedst kendt som en Mac-fokuseret udvikler, der skabte The Tower, et tårnstyringsspil, som SimCity-studiet Maxis udgav på verdensplan som SimTower. (Efterfølgeren, The Tower II, blev kendt som Yoot Tower uden for Japan.) Efter Seaman og efterfølgeren til PS2 udviklede Saito Odama, en hybrid af pinball-strategi til GameCube, hvor spillerne brugte stemmekommandoer til at dirigere soldater på bordet.

Denne sommer er det 20 år siden Seaman udkom, så jeg tog kontakt med Saito via e-mail for at diskutere udviklingen og arven efter spillet. Hans svar var så dybtgående med forskellige lidenskabelige tangenter til emner som videospilhistorie og lingvistik, at jeg besluttede at gengive dem her med minimal redigering.

Dette interview er blevet let redigeret af hensyn til klarheden.

Om hvordan Seaman blev til efter SimTower

“Hvis du bare adskiller temaerne, er det ene et spil om at bygge skyskrabere, og det andet handler om at opdrage en fisk med menneskeansigt, så de ser helt forskellige ud. hvis du sporer mit udgangspunkt i spilbranchen, var det fordi det mesterværk, som SimCity er, havde en dybtgående effekt på mig og førte til, at jeg fik lyst til at lave spil. Så min kerneinteresse dengang og også nu er simulationsspil.

Hvis jeg skal være endnu mere specifik, vil jeg sige, at jeg har en stor interesse for kommunikation og sprog. For mig er det mest grundlæggende aspekt ved et computerspil at opbygge en ny verden som spildesigner via det “sprog”, som spillet er. For at gøre det er man nødt til at fjerne de unødvendige dele af den virkelige verden og opdele det, man vælger at beholde, som centrale spilfunktioner eller elementer, der kan interageres med som genstande eller via spilkommandoer. Det er den centrale rygrad i simulationsspil.

Så til det punkt er Seaman et spil, hvor udfordringen var at bruge sprogets filter til at bygge bro over kløften mellem gamer og ikke-gamer. At forsøge at omdanne det faktiske sprog til et sprogelement/filter til spil er utroligt udfordrende, men det er faktisk som at omdanne naturlige sprogudtryk til spillekort og spille et kortspil med en anden person.

Det betyder, at Seaman faktisk er som at spille poker. Nøgleordene er de “kort”, der spilles frem og tilbage mellem slutbrugeren og spilfiguren (Seaman). De fleste spillere vil ikke være klar over det, men Seaman er et spil med en masse push-pull-spilelementer på samme måde som poker. Denne frem- og tilbagestrømning er en drivende mekanik i spillet. Ligesom i SimTower, når man tilføjer et sikkerhedsrum i skyskraberen, fører det at give Seaman et andet nøgleord til en helt ny samtalevej, og det er måske den nemmeste måde at formidle dette koncept på.

Jeg udtænkte ideen til Seaman under en frokost en dag. Jeg talte med en udvikler, der arbejdede sammen med mig på et nyt spil i Tower-serien. Vi havde flere projekter i gang, og et af holdene arbejdede på et simulationsspil, hvor man opdrættede tropiske fisk i et akvarium. Vi lavede bare sjov, men jeg sagde: “Hvis jeg skulle lave et spil som dette, ville jeg gøre noget skørt!” Hvortil min kollega svarede: “Ja, som hvad specifikt?” Jeg følte, at jeg var i knibe og var nødt til at sige noget hurtigt.

“Jeg ville have kameraet rettet mod brugeren og lade kæledyret tale med menneskelige ord. Noget i retning af: ‘Hvem var den kvinde, du bragte her i går?’ Sådan et kæledyr ville være fantastisk”. En anden kollega sagde: “Det ville være virkelig mærkeligt,” hvortil jeg svarede: “Ja, mærkeligt og fantastisk! Selvfølgelig kunne vi ikke kalde den Sea Monkey … vi er nødt til at kalde den Seaman! Og det blev projektets kodenavn og det endelige navn på det egentlige spil.

Alle grinede af ideens latterlige karakter, men i den weekend fortalte jeg min kone om den, og hun fandt den også mærkelig og fantastisk. Så det var et koncept, der var universelt mærkeligt for både mænd og kvinder. Og så sagde hun: “Det er et virkelig mærkeligt og ulækkert koncept, så du bør helt sikkert lave det! Og det var der, det gik op for mig, at selv kvinder kunne nyde og værdsætte et spil, der var mærkeligt og ulækkert. De ord var med til at træffe min beslutning om seriøst at lave spillet.”

Yoot Saito.

Om indflydelsen fra 90’ernes virtuelle kæledyr og Shigeru Miyamoto

“Når du siger, at virtuelle kæledyr var populære i 90’erne, går jeg ud fra, at du mener Tamagotchi, men jeg var ikke superinteresseret i den trend. Fordi, som jeg nævnte før, kan jeg godt lide komplekse simulationsspil. Jo mere komplekst temaet er, jo mere det er noget, som ingen andre skabere har lavet, jo mere interesserede det mig. Så jeg ønskede ikke at følge en andens trend.

De fleste spilskabere finder en vinderopskrift i et populært spil og tilfældigvis et par elementer eller designstykker, historie osv. og kalder det så at skabe et spil. Men jeg forstår ikke den tankegang. At man ikke fokuserer på efterfølgere og ønsker at lave noget virkelig mærkeligt og nyt, eller man kan sige, noget som højst sandsynligt ikke vil tjene penge er ret sjældent. Jeg har kun mødt én anden person, der kan forstå min grundlæggende følelse, og det er Nintendos Shigeru Miyamoto.

Miyamoto-san kan virkelig godt lide mærkelige og anderledes koncepter. Så selv om Seaman blev udgivet på Dreamcast, var vi bag kulisserne meget tæt på at vælge at udvikle spillet på Nintendo 64DD. Faktisk blev Miyamoto-san omkring den tid, hvor Seaman blev udgivet på Nintendos konkurrerende hardware, Dreamcast, vist i et blad iført en Seaman-trøje. Seaman blev i sidste ende udgivet af Sega, men Miyamoto-san var en utrolig vigtig person i processen med at få Seaman lavet, især for en person som mig selv med meget lidt erfaring med konsolspil.

Og selv om Sonys robothund Aibo blev udgivet omkring samme tid som Seaman, blev ingen af produkterne påvirket af det andet. Tilfældigvis havde jeg faktisk samtaler om en tobenet robot fra flere firmaer. Selv om det er 20 år siden, at Seaman så dagens lys, er jeg ved at lave en AI-motor, der er i stand til at tale uden at have brug for allerede eksisterende scenarier eller tekststrenge. Det har været en lang vej at komme hertil. At opfinde dette har taget meget tid og brugt en betydelig mængde af forskellige investeringer, men hvis du spørger mig, er det ligaer mere interessant end bare at udvikle et normalt spil og helt sikkert mere spændende.”

Hvordan Seaman kom til Dreamcast

“Faktisk var det en mand ved navn Irimajiri-san, som var vicepræsident hos Sega på det tidspunkt og senere blev præsident, der førte til, at Seaman blev udgivet til Dreamcast. En anden skaber ved navn Kenji Eno-san fortalte mig, at han havde en person, som han virkelig gerne ville have, at jeg skulle møde, og han præsenterede mig for Irimajiri-san.

Dengang blev Dreamcast stadig omtalt under kodenavnet Katana og var en ny type spilkonsol. Irimajiri-san var tidligere præsident for Honda i USA og mente, at Sega var nødt til at fokusere på nye typer af gamere. Det var dengang, hvor Sony var konge, og derfor besluttede jeg, at det ville være interessant at være med i markedslederen fra en lavere position, og jeg kom til Sega. Det var en stor udfordring at ændre en prototype, der var bygget på Mac, til en ny forbrugerhardware, men vi var i stand til at gøre det på omkring halvandet år. Det er takket være alt det hårde arbejde fra holdet dengang, at vi kunne nå dette mål.”

Dreamcast-mikrofonen.
Evan-Amos

Om Dreamcast-hardwaren

“Dreamcast-mikrofonen blev udviklet af Sega’s periferiteam. Jeg kan huske, at de allerede havde en prototype oppe og køre. Men at bringe et PC-udviklet spil over på en konsol gav en del problemer. Spil udviklet til PC var fokuseret på at bruge en mus og et tastatur. I bund og grund skulle man tage sig god tid til at spille de fleste PC-fokuserede spil. Man spillede et par spil/runder/runder på tastaturet og musen og skiftede derefter over til at arbejde på de samme input-enheder. Det var spil, som man bare kunne bruge lidt tid på, men som ikke krævede hele ens fokus.

Men omvendt krævede konsolspil, at man sad foran tv’et med hele ens fokus på spillet. Du tog fat i den eldrevne spilcontroller og sagde i bund og grund: “Det er spilletid!”, og det ville arbejdet ikke afbryde. Du trykkede hurtigt på flere knapper, lavede forskellige bevægelser og var fokuseret på denne oplevelse. I konsolindustrien ønskede man spiloplevelser med dyb fokus og interaktivitet. Da vores spil blev udviklet på pc, passede vores kernefokus og oplevelse ikke til den målrettede konsolplatform. Vi var nødt til at udvikle nye måder at interagere med spillet på, der krævede flere handlinger (tryk på knapper osv.) fra slutbrugeren og ting, der fik dem til at fokusere konstant konstant på spillet, mens de spillede det, hvilket førte til nogle store designændringer.”

Om lokalisering af Seaman til engelsk

“Jeg bad Sega of America (SOA) om at stå for næsten hele lokaliseringen af den engelske version af Seaman. Grunden til dette er, at der er en voldsom kulturel forskel mellem de forskellige lande, og når nogen i Japan spørger dig om din blodtype, svarer det til at spørge nogen om deres stjernetegn. Så oversættelse alene ville ikke have været nok til at udvikle en engelsk version af Seaman. Man var nødt til stort set at omskrive manuskriptet for at få det til at fungere. SOA kendte en tredjepart, der var meget dygtig til at omskrive scripts, så de fokuserede på det, hvilket gjorde det muligt for vores team at fokusere på at opbygge kernesystemet og spillet uden begrænsninger. Det eneste forslag, jeg havde, var at bruge Leonard Nimoy som brugervejledningsstemme.

Japansk er et meget nuanceret, kompliceret og følelsesbaseret sprog. Det er et sprog, der er fantastisk til eftertrykkeligt at dele subjektive følelser, så japansk forbinder virkelig til dybe dele af en talers følelser. Da jeg ikke har engelsk som modersmål kan jeg ikke udtale mig om de dybe forbindelser, man kan føle, når man taler engelsk, men jeg kan sige, at da jeg læste spilsammenligningen mellem Ecco the Dolphin og Seaman i Rolling Stone Magazine, stod det klart for mig, at skribenterne gjorde et godt stykke arbejde med at forstå spillets kernekoncept.”

Om stemmegenkendelsesteknologiens tilstand på det tidspunkt

“Den talegenkendelsesmotor, vi brugte sammen med Sega i Seaman, var licenseret fra et belgisk firma. Vi brugte deres talegenkendelsesmotorer som brugere, ikke som skabere. Da hukommelsesstørrelsen var begrænset på det tidspunkt, var talegenkendelsens ydeevne helt anderledes end i dag. Specifikt brugte vi en funktion kaldet navigation. I dag kaldes den almindelige funktion for diktering. Når man opretter en samtale af navigationstypen, skal den på forhånd forudsige, hvad brugeren sandsynligvis vil sige, og have det som et valg. Hvis brugeren udtaler et ord, der ikke er et valg, vil den få en fejl. Derfor skal forfatteren på forhånd sætte sig ind i, hvilke slags ord brugeren vil sige, og lave en samtale, der fører til et af dem. På grund af dette havde man en struktur, hvor samtaler foregår, mens man udforsker intentioner. Det var en interessant oplevelse, som ikke var blevet gjort i et spil før.”

Om at designe spillet omkring tekniske begrænsninger

“På det tidspunkt var der ikke andre spil ud over Seaman, der havde stemmesamtaler, og der er ikke så mange selv nu, så det er svært at sammenligne. Men selve stemmegenkendelsesteknologien udvikler sig hurtigt lige nu – hvis en dygtig spildesigner arbejdede på noget, tror jeg, at de kunne lave et virkelig interessant spil. Men når man taler om stemmegenkendelse som teknologi, når man forsøger at overskride en vis tærskel (som menneske), er det intelligens der kræves, ikke høreevne. Med andre ord er det, der er uundværligt, ikke stemmegenkendelsesteknologi, men snarere forståelse af kunstig intelligens. Hastigheden af AI’s fremskridt er virkelig hurtig lige nu, så jeg synes, det er en sjov tid.

For at vende tilbage til emnet var jeg i stand til at afslutte udviklingen af Seaman netop på grund af grænsen i teknologien. Havde der ikke været nogen, ville jeg aldrig have afsluttet det. Som jeg sagde tidligere, når man bringer et spil, der er udtænkt på en pc, ud til forbrugeren, er der en stor miljømæssig forskel, der hedder tidstæthed. Hvordan jeg skulle gå til værks for at overvinde den testede min klogskab, kan man sige.”

Om Seamans personlighed

“Grunden til, at Seamans personlighed og baggrund er så karakteristisk, er, at den indeholder min filosofiske idé, ikke et specifikt budskab. I begyndelsen af Seaman-projektet besluttede jeg fast, at det ville være det modsatte af konventionelle spil i tre henseender:

  • Det ville ikke være nuttet
  • Det ville kigge ind i gamerens verden indefra tv’et
  • Samtaletemaet ville være dagligdags ting, ikke en fantasiverden

Jeg var overbevist om, at hvis jeg holdt mig til disse tre aspekter, ville det blive helt anderledes end alle andre spil – noget anderledes, som ikke ses ofte. Det var min strategi, og det er det, jeg stadig stræber efter at gøre, selv nu.”

Om reaktionen på Seaman

“Reaktionen på udgivelsen af Seaman i Japan var meget større end i USA. Det kom til at blive et socialt fænomen, som f.eks. komikere, der optrådte i japanske tv-shows, hvor de efterlignede og bar Seaman-kostumer, eller nyhederne, der sagde: “Spil har udviklet sig så meget!”

Tilbage til min personlige filosofi: Når en japansk skaber skaber skaber en verden på japansk til japanske brugere, der har en stor effekt, er det sociale fænomen, at det tiltrækker forskellige medier og samfundet. I USA var fænomenet som: “Der er udkommet et relativt sjældent spil. Det er til Segas nye hardware, som de har presset på i konsolkrigene”. Så jeg tror, at anerkendelsen er helt anderledes.

Efter 20 år ser jeg aktuelle udøvende kunstnere på tv i Japan, som stadig taler om Seaman. De sagde, at det var fordi det havde en stor indflydelse på dem, da de var børn. De spøgte og sagde: ‘Seaman traumatiserede mig i min tidlige barndom’. Som skaber er det en stor ære.”

Om SeaMail, spinoff’en til Windows-desktoppen

“SeaMail er en slags prototype på en mere alsidig pc-platform, der udveksler lidt mere komplicerede ord. På grund af budgetbegrænsninger nåede det ikke særlig langt i færdiggørelsen, men det var et meget ambitiøst forsøg. Så Seaman lever, i modsætning til brugeren, i skrivebordsverdenen på en multifunktionel pc og ser på indholdet af brugerens e-mails, hyppigheden af interaktion med bestemte personer og kommentarer om brugerens forhold til andre. Det var meget lig den nuværende Siri. Denne viden findes i den kunstige konversationsmotor, som jeg arbejder på nu.”

Odama

Om brugen af mikrofonen i Odama

“Formålet med mikrofonen i Odama er helt anderledes end i Seaman. Odama er et spil, der simulerer et slagsmål mellem soldater. Jeg var interesseret i denne såkaldte ‘samurai-mængde’. Grunden til mikrofonen var, at begge brugerens hænder er optaget af flipperen. Stemmen blev ikke brugt til andet end at give kommandoer. Jeg var også motiveret til at bruge den, fordi jeg ønskede at genskabe følelsen af en general, der giver ordrer til en flok soldater i feudale kampe. Jeg ville have det til at føles som en fodboldtræner, der giver ordrer som “skub” og “til højre”. Det er det hele.

For mig var Odama det største mesterværk i mit liv, men lanceringen blev forsinket igen og igen. Jeg tror, at jeg virkelig irriterede Nintendo. Programmørerne på det tidspunkt havde ingen idé om at styre menneskemængder med autonome robotter eller kunstig intelligens, så udviklingen blev sat ret meget tilbage.”

Om den nuværende AI- og stemmeassistentteknologi

“Kunstig intelligens er på et meget avanceret stadie lige nu, men samtalemetoden inden for japansk har ikke ændret sig i 20 år. Seaman var et spil, hvor planlæggeren skrev allerede eksisterende scenarier, og folk nød, hvordan de udspillede sig.

Uendelig samtale var umulig. Så jeg er ikke længere interesseret i det projekt. Scenarierne kan kun øges med to eller fire gange i forhold til det tidligere spil. Derfor startede jeg Artificial Intelligence Laboratory for at skabe en motor, der bliver ved med at tale, selv uden scenarier. Hvis vi kan færdiggøre denne motor, vil vi begynde at udvikle en “sømand uden ende i scenarier”. Det nye vil være sømandens stemme, der genereres og tales på stedet i realtid, på stedet, og ikke en forudindspillet stemme. Det kræver en masse opfindsomhed, men lige nu er vi først lige begyndt at se lyset for enden af tunnelen.

Yoot Saito.

Japansk er et meget ejendommeligt sprog, idet det ser ud til at have en solid grammatik, men det har det faktisk ikke. Nå, men faktisk er det ikke rigtigt at sige, at det ikke har det. Den japanske grammatik, som vi lærte i skolebøgerne, er meget fremmedgjort fra den japanske grammatik, som vi bruger i samtaler, og som ikke er en rigtig grammatik. Denne divergens og modsigelse er blevet ignoreret i årtier. Der var ingen grund til at gøre noget så kostbart som at tilføje en ny grammatik. På japansk er der to eller tre subjekter. Den SVOC-stil, der blev foreslået af USA efter krigen, er imidlertid kommet til at blive brugt. Lingvister har længe argumenteret for dette, men ingen af dem, der holder sig til at skrive afhandlinger, har lavet en AI-motor og forsøgt at bevise, at deres hypotese er korrekt.

Og nu er det tid for konversationsmotorer. Det har måske ikke været nødvendigt at omdefinere grammatikken til skolerne, men det er nødvendigt at omdefinere japansk på logisk vis for at en robot kan tale. Så det er det, vi har arbejdet på.

Det har været svært. Trial and error, on and off i ca. 10 år. Da jeg ændrede grammatikken til to eller tre fag ved hjælp af digitalisering og symboler, begyndte det at lykkes. Min erfaring med udviklingen af Seaman og med nuancer ved at lave stemmeskuespil var med til at gøre det muligt – især det faktum, at betydningen af et ord ændrer sig alt efter, hvordan ‘melodien’ anvendes. Vi bemærkede, at japansk grammatik ligger i melodier og ikke i bogstaver. Dette var ikke tydeligt i papir- og pennealderen. Jeg havde overset dette som en nuance, når det faktisk har været en grundpille i japansk grammatik, og som stemmeskuespiller i Seaman-serien blev jeg opmærksom på dette begreb og besluttede mig for at udvikle en melodi-genkendelsesmotor.”

Om aktuelle projekter

“Lige nu er jeg ved at skabe en konversationsmotor, der fortsætter med at tale, selv om der ikke er noget scenarie. Til det formål har vi oprettet en organisation, der hedder ‘Seaman Artificial Intelligence Laboratory’. Når denne motor er færdig, tror jeg, at stemmegenkendelse i samtaler vil ændre sig meget.

Jeg forventer, at et talende robotprodukt vil blive lanceret i Japan om ca. et halvt år. Når først bolden kommer i gang, vil jeg gerne licensere denne motor til mange maskiner og skabe en æra, hvor japanskproducerede mikrobølgeovne, biler, kameraer og robotter taler flydende. Vi ser frem til at se det ske, og vi leder efter folk og investorer, der vil hjælpe os med engelsk. Et engelsk websted er stadig under udarbejdelse, men du kan kontakte hjemmesiden: www.seaman.ai.”

Gaming

Wait, GameStop sælger GPU’er nu?

Spil

Among Us’ næste opdatering tilføjer en bajshat

Spil

Balan Wonderworld får dag ét-patch for at rette ‘potentiel blinkfejl’, der udgør en epilepsirisiko

Se alle historier i Spil

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.