Segas Dreamcast blev i slutändan ett misslyckande, eftersom Sony kom att dominera marknaden i början av 2000-talet med PlayStation 2. Men Segas maskin lämnade efter sig ett bibliotek med unikt innovativ och inflytelserik programvara. Och kanske ingen titel var så minnesvärd som Yutaka ”Yoot” Saitos ikonoklastiska Seaman, en virtuell husdjurssimulator där du fick använda en mikrofon för att konversera med en stämningsfull, sarkastisk fiskman, med hjälp av en berättare med Leonard Nimoys röst.

Yoot Saito var tidigare mest känd som en Mac-utvecklare som skapade The Tower, ett tornförvaltningsspel som SimCity-studion Maxis släppte världen över under namnet SimTower. (Uppföljaren The Tower II kom att kallas Yoot Tower utanför Japan.) Efter Seaman och dess PS2-uppföljare skapade Saito Odama, en hybrid av flipperspel och strategi för GameCube där spelarna använde röstkommandon för att styra soldater på bordet.

I sommar är det 20 år sedan Seaman släpptes, så jag tog kontakt med Saito via e-post för att diskutera spelets utveckling och arv. Hans svar var så djupgående, med olika passionerade tangenter till ämnen som videospelshistoria och lingvistik, att jag bestämde mig för att återge dem här med minimal redigering.

Denna intervju har redigerats lätt för tydlighetens skull.

Om hur Seaman kom till efter SimTower

”Om man bara skiljer ut temana så är det ena spelet ett spel som handlar om att bygga skyskrapor och det andra handlar om att uppfostra en fisk med människoansikte, så de ser faktiskt helt olika ut. om man spårar min startpunkt i spelbranschen var det för att det mästerverk som SimCity är hade en djupgående effekt på mig och ledde till att jag ville göra spel. Så mitt kärnintresse då och även nu är simuleringsspel.

Om jag skulle vara ännu mer specifik skulle jag säga att jag har ett stort intresse för kommunikation och språk. För mig är den mest grundläggande aspekten av ett datorspel att bygga upp en ny värld som speldesigner via det ”språk” som spelet utgör. För att göra det måste man ta bort onödiga delar av den verkliga världen och bryta ner det man väljer att behålla som viktiga spelfunktioner eller element som man kan interagera med som föremål eller via spelkommandon. Det är kärnan i simuleringsspel.

Så till den punkten är Seaman ett spel där utmaningen var att använda språkets filter för att överbrygga klyftan mellan spelare och icke-spelare. Att försöka omvandla verkligt språk till ett språkelement/filter för spel är otroligt utmanande, men det är faktiskt som att omvandla naturliga språkuttryck till spelkort och spela ett kortspel med en annan person.

Det betyder att Seaman faktiskt är som att spela poker. Nyckelorden är de ”kort” som spelas fram och tillbaka mellan slutanvändaren och spelkaraktären (Seaman). De flesta spelare skulle inte inse det, men Seaman är ett spel med många push-pull-spelelement på samma sätt som poker. Detta fram och tillbaka är en drivande mekanik i spelet. Precis som i SimTower när man lägger till ett säkerhetsrum i skyskrapan leder det till en helt ny samtalsväg att ge Seaman ett annat nyckelord, och det är kanske det enklaste sättet att förmedla det här konceptet.

Jag tänkte ut idén om Seaman under en lunch en dag. Jag pratade med en utvecklare som arbetade tillsammans med mig på ett nytt tornseriespel. Vi hade flera projekt igång och ett av teamen arbetade med ett simuleringsspel där man födde upp tropiska fiskar i ett akvarium. Vi skämtade bara, men jag sa: ”Om jag skulle göra ett sånt här spel skulle jag göra något galet!” Till detta svarade min kollega: ”Ja, som vad specifikt?” Det kändes som om jag var på plats och var tvungen att säga något snabbt.

”Jag skulle ha kameran vänd mot användaren och låta husdjuret tala med mänskliga ord. Något i stil med: ”Vem var den där kvinnan som du tog hit i går? Ett sådant husdjur skulle vara fantastiskt. En annan medarbetare sa: ”Det skulle vara väldigt konstigt”, varpå jag svarade: ”Ja, konstigt och fantastiskt!”. Naturligtvis kunde vi inte kalla den Sea Monkey… vi måste kalla den Seaman! Och det blev projektets kodnamn och det slutliga namnet på det faktiska spelet.

Alla skrattade åt den löjliga idén, men den helgen berättade jag om den för min fru och hon tyckte också att den var konstig och fantastisk. Så det var ett koncept som var universellt märkligt för män och kvinnor. Och sedan sa hon: ”Det är ett riktigt konstigt och äckligt koncept så du borde definitivt göra det!”. Och det var då jag insåg att även kvinnor kunde njuta av och uppskatta ett spel som var konstigt och äckligt. De orden bidrog till mitt beslut att göra spelet på allvar.”

Yoot Saito.

Om inflytandet från 90-talets virtuella husdjur och Shigeru Miyamoto

”När du säger att virtuella husdjur var populära på 90-talet antar jag att du menar Tamagotchi, men jag var inte superintresserad av den trenden. Eftersom jag, som jag nämnde tidigare, gillar komplexa simuleringsspel. Ju mer komplext temat är, ju mer det är något som ingen annan skapare hade gjort, desto mer intresserade det mig. Så jag ville inte följa någon annans trend.

De flesta spelskapare hittar ett vinnande recept i ett populärt spel och chansar på några element eller designdelar, berättelse osv. och kallar sedan detta för att skapa ett spel. Men jag förstår inte det tankesättet. Att inte fokusera på uppföljare och att vilja göra något riktigt konstigt och nytt, eller man skulle kunna säga något som med största sannolikhet inte kommer att tjäna pengar, är ganska sällsynt. Jag har bara träffat en annan person som kan förstå min grundkänsla och det är Nintendos Shigeru Miyamoto.

Miyamoto-san gillar verkligen konstiga och annorlunda koncept. Så även om Seaman släpptes till Dreamcast var vi bakom kulisserna mycket nära att välja att utveckla spelet till Nintendo 64DD. Faktum är att runt den tid då Seaman släpptes till Nintendos rivaliserande hårdvara, Dreamcast, var Miyamoto-san med i en tidning i en Seaman-skjorta. Seaman släpptes så småningom av Sega, men Miyamoto-san var en otroligt viktig person i processen att få fram Seaman, särskilt för någon som jag själv med mycket liten erfarenhet av konsolspel.

Och även om Sonys robothund Aibo släpptes ungefär samtidigt som Seaman, påverkades ingen av produkterna av den andra. Av en slump hade jag faktiskt samtal om en tvåbent robot från flera företag. Även om det har gått 20 år sedan Seaman såg dagens ljus, gör jag en AI-motor som kan tala utan att behöva befintliga scenarier eller textsträngar. Det har varit en lång väg att komma hit. Att uppfinna detta har tagit mycket tid och förbrukat en betydande mängd olika investeringar, men om du frågar mig är det ligor mer intressant än att bara utveckla ett vanligt spel och definitivt mer spännande.”

Hur Seaman kom till Dreamcast

”Egentligen var det en man vid namn Irimajiri-san, som var vicepresident på Sega på den tiden och som senare blev president, som ledde till att Seaman släpptes till Dreamcast. En annan skapare som hette Kenji Eno-san berättade för mig att han hade någon som han verkligen ville att jag skulle träffa och presenterade mig för Irimajiri-san.

På den tiden kallades Dreamcast fortfarande för sitt kodnamn Katana och var en ny typ av spelkonsol. Irimajiri-san var tidigare ordförande för Honda i USA och ansåg att Sega behövde fokusera på nya typer av spelare. Det var en tid då Sony var kung och jag bestämde mig därför för att det skulle vara intressant att vara med i marknadsledaren från en lägre position och gick med i Sega. Att ändra en prototyp byggd på Mac till en ny konsumenthårdvara var ganska utmanande, men vi lyckades göra det på ungefär ett och ett halvt år. Det är tack vare allt hårt arbete från teamet då som vi kunde uppnå detta mål.”

Dreamcast-mikrofonen.
Evan-Amos

Om Dreamcast-hårdvaran

”Dreamcast-mikrofonen utvecklades av Segas periferiteam. Jag minns att de redan hade en prototyp igång. Att föra över ett PC-utvecklat spel till konsolen innebar dock en hel del problem. Spel som utvecklades för PC var inriktade på att använda mus och tangentbord. I grund och botten skulle man ta god tid på sig när man spelade de flesta PC-fokuserade spel. Man spelade några spel/turer/rundor med tangentbord och mus och övergick sedan till att arbeta med samma inmatningsenheter. Det var spel som du bara kunde ägna lite tid åt, men som inte krävde hela ditt fokus.

Tvärtom krävde konsolspel att du satt framför TV:n med hela ditt fokus på spelet. Du tog tag i den eldrivna spelkontrollen och sa i princip ”Det är dags att spela!” och arbetet skulle inte avbryta detta. Du tryckte snabbt på flera knappar, utförde olika rörelser och var fokuserad på den upplevelsen. Konsolindustrin ville ha spelupplevelser med djupt fokus och interaktivitet. Eftersom vårt spel utvecklades på PC passade vårt kärnfokus och vår upplevelse inte till målkonsolplattformen. Vi behövde utveckla nya sätt att interagera med spelet som krävde fler handlingar (knapptryckningar etc.) från slutanvändaren och saker som fick dem att ständigt fokusera konstant på spelet medan de spelade det, vilket ledde till några stora designförändringar.”

Om att lokalisera Seaman till engelska

”Jag bad Sega of America (SOA) att sköta nästan all lokalisering för den engelska versionen av Seaman. Anledningen till detta är att det finns en stark kulturell skillnad mellan olika länder och när någon i Japan frågar dig vad du har för blodgrupp är det likvärdigt med att fråga någon vad deras stjärntecken är. Enbart översättning skulle alltså inte ha räckt för att utveckla en engelsk version av Seaman. Man behövde i stort sett skriva om manuset för att det skulle fungera. SOA kände en tredje part som var mycket skicklig på att skriva om manus så de fokuserade på det, vilket gjorde att vårt team kunde fokusera på att bygga ut grundsystemet och spelet utan begränsningar. Det enda förslag jag hade var att använda Leonard Nimoy som röst för användarvägledning.

Japanska är ett mycket nyanserat, komplicerat och känslobaserat språk. Det är ett språk som är utmärkt för att empatiskt dela subjektiva känslor, så japanska kopplar verkligen till djupa delar av en talares känslor. Eftersom jag inte har engelska som modersmål kan jag inte kommentera de djupa kopplingar man kan känna när man talar engelska, men jag kan säga att när jag läste speljämförelsen mellan Ecco the Dolphin och Seaman i tidningen Rolling Stone stod det klart för mig att skribenterna gjorde ett bra jobb med att förstå spelets kärnkoncept.”

Om läget när det gällde tekniken för röstigenkänning vid den här tiden

”Den motor för röstigenkänning vi använde tillsammans med Sega i Seaman var licensierad från ett belgiskt företag. Vi använde deras taligenkänningsmotorer som användare, inte som skapare. Eftersom minnesstorleken var begränsad på den tiden var prestandan för taligenkänning helt annorlunda än vad den är nu. Specifikt använde vi en funktion som kallas navigation. För närvarande kallas den vanliga funktionen för diktering. När man skapar en konversation av navigationstyp måste den i förväg förutsäga vad användaren sannolikt kommer att säga och ha det som valmöjlighet. Om användaren yttrar ett ord som inte är ett alternativ får den ett fel. Därför måste skribenten i förväg sätta vilken typ av ord användaren kommer att säga och skapa en konversation som leder till ett av dem. På grund av detta hade man en struktur där konversationer görs samtidigt som man utforskar avsikter. Det var en intressant upplevelse som inte hade gjorts i ett spel tidigare.”

Om att utforma spelet kring tekniska begränsningar

”På den tiden fanns det inga andra spel förutom Seaman som hade röstsamtal, och inte så många ens nu, så det är svårt att jämföra. Men tekniken för röstigenkänning i sig utvecklas snabbt just nu – om en smart speldesigner arbetade på något tror jag att de skulle kunna göra ett riktigt intressant spel. Men när man talar om röstigenkänning som teknik, när man försöker överskrida en viss tröskel (som människa) krävs intelligens, inte hörselförmåga. Med andra ord är det oumbärliga inte tekniken för röstigenkänning, utan snarare förståelsen för artificiell intelligens. Hastigheten i utvecklingen av artificiell intelligens är verkligen snabb just nu, så jag tycker att det är en rolig tid.

För att återgå till ämnet kunde jag avsluta utvecklingen av Seaman just på grund av gränsen i tekniken. Hade det inte funnits någon sådan skulle jag aldrig ha avslutat det. Som jag sade tidigare, när man för över ett spel som utformats på en PC till konsumenten finns det en stor miljöskillnad som kallas tidsdensitet. Hur man skulle gå till väga för att övervinna detta testade min visdom, skulle man kunna säga.”

Om Seamans personlighet

”Anledningen till att Seamans personlighet och bakgrund är så utmärkande är att den innehåller min filosofiska idé, inte ett specifikt budskap. I början av Seaman-projektet bestämde jag bestämt att det skulle vara motsatsen till konventionella spel i tre avseenden:

  • Det skulle inte vara gulligt
  • Det skulle titta in i spelarens värld inifrån TV:n
  • Samtalstemat skulle vara vardagliga saker, inte en fantasivärld

Jag var övertygad om att om jag höll mig till dessa tre aspekter skulle det bli ett spel som var helt olikt alla andra spel – något annorlunda, som man inte ser ofta. Detta var min strategi och det som jag fortfarande strävar efter att göra, även nu.”

Om reaktionen på Seaman

”Reaktionen på Seamans lansering i Japan var mycket större än i USA. Det kom att bli ett socialt fenomen, till exempel komiker som dök upp i japanska tv-program där de imiterade och bar Seaman-dräkter, eller nyheterna som sa: ”Spel har utvecklats så mycket!”

Om jag återknyter till min personliga filosofi, när en japansk skapare skapar en värld på japanska för japanska användare som har en stor påverkan, så är det sociala fenomenet att det attraherar olika medier och samhället. I USA var fenomenet ungefär som: ”Ett relativt sällsynt spel har kommit ut. Det är för Segas nya hårdvara som de har drivit i konsolkriget”. Så jag tror att erkännandet är helt annorlunda.

Efter 20 år ser jag aktuella artister på TV i Japan som fortfarande talar om Seaman. De sa att det berodde på att det hade en stor inverkan på dem när de var barn. De skämtade och sa: ”Seaman traumatiserade mig i min tidiga barndom”. Som skapare är detta en stor ära.”

Om SeaMail, spinoff för Windows-datorn

”SeaMail är en slags prototyp på en mer mångsidig PC-plattform som utbyter lite mer komplicerade ord. På grund av budgetrestriktioner kom det inte särskilt långt i färdigställandet, men det var ett mycket ambitiöst försök. Seaman lever alltså, till skillnad från användaren, i skrivbordsvärlden på en multifunktionsdator och tittar på innehållet i användarens e-postmeddelanden, frekvensen av interaktion med specifika personer och kommentarer om användarens förhållande till andra. Det var mycket likt den nuvarande Siri. Denna kunskap finns i den artificiella konversationsmotor som jag arbetar med nu.”

Odama

Om användningen av mikrofonen i Odama

”Syftet med mikrofonen i Odama är helt annorlunda än i Seaman. Odama är ett spel som simulerar en strid mellan soldater. Jag var intresserad av denna så kallade ”samurajskara”. Anledningen till mikrofonen var att användarens båda händer är upptagna av flipperspelet. Rösten användes inte för något annat än att ge kommandon. Jag var också motiverad att använda den eftersom jag ville återskapa känslan av en general som ger order till en grupp soldater i feodala strider. Jag ville att det skulle kännas som en fotbollstränare som ger order som ”tryck” och ”till höger”. Det är allt.

För mig var Odama det största mästerverket i mitt liv, men lanseringen försenades gång på gång. Jag tror att jag verkligen irriterade Nintendo. Programmerarna på den tiden hade ingen aning om att kontrollera folkmassor med autonoma robotar eller artificiell intelligens, så utvecklingen blev ganska mycket försenad.”

Om nuvarande teknik för artificiell intelligens och röstassistenter

”Artificiell intelligens befinner sig i ett mycket avancerat skede just nu, men sättet att konversera inom japanskan har inte förändrats på 20 år. Seaman var ett spel där planeraren skrev redan existerande scenarier och folk njöt av hur de utspelade sig.

Oändlig konversation var omöjligt. Så jag är inte längre intresserad av det projektet. Scenarierna kan bara ökas med två eller fyra gånger jämfört med det tidigare spelet. Därför startade jag Artificial Intelligence Laboratory för att skapa en motor som fortsätter att prata även utan scenarier. Om vi kan färdigställa den här motorn kommer vi att börja utveckla en ”sjöman utan slutscenario”. Det nya kommer att vara sjömansrösten som genereras och talas på plats i realtid, på plats, inte en förinspelad röst. Detta kräver en hel del uppfinningsrikedom, men just nu börjar vi bara se ljuset i slutet av tunneln.

Yoot Saito.

Japanskan är ett mycket märkligt språk i det avseendet att det verkar ha en solid grammatik, men det har det faktiskt inte. Egentligen är det inte rätt att säga att det inte har det. Den japanska grammatik som vi lärde oss i skolböckerna är mycket alienerad från den japanska som vi använder i samtal, som inte är en riktig grammatik. Denna divergens och motsägelse har ignorerats i årtionden. Det fanns ingen anledning att göra något så kostsamt som att lägga till ny grammatik. På japanska finns det två eller tre subjekt. Den SVOC-stil som föreslogs av USA efter kriget har dock kommit att användas. Lingvister har länge argumenterat för detta, men ingen av dem, som håller sig till att skriva avhandlingar, har gjort en AI-motor och försökt bevisa att deras hypotes är korrekt.

Och nu är det dags för konversationsmotorer. Det kanske inte har varit nödvändigt att omdefiniera grammatiken för skolorna, men det är nödvändigt att logiskt omdefiniera japanska för att en robot ska kunna tala. Så det är vad vi har arbetat med.

Det har varit svårt. Försök och misstag, till och från i ungefär tio år. När jag ändrade grammatiken till två eller tre ämnen genom digitalisering och symboler började jag lyckas. Min erfarenhet av utvecklingen av Seaman och med nyansering av att göra röstskådespeleri hjälpte till att göra detta möjligt – särskilt det faktum att betydelsen av ett ord ändras beroende på hur ”melodin” tillämpas. Vi märkte att japansk grammatik finns i melodier, inte i bokstäver. Detta var inte uppenbart under pappers- och pennaåldern. Jag hade förbisett detta som en nyans, när det i själva verket har varit en grundpelare i japansk grammatik, och som röstskådespelare i sjömansserien blev jag medveten om detta begrepp och bestämde mig för att utveckla en motor för att känna igen melodier.”

Om aktuella projekt

”Just nu håller jag på att skapa en konversationsmotor som fortsätter att prata även om det inte finns något scenario. För detta ändamål har vi inrättat en organisation som heter ’Seaman Artificial Intelligence Laboratory’. När den här motorn är klar tror jag att röstigenkänning i konversationer kommer att förändras avsevärt.

Jag räknar med att en produkt med talande robotar kommer att släppas i Japan om ungefär ett halvår. När väl bollen kommer i rullning vill jag licensiera denna motor till många maskiner och skapa en era där japansktillverkade mikrovågsugnar, bilar, kameror och robotar talar flytande. Vi ser fram emot att se det hända och letar efter människor och investerare som vill hjälpa oss med engelska. En engelsk webbplats håller fortfarande på att förberedas, men du kan kontakta webbplatsen: www.seaman.ai.”

Gaming

Vänta, GameStop säljer GPU:er nu?

Spel

Among Us nästa uppdatering lägger till en bajshatt

Spel

Balan Wonderworld får dag ett-patch för att åtgärda ”potentiell blinkande bugg” som utgör en epilepsirisk

Visa alla nyheter inom Spel

Lämna ett svar

Din e-postadress kommer inte publiceras.