Sega’s Dreamcast acabou por ser um fracasso, uma vez que a Sony chegou a dominar o mercado do início dos anos 2000 com a PlayStation 2. Mas a máquina da Sega deixou para trás uma biblioteca de software inovador e influente. E talvez nenhum título fosse tão memorável como o iconoclastic Seaman de Yutaka “Yoot” Saito, um simulador virtual de animais de estimação que fez você usar um microfone para conversar com um homem-peixe mal-humorado e sarcástico, com a ajuda de um narrador vocalizado por Leonard Nimoy.
Yoot Saito era anteriormente mais conhecido como um desenvolvedor focado em Mac que criou The Tower, um jogo de gerenciamento de torres que a SimCity studio Maxis lançou mundialmente como SimTower. (Sua sequela, The Tower II, ficou conhecida como Yoot Tower fora do Japão). Depois de Seaman e sua sequela PS2, Saito desenhou Odama, um híbrido de estratégia pinball para a GameCube onde os jogadores usavam comandos de voz para direcionar soldados na mesa.
Este verão marca 20 anos desde o lançamento de Seaman, então entrei em contato com Saito por e-mail para discutir seu desenvolvimento e legado. Suas respostas foram tão profundas, com várias tangentes apaixonadas por assuntos como história de videojogos e linguística, que decidi reproduzi-las aqui com o mínimo de edição.
Esta entrevista foi ligeiramente editada para maior clareza.
- Em como Seaman veio a ser depois de SimTower
- Na influência dos animais de estimação virtuais dos anos 90 e de Shigeru Miyamoto
- Como Seaman veio a estar no Dreamcast
- No hardware do Dreamcast
- On localizing Seaman into English
- No estado da tecnologia de reconhecimento de voz da época
- Na concepção do jogo em torno de limitações técnicas
- Na personalidade de Seaman
- Na reacção ao Seaman
- On SeaMail, the Windows desktop spinoff
- On usando o microfone em Odama
- Na actual IA e tecnologia de assistente de voz
- Em projectos actuais
- Wait, GameStop vende GPUs agora?
- A próxima actualização do GameStop adiciona um chapéu de cocó
- Balan Wonderworld recebe o patch do primeiro dia para corrigir um ‘potencial bug piscante’ que representa um risco de epilepsia
Em como Seaman veio a ser depois de SimTower
“Se você está apenas separando os temas, um é um jogo sobre construir arranha-céus e o outro é sobre criar um peixe de cara humana, então eles parecem completamente diferentes. se você traçar meu ponto de partida na indústria de jogos, foi porque a obra-prima que é SimCity teve um efeito profundo em mim e me levou a querer fazer jogos. Então meu principal interesse naquela época e mesmo agora é jogos de simulação.
Se eu fosse ainda mais específico, eu diria que tenho um enorme interesse em comunicação e linguagem. Para mim, o aspecto mais básico de um jogo de computador é construir um novo mundo como designer de jogos através da ‘linguagem’ que é o jogo. Para fazer isso, você precisa remover as peças desnecessárias do mundo real e quebrar o que você escolhe manter como características ou elementos-chave do jogo que podem ser interagidos como itens ou através dos comandos do jogo. Essa é a espinha dorsal dos jogos de simulação.
Então até esse ponto, Seaman é um jogo onde o desafio era usar o filtro de linguagem para preencher a lacuna entre gamer e não gamer. Tentar transformar a linguagem real num elemento de linguagem / filtro para jogos é incrivelmente desafiante, mas na verdade é como converter expressões de linguagem natural em cartas de jogo e jogar um jogo de cartas com outra pessoa.
Isso significa que Seaman é realmente como jogar poker. As palavras-chave são as ‘cartas’ que são jogadas para a frente e para trás entre o usuário final e o personagem do jogo (Seaman). A maioria dos jogadores não se daria conta disso, mas Seaman é um jogo com muitos elementos de jogo push-pull da mesma forma que o poker. Aquele vai-e-vem é um mecanismo de condução do jogo. Tal como no SimTower quando se adiciona uma sala de segurança no arranha-céus, dando ao Seaman uma palavra-chave diferente leva a um caminho de conversação totalmente novo, e talvez essa seja a forma mais fácil de transmitir este conceito.
Concebi a ideia do Seaman ao almoço um dia. Eu estava conversando com um desenvolvedor trabalhando comigo em um novo jogo da série Tower. Tínhamos vários projetos em andamento, e uma das equipes estava trabalhando em um jogo de simulação onde você criava peixes tropicais em um aquário. Estávamos só a brincar mas eu disse, ‘Se eu fosse fazer um jogo como este, faria algo louco’, ao que o meu colega de trabalho respondeu, ‘Sim, como o quê especificamente?’ Senti-me como se estivesse no local e tivesse de dizer algo rapidamente.
‘Eu teria a câmara a enfrentar o utilizador e o animal de estimação a falar em palavras humanas. Algo do género, ‘Quem era aquela mulher que trouxeste aqui ontem?’. Um animal como aquele seria óptimo.’ Um colega de trabalho diferente disse, ‘Isso seria muito estranho’, ao que eu disse ‘Sim, estranho e ótimo!’. Claro que não lhe podíamos chamar macaco marinho… temos de lhe chamar marinheiro! E esse passou a ser o nome de código do projeto e o nome final do jogo real.
Todos riram da natureza ridícula da idéia, mas naquele fim de semana eu falei para minha esposa sobre isso e ela achou estranho e ótimo, também. Então era um conceito que era universalmente estranho para homens e mulheres. E então ela disse: ‘Esse é um conceito muito estranho e nojento, então você definitivamente deve conseguir!’. E foi aí que percebi que até as mulheres podiam desfrutar e apreciar um jogo que era estranho e nojento. Essas palavras ajudaram-me a tomar a minha decisão de fazer o jogo a sério”
Na influência dos animais de estimação virtuais dos anos 90 e de Shigeru Miyamoto
“Quando dizes que os animais de estimação virtuais eram populares nos anos 90, presumo que te referas a Tamagotchi, mas eu não estava super interessado nessa tendência. Porque, como mencionei antes, gosto de jogos de simulação complexos. Quanto mais complexo o tema, mais ele é algo que nenhum outro criador tinha feito, mais ele me interessava. Então eu não queria seguir a tendência de outra pessoa.
Mais os criadores de jogos encontram uma receita vencedora num jogo popular e casualmente alguns elementos ou peças de design, história, etc., e depois chamam a isso criar um jogo. Mas eu não entendo essa mentalidade. Não focar em sequelas e querer fazer algo realmente estranho e novo, ou você poderia dizer, algo que muito provavelmente não vai ganhar dinheiro é muito raro. Só conheci uma outra pessoa que conseguia compreender o meu sentimento base e que é Shigeru Miyamoto.
Miyamoto-san gosta mesmo de conceitos estranhos e diferentes. Então, enquanto Seaman foi lançado no Dreamcast, nos bastidores estivemos muito perto de escolher desenvolver o jogo na Nintendo 64DD. Na verdade, por volta da altura em que Seaman foi lançado no hardware rival da Nintendo, o Dreamcast, Miyamoto-san foi apresentado numa revista com uma camisola Seaman. Seaman foi eventualmente lançado pela Sega, mas Miyamoto-san foi uma pessoa incrivelmente importante no processo de criação de Seaman, especialmente para alguém como eu com muito pouca experiência em jogos de consola.
Também, embora o cão robô Aibo da Sony tenha sido lançado por volta da mesma altura que Seaman, nenhum dos produtos foi influenciado pelo outro. Coincidentemente, eu tive conversas sobre um robô bípede de várias empresas. Embora já tenham passado 20 anos desde que o Seaman viu a luz do dia, estou fazendo um motor de IA capaz de falar sem precisar de cenários preexistentes ou cordas de texto. Tem sido um longo caminho para chegar aqui. Inventar isso levou muito tempo e consumiu uma quantidade significativa de investimentos diferentes, mas se você me perguntar é mais interessante do que desenvolver um jogo normal e certamente mais emocionante.”
Como Seaman veio a estar no Dreamcast
“Na verdade, um homem chamado Irimajiri-san, que era o vice-presidente da Sega na época e depois se tornou o presidente, foi quem levou Seaman a ser lançado no Dreamcast. Um criador diferente chamado Kenji Eno-san disse-me que tinha alguém que ele realmente queria que eu conhecesse e apresentou-me a Irimajiri-san.
Back então o Dreamcast ainda estava a ser referido pelo seu nome de código Katana e era um novo tipo de consola de jogos. Irimajiri-san foi anteriormente presidente da Honda nos EUA e sentiu que a Sega precisava de se concentrar em novos tipos de jogadores. Era a altura em que a Sony era rei e por isso decidi que seria interessante estar na liderança do mercado a partir de uma posição inferior e juntei-me à Sega. Alterar um protótipo construído em Mac para um novo hardware de consumo era bastante desafiador, mas conseguimos fazê-lo em cerca de um ano e meio. Foi graças a todo o trabalho árduo da equipe naquela época que conseguimos atingir esse objetivo”
No hardware do Dreamcast
“O microfone Dreamcast foi desenvolvido pela equipe de periféricos da Sega. Eu me lembro que eles já tinham um protótipo em funcionamento. No entanto, trazer um jogo desenvolvido para PC para o console apresentou alguns problemas. Os jogos desenvolvidos para PC estavam focados em usar um mouse e teclado. Basicamente, você levava seu tempo jogando a maioria dos jogos focados no PC. Você jogaria alguns jogos / voltas / rodadas no teclado e no mouse e depois alternaria para fazer o trabalho nesses mesmos dispositivos de entrada. Eram jogos em que você podia apenas passar algum tempo, mas não exigia todo o seu foco.
Conversamente, jogos de console exigiam que você se sentasse na frente da TV com todo o seu foco no jogo. Você pegou o controlador do jogo alimentado por eletricidade e basicamente disse ‘É hora do jogo!’ e o trabalho não ia interromper isso. Carregaste rapidamente em vários botões, fizeste movimentos diferentes e concentraste-te nessa experiência. Para a indústria de consolas, eles queriam experiências de jogo que tivessem um foco profundo e interactividade. Como nosso jogo foi desenvolvido em PC, nosso foco principal e nossa experiência não se enquadravam na plataforma do console alvo. Precisávamos desenvolver novas formas de interagir com o jogo que exigissem mais ações (apertar botões, etc.) do usuário final e coisas para torná-los constantemente focados no jogo enquanto o jogávamos, o que levou a algumas grandes mudanças no design”
On localizing Seaman into English
“Eu pedi à Sega of America (SOA) para lidar com quase toda a localização para a versão em inglês do Seaman. A razão para isso é que existe uma grande diferença cultural entre diferentes países e quando alguém no Japão lhe pergunta qual é o seu tipo de sangue, é o equivalente a perguntar a alguém qual é o signo do seu zodíaco. Portanto, a tradução por si só não teria sido suficiente para desenvolver uma versão inglesa do Seaman. Você precisava praticamente reescrever o roteiro para que ele funcionasse. SOA conhecia uma terceira parte que era muito hábil em reescrever scripts, então eles se concentraram naquilo que permitiu que nossa equipe se concentrasse em construir o sistema central e o jogo sem limitações. A única proposta que eu tinha era usar Leonard Nimoy como a voz de orientação do usuário.
Japonês é uma linguagem muito matizada, complicada e baseada em sentimentos. É uma linguagem ótima para compartilhar sentimentos subjetivos de forma enfática, então o japonês realmente se conecta às partes profundas das emoções de um falante. Como não sou um falante nativo de inglês, não posso comentar as conexões profundas que se pode sentir quando se fala inglês, mas posso dizer que quando li a comparação do jogo entre Ecco the Dolphin e Seaman na revista Rolling Stone, ficou claro para mim que os escritores fizeram um ótimo trabalho compreendendo o conceito central do jogo”
No estado da tecnologia de reconhecimento de voz da época
“O mecanismo de reconhecimento de voz que usamos com a Sega na Seaman foi licenciado por uma empresa belga. Utilizávamos os seus motores de reconhecimento de voz como utilizadores e não como criadores. Como o tamanho da memória era limitado naquela época, o desempenho do reconhecimento de voz era completamente diferente do que é agora. Especificamente, nós usávamos uma função chamada navegação. Atualmente, a função comum é chamada de ditado. Quando se cria um tipo de conversa de navegação, é necessário prever com antecedência o que o usuário provavelmente vai dizer e ter isso como uma escolha. Se o usuário pronuncia uma palavra que não é uma opção, ele receberá um erro. Portanto, o escritor precisa colocar com antecedência que tipo de palavras o usuário dirá e fazer uma conversa que conduza a uma delas. Por causa disso, você tinha uma estrutura em que as conversas são feitas enquanto explora as intenções. Foi uma experiência interessante que não tinha sido feita em um jogo antes.”
Na concepção do jogo em torno de limitações técnicas
“Naquela época não havia outros jogos além de Seaman que tivessem conversas de voz, e não tantos mesmo agora, então é difícil de comparar. Mas a própria tecnologia de reconhecimento de voz está a evoluir rapidamente neste momento – se um designer de jogos inteligente trabalhasse em algo que eu acho que eles poderiam fazer um jogo realmente interessante. Contudo, quando se fala de reconhecimento de voz como uma tecnologia, quando se tenta ultrapassar um determinado limiar (como o humano), é necessária inteligência, não capacidade auditiva. Por outras palavras, o que é indispensável não é a tecnologia de reconhecimento de voz, mas sim a compreensão da inteligência artificial. A velocidade de avanço da IA é realmente rápida neste momento, então eu acho que é um momento divertido.
Voltando ao assunto, eu fui capaz de terminar o desenvolvimento do Seaman especificamente por causa do limite na tecnologia. Se não houvesse nenhum, eu nunca o teria terminado. Como eu estava dizendo antes, ao trazer um jogo concebido em um PC para o consumidor, há uma grande diferença ambiental chamada densidade de tempo. Como superar isso testou minha sabedoria, pode-se dizer”
Na personalidade de Seaman
“A razão pela qual a personalidade e o background de Seaman são tão distintos é porque ele contém minha idéia filosófica, não uma mensagem específica. No início do projeto Seaman, decidi firmemente que seria o oposto dos jogos convencionais em três aspectos:
- Não seria bonito
- Olharia para o mundo do jogador de dentro da TV
- O tema da conversa seria coisas do dia-a-dia, não um mundo de fantasia
Estava convencido de que se eu me mantivesse fiel a estes três aspectos, seria completamente diferente de qualquer outro jogo – algo diferente, não frequentemente visto. Esta era a minha estratégia e o que eu ainda me esforço para fazer, mesmo agora”
Na reacção ao Seaman
“A resposta do lançamento do Seaman no Japão foi muito maior do que nos Estados Unidos. Chegou a ser um fenômeno social, como comediantes aparecendo em programas de TV japoneses imitando e usando fantasias de Seaman, ou as notícias dizendo, ‘Games have evolved so much!’
Tocando de volta na minha filosofia pessoal, quando um criador japonês cria um mundo em japonês para usuários japoneses que tem um grande impacto, o fenômeno social é que ele atrai vários meios de comunicação e sociedade. Nos Estados Unidos, o fenômeno foi como, ‘Um jogo relativamente raro saiu. É para o novo hardware da Sega que eles têm empurrado nas guerras das consolas”. Então eu acho que o reconhecimento é bem diferente.
Depois de 20 anos, eu vejo artistas atuais na TV no Japão ainda falando sobre Seaman. Eles disseram que foi porque teve um grande impacto sobre eles quando eram crianças. Eles brincaram e disseram: ‘Seaman me traumatizou na minha infância’. Como criador, é uma grande honra”
On SeaMail, the Windows desktop spinoff
“SeaMail é uma espécie de protótipo em uma plataforma de PC mais versátil que troca palavras um pouco mais complicadas. Devido a restrições orçamentais, não chegou muito longe na sua conclusão, mas foi uma tentativa muito ambiciosa. Então Seaman, ao contrário do usuário, vive no mundo desktop de um PC multiuso e olha o conteúdo dos e-mails do usuário, freqüência de interação com pessoas específicas, e comentários sobre o relacionamento do usuário com os outros. Era muito parecido com o Siri atual. Este conhecimento existe no motor de conversação artificial em que estou trabalhando agora”
On usando o microfone em Odama
“O propósito do microfone em Odama é completamente diferente do Seaman. Odama é um jogo que simula um grupo de soldados. Eu estava interessado nesta chamada ‘multidão samurai’. O motivo do microfone foi porque ambas as mãos do usuário estão ocupadas pelo pinball. A voz foi usada para nada mais do que dar comandos. Eu também estava motivado a usá-la porque queria recriar a sensação de um general dando ordens a um grupo de soldados em batalhas feudais. Queria que se sentisse como um treinador de futebol dando ordens como “empurrar” e “para a direita”. É isso.
Para mim, Odama foi a maior obra-prima da minha vida, mas o lançamento foi adiado uma e outra vez. Acho que aborreci mesmo a Nintendo. Os programadores da altura não faziam ideia de controlar multidões de pessoas com robôs autónomos ou inteligência artificial, por isso o desenvolvimento foi bastante atrasado.”
Na actual IA e tecnologia de assistente de voz
“A inteligência artificial está numa fase muito avançada neste momento, mas o método de conversa dentro do japonês não mudou em 20 anos. Seaman era um jogo onde o planejador escrevia cenários preexistentes e as pessoas gostavam de como eles jogavam.
Conversação infinita era impossível. Então, eu não estou mais interessado nesse projeto. Os cenários só podem ser aumentados em duas ou quatro vezes em comparação com o jogo anterior. Por isso iniciei o Laboratório de Inteligência Artificial para criar uma engine que continua falando mesmo sem cenários. Se conseguirmos completar este motor, vamos começar a desenvolver um ‘Seaman sem fim no cenário’. A novidade será a voz do marinheiro gerada e falada no local em tempo real, no local, e não uma voz pré-gravada. Isto requer muita inventividade, mas neste momento, estamos apenas começando a ver a luz ao final do túnel.
Japonês é uma linguagem muito peculiar, pois parece ter uma gramática sólida, mas na verdade não tem. Bem, na verdade, não é correcto dizer que não tem. A gramática japonesa que aprendemos nos manuais escolares é muito alienada do japonês que usamos na conversação, que não é uma gramática real. Esta divergência e contradição tem sido ignorada durante décadas. Não havia necessidade de fazer algo tão caro, como afixar uma nova gramática. Em japonês, há dois ou três assuntos. No entanto, o estilo SVOC proposto pelos Estados Unidos após a guerra passou a ser utilizado. Os linguistas há muito que defendem isso, mas nenhum deles, que se atém a escrever dissertações, fizeram um motor de IA e tentaram provar que sua hipótese está correta.
E agora é a era dos motores de conversação. Pode não ter sido necessário redefinir a gramática para as escolas, mas é necessário redefinir logicamente o japonês para que um robô possa falar. Então é nisso que temos estado a trabalhar.
Tem sido difícil. Tentativa e erro, ligado e desligado há cerca de 10 anos. Quando mudei a gramática para dois ou três sujeitos através da digitalização e símbolos, comecei a ter sucesso. Minha experiência no desenvolvimento do Seaman e com nuances na atuação da voz ajudou a tornar isso possível – particularmente o fato de que o significado de uma palavra muda dependendo de como a ‘melodia’ é aplicada. Percebemos que a gramática japonesa reside em melodias e não em letras. Isto não era evidente durante a era do papel e da caneta. Eu tinha ignorado isto como nuance, quando de facto, tem sido um pilar da gramática japonesa, e como actor de voz da série Seaman, tomei consciência desta noção e decidi desenvolver um motor de reconhecimento de melodias”
Em projectos actuais
“Neste momento estou a criar um motor de conversação que continua a falar mesmo que não haja cenário. Para isso, estabelecemos uma organização chamada ‘Seaman Artificial Intelligence Laboratory’ (Laboratório de Inteligência Artificial do Marinheiro). Quando esse mecanismo estiver completo, acho que o reconhecimento de voz na conversa vai mudar muito.
Eu espero que um produto robô falante seja lançado no Japão em cerca de meio ano. Quando a bola começar a rolar, eu gostaria de licenciar este motor para muitas máquinas e criar uma era em que fornos de microondas, carros, câmeras e robôs fabricados no Japão falassem fluentemente. Estamos ansiosos para ver isso acontecer e estamos à procura de pessoas e investidores que nos ajudem com o inglês. Um site em inglês ainda está sendo preparado, mas você pode entrar em contato com o site: www.seaman.ai.”
Wait, GameStop vende GPUs agora?
A próxima actualização do GameStop adiciona um chapéu de cocó
Balan Wonderworld recebe o patch do primeiro dia para corrigir um ‘potencial bug piscante’ que representa um risco de epilepsia
Ver todas as histórias em Jogo