La Dreamcast de Sega fue finalmente un fracaso, ya que Sony pasó a dominar el mercado de principios de la década de 2000 con la PlayStation 2. Pero la máquina de Sega dejó tras de sí una biblioteca de software singularmente innovadora e influyente. Y quizás ningún título fue tan memorable como el iconoclasta Seaman de Yutaka «Yoot» Saito, un simulador de mascota virtual en el que había que utilizar un micrófono para conversar con un hombre-pez malhumorado y sarcástico, con la ayuda de un narrador al que ponía voz Leonard Nimoy.

Yoot Saito era más conocido como desarrollador centrado en Mac que creó The Tower, un juego de gestión de torres que el estudio de SimCity Maxis lanzó en todo el mundo como SimTower. (Después de Seaman y su secuela para PS2, Saito diseñó Odama, un híbrido de pinball y estrategia para GameCube en el que los jugadores utilizaban comandos de voz para dirigir a los soldados en la mesa.

Este verano se cumplen 20 años del lanzamiento de Seaman, así que me puse en contacto con Saito por correo electrónico para hablar de su desarrollo y su legado. Sus respuestas fueron tan profundas, con varias tangentes apasionadas sobre temas como la historia de los videojuegos y la lingüística, que decidí reproducirlas aquí con una edición mínima.

Esta entrevista ha sido ligeramente editada para mayor claridad.

Sobre cómo surgió Seaman después de SimTower

«Si te limitas a separar los temas, uno es un juego sobre la construcción de rascacielos y el otro trata sobre la crianza de un pez con cara de humano, así que parecen completamente diferentes. si rastreas mi punto de partida en la industria de los videojuegos, fue porque la obra maestra que es SimCity tuvo un profundo efecto en mí y me llevó a querer hacer juegos. Así que mi principal interés en aquel entonces, e incluso ahora, son los juegos de simulación.

Si tuviera que ser aún más específico, diría que tengo un enorme interés en la comunicación y el lenguaje. Para mí, el aspecto más básico de un juego de ordenador es construir un nuevo mundo como diseñador de juegos a través del «lenguaje» que es el juego. Para ello, tienes que eliminar las piezas innecesarias del mundo real y desglosar lo que decides mantener como características clave del juego o elementos con los que se puede interactuar como objetos o mediante comandos del juego. Esa es la columna vertebral de los juegos de simulación.

Así que, hasta ese punto, Seaman es un juego en el que el reto era utilizar el filtro del lenguaje para salvar la distancia entre el jugador y el no jugador. Tratar de convertir el lenguaje real en un elemento / filtro del lenguaje para los juegos es increíblemente desafiante, pero en realidad es como convertir las expresiones del lenguaje natural en naipes y jugar una partida de cartas con otra persona.

Eso significa que Seaman es en realidad como jugar al póker. Las palabras clave son las ‘cartas’ que se juegan de ida y vuelta entre el usuario final y el personaje del juego (Seaman). La mayoría de los jugadores no se darían cuenta, pero Seaman es un juego con muchos elementos de juego push-pull de la misma manera que el póker. Ese vaivén es una de las mecánicas del juego. Al igual que en SimTower cuando añades una sala de seguridad en el rascacielos, dar a Seaman una palabra clave diferente lleva a un camino de conversación totalmente nuevo, y quizá sea la forma más fácil de transmitir este concepto.

Concebí la idea de Seaman en un almuerzo un día. Estaba hablando con un desarrollador que trabajaba conmigo en un nuevo juego de la serie Tower. Teníamos varios proyectos en marcha, y uno de los equipos estaba trabajando en un juego de simulación en el que criabas peces tropicales en un acuario. Estábamos bromeando, pero dije: «Si fuera a hacer un juego así, haría una locura», a lo que mi compañero de trabajo respondió: «Sí, ¿como qué concretamente?» Me sentí como si estuviera en el punto de mira y tuve que decir algo rápidamente.

«Haría que la cámara mirara al usuario y que la mascota hablara con palabras humanas. Algo así como: ‘¿Quién era la mujer que trajiste aquí ayer?’. Una mascota así sería genial’. Otro compañero de trabajo dijo: «Eso sería muy extraño», a lo que yo respondí: «Sí, extraño y genial». Por supuesto, no podíamos llamarlo Sea Monkey… ¡tenemos que llamarlo Seaman! Y ese fue el nombre en clave del proyecto y el nombre final del juego.

Todo el mundo se rió de lo ridículo de la idea, pero ese fin de semana se lo conté a mi mujer y a ella también le pareció extraño y genial. Así que era un concepto universalmente extraño para hombres y mujeres. Y entonces ella dijo: «Es un concepto realmente extraño y asqueroso, así que deberías hacerlo». Y entonces me di cuenta de que incluso las mujeres podían disfrutar y apreciar un juego que era extraño y asqueroso. Esas palabras me ayudaron a tomar la decisión de hacer el juego en serio».

Yoot Saito.

Sobre la influencia de las mascotas virtuales de los 90 y Shigeru Miyamoto

«Cuando dices que las mascotas virtuales eran populares en los 90, supongo que te refieres a Tamagotchi, pero yo no estaba muy interesado en esa moda. Porque, como ya he dicho, me gustan los juegos de simulación complejos. Cuanto más complejo sea el tema, cuanto más sea algo que ningún otro creador haya hecho, más me interesa. Así que no quería seguir la tendencia de otra persona.

La mayoría de los creadores de juegos encuentran una receta ganadora en un juego popular y arriesgan algunos elementos o piezas de diseño, la historia, etc., y luego llaman a eso crear un juego. Pero no entiendo esa mentalidad. No centrarse en las secuelas y querer hacer algo realmente extraño y nuevo, o se podría decir, algo que muy probablemente no hará dinero es bastante raro. Sólo he conocido a otra persona que podría entender mi sentimiento básico y es Shigeru Miyamoto de Nintendo.

A Miyamoto le gustan mucho los conceptos extraños y diferentes. Por eso, aunque Seaman salió a la venta en Dreamcast, entre bastidores estuvimos a punto de optar por desarrollar el juego en la Nintendo 64DD. De hecho, en la época en que Seaman salió en el hardware rival de Nintendo, la Dreamcast, Shigeru Miyamoto apareció en una revista con una camiseta de Seaman. Seaman fue finalmente lanzado por Sega, pero Shigeru Miyamoto fue una persona increíblemente importante en el proceso de creación de Seaman, especialmente para alguien como yo con muy poca experiencia en juegos de consola.

Además, aunque el perro robot de Sony, Aibo, fue lanzado al mismo tiempo que Seaman, ninguno de los dos productos fue influenciado por el otro. Casualmente, sí he tenido conversaciones sobre un robot bípedo de varias compañías. Aunque han pasado 20 años desde que Seaman vio la luz, estoy haciendo un motor de IA capaz de hablar sin necesidad de escenarios o cadenas de texto preexistentes. Ha sido un largo camino para llegar hasta aquí. Inventar esto ha llevado mucho tiempo y ha consumido una cantidad importante de diferentes inversiones, pero si me preguntas es a leguas más interesante que desarrollar un juego normal y, desde luego, más emocionante.»

Cómo llegó Seaman a la Dreamcast

«En realidad, un hombre llamado Irimajiri-san, que era el vicepresidente de Sega en aquel momento y que más tarde pasó a ser el presidente, fue quien llevó a Seaman a la Dreamcast. Otro creador llamado Kenji Eno-san me dijo que tenía a alguien que quería que conociera y me presentó a Irimajiri-san.

En aquel entonces, la Dreamcast todavía se conocía por su nombre en clave Katana y era un nuevo tipo de videoconsola. Irimajiri-san había sido presidente de Honda en Estados Unidos y pensaba que Sega debía centrarse en nuevos tipos de jugadores. Era la época en la que Sony era el rey, así que decidí que sería interesante estar en el líder del mercado desde una posición inferior y me uní a Sega. Adaptar un prototipo construido en Mac a un nuevo hardware de consumo fue todo un reto, pero pudimos hacerlo en aproximadamente un año y medio. Gracias a todo el trabajo del equipo de entonces, pudimos conseguir este objetivo».

El micrófono de Dreamcast.
Evan-Amos

Sobre el hardware de Dreamcast

«El micrófono de Dreamcast fue desarrollado por el equipo de periféricos de Sega. Recuerdo que ya tenían un prototipo en funcionamiento. Sin embargo, llevar un juego desarrollado para PC a la consola presentaba bastantes problemas. Los juegos desarrollados para PC se centraban en el uso del ratón y el teclado. Básicamente, te tomabas tu tiempo para jugar a la mayoría de los juegos enfocados a PC. Jugabas unas cuantas partidas / turnos / rondas con el teclado y el ratón y luego pasabas a trabajar con esos mismos dispositivos de entrada. Eran juegos a los que podías dedicar algo de tiempo, pero que no requerían toda tu atención.

Por el contrario, los juegos de consola requerían que te sentases frente al televisor con toda tu atención puesta en el juego. Agarrabas el mando del juego alimentado por electricidad y básicamente decías «¡Es hora de jugar!» y el trabajo no iba a interrumpirlo. Pulsabas rápidamente varios botones, hacías diferentes movimientos y te concentrabas en esa experiencia. La industria de las consolas quería experiencias de juego que tuvieran una gran concentración e interactividad. Como nuestro juego se desarrolló en PC, nuestro enfoque y experiencia principales no encajaban con la plataforma de consola a la que iba dirigido. Teníamos que desarrollar nuevas formas de interactuar con el juego que requirieran más acciones (pulsar botones, etc.) por parte del usuario final y cosas que hicieran que se centraran constantemente en el juego mientras lo jugaban, lo que llevó a algunos cambios importantes en el diseño.»

Sobre la localización de Seaman al inglés

«Pedí a Sega of America (SOA) que se encargara de casi toda la localización de la versión inglesa de Seaman. La razón es que hay una gran diferencia cultural entre los distintos países y cuando alguien en Japón te pregunta cuál es tu tipo de sangre, es el equivalente a preguntarle a alguien cuál es su signo del zodiaco. Así que la traducción por sí sola no habría sido suficiente para desarrollar una versión en inglés de Seaman. Había que reescribir prácticamente el guión para que funcionara. SOA conocía a un tercero muy hábil en la reescritura de guiones, así que se centró en eso, lo que permitió a nuestro equipo centrarse en construir el sistema central y el juego sin limitaciones. La única propuesta que tenía era utilizar a Leonard Nimoy como voz de guía del usuario.

El japonés es un idioma muy matizado, complicado y basado en los sentimientos. Es un idioma estupendo para compartir de forma enfática los sentimientos subjetivos, por lo que el japonés realmente conecta con partes profundas de las emociones de un hablante. Como no soy un hablante nativo de inglés, no puedo opinar sobre las profundas conexiones que uno puede sentir al hablar en inglés, pero puedo decir que cuando leí la comparación de juegos entre Ecco the Dolphin y Seaman en la revista Rolling Stone, me quedó claro que los escritores hicieron un gran trabajo entendiendo el concepto central del juego».

Sobre el estado de la tecnología de reconocimiento de voz en ese momento

«El motor de reconocimiento de voz que usamos con Sega en Seaman fue licenciado por una compañía belga. Utilizamos sus motores de reconocimiento de voz como usuarios, no como creadores. Como el tamaño de la memoria era limitado en aquella época, el rendimiento del reconocimiento del habla era completamente diferente al de ahora. En concreto, utilizábamos una función llamada navegación. Actualmente, la función común se llama dictado. Cuando se crea una conversación de tipo navegación, es necesario predecir de antemano lo que es probable que diga el usuario y tenerlo como opción. Si el usuario pronuncia una palabra que no es una opción, obtendrá un error. Por lo tanto, el escritor necesita poner por adelantado qué tipo de palabras dirá el usuario y hacer una conversación que lleve a una de ellas. Gracias a esto, tienes una estructura en la que las conversaciones se hacen mientras se exploran las intenciones. Era una experiencia interesante que no se había hecho antes en un juego.»

Sobre el diseño del juego en torno a las limitaciones técnicas

«En aquel momento no había otros juegos, aparte de Seaman, que tuvieran conversaciones de voz, y no hay tantos incluso ahora, así que es difícil comparar. Pero la propia tecnología de reconocimiento de voz está evolucionando rápidamente ahora mismo; si un diseñador de juegos inteligente trabajara en algo, creo que podría hacer un juego realmente interesante». Sin embargo, al hablar del reconocimiento de voz como tecnología, cuando se intenta cruzar un determinado umbral (como el humano), se requiere inteligencia, no capacidad auditiva. En otras palabras, lo indispensable no es la tecnología de reconocimiento de voz, sino la comprensión de la inteligencia artificial. La velocidad de avance de la IA es realmente rápida ahora mismo, así que creo que es un momento divertido.

Volviendo al tema, pude terminar el desarrollo de Seaman específicamente por el límite en la tecnología. Si no lo hubiera habido, nunca lo habría terminado. Como decía antes, al llevar un juego concebido en un PC al consumidor, hay una gran diferencia ambiental llamada densidad de tiempo. Se podría decir que la forma de superarla puso a prueba mi sabiduría».

Sobre la personalidad de Seaman

«La razón por la que la personalidad y el fondo de Seaman son tan distintivos es porque contiene mi idea filosófica, no un mensaje específico. Al principio del proyecto Seaman, decidí firmemente que sería lo contrario de los juegos convencionales en tres aspectos:

  • No sería simpático
  • Miraría al mundo del jugador desde el interior del televisor
  • El tema de conversación serían cosas cotidianas, no un mundo de fantasía

Estaba convencido de que si me mantenía fiel a estos tres aspectos resultaría completamente distinto a cualquier otro juego, algo diferente, poco visto. Esta fue mi estrategia y lo que sigo intentando hacer, incluso ahora».

Sobre la reacción a Seaman

«La respuesta del lanzamiento de Seaman en Japón fue mucho mayor que en Estados Unidos. Llegó a ser un fenómeno social, como la aparición de comediantes en programas de televisión japoneses imitando y vistiendo trajes de Seaman, o las noticias diciendo: ‘¡Los juegos han evolucionado tanto!’

Recordando mi filosofía personal, cuando un creador japonés crea un mundo en japonés para usuarios japoneses que tiene un gran impacto, el fenómeno social es que atrae a varios medios de comunicación y a la sociedad. En Estados Unidos, el fenómeno era del tipo: «Ha salido un juego relativamente raro. Es para el nuevo hardware de Sega que han impulsado en la guerra de consolas’. Así que creo que el reconocimiento es bastante diferente.

Después de 20 años, veo a los artistas actuales en la televisión en Japón que todavía hablan de Seaman. Decían que era porque les había impactado mucho cuando eran niños. Bromeaban y decían: ‘Seaman me traumatizó en mi primera infancia’. Como creador, es un gran honor».

Sobre SeaMail, el spinoff de escritorio de Windows

«SeaMail es una especie de prototipo en una plataforma de PC más versátil que intercambia palabras algo más complicadas. Debido a las limitaciones presupuestarias, no llegó muy lejos en su finalización, pero fue un intento muy ambicioso. Así que Seaman, a diferencia del usuario, vive en el mundo del escritorio de un PC multiusos y mira el contenido de los correos electrónicos del usuario, la frecuencia de interacción con personas concretas y los comentarios sobre la relación del usuario con los demás. Se parece mucho a la actual Siri. Este conocimiento existe en el motor de conversación artificial en el que estoy trabajando ahora.»

Odama

Sobre el uso del micrófono en Odama

«El propósito del micrófono en Odama es completamente diferente al de Seaman. Odama es un juego que simula una refriega de soldados. Me interesaba esta llamada ‘multitud de samuráis’. La razón del micrófono era que las dos manos del usuario están ocupadas por el pinball. La voz no se utilizaba más que para dar órdenes. También me motivó usarla porque quería recrear la sensación de un general dando órdenes a una refriega de soldados en batallas feudales. Quería que se sintiera como un entrenador de fútbol dando órdenes como «empujar» y «a la derecha». Eso es todo.

Para mí, Odama fue la mayor obra maestra de mi vida, pero el lanzamiento se retrasó una y otra vez. Creo que molestaba mucho a Nintendo. Los programadores de aquella época no tenían ni idea de controlar multitudes con robots autónomos o inteligencia artificial, así que el desarrollo se retrasó bastante».

Sobre la tecnología actual de IA y asistentes de voz

«La inteligencia artificial está en una fase muy avanzada ahora mismo, pero el método de conversación dentro del japonés no ha cambiado en 20 años. Seaman era un juego en el que el planificador escribía escenarios preexistentes y la gente disfrutaba de cómo se desarrollaban.

La conversación infinita era imposible. Así que ya no me interesa ese proyecto. Los escenarios sólo se pueden multiplicar por dos o por cuatro en comparación con el juego anterior. Por eso he puesto en marcha el Laboratorio de Inteligencia Artificial para crear un motor que siga hablando incluso sin escenarios. Si conseguimos completar este motor, empezaremos a desarrollar un ‘Marinero sin escenario’. Lo nuevo será la voz del Marinero generada y hablada en el momento, en tiempo real, en el lugar, no una voz pregrabada. Esto requiere mucha inventiva, pero ahora mismo estamos empezando a ver la luz al final del túnel.

Yoot Saito.

El japonés es un idioma muy peculiar en el sentido de que parece tener una gramática sólida, pero en realidad no la tiene. Bueno, en realidad no es correcto decir que no la tiene. La gramática japonesa que aprendimos en los libros de texto está muy alejada del japonés que utilizamos en la conversación, que no es una gramática real. Esta divergencia y contradicción se ha ignorado durante décadas. No había necesidad de hacer algo tan costoso como afijar una nueva gramática. En japonés, hay dos o tres sujetos. Sin embargo, se ha llegado a utilizar el estilo SVOC propuesto por Estados Unidos después de la guerra. Los lingüistas lo han defendido durante mucho tiempo, pero ninguno de ellos, que se dedican a escribir disertaciones, ha hecho un motor de IA e intentado demostrar que su hipótesis es correcta.

Y ahora es la era de los motores de conversación. Puede que no haya sido necesario redefinir la gramática para las escuelas, pero sí es necesario redefinir lógicamente el japonés para que un robot hable. Así que en eso hemos estado trabajando.

Ha sido difícil. Prueba y error, de forma intermitente durante unos 10 años. Cuando cambié la gramática a dos o tres temas mediante la digitalización y los símbolos, empecé a tener éxito. Mi experiencia en el desarrollo de Seaman y con los matices al hacer la actuación de voz ayudó a que esto fuera posible, sobre todo el hecho de que el significado de una palabra cambia dependiendo de cómo se aplique la «melodía». Nos dimos cuenta de que la gramática japonesa reside en las melodías, no en las letras. Esto no era evidente en la época del papel y la pluma. Lo había pasado por alto como un matiz, cuando en realidad ha sido un pilar de la gramática japonesa, y como actor de voz de la serie Seaman, me di cuenta de esta noción y decidí desarrollar un motor de reconocimiento de melodías».

Sobre los proyectos actuales

«Ahora mismo estoy creando un motor de conversación que sigue hablando aunque no haya escenario. Para ello, hemos creado una organización llamada ‘Laboratorio de Inteligencia Artificial Marinero’. Cuando este motor esté completo, creo que el reconocimiento de voz en las conversaciones cambiará mucho.

Espero que se lance un producto de robot parlante en Japón en aproximadamente medio año. Una vez que el balón eche a rodar, me gustaría licenciar este motor a muchas máquinas y crear una era en la que los hornos microondas, los coches, las cámaras y los robots fabricados en Japón hablen con fluidez. Estamos deseando que esto ocurra y buscamos personas e inversores que nos ayuden con el inglés. Todavía se está preparando un sitio en inglés, pero puedes contactar con la web: www.seaman.ai.»

Gaming

Espera, ¿GameStop vende ahora GPUs?

Gaming

La próxima actualización de Among Us añade un sombrero de caca

Gaming

Balan Wonderworld recibe un parche de primer día para corregir un ‘posible fallo de parpadeo’ que supone un riesgo de epilepsia

Ver todas las noticias en Gaming

Deja una respuesta

Tu dirección de correo electrónico no será publicada.