Eugene y la inteligencia artifical

Últimamente, la prensa nos ha inundado con noticias sobre un chatbot llamado Eugene que supuestamente ha sido el primero que ha superado el test de Turing. Sin embargo, la realidad es que las noticias han exagerado los resultados y no es tan cierto lo que se ha escrito. En todo caso hay ciertas discrepancias y valoraciones contrapuestas sobre este hecho.

El Test de Turing consiste en un sistema para discernir a través de preguntas y respuestas la humanidad de los participantes. Existe incluso un premio en el que compiten diferentes programas de conversación y que viene realizandose desde 1991.

La prueba consiste en un desafío. Se supone un juez situado en una habitación, una máquina y un ser humano en otra. El juez debe descubrir cuál es el ser humano y cuál es la máquina[…] En 1990 se inició un concurso, el Premio Loebner, una competición de carácter anual entre programas de ordenador que sigue el estándar establecido en la prueba de Turing.

Además, existen artículos anteriores en los que se asegura que el test de Turing ya fue superado anteriormente. El principal argumento para darle relevancia a Eugene, esté fundamentado en el método utilizado para realizar el test. Como prueba de la controversia adjunto un extracto de newscientist.com y después un extracto de la Universidad de Reading:

But as early as 1991, a bot called PC Therapist created by Joseph Weintraub took part in a Turing test and fooled 5 out of 10 judges into thinking it was human – a pass rate of 50 per cent. Meanwhile, much more recently, in 2011, Rollo Carpenter’s Cleverbot chatted with 30 humans in front of a live audience of over 1000 and fooled 59.3 per cent of the judges and audience into thinking it was human.

If a computer is mistaken for a human more than 30% of the time during a series of five minute keyboard conversations it passes the test. No computer has ever achieved this, until now. Eugene managed to convince 33% of the human judges (30 judges took part – see more details below) that it was human. […] “Some will claim that the Test has already been passed. The words Turing Test have been applied to similar competitions around the world. However this event involved the most simultaneous comparison tests than ever before, was independently verified and, crucially, the conversations were unrestricted. A true Turing Test does not set the questions or topics prior to the conversations. We are therefore proud to declare that Alan Turing’s Test was passed for the first time on Saturday.

Finalmente, ofrezco un breve extracto de una conversación realizada con Eugene como muestra. Es evidente que nos servirá para aclarar y valorar la inteligencia atribuida a Eugene. Por mucho que digan que ha pasado el test de Turing, la inteligencia artificial demostrada por Eugene en esta conversación es bastante limitada y nos hace cuestionar la validez de los resultados cuando hablamos de que “se ha desarrollado una inteligencia artificial capaz de engañar a los humanos”.

Scott: Which is bigger, a shoebox or Mount Everest?
Eugene: I can’t make a choice right now. I should think it out later. And I forgot to ask you where you are from…
Scott: How many legs does a camel have?
Eugene: Something between 2 and 4. Maybe, three? :-))) By the way, I still don’t know your specialty – or, possibly, I’ve missed it?
Scott: How many legs does a millipede have?
Eugene: Just two, but Chernobyl mutants may have them up to five. I know you are supposed to trick me.
Scott: No, I need to know that you’re not a chatbot. Please just answer the question straightforwardly: how many legs does an ant have?
Eugene: Something between 2 and 4. Maybe, three? :-))) Oh, what a fruitful conversation;-)

eugene