Siri responde a una niña de 12 años: «cierra la puta boca»

Hemos mencionado en más de una ocasión las anécdotas de Siri. Sin embargo, el caso acaecido en Reino Unido supera todo lo conocido. La respuesta de Siri a una pregunta de una niña de doce años es cuanto menos impactante.
El sistema de reconocimiento de voz incluido en el nuevo iPhone 4S, Siri, era una de las novedades más destacadas en la presentación de Apple, un día antes de la muerte de Steve Jobs. Desde entonces, han aparecido infinidad de artículos analizando su funcionamiento y, más concretamente, comprobando las reacciones de este servicio ante las preguntas más comprometedoras y anecdóticas. Ya son célebres frases como: ¿Qué llevas puesto? –Aluminosilicato de vidrio y acero inoxidable. Bonito, ¿eh? ¿Te casarás conmigo? –Mi acuerdo de Licencia de usuario final no contempla el matrimonio. Mis disculpas. O hasta sugerencias sobre lugares para deshacerte de un cadáver… Sin embargo, el caso de los últimos días es diferente pues supone un precedente para el asistente por voz del iPhone 4S.
Cruce de cables
Ha sucedido en unos grandes almacenes en Reino Unido. Una madre y su hija se encontraban en una tienda Tesco. La curiosidad de la niña de 12 años le llevó, según informa ABC, a los iPhone 4S de Apple y a su asistente por voz Siri. Acompañada por la madre, la cría se dispuso a comprobar el funcionamiento del sistema de reconocimiento de voz de Apple con una simple pregunta: ¿Cuántas personas hay en el mundo? La respuesta de Siri no se hizo esperar con una tosca y desacertada solución: no estoy seguro de lo que me has dicho, así que cierra la puta boca.
¿Situación provocada?
La madre, muy sorprendida por el «insulto», volvía a formular la misma cuestión que su retoño para corroborar la desafortunada contestación. El resultado fue el mismo. Indignada, la mujer se dirigió al responsable de la tienda y comunicó lo sucedido. Una vez más, se comprobaba lo suscitado por la señora para descartar un posible error. Como medida inmediata, el terminal iPhone 4S era retirado del stand de muestras y enviado a Apple para analizar la situación. Las primeras pesquisas abogan por una manipulación del teléfono de Apple. ¿Será realmente una hipotética modificación, producto de algún gracioso? ¿Posible fallo de Siri? Estaremos atentos a las novedades y explicaciones que puedan darse en las próximas horas.
Eso debe de ser codigo Android oculto…
Detras de todo esto debe haber un fandroid
Y después de un fandroid siempre viene un fanboy con poco sentido del humor.
parece mentira como los maqueros os quitais la mierda de encima echando la culpa a los de android. dais pena.
Tio, es una broma.
El que da pena eres tu.
Skynet…¿estás ahí?.jajajajaja…..
Será que la niña se llama Laura.
Ya sabéis el cariño que le tenía Steve a su hija.
Es Lisa, no Laura.. xD
Si, menudo huevo de pascua le han metido…. si al menos la frase fuera graciosa, un chiste o algo así… pero insultar de ese modo!!!
Seguro que algún programador no está todo lo bien tratado que debería y eso es el resultado de su magistral cabreo con la compañía, igual no le han pagado, jeje…
Ahora, en serio, a veces puede pasar que un software de Inteligencia Artificial de respuestas muy raras, es decir, que nada tengan que ver con la pregunta… es algo muy complejo.
Por un lado el reconocimiento de la voz es imposible (matemáticamente) por lo que se hacen estimaciones de probabilidad (a mí personalmente ninguno me reconoce la voz, ni tan siquiera comandos simples, y eso que pronuncio muy bien en las pruebas que hago, pero nada)
Por otro lado está el tema de «entender» la frase, bajo la suposición de que se haya reconocido bien la voz… es decir imaginemos que tecleamos una pregunta… que el software «entienda» qué preguntamos no es para nada trivial, es una tarea muy compleja; y si las preguntas son elaboradas, pues peor aún.
La tecnología aún está en pañales, lo que me parece ridículo es que se implante estando tan «verde» aún… pero claro el primero que logre tener éxito se comerá el mercado, o eso piensan los fabricantes… está muy bien que nos vendan la moto de medio caballo, pero no que nos digan que correrá más que un fórmula 1… a eso lo llamo estafa.
Si afirman que reconoce la voz, que sea cierto… si afirman que puede contestar preguntas «libres» que sea cierto, de lo contrario que digan que hará lo mejor que se sabe por intentar entender y contestar a lo que se pregunte y que avisen que repuestas como esas podrían darse…
Si bien, esa serie de palabras, tal cual, me parece que no deberían darse y eso si que es simple de evitar… con no tener ciertas palabras o tener combinaciones prohibidas bastaría…. y eso consume mucha menos CPU que el reconocer, analizar, contextualizar, buscar en la base de datos, crear la respuesta y pronunciarla en formato de voz comprensible… pero que muchísima menos CPU, no llegaría ni al 1 por millón.
Esto pasa por querer sacar al mercado un producto lo antes posible… luego vienen los llantos y quejas de que el producto es devuelto o que no agrada al consumidor.
Vale, que no se haga como hace décadas, que se analizaba y estudiaba durante años antes de sacarlo a la venta desde que se tenía el prototipo funcional, pero de ahí a sacarlo el mismo día, como que no, no me parece buena idea.
Como digo son opiniones personales, que incluso podrían cambiar con el paso del tiempo.
Espero no haber ofendido a nadie, pero me gusta decir las cosas claras, y es que resulta muy fácil criticar, pero nadie alaba el pedazo de trabajo que hay detrás del reconocimiento de voz, y menos aún del de que el software «entienda» lo que se le dice… algo que se viene intentando desde los 70’s, básicamente desde que salió el primer ordenador, y se empezó con modelos en los que tenías que teclear la pregunta…. algunos incluso aprendían sobre la marcha y mejoraban mucho las respuestas.
Ójala algún día se logre no tener que usar teclados, hablar directamente y que «entienda» lo que dices, pero lo veo aún muy lejos, al menos deben cambiar dos aspectos… uno, encontrar unas matemáticas (transformadas) con las que se pueda transformar el «sonido» en letras, sílabas, palabras y frases, y otro aún más difícil, que todos los humanos hablemos con una semántica correcta o bien que se pueda adaptar a los errores que cometemos.
Pondré un ejemplo muy simple, el leísmo, laísmo y loísmo que es bien fácil de evitar cometer error con él pero todos cometemos errores…
Significado a expresar: Regalar a Rosa un ramo.
Ejemplo Mal: Ayer le regalé un objeto.
Ejemplo correcto: Ayer la regalé un objeto.
Si sustituimos la, le o lo por a él, a ella o a ello se sabrá evitar el error.
Significado a expresar: Regalar a Rosa un ramo.
Ejemplo Mal: Ayer regalé un objeto a él.
Ejemplo correcto: Ayer regalé un objeto a ella.
Pues hacer que un software sea capaz de comprender tanto las que están bien como las que están mal y que entienda que son lo mismo no siempre es fácil, a veces es muy difícil… y aún más con las letras mudas o que no pronunciamos… mucha gente se come ciertas letras… por ejemplo las terminaciones en ..ado como acabado, que suelen pronunciar sin al ‘d’, es decir «acabao», «bacalao», etc… esto es la parte sintáctica del proceso…
Se suele seguir un proceso de tres pasos tras convertir el sonido en letras: léxico (caracteres válidos), sintáctico (palabras correctamentes escritas) y semántico (frases bien construidas)… similar a los correctores ortográficos modernos, después viene lo complejo, «enterder» lo que la frase «bien construida» quiere significar y por tanto poder buscar qué responder.
Es extremadamente complejo, mejor alabemos el «buen» trabajo que se está haciendo y no «critiquemos» esas salidas de tono de algunas respuestas, que con simples filtros en el proceso final se pueden evitar de forma muy simple.
Me parece una verdadera salvajada que pueda llegar a decir eso como respuesta, pero me parece una maravilla que al menos responda bien a una sola pregunta, no digamos ya que pueda ser usado como asistente.
Personalmente no lo he probado, pero en el tema del reconocimiento de voz estoy muy interesado, ya que de momento ningún software (ni las tarjetas especializadas de IBM) han sido capaces de reconocer tres simples comandos… minimizar, maximizar y restaurar, mucho menos un dictado… y a un amigo que es tartamudo le funciona muy bien, … habñe con IBM y analizaron los patrones de onda que generaba y su experto me comentó, explicó y justificó matemáticamente porque no sería posible hasta que no se mejore la matemática que hay detrás… de eso hace ya unos cuantos añitos y todavía no ha cambiado.
Eso si nunca perderé la esperanza de que algún día sea posible, sino a mí, si al resto de humanos o al menos a un porcentaje.
Nota: El resto de humanos si que entiende lo que pronuncio sin ningún problema… se debe a que la precisión del oído humano es muchísimo mayor que la que consiguen las «transformadas» que se encargan de pasar el sonido a texto… en el oído la precisión media humana viene a ser de unos 4Hz, las transformadas no logran mas que 50Hz de precisión. Vamos que una variación en la frecuencia de 10Hz un humano medio la percibe perfectamente pero las «transformadas» no son capaces de afinar tanto. Al hablar variamos entre unos 5000Hz y 14000Hz, claro que los cantantes de ópera son capaces de llegar mucho más allá, el oído humano medio es capaz de percibir desde 500Hz (uno muy entrenado incluso puede llegar a los 50Hz y oír vibrar los cables eléctricos de la casa) hasta los 22000Hz (uno muy entrenado incluso a los 50000Hz) en mi caso soy capaz de percibir mono-frecuencias concretas en el rango de los ultrasonidos, y no es ningún misterio, es porque se producen armónicos de menos frecuencia dentro del oído interno, y se puede demostrar si localizas dos o más frecuencias concretas que oigas… le dices al que las genera, cambia de esta a esta otra o a una tercera según te plazca, que yo te diré cual de las tres usas… y funciona, lo que no se puede es detectar pequeñas variaciones… eso no, sólo determinadas frecuencias… igual te suena esto: he los murciélagos están chillando, emiten unos soniditos muy agudos… es muy raro que emitan en la zona audible, casi siempre son ultrasonidos, pero lo que oímos no es la frecuencia concreta, sino un armónico (frecuencia resonante menor). No hay misterio en ello y todos somos capaces, es sólo cuestión de hallar las frecuencias que seas capaz de detectar (oir algo cuando se emiten) y diferenciarlas, en un ambiente libre de otros sonidos es mucho más fácil y aún más en cámaras anecóicas.
Quizás al que lea esto si le funcionen los reconocedores de voz actuales, pero a mí no y es una pena, porque me encantaría «hablar» con el ordenador… o mejor dicho «dictarle», de momento me conformaría con poder controlar ciertas órdenes básicas.
En fin, les deseo la mejor de las suertes a los que se dedican a «mejorar» el reconocimiento y el «entendimiento» de lo que se pronuncia.
Por cierto, hace años, vi un software capaz de «reconocer» y convertir a texto lo que dicen hasta cinco personas diferentes a la vez a un mismo micrófono, es decir múltiples conversaciones a la vez… pero no sólo eso, sino que diferenciaba (con el color del texto) lo que era de cada uno… y casi no cometía errores, bueno acertaba en un 90 y pico por ciento que ya era mucho… lo probaron conmigo y el grado de acierto era increíble, era el más grande que hasta ahora había conseguido, tan sólo un mísero 1%, pero eh, al menos el 1%, los demás como digo ni el uno por millón… y si me pidieron que leyera una serie de textos y que les autorizara a conservar esas grabaciones para poder estudiarlas y mejorar el proceso… obviamente acepté, claro… me gusta colaborar.
En fin una respuesta, esa que dio el Siri, bastante desafortunada y muy fácil e evitar en el futuro, pero un duro trabajo el que se deben haber tomado para sacarlo al mercado… si puedo y veo en alguna tienda algún iPhone 4S con Siri, intentaré probarlo, igual hasta me llevo una grata sorpresa!!! nunca se sabe.
paso de leerme todo ese royo
oink oink oink
3 cosas
La regalé un ramo, es un laismo y está mal. Aunque sea femenino el destinatario, se debe usar le.
Bacalao es así, nada de bacalado.
Tienes sistemas de reconocimiento de voz excelentes, philips speechmagic, con diccionarios específicos para profesiones
no estoy seguro de lo que me has dicho, así que cierra la puta boca.
para leer esto mejor has un libro ¿no?
igual… si para querer un asistente así mejor contrato a una persona cualquiera
uff vaya rollo
no tienes nada mejor que hacer?
lo va a leer Rita
De seguro hiciste un copy paste.
Eres buen (mal) escritor y deverias (no) hacer un libro
z666zz666z: desde luego ganas de hablar no te faltan.
Sólo una cosa: el ejemplo del laísmo es incorrecto. Regalar un ramo a Rosa se dice RegalarLE un ramo (porque Rosa es objeto indirecto). RegalarLA un ramo es incorrecto.
buahh…esto me suena una leyenda urbana como la copa de un pino,no se lo creen ni ellos.
Y eso que el del laísmo no se metió con el tema cacofónico…
Regalar a ella un ramo
Regalarle un ramo
Regalarlo a ella
«Regalárselo» y no «Regalárlelo»
Pero sí, el ejemplo está mal como dice Iván.
soys unos chorras, discuitendo iphone contra android como si os fuerana pagar algo a vosotros. Os sacan el dinero por chorradas tanto uno como otros y os da igual preferis discutir, en vez de exigir calidad de verdad que parece que con cada tonteria y estupidez nueva que sacan vais corriendo como perritos a comprarla.
Gracias por el único comentario con sentido que he leido en una de estas páginas en mucho tiempo.
Siri like a boss
z666zz666z He llegado al tercer renglon.
De verdad que hay gente sin sentido del humor… (la madre incluída). A más de un@ le tenían que dar esa respuesta… jajajaja
Por otro lado, es una de las noticias más divertidas que he leído en Movilzona, junto con la de la tarifa «¿Me entiendes?» de Yoigo el 28 de diciembre. ¡Enhorabuena a sus redactores por arrancarnos una sonrisa de vez en cuando!
¿Desde cuando la programación de Apple es código abierto como para que nadie pueda modificarlo? Eso es un fallo de Mac y punto, y bastante cachondo por cierto xDD
Es tan sencillo como poner en las opciones del teléfono, que tu nombre es «así que cierra la puta boca».
Y cada vez que Siri se dirija a ti te lo dirá.
Aunque soy antiapple, tengo que reconocer que es el comentario con más sentido de todos los leídos.
Enhorabuena!
Yo creo que era Steve Jobs el que había programado ese teléfono… esa respuesta encajaría con su personalidad
Yo le hubiera contestado: ¡vete al carajo, apple de mierda!
La noticia es anterior y era un niño.
haaaaaaaaaaaaaaaahahahahaha, tenía que haberle contestado. ___Cierra la puta boca y cómprate un Galaxy S·, que yo soy una mierda de smartphone, mi corazón es vetusto y anticuado.
no me lo creo
yo tampoco me lo creo mucho, la unica posibilidad es que alguien alla reemplazado el asistente de siri por uno que solo responda eso
no creo que haya sido eso cierto, ya que si por algun motivo llego a ocurrir apple lo mejora y tambien pudo haver sido desbloqueado y hayan puesto una aplicasion o algo …
tambbien todos saben que las personas que critican el iphone la marca mac de apple en general es gente que no puede adquirir estos productos.
aparte galaxy S le debe el exito a apple cabe recordar que samsung sigue pagando deudas y demandas a apple por motivos de copia de software, asi que en mi opinion personal el iphone de apple es lo mejor en todo el mundo, siempre innovando y estand a la vanguardia en tecnologia.
Saludos a todos!!!!
Ole tus huevos , campeón.Eso los diras por ti, no? No creo que te interese lo que cobro, ni te lo voy a decir, pero me llega mas que suficiente para comprarme el movil que me de la gana, y cuando me de la gana. Y adivinas que movil tengo. No te rompas la cabeza, un xperia S, simplemente poruqe me gusta y tiene una buena camara. O la unica decision posible es que si tienes dinero compres apple? No tengo Apple , simplemente por que no quiero y me gusto mas otra opcion. Gracias a Dios aun puedo elegir lo que quiero.
jajajajajajaj de que se escandalizan me gustaría oir a un inglés cuando no hay nadie delante jajajaja.
Pues parece sencillo, si le dices a Siri que te llamas «así que cierra la puta boca» te dirá esa frase, «no estoy seguro de lo que me has dicho, /nombre/» cuando no te entienda…
Y yo le pregunto lo ocurrido en el mismo tipo de móvil y me dice no sé nada de eso