Siri responde a una niña de 12 años: “cierra la puta boca”

Escrito por
Apple

Hemos mencionado en más de una ocasión las anécdotas de Siri. Sin embargo, el caso acaecido en Reino Unido supera todo lo conocido. La respuesta de Siri a una pregunta de una niña de doce años es cuanto menos impactante.

El sistema de reconocimiento de voz incluido en el nuevo iPhone 4S, Siri, era una de las novedades más destacadas en la presentación de Apple, un día antes de la muerte de Steve Jobs. Desde entonces, han aparecido infinidad de artículos analizando su funcionamiento y, más concretamente, comprobando las reacciones de este servicio ante las preguntas más comprometedoras y anecdóticas. Ya son célebres frases como: ¿Qué llevas puesto? –Aluminosilicato de vidrio y acero inoxidable. Bonito, ¿eh? ¿Te casarás conmigo? –Mi acuerdo de Licencia de usuario final no contempla el matrimonio. Mis disculpas. O hasta sugerencias sobre lugares para deshacerte de un cadáver… Sin embargo, el caso de los últimos días es diferente pues supone un precedente para el asistente por voz del iPhone 4S.

Cruce de cables

Ha sucedido en unos grandes almacenes en Reino Unido. Una madre y su hija se encontraban en una tienda Tesco. La curiosidad de la niña de 12 años le llevó, según informa ABC, a los iPhone 4S de Apple y a su asistente por voz Siri. Acompañada por la madre, la cría se dispuso a comprobar el funcionamiento del sistema de reconocimiento de voz de Apple con una simple pregunta: ¿Cuántas personas hay en el mundo? La respuesta de Siri no se hizo esperar con una tosca y desacertada solución: no estoy seguro de lo que me has dicho, así que cierra la puta boca.

¿Situación provocada?

La madre, muy sorprendida por el “insulto”, volvía a formular la misma cuestión que su retoño para corroborar la desafortunada contestación. El resultado fue el mismo. Indignada, la mujer se dirigió al responsable de la tienda y comunicó lo sucedido. Una vez más, se comprobaba lo suscitado por la señora para descartar un posible error. Como medida inmediata, el terminal iPhone 4S era retirado del stand de muestras y enviado a Apple para analizar la situación. Las primeras pesquisas abogan por una manipulación del teléfono de Apple. ¿Será realmente una hipotética modificación, producto de algún gracioso? ¿Posible fallo de Siri? Estaremos atentos a las novedades y explicaciones que puedan darse en las próximas horas.


Continúa leyendo

Comentarios

39 comentarios
  1. Mario 03 Ene, 12 10:08

    Eso debe de ser codigo Android oculto…

    0
    1. Maria 03 Ene, 12 10:41

      Detras de todo esto debe haber un fandroid

      0
      1. iVapor 03 Ene, 12 11:50

        Y después de un fandroid siempre viene un fanboy con poco sentido del humor.

        0
  2. yo 03 Ene, 12 10:51

    parece mentira como los maqueros os quitais la mierda de encima echando la culpa a los de android. dais pena.

    0
    1. Tu 03 Ene, 12 11:46

      Tio, es una broma.
      El que da pena eres tu.

      0
  3. Anonimous 03 Ene, 12 10:57

    Skynet…¿estás ahí?.jajajajaja…..

    0
  4. Nonaino 03 Ene, 12 11:19

    Será que la niña se llama Laura.
    Ya sabéis el cariño que le tenía Steve a su hija.

    0
    1. Miguel 03 Ene, 12 14:47

      Es Lisa, no Laura.. xD

      0
  5. z666zz666z 03 Ene, 12 11:25

    Si, menudo huevo de pascua le han metido…. si al menos la frase fuera graciosa, un chiste o algo así… pero insultar de ese modo!!!

    Seguro que algún programador no está todo lo bien tratado que debería y eso es el resultado de su magistral cabreo con la compañía, igual no le han pagado, jeje…

    Ahora, en serio, a veces puede pasar que un software de Inteligencia Artificial de respuestas muy raras, es decir, que nada tengan que ver con la pregunta… es algo muy complejo.

    Por un lado el reconocimiento de la voz es imposible (matemáticamente) por lo que se hacen estimaciones de probabilidad (a mí personalmente ninguno me reconoce la voz, ni tan siquiera comandos simples, y eso que pronuncio muy bien en las pruebas que hago, pero nada)

    Por otro lado está el tema de “entender” la frase, bajo la suposición de que se haya reconocido bien la voz… es decir imaginemos que tecleamos una pregunta… que el software “entienda” qué preguntamos no es para nada trivial, es una tarea muy compleja; y si las preguntas son elaboradas, pues peor aún.

    La tecnología aún está en pañales, lo que me parece ridículo es que se implante estando tan “verde” aún… pero claro el primero que logre tener éxito se comerá el mercado, o eso piensan los fabricantes… está muy bien que nos vendan la moto de medio caballo, pero no que nos digan que correrá más que un fórmula 1… a eso lo llamo estafa.

    Si afirman que reconoce la voz, que sea cierto… si afirman que puede contestar preguntas “libres” que sea cierto, de lo contrario que digan que hará lo mejor que se sabe por intentar entender y contestar a lo que se pregunte y que avisen que repuestas como esas podrían darse…

    Si bien, esa serie de palabras, tal cual, me parece que no deberían darse y eso si que es simple de evitar… con no tener ciertas palabras o tener combinaciones prohibidas bastaría…. y eso consume mucha menos CPU que el reconocer, analizar, contextualizar, buscar en la base de datos, crear la respuesta y pronunciarla en formato de voz comprensible… pero que muchísima menos CPU, no llegaría ni al 1 por millón.

    Esto pasa por querer sacar al mercado un producto lo antes posible… luego vienen los llantos y quejas de que el producto es devuelto o que no agrada al consumidor.

    Vale, que no se haga como hace décadas, que se analizaba y estudiaba durante años antes de sacarlo a la venta desde que se tenía el prototipo funcional, pero de ahí a sacarlo el mismo día, como que no, no me parece buena idea.

    Como digo son opiniones personales, que incluso podrían cambiar con el paso del tiempo.

    Espero no haber ofendido a nadie, pero me gusta decir las cosas claras, y es que resulta muy fácil criticar, pero nadie alaba el pedazo de trabajo que hay detrás del reconocimiento de voz, y menos aún del de que el software “entienda” lo que se le dice… algo que se viene intentando desde los 70’s, básicamente desde que salió el primer ordenador, y se empezó con modelos en los que tenías que teclear la pregunta…. algunos incluso aprendían sobre la marcha y mejoraban mucho las respuestas.

    Ójala algún día se logre no tener que usar teclados, hablar directamente y que “entienda” lo que dices, pero lo veo aún muy lejos, al menos deben cambiar dos aspectos… uno, encontrar unas matemáticas (transformadas) con las que se pueda transformar el “sonido” en letras, sílabas, palabras y frases, y otro aún más difícil, que todos los humanos hablemos con una semántica correcta o bien que se pueda adaptar a los errores que cometemos.

    Pondré un ejemplo muy simple, el leísmo, laísmo y loísmo que es bien fácil de evitar cometer error con él pero todos cometemos errores…

    Significado a expresar: Regalar a Rosa un ramo.
    Ejemplo Mal: Ayer le regalé un objeto.
    Ejemplo correcto: Ayer la regalé un objeto.

    Si sustituimos la, le o lo por a él, a ella o a ello se sabrá evitar el error.

    Significado a expresar: Regalar a Rosa un ramo.
    Ejemplo Mal: Ayer regalé un objeto a él.
    Ejemplo correcto: Ayer regalé un objeto a ella.

    Pues hacer que un software sea capaz de comprender tanto las que están bien como las que están mal y que entienda que son lo mismo no siempre es fácil, a veces es muy difícil… y aún más con las letras mudas o que no pronunciamos… mucha gente se come ciertas letras… por ejemplo las terminaciones en ..ado como acabado, que suelen pronunciar sin al ‘d’, es decir “acabao”, “bacalao”, etc… esto es la parte sintáctica del proceso…

    Se suele seguir un proceso de tres pasos tras convertir el sonido en letras: léxico (caracteres válidos), sintáctico (palabras correctamentes escritas) y semántico (frases bien construidas)… similar a los correctores ortográficos modernos, después viene lo complejo, “enterder” lo que la frase “bien construida” quiere significar y por tanto poder buscar qué responder.

    Es extremadamente complejo, mejor alabemos el “buen” trabajo que se está haciendo y no “critiquemos” esas salidas de tono de algunas respuestas, que con simples filtros en el proceso final se pueden evitar de forma muy simple.

    Me parece una verdadera salvajada que pueda llegar a decir eso como respuesta, pero me parece una maravilla que al menos responda bien a una sola pregunta, no digamos ya que pueda ser usado como asistente.

    Personalmente no lo he probado, pero en el tema del reconocimiento de voz estoy muy interesado, ya que de momento ningún software (ni las tarjetas especializadas de IBM) han sido capaces de reconocer tres simples comandos… minimizar, maximizar y restaurar, mucho menos un dictado… y a un amigo que es tartamudo le funciona muy bien, … habñe con IBM y analizaron los patrones de onda que generaba y su experto me comentó, explicó y justificó matemáticamente porque no sería posible hasta que no se mejore la matemática que hay detrás… de eso hace ya unos cuantos añitos y todavía no ha cambiado.

    Eso si nunca perderé la esperanza de que algún día sea posible, sino a mí, si al resto de humanos o al menos a un porcentaje.

    Nota: El resto de humanos si que entiende lo que pronuncio sin ningún problema… se debe a que la precisión del oído humano es muchísimo mayor que la que consiguen las “transformadas” que se encargan de pasar el sonido a texto… en el oído la precisión media humana viene a ser de unos 4Hz, las transformadas no logran mas que 50Hz de precisión. Vamos que una variación en la frecuencia de 10Hz un humano medio la percibe perfectamente pero las “transformadas” no son capaces de afinar tanto. Al hablar variamos entre unos 5000Hz y 14000Hz, claro que los cantantes de ópera son capaces de llegar mucho más allá, el oído humano medio es capaz de percibir desde 500Hz (uno muy entrenado incluso puede llegar a los 50Hz y oír vibrar los cables eléctricos de la casa) hasta los 22000Hz (uno muy entrenado incluso a los 50000Hz) en mi caso soy capaz de percibir mono-frecuencias concretas en el rango de los ultrasonidos, y no es ningún misterio, es porque se producen armónicos de menos frecuencia dentro del oído interno, y se puede demostrar si localizas dos o más frecuencias concretas que oigas… le dices al que las genera, cambia de esta a esta otra o a una tercera según te plazca, que yo te diré cual de las tres usas… y funciona, lo que no se puede es detectar pequeñas variaciones… eso no, sólo determinadas frecuencias… igual te suena esto: he los murciélagos están chillando, emiten unos soniditos muy agudos… es muy raro que emitan en la zona audible, casi siempre son ultrasonidos, pero lo que oímos no es la frecuencia concreta, sino un armónico (frecuencia resonante menor). No hay misterio en ello y todos somos capaces, es sólo cuestión de hallar las frecuencias que seas capaz de detectar (oir algo cuando se emiten) y diferenciarlas, en un ambiente libre de otros sonidos es mucho más fácil y aún más en cámaras anecóicas.

    Quizás al que lea esto si le funcionen los reconocedores de voz actuales, pero a mí no y es una pena, porque me encantaría “hablar” con el ordenador… o mejor dicho “dictarle”, de momento me conformaría con poder controlar ciertas órdenes básicas.

    En fin, les deseo la mejor de las suertes a los que se dedican a “mejorar” el reconocimiento y el “entendimiento” de lo que se pronuncia.

    Por cierto, hace años, vi un software capaz de “reconocer” y convertir a texto lo que dicen hasta cinco personas diferentes a la vez a un mismo micrófono, es decir múltiples conversaciones a la vez… pero no sólo eso, sino que diferenciaba (con el color del texto) lo que era de cada uno… y casi no cometía errores, bueno acertaba en un 90 y pico por ciento que ya era mucho… lo probaron conmigo y el grado de acierto era increíble, era el más grande que hasta ahora había conseguido, tan sólo un mísero 1%, pero eh, al menos el 1%, los demás como digo ni el uno por millón… y si me pidieron que leyera una serie de textos y que les autorizara a conservar esas grabaciones para poder estudiarlas y mejorar el proceso… obviamente acepté, claro… me gusta colaborar.

    En fin una respuesta, esa que dio el Siri, bastante desafortunada y muy fácil e evitar en el futuro, pero un duro trabajo el que se deben haber tomado para sacarlo al mercado… si puedo y veo en alguna tienda algún iPhone 4S con Siri, intentaré probarlo, igual hasta me llevo una grata sorpresa!!! nunca se sabe.

    0
    1. musulman 03 Ene, 12 13:27

      paso de leerme todo ese royo

      0
    2. peewee 03 Ene, 12 14:32

      oink oink oink

      0
    3. Anónimo 03 Ene, 12 15:53

      3 cosas
      La regalé un ramo, es un laismo y está mal. Aunque sea femenino el destinatario, se debe usar le.
      Bacalao es así, nada de bacalado.
      Tienes sistemas de reconocimiento de voz excelentes, philips speechmagic, con diccionarios específicos para profesiones

      0
    4. Siri 03 Ene, 12 16:08

      no estoy seguro de lo que me has dicho, así que cierra la puta boca.

      0
    5. ozkarlee 03 Ene, 12 16:50

      para leer esto mejor has un libro ¿no?

      igual… si para querer un asistente así mejor contrato a una persona cualquiera

      0
    6. chucky 03 Ene, 12 18:06

      uff vaya rollo

      no tienes nada mejor que hacer?

      lo va a leer Rita

      0
    7. José 04 Ene, 12 0:34

      De seguro hiciste un copy paste.

      0
    8. Anonimo 08 Ene, 12 10:51

      Eres buen (mal) escritor y deverias (no) hacer un libro

      0
  6. Iván 03 Ene, 12 11:43

    z666zz666z: desde luego ganas de hablar no te faltan.
    Sólo una cosa: el ejemplo del laísmo es incorrecto. Regalar un ramo a Rosa se dice RegalarLE un ramo (porque Rosa es objeto indirecto). RegalarLA un ramo es incorrecto.

    0
  7. hola 03 Ene, 12 11:59

    buahh…esto me suena una leyenda urbana como la copa de un pino,no se lo creen ni ellos.

    0
  8. Demostenes 03 Ene, 12 12:24

    Y eso que el del laísmo no se metió con el tema cacofónico…

    Regalar a ella un ramo

    Regalarle un ramo

    Regalarlo a ella

    “Regalárselo” y no “Regalárlelo”

    Pero sí, el ejemplo está mal como dice Iván.

    0
  9. neron 03 Ene, 12 12:50

    soys unos chorras, discuitendo iphone contra android como si os fuerana pagar algo a vosotros. Os sacan el dinero por chorradas tanto uno como otros y os da igual preferis discutir, en vez de exigir calidad de verdad que parece que con cada tonteria y estupidez nueva que sacan vais corriendo como perritos a comprarla.

    0
    1. Gracias 18 Ene, 12 9:34

      Gracias por el único comentario con sentido que he leido en una de estas páginas en mucho tiempo.

      0
  10. javi 03 Ene, 12 12:52

    Siri like a boss

    0
  11. J.J. 03 Ene, 12 13:13

    z666zz666z He llegado al tercer renglon.

    0
  12. Rosalía 03 Ene, 12 13:30

    De verdad que hay gente sin sentido del humor… (la madre incluída). A más de un@ le tenían que dar esa respuesta… jajajaja

    Por otro lado, es una de las noticias más divertidas que he leído en Movilzona, junto con la de la tarifa “¿Me entiendes?” de Yoigo el 28 de diciembre. ¡Enhorabuena a sus redactores por arrancarnos una sonrisa de vez en cuando!

    0
  13. =/ 03 Ene, 12 14:12

    ¿Desde cuando la programación de Apple es código abierto como para que nadie pueda modificarlo? Eso es un fallo de Mac y punto, y bastante cachondo por cierto xDD

    0
  14. underback 03 Ene, 12 14:48

    Es tan sencillo como poner en las opciones del teléfono, que tu nombre es “así que cierra la puta boca”.
    Y cada vez que Siri se dirija a ti te lo dirá.

    0
    1. Xavi 03 Ene, 12 17:35

      Aunque soy antiapple, tengo que reconocer que es el comentario con más sentido de todos los leídos.
      Enhorabuena!

      0
  15. Bill Gates 03 Ene, 12 15:53

    Yo creo que era Steve Jobs el que había programado ese teléfono… esa respuesta encajaría con su personalidad

    0
  16. pepe 03 Ene, 12 16:55

    Yo le hubiera contestado: ¡vete al carajo, apple de mierda!

    0
  17. Samuel 06 Ene, 12 19:22

    La noticia es anterior y era un niño.

    0
  18. kornival korn 03 Nov, 12 18:14

    haaaaaaaaaaaaaaaahahahahaha, tenía que haberle contestado. ___Cierra la puta boca y cómprate un Galaxy S·, que yo soy una mierda de smartphone, mi corazón es vetusto y anticuado.

    0
  19. josy 05 Nov, 12 18:51

    no me lo creo

    0
    1. Alonso Seguel Velásquez 08 Nov, 12 4:57

      yo tampoco me lo creo mucho, la unica posibilidad es que alguien alla reemplazado el asistente de siri por uno que solo responda eso

      0
  20. Edgardo Kaiba 08 Nov, 12 14:15

    no creo que haya sido eso cierto, ya que si por algun motivo llego a ocurrir apple lo mejora y tambien pudo haver sido desbloqueado y hayan puesto una aplicasion o algo …
    tambbien todos saben que las personas que critican el iphone la marca mac de apple en general es gente que no puede adquirir estos productos.
    aparte galaxy S le debe el exito a apple cabe recordar que samsung sigue pagando deudas y demandas a apple por motivos de copia de software, asi que en mi opinion personal el iphone de apple es lo mejor en todo el mundo, siempre innovando y estand a la vanguardia en tecnologia.
    Saludos a todos!!!!

    0
    1. Oscar Fernandez 10 Nov, 12 22:13

      Ole tus huevos , campeón.Eso los diras por ti, no? No creo que te interese lo que cobro, ni te lo voy a decir, pero me llega mas que suficiente para comprarme el movil que me de la gana, y cuando me de la gana. Y adivinas que movil tengo. No te rompas la cabeza, un xperia S, simplemente poruqe me gusta y tiene una buena camara. O la unica decision posible es que si tienes dinero compres apple? No tengo Apple , simplemente por que no quiero y me gusto mas otra opcion. Gracias a Dios aun puedo elegir lo que quiero.

      0
  21. magalufo 17 Jul, 14 23:23

    jajajajajajaj de que se escandalizan me gustaría oir a un inglés cuando no hay nadie delante jajajaja.

    0
  22. Anónimo 18 Ago, 15 14:39

    Pues parece sencillo, si le dices a Siri que te llamas “así que cierra la puta boca” te dirá esa frase, “no estoy seguro de lo que me has dicho, /nombre/” cuando no te entienda…

    0
  23. Anónimo 05 Dic, 15 14:06

    Y yo le pregunto lo ocurrido en el mismo tipo de móvil y me dice no sé nada de eso

    0