Las mujeres dan su voz

Interesante … le he dado vueltas a escribir sobre este tema por un tiempo, sin embargo, creo dejé que simplemente quedara como un borrador de artículo. No obstante, este domingo mientras extrañamente hacía sapping por canales de tv nacional justo me crucé con el reportaje que hacía el programa TEC sobre asistentes personales y recordé el tema.

Es interesante hace un tiempo no pude evitar la curiosidad cuando leí el título de Why computer voices are mostly female y es que, ciértamente, la varios de los asistentes personales para celulares no sólo tienen voz de mujer sino que también tienen nombre de mujer: NinaSiri, Iris, Sara, Ziggy, Eva, … y algunos de ellos tienen una interfaz femenina también.

Entonces quise hacer un poco de investigación sobre el tema y le pedí a mi fiel amigo google que me dijera las posibles razones de porqué las voces más comunes en este tipo de sw es femenina y en resumen esto fue lo que me dijo(absolutamente recomendado que si tienen algo de tiempo se den una vuelta por los enlaces al final del post):

  • “Likability”: Está probado científicamente que la voz femenina está asociada a gentileza, amabilidad, e incluso sentido maternal
  • Socialmente  el tipo de trabajo que realizan estos asistentes está asociado a mujeres (Buuhhh)
  • Identificable: es más fácilmente percibible en un ambiente ruidoso, al menos más que la de un hombre, debido a sus características físicas (tono, frecuencia, decibeles, =S).

Todo bien … sin embargo la cuestión se hace más curiosa aún si sabes un dato interesante sobre Procesamiento de Lenguaje Natural: la voz femenina es la voz más difícil de producir. Aja! sorpresa! Y es que este tipo de voz tiene la menor regularidad de todas, incluso modelar artificialmente la voz de un niño es más fácil. Existen muchas irregularidades, cambios muy variados y dramáticos, la escala de frecuencias es amplia … es fin … para los que trabajan en esto … es muy complicado. Es también por esta misma razón que los problemas de estas voces son más percibibles, por eso es que nos quejamos y por ahí alguien dice: “todavía suena robótico” o “no suena como una persona real”.

De hecho sería más fácil para los ingenieros y científicos detrás de estos sw que la voz fuera masculina. Sin embargo, el factor humano terminó eligiendo.

Enlaces:

Advertisements

Y que pasa con los ciegos??????

Hoy mientras regresaba a casa recordé un tema sobre el que quería escribir hace demasiado tiempo: los semaforos de mi quierida y adorada Lima, pero no se equivoquen no me refiero a aquellos semáforos malogrados, o aquellos que en verdad parecen odiarte porque siempre cambian de luz (en tu contra, por supuesto) cuando llegas a su esquina. Hoy voy a hablar de aquellos semáforos que quisiera que existieran, aquellos que quisiera … que hablaran.
La pregunta surgió un día cualquiera: si para mí es todo un problema el tema de cruzar una pista …. entonces … cómo hacen los ciegos? Casi de manera inmediata mi ingeniera informática interna me gritó a todo pulmón que la respuesta tenía que venir de la tecnología, y que probablemente a más de 1 millón de personas se preguntaron esto antes que yo. Pero … si es así … porqué a nadie se le ha ocurrido hacer algo al respecto? Será que poner en práctica un sistema efectivo que ayude a una persona ciega a cruzar una pista es TAN complejo???? Por 3 segundos busqué un argumento sincero que apoye este ridículo intento de justificar la inconsciencia de quienes sean los involucrados en el tema por parte de nuestros queridos municipios, pero definitivamente no encontré ninguno. Por el contrario, lo primero que pensé fue que sólo se necesitarían un botón, un pequeño parlante y alguien que acceda a grabar algunas palabras (rojo, verde, amarillo, y algunos números, probablemente del 1 al 60).
Según mi decadente mente minimalista el botón sería lo que activaría el sistema, al ser presionado por el invidente se realizaría la consulta sobre la luz activada y los segundos que faltan para que cambie (por cierto, algunas personas piensan que esta información sólo la tienen los semaforos inteligentes ….. FALSO!!!!!), luego con ambos parámetros se busca y emite la lectura correspondiente a manera de audio, usando las grabaciones de aquella alma caritativa que nos prestó su voz.
Ciértamente, pueden agregarse muchas más cosas como que el botón tenga grabado en Braille la palabra semáforo, o que las grabaciones sean en 2 idiomas, o que el volumen este ajustado a la cantidad de ruido de la vía, etc, cosas que definitivamente pueden venir incluidas en un complejo sistema de “gestión de semaforos para invidentes”, los cuales estoy segura hacen magníficamente su trabajo, y cuyo precio seguramente está más que justificado desde algún punto de vista, pero … no es suficiente tiempo sin hacer algo????  No ayudaría el simple sistemita en bastante a los invidentes? No le costaría menos a nuestra municipalidad invertir en un prototipo asi??? No sería mejor si lo hace una universidad????
He de terminar regresando a mi relato inicial, pero sólo para deprimirme más,al dïa siguiente de mi enigmática y filosofal pregunta escuché en el auto que de la Municipalidad de Lima iba a adquirir próximamente un sistema de semáforos  para invidentes, por supuesto casi lloro de l emoción, al igual que ahora,  sólo que la emoción es diferente porque ya pasó mas de 1 año y … nada.

iGadgets … todo un mundo!!

Hoy andaba curioseando algunas páginas de cosas “interesantes” del tipo “regalos que le puedes comprar a un geek” y alternando con ello leía en my reader algunos post que estaban pendientes, entonces encontré algo interesante One iPad phenomenon that Android can’t counter … en resumen el post señala que una de las cosas en las que nuestra querida manzanita está que arde es en la cantidad de accesorios(Gadgets) que está disponibles en el mercado para personalizar tu iPod (cualquier modelo), iPhone, iPad, y todo lo demás que saquen.  Esta amplia oferta de gadgets de todo tipo garantiza que sin importar cuán extravagante pueda ser lo que quieras es probable que ya esté en el mercado como un accesorio para i(XYZ).

Bueno comprobar la veracidad de esa afirmación puede llegar a ser muy divertido especialmente si buscamos en estos sitios especializados en los más exigentes consumidores: “geek’s sites“.  Sugerencia: vean todo! La mayoría de las cosas más interesantes está en categorías que ni siquiera verían … así que no sean pre juiciosos y hagan bien su tarea!! Encuentren los más locos gadgets para dispositivos de Apple!! Sólo para que se animen a buscar les dejo una pequeña lista de Cool and Fun Accesories for the iPad.

Enjoy!

Enlaces:

 

 

Mejoran el iTunes U!

No es una novedad que la tecnología está cada vez más cerca del ámbito educativo, y comienza a ser más que obvio que los alumnos de hoy no tienen el mismo esquema de pensamiento que los de hace 15, 10 e incluso 5 años, sino que vaya que van cambiando. Ya no sólo se trata de las fuentes de las cuales obtienen información, sino que también están fuertemente influenciados por la forma en que dicha información les es entregada, nadie puede negar el éxito que tienen las infografías en su finalidad de transmitir datos estadísticos de una manera cómoda e ilustrativa.

Esta es la razón por la cual los componentes de la educación tienen que comenzar a cambiar, y es que los alumnos ya cambiaron y ellos no se van a amoldar a los antiguos formatos de enseñanza, es la enseñanza la que tendrá que amoldarse a ellos. En este marco el relanzamiento de iTunes U enriquece su ya conocida aplicación con la nueva perspectiva de libros de texto (iBook2 + iBook Author) es probablemente la más notorias de las respuestas al clamor de los estudiantes, y definitivamente necesitará la inclusión del tercer agente en el cambio de las metodologías de enseñanza (los alumnos están dentro de esta movida de todas maneras, y bueno la tecnología ni qué decir), y tal vez los más difíciles de convencer: los profesores. La propuesta es generar opciones de naturaleza dinámica, divertida, cargada de información compleja pero de fácil acceso, que permita la exploración y facilite el aprendizaje.

Entonces, opino que los que no han curiosiado iTunes U se den un vuelta por ahi y busquen  algún curso dentro de las 1000+ universidades que están dentro de este programa que les llame la atención (recuerden que hay de todo!) y bueno prueben a ver qué tal les va con ello. Yo ya encontré mas de 1!!! =D

Enlaces:

Siri … una mirada algo diferente

Desde la presentación del iPhone 4S la semana pasada he escuchado todo tipo de comentarios sobre Siri la nueva aplicación que trae, la mayoría se resumen en 3:

  • Es increíble lo inteligente que es
  • Es una idea absolutamente innovadora y revolucionaria, Steve Jobs cambió el mundo
  • Es lo máximo, no sabes (corrección … el problema es justamente ese: SI sé de qué se trata)

Ahh y por supuesto todos ellos vienen de personas que NO tienen el iPhone 4S y mucho menos han probado Siri, =D!
Realmente tanta era la atención mediática que recibía este “monstrito” que decidí usmear un poquito con la esperanza de asombrarme igual que los demás y ver qué maravilla habían sacado ahora. Claro mi punto de vista sería completamente distinto, estaría analisando Siri desde mi perspectiva favorita: Procesamiento de Lenguaje Natural.
Mi primer paso para enterarme de qué rayos se trataba fue googlear  y leer mis feeds, dentro de ellos encontré que aproximadamente el 70% de las noticias sobre el tema decían lo siguiente:”un asistente de control de voz que tiene la capacidad responder a preguntas simples y de ejecutar tareas sin utilizar el teclado“. Además todos señalan que Siri puede:

  • responder a preguntas de voz como “¿Cuál es la temperatura exterior?”, “¿Cuántos días faltan para Navidad?” o “¿Qué hora es en París?”.
  • activar una alerta a la hora deseada –“Despiértame a las 6:00 a.m.”
  • o anotar una cita en el calendario.
  • encontrar lugares cerca de tu ubicación, hacer reservaciones en restaurantes, solicitar un taxi, encontrar boletos para eventos o informarte sobre el clima.

Por supuesto todos ellos incluían el video promocional de Apple donde Siri es usado a la perfección.
De todo esto lo primero que concluí era que ninguno de los artículos de primera mano que encontré fue elaborado por un experto en el tema de PLN. Todos repetían lo mismo, una descripción superficial y marketera. Hasta el momento no existía ninguna diferencia conceptualmente significativa entre un ejecutor de comandos de voz y lo que los medios(realmente fueron sólo los medios?) habían denominado como un asistente personal inteligente.  Ahhh y por cierto la tecnología que lo hace posible(reconocimiento + síntesis de voz) existe hace ufffff …. por lo menos unos 10 años:

Entonces me topé con un artículo interesante que realmente resaltaba lo que Siri es, y más importante aún, lo que no es. Siri es un (dándole el beneficio de la duda) intérprete de comandos de voz, y digo intérprete porque quiero creer que no sólo busca keywords en la salida de un reconocedor de voz  para poder hacer su magia. Pero ojo hasta aqui llega en cuanto a “inteligente” lo demás es ejecución de comandos como parte de la interacción que Siri tiene con su abanico de aplicaciones. Y me tomo el tiempo de resaltar que esa interacción si me parece algo rescatable … aunque  jejeje … ya existía XD.

Bien como no encontré nada que me dijera exactamente cómo funciona decidí divertirme pensando cuál podría ser una arquitectura tentativa de Siri:

  • Un reconocedor de voz: dicen que es bastante bueno, eso depende varios factores en las pruebas que se realizan: ruido del ambiente en el que se prueba, género del hablante, velocidad de discurso, si es la lengua nativa del hablante o no, entre otros detallitos.
  • Intérprete de comandos: insisto en que debe existir, al principio debería buscar keywords y luego rescatar aquella información importante en los mensajes que deben ser tratados como criterios de búsqueda indirectos. Ejm: “Existe un buen lugar de hamburguesas por aqui?”, Siri debería rescatar este pseudocriterio para pedirnos más información al respecto y transformarlo en un criterio claro, asi la palabra buen en el ejemplo podríamos definirla como “con más de 50% de recomendaciones de usuarios”.
  • El intérprete de comandos, lo interesante sería cómo está armada la relación entre los keywords y las acciones a ser tomadas en la aplicación correspondiente … tal vez se haga en 2 tiempos. Pero eso si la relación debe ser dinámica pues se supone que “aprende”.
  • TTS, para cualquier tipo de interacción que quiera tener con el usuario. Que por cierto es bastante malo, lo cual me despierta una curiosidad, porqué los de iPhone usaron un TTS tan malo? Será una desición que tiene que ver con Business Partners??

Ahhh por cierto sólo para el caso de inglés, francés y alemán, tienen idea del porqué?? Pues es porque las tecnologías que usa sólo tienen un avance parejo en esos idiomas y para migrarlo a otros tendrían que hacer demasiado trabajo antes de poder usar Siri. Y por ejemplo qué está detrás de este cosito? Nuance y Quora. Un post interesante es el de TechCrunch, totalmente recomendable.

Luego de la salida a la venta del iPhone 4S el viernes la web se ha poblado de post relacionados a pruebas que se hacen de Siri, en algunos casos alabándolo y en otros maldiciéndolo, creo que aún es muy pronto para cualquiera de los 2 extremos. Lo que si es necesario es seguir probando pero con espíritu científico, en buena ley, no con trucos, no es una competencia de hombre vs máquina, ni hay premio por encontrar el talón de aquiles de Siri por puro esparcimiento. Aqui algunos de ellos:

Obvio que la verdad sólo se puede obtener de primera mano, hay que probar cómo funciona, porqué pasa lo bueno y lo malo, y luego sacar las conclusiones respectivas, en base a hechos, investigación de campo y no de biblioteca. Debo confesar que me muero por probar Siri … pero bajo otro tipo de estándares … de hecho es interesante que Apple incorpore al mundo comercial masivo una aplicación de este tipo…. Y por supuesto tiene MUCHO potencial, pero por ahora le falta fortalecer algunos puntos y será con el feedback de los usuarios y testers que llegará a un muy buen nivel.

Ahora sólo me queda esperar … no te librarás de mi Siri! XD

Realidad Virtual: otra realidad

Algo que definitivamente se ha vuelto un tema mucho más fuerte con el pasar de los años es el tema de realidad virtual, especialmente porque como todo concepto propiamente inventado por mentes humanas evoluciona y se va tornando más complejo, ya no es tan fácil interactuar con “algo” que no existe físicamente en el mundo real y llamarlo realidad virtual, sino que ya van apareciendo los temas de cross reality, realidad aumentada, realidad simulada y demás.

Bien, de acuerdo con la enciclopedia favorita de las personas del planeta(si no saben la respuesta andamos un poco alejados de la realidad … es Wikipedia), la realidad virtual es definida como ambientes simulados por computadores que pueden emular lugares del mundo real e incluso mundos imaginarios. La mayoría de las experiencias que se pueden tener con realidad virtual son visuales pero también existen aplicaciones que brindan informacion del tipo auditivo y táctil. La interacción de los usuarios con estas aplicaciones se puede a través de diferentes medios: pueden ser tan simples como teclado y mouse, o dispositivos multitáctiles como los guantes y trajes con sensores de movimiento. En esta página del MIT se muestran buenos ejemplos de la interacción que se puede lograr con realidad virtual.

Bueno entonces este es el punto de partida para el resto de conceptos que nos inundan últimamente. Tratando de ir en orden, Mediated Reality se define como la posibilidad de cambiar la percepción del mundo real, agregando, sustrayendo o manipulando información mediante aplicaciones de compuatdora u otros dispositivos, de alguna manera se la podría llamar la realidad convergente entre lo real y lo virtual. De este concepto se desprenden 2 ramas: la realidad aumentada y la realidad disminuída. La primera de ellas se trata de “decorar” nuestra visión del mundo que nos rodea, en tiempo real, sobreponiendo elementos del mundo virtual. Gracias a los avances tecnológicos este tipo de realidad se ha convertido no sólo en uno de los más aceptados sino que también uno de los más ampliamente integrados a plataformas tecnológicas comerciales. Los videos a continuación son ejemplos de cómo son las aplicaciones que usan realidad aumentada.

Y es que esta nueva tecnología está tan de moda que ni el conocido actor Robert Downey Jr. y la revista Esquire se pudieron resistir a demostrarnos cómo la lectura de una revista puede cambiar dráticamente en el siguiente video.

Todo bien, pero qué se supone que es cross reality? Bien este es un concepto bastante interesante especialmente porque no se trata de manipular nuestra visión del mundo real sino en transferir datos del mundo real al mundo virtual a través de sensores y dispositivos que permiten que la transferencia de información se refleje en tiempo real dentro de un mundo imaginario. Digamos, por ejemplo, que quisieramos observar el crecimiento de una planta y el proceso de su desarrollo, esto sucede todos los días en el mundo real pero si quisieramos verlo en un mundo virtual tendríamos que ir actualizando varios parámetros de nuestro “objeto planta” cada determinado intervalo de tiempo y cruzar los dedos para ser lo más exactos posible. Sin embargo, realizarlo de esta forma tiene varias desventajas, no sólo una gran inversión de tiempo sino que también nos limita mucho la información que se puede almacenar sobre el proceso, es entonces donde Cross-reality puede salir al rescate! Lo que podemos hacer es rodear a nuestra plantita con tantos sensores como consideremos adecuado y con ayuda de un software especializado reflejar la información que capturan dichos sensores,en el mundo real, y volcarla al mundo virtual, con lo cual el proceso puede ser tan exacto como lo sean los mismos sensores. Bastante interesante no?? imagínense todo lo que se puede capturar del mundo real con los sensores de movimiento, nivel de luz y sonido, vibraciones, temperatura e incluso humedad. Varios de los proyectos más interesantes se llevan a cabo actualmente en el MIT Media Laboratory.

Los métodos de interacción con las aplicaciones de realidad virtual son todo un tema aparte ya que van desde cascos, lentes, sensores y toda una serie de dispositivos que hacía que parecieramos realmente de otro planeta hasta cosas tan sofisticadas y portables como pueden ser los guantes, haptics y hasta la ropa. En los siguientes posts encontrarán información muy interesante sobre cuál es la tendencia en los dispositivos de interacción para realidad virtual.

Sólo para darnos una idea también podemos buscar en nuestra tienda virtual preferida, tipo amazon, best buy, ebay o cualquier otra a ver qué productos se pueden encontrar bajo la rúbrica de realidad virtual.

Pero para sorpresa de muchos el tema de otras realidades no queda sólo ahi, sino que también se maneja, bastante seriamente debo decir, la propuesta de la realidad simulada, que no es realidad virtual, pues en la realidad simulada nos llevaría a tal punto en el que no sería posible identificar cuál es la parte real y cuál es la virtual dentro de nuestras propias experiencias, y si a alguien le suena a algo parecido a The Matrix y AVATAR pues entendieron el concepto. Pero qué tanto se puede hacer por lograrlo? Sólo el tiempo y la tecnología lo dirán, aunque por ahora este tipo de realidad sólo es realidad en nuestras películas favoritas.

Alguno por ahi esperará que toque el tema de las aplicaciones que tuvo, tiene y puede tener la realidad virtual pero definitivamentes es algo que les dejo de tarea a aquellos a los que les pareció interesante el tema. Traten de ver qué tan lejanos estamos de la realidad virtual que nos mostró James Cameron en AVATAR.

En conclusión, todavía se alucina mucho con este tema pero hay cosas que definitivamente ya dejaron de ser simple imaginación de mentes brillantes, aburridas de una sóla realidad, y ya son parte del presente en lugar de “futuro de ciencia ficción”. Por lo tanto ponerse al día en cuanto a de qué se trata cada cosa, cómo se utiliza, sus pros y contras sería una buena actividad para nuestra salud mental.

URL’s

http://aumentados.es
http://www.engadget.com/2010/04/09/mit-media-labs-surround-vision-brings-virtual-reality-to-a-tabl/
http://en.wikipedia.org/wiki/Virtual_reality
http://www.readwriteweb.com/archives/cross_reality_when_sensors_meet_virtual_reality.php
http://www.readwriteweb.com/archives/cross_reality_will_change_your_life.php
http://www.maestrosdelweb.com/actualidad/cross-reality-y-las-dudas-sobre-privacidad/

ACM-ICPC Arequipa

Hola a todos,

Han sido demasiadas semanas de silencio, pero bueno hay que cumplir con muchas cosas y a veces realmente no hay tiempo para más.

Bien les comento que el fin de semana pasado estuve de viaje en Arequipa, una ida y una vuelta. La razón fue que este año el ACM-ICPC tenía una sede en el Universidad Católica San Pablo y yo debía participar como representante de la PUCP y además ser Observer del concurso.

De ese viaje rescato muchas cosas. La primera de ellas es la experiencia de participar con los organizadores de este año en dicha sede, y aunque tuvimos nuestras sorpresas todo pudo llevarse a cabo con éxito y siempre con el buen humor y la cordialidad por delate.

Además, debo decir que el campus de la UCSP en el cual se desarrolló el concurso es muy bonito, realmente unas vistas desde los balcones que no podemos apreciar en Lima. Les dejo algunas fotos para que lo comprueben por ustedes mismos.

This slideshow requires JavaScript.

El concurso dura unas largas 5 horas, definitivamente maratónico, de hecho la espectativa estaba en el Aire pues competían, como todos los años, Argentina, Bolivia, Chile y Perú en simultáneo. En nuestro caso por primera vez se tendrían 3 sedes activas con ubicación en Lima (Site 1), Arequipa (Site 2) y Trujillo (Site 3) para albergar a nada más y nada menos que 46 teams participantes, una cantidad definitivamente inusitada y sólo superada por los 51 teams de Brasil y los 54 teams registrados para la unión de Colombia y Venezuela.

En Arequipa participaron equipos de Arequipa, Cuzco y Puno que dieron su mejor esfuerzo.


Definitivamente fue una edición emocionante del concurso, y de hecho promete ser mucho más emocionante aún, pues todavía faltan los resultados oficiales para la región y puede ser que el Perú nos de otra sorpresa, prometo avisarles apenas salgan los resultados. Por el momento lo que se puede decir es FELICITACIONES! Al equipo HaCkErMaTh de la PUCP por haberse coronado campeones nacionales en el concurso realizado el sábado que pasó. Si nosotros estamos felices me imagino que los chicos y su coach no caben en si mismos de la alegría.

Divertido y emocionante viaje, lo único malo fue que el domigo casi todo salió mal, o por lo menos parecía, se retrasó el bus, hubieron confusiones en el hotel, todo lo relacionado a salir de Arequipa fue terrible, y hasta al llegar a Lima habían problemas en el aeropuerto relacionado a varias cosas, tanto asi que tuvimos que salir por otro lado. Casi todo parecía terrible, pero sólo para confirmar que “no hay mal que por bien no venga” resultó que justo por donde tuvimos que salir nos cruzamos con Green Day!!! Jejeje casi increíble … pero cierto!