Mi tesina de máster
// July 13th, 2009 // 8 Comments » // cranfield
Como sabéis, la tesina es el proyecto final que cierra el máster y es donde, en teoría, se ponen en juego todos los conocimientos aprendidos. En mi caso, estoy utilizando también conocimientos aprendidos durante el año pasado en la UPV, cuando hice la intensificación de Inteligencia Artificial.
Os cuento de qué va la tesina, obviando detalles técnicos, con un extracto traducido:
“Cuando un simple usuario quiere obtener una imágen de internet, normalmente va a uno de los buscadores de imágenes y busca la palabra que mejor representa la imágen. Suponed por ejemplo que un usuario quiere obtener imágenes de “perros”; introduciría el término de búsqueda “perro”, pero desgraciadamente, obtendría gráficos con el texto “perro” o imágenes con el nombre”perro”, incluso si esas imágenes no tienen ningún perro.
Además, este tipo de búsqueda está limitada por el idioma utilizado, de forma que las palabras “perro”, “dog”, “chien” o “cane” darían resultados esperados, pero escribiendo sólo una de ellas resultaría en una pérdida de imágenes taggeadas o guardadas con un nombre usando otro idioma (como el japonés por ejemplo).
Usando reconocimiento de imágenes y un sistema de taggeado adecuado, se permitiría al usuario saltar sobre esas barreras: ofreciendo al sistema una imágen de un perro, éste devolvería otras imágenes de perros sin tener el problema del idioma y evitando gráficos o imágenes sin perros en ellas.”
Las implicaciones técnicas de lo explicado arriba son varias, como que para que el sistema reconozca la imágen del perro, la red neuronal utilizada debe haber sido entrenado primero para ello. Como la tesina tiene un tiempo limitado, la demostración que haré en la presentación oficial sólo distinguirá “vacas” y “coches deportivos”… ya sabéis, make it simple!
Detrás de lo que el usuario ve, existe un sistema distribuido de información con unas propiedades que no convierten en una locura el hecho de que el sistema sea capaz de reconocer casi cualquier cosa y que las imágenes que obtenga como respuesta provengan de todo el planeta… y ahí es donde entra la parte Grid de la tesina.
Aquí podéis ver un gráfico que representa todo el proyecto:
Una buena noticia al respecto de la tesina es que mi supervisor está tan emocionado con ella que me animó a escribir un artículo y presentarlo a un certamen organizado por la Universidad de Oxford. Al principio no estaba muy convencido de hacerlo, pero es un buen punto de currículum si llegaran a aceptarlo… aún estoy esperando el veredicto, así que ya os contaré.
Respecto al progreso: toda la parte de reconocimiento y servicio web ya está terminada y funcionando relativamente bien, a pesar de haber entrenado la red neuronal con sólo 40 modelos. La parte del Data Grid es la que me ocupa ahora y, si todo va bien, estará terminada antes del fin de semana.
Una vez la programación esté terminada, sólo quedará preparar la presentación oficial que tendrá lugar el próximo 28 de Julio y terminar de escribir la memoria para entregarla antes del 25 de Agosto. Una vez hecho esto, habrá una última presentación conclusiva el 3 de Septiembre y entonces ya habré terminado oficialmente el máster; será momento de dejar Inglaterra definitivamente y volver a España para preparar el siguiente salto… pero esa es otra historia.







