Machine Learning

Hace unas 3 semanas empecé a tontear con Machine Learning y el curso de Udacity Intro to Machine Learning. Ni que decir tiene que me he tenido que poner al día en Python, que hasta el momento solo había hecho pequeños scripts para cosas que me venían bien. Ahora me estoy curtiendo en el arte de la visualización de datos y manipulación de matrices.

En agosto ha empezado el AWS DeepRacer Scholarship Challenge de Udacity también y, aunque me pilla un poco verde, me he apuntado.

AWS DeepRacer constiste en enseñar mediante Reinforcement Learning a conducir a un cochecito virtual. AWS tiene competiciones virtuales todos los meses en las que puedes competir por diferentes premios, normalmente crédito en AWS. También hay disponible un coche físico a escala 1/18 para correr en competiciones presenciales en los eventos de Amazon por todo el mundo.

Para que nos entendamos, Reinforcement Learning es como el juego de caliente-frío. Ese juego en el que se esconde un objeto que otra persona tiene que encontrar. Esa persona se va moviendo aleatoriamente sin saber absolutamente nada de dónde hemos escondido el objeto, y le vamos diciendo caliente o frío según se vaya acercando al objetivo o no. Poco a poco la persona va acotando la zona en la que está el objeto y, eventualmente, encontrándolo.

Aquí es lo mismo. El coche empieza a moverse erráticamente por el escenario. A la vez, le vamos dando puntos («caliente» o «frío») según lo vaya haciendo bien o mal. Pero al principio no tiene ni idea de nada, no sabe que el juego consiste en ir por la pista, ni sabe que el objetivo es dar una vuelta completa, ni sabe girar para tomar curvas… ¿curvas? ¿eso qué es? Le dejamos que lo descubra todo por sí mismo. El siguiente vídeo es al principio del entrenamiento.

Y este otro vídeo cuando lleva 2h45min. Se nota la diferencia.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos requeridos están marcados *

Publicar comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.