¿Sabes que el álgebra, y los vectores en particular, son el combustible que necesitan todos los algoritmos de Inteligencia Artificial? Así es. Los vectores y las matrices son el corazón del procesamiento de datos de la Inteligencia Artificial hoy día.
Pero, ¿qué tiene de especial un vector? Para entenderlo primero debes saber qué es un vector.
¿Qué es un vector?
Cuando pensamos en procesamiento de datos, nos referimos a la habilidad de tomar información y modificarla. En algunos casos necesitamos transformarla de forma que podamos extraer conocimiento de ella; en otros casos la podemos coger para modificarla, o para extraer información sobre su estructura. En otras ocasiones, los datos son no visuales.
En cualquier caso, los datos son un conjunto de unidades de información compuesto por una lista de características que describen ese conjunto. En el caso de la imagen, por ejemplo, son los píxeles. En el caso de un paciente médico, son los atributos que lo describen (sexo, edad, historial…). Si entendemos cada conjunto de datos como una colección de características, entenderemos lo que es un vector.
Convertir los conjuntos de datos en vectores es muy útil porque encapsula una lista de características de forma que es más fácil relacionar cada grupo por separado; y porque la interpretación de vectores geométrica ayuda a revelar información sobre cómo los conjuntos se relacionan entre ellos en una ficha técnica.
¿Qué tiene de especial un vector?
En este sentido, lo que hace especial a los vectores es que, cuando los interpretamos geométricamente, aquellos vectores que apuntan en una misma dirección tienen propiedades similares.
Por ejemplo, cuando interpretamos imágenes de coches y peatones como vectores en un espacio multidimensional, aunque no podamos visualizar las direcciones a las cuales el vector apunta, sí que podemos calcularlas para después comparar los vectores que pertenecen a imágenes de coches con los que corresponden a imágenes de peatones. Los vectores de coches apuntarán en una misma dirección, y los de los peatones, en otra.
Así pues, crear un algoritmo que pueda aprender automáticamente las diferencias entre los coches y los peatones supondrá manipular esos vectores matemáticamente para entender la dirección en la que apuntan y encontrar así la línea que divide el espacio donde los coches y los peatones se separan. Una vez encontrado ese hiperplano, el algoritmo puede clasificar una imagen totalmente nueva porque sabe en qué lado del vector está: el de los coches o el de los peatones.
Por eso los algoritmos de Inteligencia Artificial terminan por llevar a cabo un número muy copioso de operaciones con vectores. Por lo tanto no es una sorpresa que el otro tipo de dato estructurado comúnmente empleado en Inteligencia Artificial sea la matriz: una matriz es una colección de vectores apilados unos sobre otros.
De hecho, en algunos casos es útil combinar varios vectores como una matriz para poder procesar un set de vectores al mismo tiempo.
Puedes ampliar información sobre los vectores en este documento preparado por CoreAvi.