Todo escritor tiene su propio estilo, inconfundible y no tan fácilmente imitable, algo también aplicable a los programadores. Cada programador hace las cosas, dentro de los límites del lenguaje que emplee, de una forma distinta, aunque reconocer el trabajo de un programador en concreto dentro de un largo listado de código no es sencillo. Para esta tarea el aprendizaje automático podría ser una gran ayuda, gracias al trabajo de un grupo de investigadores.
Rachel Greenstadt, de la Universidad Drexel y Aulin Caliskan, de la Universidad de George Washinton, han desarrollado un sistema de aprendizaje automático que puede descubrir el autor del código de un programa a partir del código fuente o del archivo binario. Para ello, el algoritmo que emplea necesita que se le proporcionen ejemplos del trabajo del programador, los cuales no tienen por qué ser muy extensos. Las pruebas realizadas hasta la fecha, empleando ocho muestras por programador, han sido con 600 participantes del Code Jam de Google, consiguiendo identificar al creador del programa en un 83 % de los casos.
Las utilidades de este sistema son múltiples, ya que permitiría detectar plagios o identificar a los creadores de un malware, aunque a cambio de que los programadores perdieran el anonimato.
Vía: EnGagdget.