3/9/2018

Armonización del marco conceptual de la ley ambiental.

Este texto ha sido traducido automáticamente y por lo tanto puede diferir del original. No se pueden derivar derechos de esta traducción.

💬 Click here to read this page in English.

En 2017, Dialogic llevó a cabo un proyecto para Rijkswaterstaat para analizar listas de términos de los municipios. Se investigó qué datos podían ser utilizados y qué pasos eran necesarios para analizar estos datos. Desde el programa y la VNG se solicitó actualizar y ampliar esta investigación. El gobierno, a través de la ley del entorno, busca simplificar y fusionar las regulaciones para el desarrollo espacial. En esta investigación, examinamos en qué medida podemos armonizar los términos de la ley del entorno entre los municipios mediante métodos de text-mining y machine learning. Con el text-mining podemos estructurar conjuntos de datos no estructurados. Utilizando diversas métricas de distancia como la similitud de Jaccard (figura 1), podemos calcular cómo difieren entre sí grandes cantidades de texto. La similitud de Jaccard se utiliza no solo para la minería de textos, sino también para la detección de plagio o sistemas de recomendación. Por ejemplo, el término "evento". En dos municipalidades diferentes se utilizan ligeramente diferentes definiciones de este término: Municipio 1: todas las actividades de entretenimiento accesibles al público, incluyendo: ... Municipio 2: cada actividad de entretenimiento accesible al público con la excepción de: ... Al calcular la similitud de Jaccard, determinamos la proporción entre la intersección (número de palabras que aparecen en ambos conjuntos 1 y 2) y la unión (número de palabras únicas). La tabla a continuación ilustra cómo se calcula la intersección entre los dos conjuntos. Una vez calculada la similitud de Jaccard, es necesario establecer un valor de corte. Este valor se ajusta para garantizar con alta certeza que dos términos son iguales entre sí. Después de utilizar los métodos de text-mining para identificar qué términos coinciden fuertemente entre sí, podemos clasificar nuevos términos en el futuro con algoritmos de machine learning. Al asignar etiquetas a la lista de términos no estructurada, podemos predecir, por ejemplo, con una máquina de vectores de soporte o una red neuronal profunda, en qué medida un nuevo término se corresponde con uno de los términos estandarizados. De esta manera, no solo damos estructura a los términos existentes, sino que también establecemos marcos para la formación de nuevos términos. Los métodos desarrollados tienen numerosas aplicaciones más allá de la investigación sobre la ley del entorno. Por ejemplo, la métrica de distancia de Jaccard puede utilizarse para comparar cualquier conjunto potencial de elementos entre sí, no limitándose (aunque siendo muy útil) a propósitos de minería de texto. Los algoritmos de machine learning pueden aplicarse a cualquier problema de clasificación concebible. En la página Data Science en Dashboards puede probar algunos de estos algoritmos usted mismo. Puede considerar, por ejemplo, una red neuronal que predice la función de una vacante educativa.

Conoce a los investigadores