Logo

29/06/22 | Internacional

Un modelo anal铆tico para la detecci贸n de fraudes y curso online avanzado

Image La OMA se complace en anunciar que el modelo LITE DATE para la detecci贸n de fraudes con el curso avanzado de an谩lisis de datos ya est谩 disponible en ingl茅s y franc茅s a partir del 17 de junio, con el apoyo del Fondo de Cooperaci贸n Aduanera de Corea (CCF-K).

En l铆nea con el enfoque de la OMA en el an谩lisis de datos para fines aduaneros, el proyecto BACUDA contin煤a brindando algoritmos de c贸digo abierto de acuerdo con las necesidades de los miembros y las actividades de desarrollo de capacidades que lo acompa帽an.

隆La 煤ltima incorporaci贸n es el modelo LITE DATE con el c贸digo fuente y las explicaciones incluidas en el curso Advanced Data Analytics en Plataforma de aprendizaje electr贸nico.

LITE DATE, f谩cil y sencillo de usar

LITE DATE es una versi贸n lite del modelo DATE desarrollado en 2020 como parte del proyecto BACUDA, en el sentido de que la estructura del modelo se ha simplificado para un uso m谩s amplio sin perder su funcionalidad.

Despu茅s de la publicaci贸n del modelo DATE y el lanzamiento del curso intermedio, que cubr铆a el algoritmo y el c贸digo fuente del modelo DATE, los miembros expresaron su necesidad de abordar la dificultad del modelo debido a sus requisitos de GPU, bibliotecas y t茅cnicas de programaci贸n complejas.

En este sentido, el modelo LITE DATE se desarroll贸 en respuesta a esos comentarios y recomendaciones para que sea un modelo f谩cil de practicar,
comprender y ejecutar sin una GPU de alto rendimiento.

Mientras que el modelo DATE original tiene como objetivo detectar el fraude prediciendo la cantidad de ingresos adicionales, el modelo LITE DATE realiza solo la primera tarea entre las funciones mencionadas anteriormente.

Aspectos clave de LITE DATE

El objetivo del modelo LITE DATE es detectar transacciones fraudulentas.
T茅cnicamente hablando, es un modelo de clasificaci贸n binaria que tiene como objetivo clasificar la transacci贸n dada en la clase de transacciones ilegales o en la clase de transacciones no ilegales. El clasificador XGBoost se utiliz贸 para la clasificaci贸n binaria, que es un algoritmo de conjunto basado en 谩rboles que utiliza el m茅todo de impulso.

Los datos utilizados para el modelo de capacitaci贸n son el conjunto de datos de declaraci贸n de aduana sint茅tico creado y compartido por el equipo del proyecto. El conjunto de datos comprende 100 000 muestras sint茅ticas de datos de declaraciones de aduanas etiquetadas con los resultados de inspecci贸n sint茅ticos.

En t茅rminos de rendimiento, el modelo muestra un recuerdo del 79,9 % y una precisi贸n del 20,8 % (el recuerdo es una m茅trica com煤nmente utilizada para evaluar con precisi贸n la detecci贸n de fraude de la IA).

De acuerdo con los resultados, se espera que el modelo pueda detectar alrededor del 80% de todas las transacciones il铆citas y reducir la cantidad de transacciones sujetas a inspecci贸n humana a un tercio mientras triplica su eficacia del 7% al 20,8%

BACUDA: apoyando a la Aduana con an谩lisis de datos

Por la Secretar铆a de la OMA

Los miembros de la OMA pidieron a la Secretar铆a que ponga un nuevo enfoque en el desarrollo de orientaci贸n y capacidad para apoyar el uso de an谩lisis de datos. Como una de las respuestas, se puso en marcha un equipo de expertos en el marco de un proyecto llamado BACUDA. El nombre del proyecto es un acr贸nimo que significa "BAND of CUstoms Data Analysts". Tambi茅n es una palabra coreana que significa 鈥渃ambiar鈥. De
hecho, el objetivo del proyecto es ayudar a las administraciones aduaneras a adoptar herramientas y metodolog铆as anal铆ticas, un paso importante para muchos.

Los miembros del equipo BACUDA son todos expertos en datos con quienes la Secretar铆a ha estado colaborando durante algunos a帽os. Son funcionarios de Aduanas a cargo de la gesti贸n de riesgos, estad铆sticas y sistemas inform谩ticos, as铆 como economistas profesionales y cient铆ficos
de datos con formaci贸n acad茅mica en inform谩tica. Cient铆ficos de datos de varias nacionalidades del Instituto de Ciencias B谩sicas (IBS), el Instituto Avanzado de Ciencia y Tecnolog铆a de Corea (KAIST) y la Universidad Nacional Cheng Kung (NCKU) est谩n involucrados en el proyecto y lideran el desarrollo de tecnolog铆a de punta. algoritmos de 煤ltima generaci贸n. Sin embargo, cualquier experto en datos calificado que trabaje en administraciones aduaneras o en el mundo acad茅mico puede unirse al equipo de BACUDA.

OBJETIVO

BACUDA es un proyecto de investigaci贸n colaborativo entre Aduanas y cient铆ficos de datos cuyo objetivo es desarrollar metodolog铆as de an谩lisis de datos, incluidos algoritmos en lenguajes de programaci贸n de c贸digo abierto (R 1 o Python 2 ). Los m茅todos y algoritmos se explican y comparten en el sitio web de la OMA, donde se presentan en la "Serie 3 " y se clasifican por objetivos, lo que permite a los miembros de la OMA implementar los algoritmos en sus administraciones para analizar sus propios datos.

M脡TODOS DE TRABAJO

Para desarrollar los algoritmos, los analistas de BACUDA utilizan datos de Aduanas al nivel m谩s desagregado, es decir, el nivel de transacciones. Dichos datos se recopilan de las administraciones aduaneras que desean apoyar el proyecto y luego se anonimizan para respetar la confidencialidad de la informaci贸n proporcionada. Adem谩s, los expertos que acceden a los datos an贸nimos deben firmar una declaraci贸n de confidencialidad, y los resultados preliminares de cualquier investigaci贸n se entregan primero a los propietarios de los datos, quienes deben aprobarlos antes de su publicaci贸n.

El 茅xito potencial del proyecto radica en el acceso a una gran cantidad de datos a nivel de transacci贸n, pero los expertos de BACUDA tambi茅n trabajan con datos de c贸digo abierto. Estos datos no se limitan a datos macroecon贸micos o geogr谩ficos y espaciales obtenidos de organizaciones internacionales. Tambi茅n incluye im谩genes satelitales 4 de dominio p煤blico publicadas por algunas agencias espaciales y militares. Adem谩s, los expertos tambi茅n hacen uso de algunas plataformas que permiten rastrear el movimiento de medios de transporte, como aviones, 5 as铆 como actividades delictivas o eventos espec铆ficos 6 . Juntos, estos datos permiten obtener una mejor comprensi贸n de las actividades y las cadenas de suministro relacionadas con la frontera.

Gracias a las herramientas de miner铆a de texto y web scraping, los datos no estructurados pueden extraerse de p谩ginas web o sitios de redes sociales (SNS) y luego analizarse. Por ejemplo, los datos de precios en las plataformas de compras en l铆nea pueden cotejarse para evaluar la conformidad del valor declarado de un art铆culo a efectos de valoraci贸n en aduana.

RESULTADOS Y CAMINO A SEGUIR

Para desarrollar y probar los algoritmos que han dise帽ado, los analistas de BACUDA tienen a su disposici贸n dos potentes ordenadores conectados a
un servidor en la nube gracias al generoso apoyo del Servicio de Aduanas de Corea. Esta instalaci贸n les permite trabajar en cualquier lugar, en cualquier momento, siempre que puedan conectarse a Internet.

El equipo del proyecto ya ha desarrollado m茅todos y algoritmos b谩sicos presentados en la "Serie 3 " y clasificados seg煤n los siguientes objetivos: an谩lisis de datos espejo con R y Shiny, previsi贸n de ingresos aduaneros, an谩lisis de brechas de ingresos, raspado web de datos de precios y detecci贸n de fraude aduanero mediante Aprendizaje autom谩tico con Random Forest y Python. El acceso a esta informaci贸n est谩 restringido y se invita a los lectores interesados ??que no tengan una cuenta de usuario para el sitio web de la OMA a enviar una solicitud de acceso a la OMA si son funcionarios de aduanas o a ponerse en contacto con la Unidad de Investigaci贸n de la OMA si tienen otra funci贸n p煤blica o privada.

En conclusi贸n, cabe destacar que el equipo del proyecto est谩 preparado para resolver todo tipo de enigmas para las administraciones aduaneras, no solo cuestiones relacionadas con la aplicaci贸n en s铆. Podr铆an, por ejemplo, ayudar a desarrollar chatbots para asesorar a los importadores sobre c贸mo clasificar sus productos o c贸mo calcular los aranceles e impuestos que se aplican a sus operaciones comerciales. Otra 谩rea en la que los expertos de BACUDA podr铆an ser 煤tiles es en la medici贸n del desempe帽o de la Aduana mediante la extracci贸n de texto de los comentarios que aparecen en las redes sociales, en lugar de utilizar las encuestas tradicionales.

Image Image Image Image