Af Lars Væhrens, Data Scientist.
Hvis du ikke kender til online brand protection, så går det kort fortalt ud på at beskytte immaterielle rettigheder (IPR) mod krænkelser på nettet. Krænkelser kommer i mange former, men kopivarer er den mest kendte.
Læs mere om, hvordan online brand protection foregår.
Systematisk gennemgang af e-handelsplatforme effektiviseres ved brug af AI
Et helt centralt element i vores online brand protection-ydelser, er gennemgangen af store mængder data for at fremfinde/udsøge krænkelser (for eksempel falske hjemmesider og kopivarer) på internettet. Det er her, at værktøjer som AI er med til at forbedre kvaliteten og hastigheden af vores overvågning og juridiske vurdering, så vi så hurtigt som muligt kan håndhæve vores kunders rettigheder ved at få fjernet det krænkende indhold.
AI var emnet på konferencen ‘International Conference on Machine Learning and Applications’ (ICMLA). Med et fokus på anvendelse i den virkelige verden blev der præsenteret og diskuteret emner om alt fra data til modelarkitekturer samt vurdering og tolkning af trænede modeller.
De tre vigtigste takeaways fra ICMLA
1. Nye modelarkitekturer, der generaliserer bedre
2. Valg af data og hvordan man anvender det, når der kun er små mængder tilgængelig
3. Forbedringer af den superviserede træningsproces, når mennesker er indblandet
Data spiller en central rolle i træning af AI-modeller, så dette var et omdiskuteret emne på konferencen. Og selvom det er en generel tendens i branchen at træne større modeller på endnu mere data, så har mange valgt at forsøge at få mere ud af mindre data. Det er specielt interessant, når man indledende vil undersøge om AI er en brugbar løsning til en problemstilling.
Superviseret træning er oplagt til brug for online brand protection
På konferencen var det også tydeligt at se, at superviseret træning, hvor man træner en AI-model med hjælp fra mennesker, stadig er suveræn indenfor de fleste applikationer. Dog består flaskehalsen stadig i, at mennesker skal gennemgå dataene for så efterfølgende at træne en model. For at mindske flaskehalsen, kan man anvende en model, som er trænet på en mindre mængde data, som iterativt bliver forbedret, når mere data bliver gennemgået.
Superviseret træning er oplagt til brug for online brand protection. En model kan trænes til at genkende krænkelser. En sådan model kan trænes med data fra menneskers vurdering af historiske krænkelser.
Træningen stopper dog ikke nødvendigvis dér. Superviseret træning er også relevant i produktionen, når en AI-model allerede er trænet og anvendes. Krænkernes adfærd ændrer sig løbende for at tilpasse sig vores indsats imod dem, og derfor er det vigtigt, at vores modeller også forbedres og lærer om krænkernes nye adfærd. Derfor er det vigtigt at anvende den tilgængelige data så effektivt som muligt.
Når krænkere ændrer deres adfærd, beskrives dette som et ”data drift” inden for AI, og derfra kan man automatisk træne en ny model, som vil være i stand til at finde krænkelserne igen. Dog vil man med denne metode altid være et skridt bag krænkerne, hvis man først skal observere en ændring i adfærd, før man kan skride til handling. Nyere modelarkitekturer gør det muligt at abstrahere mønstre i dataene, som gør det muligt at adskille krænkelser på trods af ændringer i datagrundlaget. I praksis betyder det, at vi kan forhindre krænkere i at undgå vores detektion.
Selvom vi stadig er i udviklingsstadiet af vores egne modeller, har vi allerede set gode resultater, som vi arbejder på snart at rulle ud til flere af vores kunder.
Hvordan kan du beskytte dit brand mod ulovligt online salg?
Vi tilbyder en fuld pakkeløsning, hvor det er gjort nemt for vores kunder. Vi laver for eksempel ikke computergenererede søgninger og sender rå resultater videre. Vores specialister foretager altid en juridisk vurdering af alle resultaterne og laver de nødvendige tiltag for at stoppe krænkelserne. Det er kombinationen af it-kompetencer og juridiske kompetencer med speciale i immaterialret, der gør vores ydelser unikke.
Lars er specialist i AI og machine learning indenfor områderne sprogteknologi (NLP), billedbehandling, automatiserede systemer, og robotteknologi. Hans paper “Learning Task-independent Joint Control for Robotic Manipulators with Reinforcement Learning and Curriculum Learning”, handler – kort fortalt – om, hvordan man kan træne robotter nemmere end det er muligt i dag. Det har Lars udviklet en model til. Under sit studie var han i praktik og skrev speciale i samarbejde med Mercedes-Benz i Tyskland, og det var her, han fik mulighed for at afprøve de forskellige teorier i praksis.