Het probleem met templates
Klassieke OCR werkt met een sjabloon per leverancier: hier staat het artikelnummer, daar het aantal colli. Dat werkt tot de leverancier zijn layout aanpast, een nieuwe teler aanlevert of het seizoen wisselt van herkomstland. In een keten met honderden aanvoerders is het onderhoud van die sjablonen een baan op zich, en in het hoogseizoen, precies als het moet werken, loopt het vast.
Lezen zoals een mens leest
De huidige generatie document-AI werkt zonder sjablonen. Het model kijkt naar wat er staat en herkent de betekenis van velden, ongeacht waar ze staan of hoe ze heten. Producten, aantallen, partijen, herkomst: het wordt herkend en gestructureerd, ook bij een paklijst die het systeem nog nooit heeft gezien. Twijfelgevallen worden voorgelegd in plaats van gegokt.
Traceability als bijvangst
Elke paklijst die gestructureerd binnenkomt, is batchdata die je niet meer hoeft te reconstrueren. Eén-stap-terug, één-stap-vooruit moet bij een recall binnen vier uur staan; dat lukt alleen als partij-informatie al als data in je systemen leeft in plaats van als PDF in een mailbox. Automatische verwerking aan de poort maakt de traceability-uitvraag een query in plaats van een zoektocht.
Meeschalen met het seizoen
Het verschil wordt het scherpst zichtbaar in de piek. Handwerk schaalt met mensen, en die zijn er in het seizoen niet bij te krijgen. Een pipeline verwerkt tien of tienduizend documenten per dag door dezelfde infrastructuur; je team behandelt alleen de uitzonderingen. Voor een keurbedrijf bouwen we op dit moment zo'n pipeline voor richting de 200.000 paklijsten per jaar.

