DocFlows

Machine Learning Technology

ONZE OPLOSSING

Veel bedrijven ontvangen nog steeds ongestructureerde documenten in hun purchase-to-pay automatiseringsproces. Documenten zoals facturen worden op papier afgedrukt en via reguliere postdiensten of als PDF-bijlage in e-mails verzonden. Het is hoe dan ook niet efficiënt dat zowel gestructureerde als gevalideerde gegevens nodig zijn om deze documenten in ERP-systemen te importeren. Deze documenten moeten dus verwerkt en geconverteerd worden naar een gestructureerde versie. Tegenwoordig zijn de meest gebruikte oplossingen afhankelijk van OCR-technologie of pseudo handmatig overtypen.

De eerste categorie staat bekend om een snelle verwerking, maar die is meestal saai en onnauwkeurig en vereist een menselijke tussenkomst om sjablonen te maken. Optical Character Recognition (OCR) is per definitie de technologie waarmee machines afgedrukte of handgeschreven documenten, PDF’s of afbeeldingen kunnen scannen en de afbeeldingsgegevens automatisch kunnen converteren naar editeerbare tekstformaten voor verdere verwerking.

De huidige OCR-systemen bieden gedeeltelijke oplossingen voor issues i.v.m. handmatige gegevensextractie, maar ze creëren ook nieuwe oplossingen. Menselijke operators moeten regels en sjablonen schrijven voor elke factuurlayout waardoor onderhoud een eindeloze taak wordt. De tweede categorie, het overtypen, biedt betere algemene nauwkeurige resultaten, maar het proces is veel trager omdat het menselijke inspanning vereist. Het is veel duurder dan OCR en het is moeilijk op te schalen omdat dit extra opgeleid personeel vereist.

De tweede categorie, het overtypen, biedt betere algemene nauwkeurige resultaten, maar het proces is veel trager omdat het menselijke inspanning vereist. Het is veel duurder dan OCR en het is moeilijk op te schalen omdat dit extra opgeleid personeel vereist.

Vandaag introduceert D Soft DocFlows, een nieuwe aanpak om het probleem op te lossen, een oplossing die het beste van twee werelden combineert. Het is snel, schaalbaar, betaalbaar en vereist geen handmatige invoer van de klant. In tegenstelling tot traditionele OCR-systemen heeft DocFlows geen sjablonen nodig.

Omdat het systeem geen rekening houdt met de structuur van documenten en gebaseerd is op machine learning technologie, levert het steeds nauwkeuriger resultaten bij voortdurend gebruik.

WAAROM KIEZEN VOOR DOCFLOWS?

Snelle en schaalbare infrastructuur

DocFlows draait op een high-performance, zeer schaalbaar Kubernetes platform. Wij garanderen documentverwerking binnen enkele seconden.

Betaalbaar

DocFlows gebruikt een transactioneel model.

Betrouwbaar

Omdat DocFlows valideert op basis van een voorgedefinieerd SML-schema kunt u erop rekenen dat het resultaat aan de eisen voldoet.

Interoperabel

Het omzetten van documenten in gestructureerde bestanden levert basisgegevens op voor verdere diepgaande analyse.

Ons doel is om een volledig hands-off document processing service aan te bieden. D Soft traint DocFlows voor uw specifieke markt en type documenten. U levert ons monsters, wij trainen het model. DocFlows is volledig geïntegreerd met DocTrails.

 

DocFlows is een proces bestaande uit 3 stappen

DocFlows is gebaseerd op Machine Learning technologie en ingebouwde logica op maat. Elke stap in het proces wordt bepaald door vertrouwensscores. DocFlows selecteert de kandidaat met de hoogste score en leert van dat proces.

Step 1:
Eerst wordt een inkomend document geclassificeerd. Tijdens deze stap gebruikt DocFlows zijn ingebouwde Machine Learning algoritmes om de Afzender en Ontvanger te bepalen. Voor nieuwe afzenders heeft DocFlows 5 tot 10 vergelijkbare documenten nodig om de modellen te trainen.

Step 2:
Vervolgens zal DocFlows gegevens uit het geclassificeerde document halen en deze omzetten in een gestructureerd document op basis van de labeling die in onze modellen is opgeslagen.

Step 3:
Tenslotte zal DocFlows het resultaat evalueren op basis van de gestructureerde vereiste output. DocFlows berekent line-item integriteit, BTW-totalen, en nog veel meer.

DocFlows werkt met een eigen kwaliteitslabelsysteem. Het resultaat van verwerking in DocFlows krijgt altijd een kwaliteitslabel variërend van F tot A. Bestanden met een A-label worden gevalideerd op diverse criteria, zoals de aanwezigheid van alle wettelijk verplichte velden, consistentie tussen artikelregels, factuurtotalen, BTW, enz. Bestanden met een A-label kunnen in principe direct worden geïmporteerd.

INPUT / OUTPUT CHANNELS

DocFlows biedt meerdere in- en uitvoerkanalen die als workflows kunnen worden gecombineerd. Kies gewoon een invoerkanaal dat uw documenten accepteert en combineer het met een uitvoerkanaal dat uw verwerkte XML-documenten terugstuurt.

Cloud Sharing Platform
Koppel DocFlows aan uw favoriete Cloud Sharing Platform account en begin meteen met het verwerken van PDF-documenten.  
DocFlows Connector
Na installatie zal DocFlows Connector een map op uw systeem controleren op inkomende PDF-bestanden, deze verwerken en het resultaat terugplaatsen in een andere map.  
E-mail
Het is beslist de eenvoudigste manier om met DocFlows van start te gaan: scan uw documenten en stuur ze door naar uw DocFlows e-mailadres.  
Webportaal
Via het webportaal kunnen gebruikers te verwerken documenten uploaden, documentstromen configureren, de verwerking en algemene systeemprestaties controleren.  
sFTP
Legacy-omgevingen gebruiken misschien liever het ouderwetse File Transfer Protocol. Upload uw documenten naar uw DocFlows sFTP-account en DocFlows stuurt het resultaat terug in een andere map.  

INTEGRATIE

API

DocFlows biedt een uitgebreide RestAPI aan die methoden voorziet om kanalen te configureren, document te up- en downloaden en prestaties te monitoren.

 

DocFlows PrinterDriver

Om gemakkelijk te communiceren met DocFlows kiest u onze DocFlows PrinterDriver. Download die uit de Windows Store, installeer en stuur uw document naar DocFlows vanuit elke Windows app.