wtorek,23 styczeń 2018

OCR faktur

OCR faktur

Co to jest OCR faktur?

OCR faktur – Invoice Opitcal Character Recognition, to narzędzie służące do rozczytywania tekstu z zeskanowanych dokumentów i obrazów. System dekoduje wybrany dokument, rozpoznając w nim tekst, tabele i elementy graficzne, następnie skanuje słowa rozczytując litery niezależnie od użytej czcionki. Dzięki temu możliwe jest m.in. zaznaczanie, kopiowanie i przenoszenie treści rozpoznanych na dokumencie do innych aplikacji.

Jakie są zalety OCR-owania faktur?

Główną zaletą systemu OCR jest wpływ na zmniejszenie czasu, w którym pracownicy musieliby wyszukiwać lub ręcznie przepisywać dane z faktur. Jak również, możliwość automatycznego umieszczenia dokumentów w archiwum elektronicznym, przy zachowaniu wyglądu oryginalnej kopii, oraz wyszukiwanie i przeszukiwanie faktur za pomocą słów kluczowych w wymiarze pełnotekstowym.
Załóżmy, że w Państwa firmie doszło do uszkodzenia sprzętu, na przykład monitora. W takim wypadku należy odnaleźć fakturę, na którą monitor został zakupiony. Jeśli nie pamiętamy nazwy sklepu, czy daty zakupu, proces wyszukiwania staje się automatycznie utrudniony, chociażby dlatego, że wymaga nakładu większej ilości czasu, aby odnaleźć właściwy dokument. Dzięki funkcji przeszukiwania pełnotekstowego, dana faktura, może zostać odnaleziona przez proste wyszukiwanie słów kluczowych takich jak “monitor”, nazwa producenta sprzętu lub numer seryjny.

OCR w systemie Invoice Data Recognition – certyfikowaną integracją JobRouter

OCR faktur w Invoice Opitcal Character Recognition, to narzędzie służące do rozczytywania tekstu z zeskanowanych dokumentów i obrazów. IDR stworzony przez nasz zespół, został certyfikowanym modułem JobRotuer.

IDR OCR certificate JobRouter

Moduł IDR pozwala na analizowanie danych z wprowadzonych do systemu faktur i automatyczne eksportowanie ich do systemu JobRouter, czy też zintegrowanych z JobRouter systemów finansowo-księgowych. W module IDR, OCR działa za pomocą inteligentnego ‘lasso’ które skanuje wprowadzony obraz faktury w celu znalezienia słów kluczowych i przypisanych do nich wartości, niezależnie od użytej czcionki. System jest zintegrowany z wybranymi bazami danych wewnątrz firmy (np. kontrahentów, zamówień) oraz bazami publicznymi (np. GUS, KRS) i słownikami językowymi dzięki którym, weryfikuje rozczytane wartości.
Użytkownik również może zweryfikować rozczytane dane z poziomu swojego interfejsu. Użytkownik po rozczytaniu faktury przez system otrzymuje podgląd w formie formularza i zdjęcia faktury, w którym wartości na fakturze są podświetlane po najechaniu kursorem na odpowiednie pola formularza. W ten sposób weryfikacja, czy dana faktura została poprawnie rozczytana, przed wysłaniem jej do systemu, zajmuje tylko kilka sekund.
W przypadku, gdy jakiekolwiek dane nie zostały poprawnie zeskanowane, użytkownik może zaznaczyć poprawną wartość na fakturze za pomocą lassa OCR. Wówczas algorytmy systemu zapamiętają działanie użytkownika i powiążą je z NIP wystawcy faktury. Dzięki temu faktura powiązana z danym nadawcą zostanie poprawnie rozczytana kolejnym razem.
IDR to system uczący się, zatem każda rozczytana faktura rozbudowuje mapę prawdopodobieństwa znalezienia danych w danym miejscu na fakturze, przypisując je do NIP wystawcy faktur.

Jak i jakie dokumenty mogą zostać poddane OCR?

Narzędzie OCR wdrożone w odpowiedni system może zostać połączone z innymi mechanizmami, rozszerzając swoją skuteczność.
W przypadku IDR
narzędzie świetnie poradzi sobie z fakturami, korektami faktur, paragonami (np. z autostrady) i innymi dokumentami księgowymi w postaci zarówno skanów, jak i wersji PDF, przesłanych do firmy np. drogą elektroniczną. W przypadku poddaniu procesowi OCR faktur czy rachunków wypisanych ręcznie, skuteczność systemu jest niższa, ale nadal możliwa! Proces znacząco wpływa na skrócenie czasu przeznaczanego na ręczne wprowadzanie faktury.

Jak działa OCR w procesie akceptacji faktur?

Silnik OCR po zamianie obrazu na tekst, (zeskanowanego dokumentu, lub faktury w pliku pdf, jpg otrzymanego drogą elektroniczną) przenosi dane do systemu księgowego lub systemu obiegu faktur w odpowiednie pola.
Algorytmy będące częścią systemu, przeszukują rozpoznaną treść w celu znalezienia NIP, numeru faktury, kwoty netto, brutto, numeru pozycji, adresu czy daty. Znalezienie kluczowych słów takich jak numer faktury, czy data wystawienia dokumentu, umożliwia systemowi zaklasyfikowanie wyrażeń znajdujących się w okolicy słów kluczowych do właściwych pól. Co więcej, gdy jest to możliwe, system weryfikuje format tekstu (np. czy dana wartość jest datą), cyfrę kontrolną (np. NIP), a także analizuje zgodność rozpoznanych danych z bazą systemu ERP lub finansowo księgowego.

Jeśli to możliwe system zawsze wspomaga się wiarygodnymi bazami danych takimi jak:

  • baza kontrahentów systemu ERP
  • słownik adresów TERYT
  • słownik walut NBP
  • baza danych podmiotów gospodarczych GUS
  • baza indeksów magazynowych (np. w ERP)
  • baza zamówień (PO)

Treści rozpoznane przez system OCR-ujący faktury, które znajdują się wokół słów kluczowych, zyskują najwyższy wskaźnik prawdopodobieństwa poprawności.

Co wpływa na skuteczność OCR faktur? Czy system przeczyta nawet trudne do rozczytania dane dla ludzkich oczu?

Skuteczność OCR faktur zależy od wielu czynników. Są nimi: jakość papieru, skanu, sposobu wydruku, ostrość i kolor tekstu, czy kompleksowość algorytmów wyszukujących.
W przypadku IDR, system korzysta z historycznych map, starając się mimo wszystko wyeliminować konieczność ręcznego przepisywania danych z faktury. Dzięki integracji z dowolnym systemem ERP, system IDR sięga do bazy kontrahentów, aby pozyskać ewentualne braki informacji. Dane pobrane z bazy kontrahentów lub zamówień mogą zostać użyte do weryfikacji danych, dotyczących płatności wykrywając ewentualne zmiany. Aby zobrazować ten proces,  proszę sobie wyobrazić, że faktura, która miała zostać wdrożona do systemu, została uszkodzona w miejscu adresu kontrahenta (na przykład została wylana na nią kawa). Adres zarówno dla oka, jak i komputera stał się niewidoczny. Jakkolwiek algorytm OCR jest w stanie dopasować brakujące dane z pozostałymi. Na przykład – jeśli numer NIP został rozpoznany, system sam wprowadzi adres pobrany z bazy danych do elektronicznej kopii faktury.

Czy OCR jest nieomylny? Co, jeśli OCR popełni błąd?

W końcowym etapie OCR faktury, system IDR generuje formularz z polami wypełnionymi danymi według najwyższego prawdopodobieństwa zgodności. Użytkownik otrzymuje zadanie  ich weryfikacji oraz ewentualnego poprawienia błędów. Jednakże, dane wymagające poprawy nie muszą być ręcznie przepisywane. Dla pól, w których użytkownik znalazł błąd, możliwe jest użycie intuicyjnej funkcji “Lasso OCR”, dzięki której użytkownik może poprawić dane poprzez proste zaznaczenie ich kursorem na zeskanowanym obrazie.

Działanie lassa OCR zostało przedstawione na poniższym filmie

Jak przygotować dokumenty do skutecznego OCR faktur?

Nie bez znaczenia dla jakości efektu końcowego OCR faktury jest sposób skanowania dokumentów. Dokumenty powinny być pozbawione wszelkich dodatkowych adnotacji, pieczęci z datownikiem, zabrudzeń i zanieczyszczeń. Najkorzystniej faktura nie powinna posiadać zagięć, czy zagniecionych rogów. Nowoczesne skanery często poprawiają stan jakości skanu faktury, np. poprzez wyprostowanie do pionu, usunięcie śladów nacięć po dziurkaczu itp. Takie poprawki, nie mają większego znaczenia, jeśli nie wpływają na treść faktury. Jednak może się zdażyć, że podpis czy pojedyncza cyfra, zostaną zidentyfikowane jako zagięcie papieru, lub wspomniane nacięcie po dziurkaczu.  Dlatego należy jednak postarać się aby dokument był przygotowany w taki sposób, żeby wykorzystanie sztucznego poprawiania skanu nie było koniecznie.

Jak skanować dokumenty do OCR?

Ustawienia skanera mają wpływ na działanie systemu IDR. Idealne ustawienie skanera to:

  • rozdzielczość skanowania 300dpi lub wyższa
  • ustawienia kolorów: odcienie szarości lub kolor
  • format skanowania PDF

Warto zaznaczyć, że IDR radzi sobie nawet z fakturami, które zostały przesłane do systemu z telefonu, którym wykonano zdjęcie faktury. Aczkolwiek im lepsza jest jakość skanu, tym lepszy efekt końcowy OCR-owania faktury.

Korzyści ze stosowania OCR faktur:

  • Znaczna redukcja czasu wprowadzania faktur do systemu księgowego
  • Możliwość elektronicznej akceptacji faktury przed wprowadzeniem do systemu księgowego
  • Możliwość raportowania kosztów organizacji już od momentu zeskanowania faktury
  • Weryfikacja nieprawidłowości na fakturze (np. poprzez porównanie danych na FV z danymi z GUS czy VIES)

Ile można zaoszczędzić na wdrożeniu OCR faktur?

Średnie wynagrodzenie księgowych w Polsce w 2016 roku wynosiło 3900 zł brutto.
Jeśli ręczne wprowadzanie faktury do systemu średnio zajmowało 3 minuty, to stanowiło wydatek 1,21 zł za czas poświęcony przez pracownika. Przy użyciu narzędzia OCR cały proces od zeskanowania do sprawdzenia danych zajmuje mniej niż minutę, a co za tym idzie, kosztuje 40 groszy.
W przypadku gdy firma dostaje 100 faktur miesięcznie, oznacza to oszczędność 80 zł w skali miesiąca, natomiast jeśli firma otrzymuje 2000 faktur miesięcznie, kwota znacząco rośnie do 1600 zaoszczędzonych złotych.
Co stanowi niemalże pół etatu przeciętnej księgowej.

Jakie są konsekwencje nieużywania OCR faktur?

Wzrost kompetencji pracowników, problemy z ich znalezieniem i powiększenie kosztów pracy, stwarzają konieczność poszukiwań optymalizacji i automatyzacji w każdym procesie występującym w organizacji. Wprowadzanie faktur do systemu to żmudna czynność występująca od kilku dekad w każdym przedsiębiorstwie. Mimo że narzędzia do OCR faktur są stosunkowo nowym wynalazkiem, to ci, którzy ich używają, są zgodni co do wpływu na poprawę czasu i jakości ich pracy. W związku z tym odpowiedź na pytanie „ Czy możliwe jest w dłuższej perspektywie niestosowanie OCR faktur?” brzmi – Tak, możliwe jest nieużywanie systemu do OCR faktur, ale czy warto? Czy odrzucenie dostępnych narzędzi w dobie postępującej technologii i rynku konkurencji, które faktycznie pomogą zaoszczędzić czas i pieniądze, jest tego warte? Odpowiedzcie sobie sami na to pytanie.

Podsumowując…

Podsumowując, OCR faktur to kolejny krok w optymalizacji biznesu, zalety płynące z tego wdrożenia to między innymi: zaoszczędzony czasu na ręczne przepisywanie danych, co może stanowić nawet pół etatu księgowej, możliwość synchronizacji systemu z elektronicznym archiwum oraz innymi systemami, możliwość elektronicznej akceptacji faktury przed wprowadzeniem do systemu księgowego oraz możliwość generowania raportów dotyczących kosztów poniesionych przez organizację. Dzięki OCR również dużo łatwiej jest zauważyć i zweryfikować nieprawidłowości, jeśli takie się pojawią.
Oczywiście, nie istnieje system nieomylny, jednak OCR faktur w połączeniu z odpowiednią bazą danych i sprawnymi algorytmami, wykazuje ogromną skuteczność. Takie połączenie znajduję się w systemie IDR, a dzięki niemu firmy mają możliwość redukcji kosztów, czasu wykonywanych zadań przez pracowników i popełnianych błędów. OCR przyniósł już wiele korzyści rozwijającym się, polskim przedsiębiorstwom i staje się coraz popularniejszym rozwiązaniem.
Jeśli Twoja firma również jest zainteresowana wdrożeniem systemu o wymienionych funkcjonalnościach, lub po prostu chciałabyś/chciałbyś dowiedzieć się więcej — zapraszamy do skorzystania z formularza kontaktowego, znajdującego się w górnym prawym rogu naszej strony, lub kontaktu e-mail z biuro@e-msi.pl

Aby dowiedzieć się więcej o systemie IDR, kliknij tutaj.

Umów się na bezpłatną prezentację i analizę potrzeb.
OSTATNIE WPISY

Kim jest citizen developer i jaki ma wpływ na organizacje?

Coraz więcej słyszymy o stanowisku lub roli w firmie określanej jako Citizen Developer. Jest to stosunkowo nowe wyrażenie dlatego, chcielibyśmy Państwa z nim zapoznać. Jako pierwsza Citizen developer opisała firma badawcza Gartner. Określając, że jest  to osoba, która tworzy nowe aplikacje biznesowe na potrzeby własne lub innych, wykorzystując środowiska programistyczne, które nie są sprzeczne ze […]


4 przeszkody na drodze do pełnej digitalizacji

Automatyzacja procesów biznesowych jest kluczem do pełnej digitalizacji. Decydenci na całym świecie od lat stawiają sobie za cel cyfrową optymalizację firm. Nieustannie poszukują najlepszego narzędzia, które przyczyniłoby się do zwiększonej konkurencyjności ich firmy w tym obszarze. Znalezienie jednego narzędzia które odpowiedziałoby na wszystkie potrzeby automatyzacji firmy, wydaje się jednak prawie niemożliwe. Zatem większość firm, dążąc […]


Sprawna ewidencja czasu pracy zdalnej — wyzwanie, nie problem

Ostatnie dwa lata to czas wielkich zmian. Pandemia wpłynęła na otaczający nas świat, w mniejszym lub większym stopniu zmieniając niemal każdy jego aspekt. Sfera zawodowa jest tego doskonałym przykładem. Rozwój pracy zdalnej wymusił stosowanie wielu nowych rozwiązań, mających na celu jej uporządkowanie i nadzór. Istotnym problemem okazała się ewidencja czasu pracy zdalnej w sposób skuteczny […]


Rodzaje workflow – Na czym opierają się przepływy pracy?

Istnieje pięć podstawowych wzorców przepływu procesów biznesowych – są to rodzaje workflow – wszystkie możesz poznać dzięki JobRouter® Proces biznesowy to seria zadań użytkownika i zdarzeń automatycznych (kroków systemowych) oraz kolejność ich wykonania. JobRouter umożliwia modelowanie dowolnej liczby różnych procesów biznesowych, a w każdym procesie występują zupełnie inne ścieżki. JobRouter umożliwia tworzenie workflow, zarówno prostych […]


6
Dodaj komentarz

avatar
3 Comment threads
3 Thread replies
0 Followers
 
Most reacted comment
Hottest comment thread
4 Comment authors
Agata LechAnonimAgata LechMariuszPaweł Recent comment authors
  Subscribe  
najnowszy najstarszy oceniany
Powiadom o
Anonim
Gość
Anonim

Czy Państwa system posiada aplikację mobilną? Jak wygląda dostosowanie zdjęcia do OCR faktur?

Mariusz
Gość
Mariusz

W firmie transportowej, w której pracuje, kierowcy często wyjeżdżają w długie trasy. Czy OCR faktur poradzi sobie również z rozczytywaniem zdjęć wykonanych i wysłanych telefonem?

e-MSI
Gość

Witam! Tak, system IDR do OCR faktur, pozwala na automatyzację tego procesu. Wszystkie funkcje są dopasowywane indywidualnie do potrzeb firmy, jakkolwiek, system może być również obsługiwany na urządzeniach mobilnych, a zdjęcia faktur przesyłane z dowolnego miejsca na świecie. Po wykonaniu zdjęcia faktury, weryfikacji danych i przesłaniu jej przez odpowiednią aplikację, dane trafią natychmiast do systemu.

Paweł
Gość
Paweł

Nasza firma otrzymuje faktury w języku polskim, czeskim, angielskim oraz niemieckim. Czy ten system OCR poradzi sobie również z rozczytywaniem faktur w językach obcych?

e-MSI
Gość

Oczywiście, każde wdrożenie dostosujemy do wymagań klienta. W przypadku powyższych wymagań instalujemy w systemie odpowiednie słowniki oraz definiujemy słowa kluczowe, wokół których system OCR ma szukać podanych wartości. Dzięki temu system nie szuka np. daty tylko wokół słowa data, ale również date, datum. Należy nie zapominać, że algorytmy systemu OCR wraz ze wzrostem liczby wprowadzonych faktur zwiększają swoje siatki prawdopodobieństwa. Oznacza to, że system uczy się i coraz trafniej rozpoznaje język i wartości faktury, nawet w miejscach, które są trudne do rozczytania dla ludzkich oczu.