wtorek,23 Styczeń 2018

OCR faktur – co oznacza?

OCR faktur

Czym jest OCR faktur?

OCR faktur – Invoice Opitcal Character Recognition, to narzędzie służące do rozczytywania tekstu z zeskanowanych dokumentów i obrazów. System dekoduje wybrany dokument rozpoznając w nim tekst, tabele i elementy graficzne, następnie skanuje słowa rozczytując litery niezależnie od użytej czcionki. Dzięki temu możliwe jest m.in. zaznaczanie, kopiowanie i przenoszenie treści rozpoznanych na dokumencie do innych aplikacji.

Jakie są zalety OCR-owania faktur?

Główną zaletą systemu OCR jest wpływ na zmniejszenie czasu, w którym Państwa pracownicy musieliby wyszukiwać lub przepisywać papierowe faktury. Jak również, możliwość automatycznego umieszczenia dokumentów w archiwum elektronicznym, przy zachowaniu wyglądu oryginalnej kopii, oraz wyszukiwanie i przeszukiwanie faktur za pomocą słów kluczowych w wymiarze pełnotekstowym. Załóżmy, że w Państwa firmie doszło do uszkodzenia sprzętu, na przykład monitora. W takim wypadku należy odnaleźć fakturę, na którą monitor został zakupiony. Jeśli nie pamiętamy nazwy sklepu, czy daty zakupu, proces wyszukiwania staje się automatycznie utrudniony, chociażby dlatego, że wymaga nakładu większej ilości czasu aby odnaleźć właściwy dokument. Jakkolwiek dzięki funkcji przeszukiwania pełnotekstowego, dana faktura, może zostać odnaleziona przez proste wyszukiwanie słów kluczowych takich jak “monitor”, nazwa producenta sprzętu lub numer seryjny.

Jak i jakie dokumenty mogą zostać poddane OCR?

Narzędzie OCR wdrożone w odpowiedni system może zostać połączone z innymi mechanizmami rozszerzając swoją skuteczność. Dzięki współpracy naszego zespołu, stworzyliśmy IDR – Invoice Data Recognition. IDR to program używający narzędzia OCR w procesie przetwarzania faktur. System charakteryzuje się ogromną skutecznością, będąc atrakcyjny cenowo w porównaniu z innymi dostępnymi rozwiązaniami o podobnej funkcjonalności.
IDR stanie się niezastąpiony w każdym przedsiębiorstwie, którego dotyczy akceptacja dużej liczby faktur.
IDR świetnie poradzi sobie również z fakturami, korektami, paragonami (np. z autostrady) i innymi dokumentami księgowymi w postaci zarówno skanów jak i wersji PDF, przesłanych do firmy np. drogą elektroniczną. W przypadku poddaniu procesowi OCR faktur czy rachunków wypisanych ręcznie skuteczność systemu jest  niższa, jednak nadal znacząco wpływa na skrócenie czasu przeznaczanego na ręczne wprowadzanie faktury.

Jak działa OCR w procesie akceptacji faktur?

Silnik OCR po zamienie obrazu na tekst, (zeskanowanego dokumentu, lub faktury w pliku pdf, jpg otrzymanego drogą elektroniczną) przenosi dane do systemu księgowego lub systemu obiegu faktur w odpowiednie pola.
Algorytmy będące częścią systemu, przeszukują rozpoznaną treść w celu znalezienia NIP, numeru faktury, kwoty netto, brutto, numeru pozycji, adresu czy daty. Znalezienie kluczowych słów takich jak numer faktury, czy data wystawienia dokumentu, umożliwia systemowi zaklasyfikowanie wyrażeń znajdujących się w okolicy słów kluczowych do właściwych pól. Dodatkowo, gdy jest to możliwe system weryfikuje format tekstu (np. czy dana wartość jest datą), cyfrę kontrolną (np. NIP), a także analizuje zgodność rozpoznanych danych z bazą systemu ERP lub finansowo księgowego.

Jeśli to możliwe system zawsze wspomaga się wiarygodnymi bazami danych takimi jak:

  • baza kontrahentów systemu ERP
  • słownik adresów TERYT
  • słownik walut NBP
  • baza danych podmiotów gospodarczych GUS
  • baza indeksów magazynowych (np. w ERP)
  • baza zamówień (PO)

Treści rozpoznane przez system OCR-ujący faktury, które znajdują się wokół kluczowych słów zyskują najwyższy wskaźnik prawdopodobieństwa poprawności.
IDR to system uczący się, zatem każda rozczytana faktura rozbudowuje mapę prawdopodobieństwa znalezienia danych w danym miejscu na fakturze, przypisując je do NIP wystawcy faktury.

Co wpływa na skuteczność OCR faktur? Czy system przeczyta nawet trudne do rozczytania dane dla ludzkich oczu?

Skuteczność OCR faktur zależy od wielu czynników. Są nimi: jakość papieru, skanu, sposobu wydruku, ostrość i kolor tekstu, czy kompleksowość algorytmów wyszukujących.
W przypadku IDR, system korzysta z historycznych map starając się mimo wszystko wyeliminować konieczność ręcznego przepisywania danych z faktury. Dzięki integracji z dowolnym systemem ERP, system IDR sięga do bazy kontrahentów, aby pozyskać ewentualne braki informacji. Dane pobrane z bazy kontrahentów lub zamówień mogą zostać użyte do weryfikacji danych dotyczących płatności wykrywając ewentualne zmiany. Aby zobrazować ten proces,  proszę sobie wyobrazić, że faktura, która miała zostać wdrożona do systemu, została uszkodzona w miejscu adresu kontrahenta (na przykład została wylana na nią kawa). Adres zarówno dla oka, jak i komputera stał się niewidoczny. Jakkolwiek algorytm OCR jest w stanie dopasować brakujące dane z pozostałymi. Na przykład – jeśli numer NIP został rozpoznany, system sam wprowadzi adres pobrany z bazy danych do elektronicznej kopii faktury.

Czy OCR jest nieomylny? Co jeśli OCR popełni błąd?

W końcowym etapie OCR faktury, system IDR generuje formularz z polami wypełnionymi danymi według najwyższego prawdopodobieństwa zgodności. Użytkownik otrzymuje zadanie  ich weryfikacji oraz ewentualnego poprawienia błędów. Jednakże, dane wymagające poprawy nie muszą być ręcznie przepisywane. Dla pól, w których użytkownik znalazł błąd, możliwe jest użycie intuicyjnej funkcji “Lasso OCR”, dzięki której użytkownik może poprawić dane poprzez proste zaznaczenie ich kursorem na zeskanowanym obrazie.

Działanie lassa OCR zostało przedstawione na poniższym filmie

Jak przygotować dokumenty do skutecznego OCR faktur?

Nie bez znaczenia dla jakości efektu końcowego OCR faktury jest sposób skanowania dokumentów. Dokumenty powinny być pozbawione wszelkich dodatkowych adnotacji, pieczęci z datownikiem, zabrudzeń i zanieczyszczeń. Najkorzystniej faktura nie powinna posiadać zagięć, czy zagniecionych rogów. Nowoczesne skanery często poprawiają stan jakości skanu faktury, np. poprzez wyprostowanie do pionu, usunięcie śladów nacięć po dziurkaczu itp. Takie poprawki, nie mają większego znaczenia jeśli nie wpływają na treść faktury. Jednak może się zdażyć, że podpis czy pojedyncza cyfra, zostaną zidentyfikowane jako zagięcie papieru, lub wspomniane nacięcie po dziurkaczu.  Dlatego należy jednak postarać się aby dokument był przygotowany w taki sposób, żeby wykorzystanie sztucznego poprawiania skanu nie było koniecznie.

Jak skanować dokumenty do OCR?

Ustawienia skanera mają wpływ na działanie systemu IDR. Idealne ustawienie skanera to:

  • rozdzielczość skanowania 300dpi lub wyższa
  • ustawienia kolorów: odcienie szarości lub kolor
  • format skanowania PDF

Warto zaznaczyć, że IDR radzi sobie nawet z fakturami, które zostały przesłane do systemu z telefonu, którym wykonano zdjęcie faktury. Aczkolwiek im lepsza jest jakość skanu tym lepszy efekt końcowy OCR-owania faktury.

Korzyści ze stosowania OCR faktur:

  • Znaczna redukcja czasu wprowadzania faktur do systemu księgowego
  • Możliwość elektronicznej akceptacji faktury przed wprowadzeniem do systemu księgowego
  • Możliwość raportowania kosztów organizacji już od momentu zeskanowania faktury
  • Weryfikacja nieprawidłowości na fakturze (np. poprzez porównanie danych na FV z danymi z GUS czy VIES)

Ile można zaoszczędzić na wdrożeniu OCR faktur?

Średnie wynagrodzenie księgowych w Polsce w 2016 roku wynosiło 3900 zł brutto.
Jeśli ręczne wprowadzanie faktury do systemu średnio zajmowało 3 minuty, to stanowiło wydatek 1,21 zł za czas poświęcony przez pracownika. Przy użyciu narzędzia OCR cały proces od zeskanowania do sprawdzenia danych zajmuje mniej niż minutę, a co za tym idzie, kosztuje 40 groszy.
W przypadku gdy firma dostaje 100 faktur miesięcznie oznacza to oszczędność 80 zł w skali miesiąca, natomiast jeśli firma otrzymuje 2000 faktur miesięcznie kwota znacząco rośnie do 1600 zaoszczędzonych złotych.
Co stanowi niemalże pół etatu przeciętnej księgowej.

Czy możliwe jest w dłuższej perspektywie niestosowanie OCR faktur?

Wzrost kompetencji pracowników, problemy z ich znalezieniem i powiększenie kosztów pracy, stwarzają konieczność poszukiwań optymalizacji i automatyzacji w każdym procesie występującym w organizacji. Wprowadzanie faktur do systemu to żmudna czynność występująca od kilku dekad w każdym przedsiębiorstwie. Mimo że narzędzia do OCR faktur są stosunkowo nowym wynalazkiem, to ci, którzy ich używają, są zgodni co do wpływu na poprawę czasu i jakości ich pracy. W związku z tym odpowiedź na pytanie „ Czy możliwe jest w dłuższej perspektywie niestosowanie OCR faktur?” brzmi – Tak, możliwe jest nieużywanie systemu do OCR faktur, ale czy warto? Czy odrzucenie dostępnych narzędzi w dobie postępującej technologii i rynku konkurencji, które faktycznie pomogą zaoszczędzić czas i pieniądze, jest tego warte? Odpowiedzcie sobie sami na to pytanie.

Podsumowując…

Podsumowując, OCR faktur to kolejny krok w optymalizacji biznesu, zalety płynące z tego wdrożenia to między innymi: zaoszczędzony czasu na ręczne przepisywanie danych, co może stanowić nawet pół etatu księgowej, możliwość synchronizacji systemu z elektronicznym archiwum oraz innymi systemami, możliwość elektronicznej akceptacji faktury przed wprowadzeniem do systemu księgowego oraz możliwość generowania raportów dotyczących kosztów poniesionych przez organizację. Dzięki OCR, również dużo łatwiej jest zauważyć i zweryfikować nieprawidłowości, jeśli takie się pojawią.
Oczywiście, nie istnieje system nieomylny, jednak OCR faktur w połączeniu z odpowiednią bazą danych i sprawnymi algorytmami, wykazuje ogromną skuteczność. Takie połączenie znajduję się w systemie IDR, a dzięki niemu firmy mają możliwość redukcji kosztów, czasu wykonywanych zadań przez pracowników i popełnianych błędów. OCR przyniósł już wiele korzyści rozwijającym się, polskim przedsiębiorstwom i staje się coraz popularniejszym rozwiązaniem.
Jeśli Twoja firma również jest zainteresowana wdrożeniem systemu o wymienionych funkcjonalnościach, lub po prostu chciałabyś/chciałbyś dowiedzieć się więcej — zapraszamy do skorzystania z formularza kontaktowego, znajdującego się w górnym prawym rogu naszej strony, lub kontaktu e-mail z biuro@e-msi.pl

Aby dowiedzieć się więcej o systemie IDR, kliknij tutaj.

Umów się na bezpłatną prezentację i analizę potrzeb.
OSTATNIE WIPISY

DESI 2019

W poprzednim roku pisaliśmy o Digital Society Index…


9
Dodaj komentarz

avatar
4 Comment threads
5 Thread replies
0 Followers
 
Most reacted comment
Hottest comment thread
4 Comment authors
Agata LechAgata LechAnonimMariuszPaweł Recent comment authors
  Subscribe  
najnowszy najstarszy oceniany
Powiadom o
Anonim
Gość
Anonim

Czy Państwa system posiada aplikację mobilną? Jak wygląda dostosowanie zdjęcia do OCR faktur?

e-MSI
Admin

Dziękujemy za komentarz. Tak, nasz system do OCR faktur posiada aplikacje mobilną. Umożliwia ona konwersję zdjęć do pliku PDF, z którego rozczytuje tekst. Zrobione w aplikacji zdjęcie jest przycinane do rozmiaru sfotografowanego dokumentu, prostowane i wyostrzane. Możliwe jest dodawanie wielu stron dokumentu.

Anonim
Gość
Anonim

Czy Państwa system posiada aplikację mobilną? Jak wygląda dostosowanie zdjęcia do OCR faktur?

Mariusz
Gość
Mariusz

W firmie transportowej, w której pracuje, kierowcy często wyjeżdżają w długie trasy. Czy OCR faktur poradzi sobie również z rozczytywaniem zdjęć wykonanych i wysłanych telefonem?

e-MSI
Admin

Witam! Tak, system IDR do OCR faktur, pozwala na automatyzację tego procesu. Wszystkie funkcje są dopasowywane indywidualnie do potrzeb firmy, jakkolwiek, system może być również obsługiwany na urządzeniach mobilnych, a zdjęcia faktur przesyłane z dowolnego miejsca na świecie. Po wykonaniu zdjęcia faktury, weryfikacji danych i przesłaniu jej przez odpowiednią aplikację, dane trafią natychmiast do systemu.

Paweł
Gość
Paweł

Nasza firma otrzymuje faktury w języku polskim, czeskim, angielskim oraz niemieckim. Czy ten system OCR poradzi sobie również z rozczytywaniem faktur w językach obcych?

e-MSI
Admin

Oczywiście, każde wdrożenie dostosujemy do wymagań klienta. W przypadku powyższych wymagań instalujemy w systemie odpowiednie słowniki oraz definiujemy słowa kluczowe, wokół których system OCR ma szukać podanych wartości. Dzięki temu system nie szuka np. daty tylko wokół słowa data, ale również date, datum. Należy nie zapominać, że algorytmy systemu OCR wraz ze wzrostem liczby wprowadzonych faktur zwiększają swoje siatki prawdopodobieństwa. Oznacza to, że system uczy się i coraz trafniej rozpoznaje język i wartości faktury, nawet w miejscach, które są trudne do rozczytania dla ludzkich oczu.