Blog

OCR faktur

ocr faktur

Co to jest OCR faktur?

OCR faktur – (ang. Invoice Opitcal Character Recognition) to narzędzie służące do rozczytywania tekstu z przesłanych dokumentów i obrazów.

Jak odbywa się skanowanie faktur OCR? System wyposażony w technologię OCR do faktur dekoduje wybrany dokument, rozpoznając w nim tekst, tabele i elementy graficzne, następnie skanuje słowa rozczytując litery niezależnie od użytej czcionki. Dzięki temu możliwe jest m.in. zaznaczanie, kopiowanie i przenoszenie treści rozpoznanych na dokumencie do innych aplikacji.

Jakie są zalety OCR-owania faktur?

Główną zaletą systemu OCR jest oszczędność czasu, w którym pracownicy musieliby wyszukiwać lub ręcznie przepisywać dane z faktur i dokumentów. Dobry program OCR do faktur umożliwia również automatyczne umieszczanie dokumentów w archiwum elektronicznym, przy zachowaniu wyglądu oryginalnej kopii, oraz wyszukiwanie i przeszukiwanie faktur za pomocą słów kluczowych w wymiarze pełnotekstowym. 

Załóżmy, że w Twojej firmie doszło do uszkodzenia sprzętu, na przykład monitora. W takim wypadku należy odnaleźć fakturę zakupu tego sprzętu. Jeśli nie pamiętamy nazwy sklepu, czy daty zakupu, proces wyszukiwania staje się automatycznie utrudniony, chociażby dlatego, że wymaga nakładu godzin pracy, aby odnaleźć właściwy dokument. Funkcji przeszukiwania pełnotekstowego pozwala na szybkie odnalezienie potrzebnych dokumentów, przez proste wyszukiwanie słów kluczowych takich jak “monitor”, nazwa producenta sprzętu lub numer seryjny.

OCR w systemie Invoice Data Recognition – certyfikowaną integracją JobRouter

OCR faktur w systemie Invoice Opitcal Character Recognition (optyczne rozpoznawanie tekstu), to narzędzie służące do odczytywania danych z zeskanowanych dokumentów i plików graficznych. IDR stworzony przez nasz zespół, został certyfikowanym modułem JobRotuer.

OCR faktur

Moduł IDR pozwala na analizowanie danych z wprowadzonych do systemu faktur w różnych formatach i automatyczne eksportowanie ich do systemu JobRouter, czy też zintegrowanych z JobRouter systemów finansowo-księgowych, czy księgowości online. W module IDR, Optical Character Recognition faktury działa za pomocą inteligentnego ‘lasso’ które odczyta wprowadzony obraz faktury w celu znalezienia słów kluczowych i przypisanych do nich wartości, niezależnie od użytej czcionki. System jest zintegrowany z wybranymi bazami danych wewnątrz firmy (np. kontrahentów, zamówień) oraz bazami publicznymi (np. GUS, KRS) i słownikami językowymi dzięki którym, weryfikuje rozczytane wartości. 

Użytkownik również może zweryfikować rozpoznawane znaki z poziomu swojego interfejsu. Użytkownik po rozczytaniu faktury przez system otrzymuje podgląd w formie formularza i zdjęcia faktury, w którym wartości na fakturze są podświetlane po najechaniu kursorem na odpowiednie pola formularza. W ten sposób weryfikacja, czy dana faktura została poprawnie rozczytana zanim zostaje wprowadzona do systemu, zajmuje tylko kilka sekund. 

Jeśli podczas wykorzystanie programu ocr jakiekolwiek dane nie zostały poprawnie zeskanowane, użytkownik może zaznaczyć poprawną wartość na fakturze za pomocą lassa OCR. Wówczas system zapamięta działanie użytkownika i powiążą je z NIP wystawcy dokumentu. Dzięki temu faktura powiązana z danym nadawcą zostanie poprawnie rozczytana kolejnym razem. 

IDR to system uczący się, zatem każda rozczytana faktura rozbudowuje mapę prawdopodobieństwa znalezienia danych w danym miejscu na fakturze, przypisując je do NIP wystawcy faktur.

Jak i jakie dokumenty mogą zostać poddane OCR?

Oprogramowanie OCR wdrożone w odpowiedni system może zostać połączone z innymi mechanizmami, rozszerzając swoją skuteczność.

W przypadku IDR narzędzie świetnie poradzi sobie z fakturami, korektami faktur, paragonami (np. z autostrady) i innymi dokumentami księgowymi w postaci zarówno skanów papierowych dokumentów, jak i wersji elektronicznych, przesłanych do firmy np. w PDF. W przypadku poddaniu procesowi OCR faktur czy rachunków wypisanych ręcznie, skuteczność systemu jest niższa, ale nadal możliwa! Proces znacznie przyspiesza pracę i czas przeznaczony na ręczne wprowadzanie faktury.

Jak działa OCR w procesie akceptacji faktur?

Silnik OCR po zamianie obrazu na tekst, (zeskanowanego dokumentu, lub faktury w pliku pdf, jpg, png otrzymanego drogą elektroniczną) przenosi dane do systemu księgowego lub systemu obiegu faktur w odpowiednie pola.

Algorytmy będące częścią systemu, przeszukują rozpoznaną treść w celu znalezienia NIP, numeru faktury, kwoty netto, brutto, numeru pozycji, adresu czy daty. Znalezienie kluczowych słów takich jak numer faktury, czy data wystawienia dokumentu, umożliwia systemowi zaklasyfikowanie wyrażeń znajdujących się w okolicy słów kluczowych do właściwych pól. Co więcej, gdy jest to możliwe, system weryfikuje format tekstu (np. czy dana wartość jest datą), cyfrę kontrolną (np. NIP), a także analizuje zgodność rozpoznanych danych z bazą systemu ERP lub finansowo księgowego.

Jeśli to możliwe system zawsze wspomaga się wiarygodnymi bazami danych takimi jak:

  • baza kontrahentów systemu ERP
  • słownik adresów TERYT
  • słownik walut NBP
  • baza danych podmiotów gospodarczych GUS
  • baza indeksów magazynowych (np. w ERP)
  • baza zamówień (PO)

Treści rozpoznane przez system OCR-ujący faktury, które znajdują się wokół słów kluczowych, zyskują najwyższy wskaźnik prawdopodobieństwa poprawności.

Co wpływa na skuteczność OCR faktur? Czy system przeczyta nawet trudne do rozczytania dane dla ludzkich oczu?

Skuteczność OCR faktur zależy od wielu czynników. Są nimi: jakość papieru, skanu, sposobu wydruku, ostrość i kolor tekstu, czy kompleksowość algorytmów wyszukujących.

W przypadku IDR, system korzysta z historycznych map, starając się mimo wszystko wyeliminować konieczność ręcznego przepisywania danych z faktury. Dzięki integracji z dowolnym narzędziem ERP, system IDR sięga do bazy kontrahentów, aby pozyskać ewentualne braki informacji. Dane pobrane z bazy kontrahentów lub zamówień mogą zostać użyte do weryfikacji danych, dotyczących płatności wykrywając ewentualne zmiany.

Aby zobrazować ten proces,  proszę sobie wyobrazić, że faktura, która miała zostać wdrożona do systemu, została uszkodzona w miejscu adresu kontrahenta (na przykład została wylana na nią kawa). Adres zarówno dla oka, jak i komputera stał się niewidoczny. Jakkolwiek OCR pozwala dopasować brakujące dane z pozostałymi. Na przykład – jeśli numer NIP został rozpoznany, system sam wprowadzi adres pobrany z bazy danych do elektronicznej kopii faktury.

Czy OCR jest nieomylny? Co, jeśli OCR popełni błąd?

W końcowym etapie OCR faktury, system IDR generuje formularz z polami wypełnionymi danymi według najwyższego prawdopodobieństwa zgodności. Użytkownik otrzymuje zadanie  ich weryfikacji oraz ewentualnego poprawienia błędów. Jednakże, dane wymagające poprawy nie muszą być ręcznie przepisywane. Dla pól, w których użytkownik znalazł błąd, możliwe jest użycie intuicyjnej funkcji “Lasso OCR”, dzięki której użytkownik może poprawić dane poprzez proste zaznaczenie ich kursorem na zeskanowanym obrazie.

Działanie lassa OCR zostało przedstawione na poniższym filmie.

Jak przygotować dokumenty do skutecznego OCR faktur?

Nie bez znaczenia dla jakości efektu końcowego OCR faktury jest sposób zeskanowania dokumentów. Dokumenty powinny być pozbawione wszelkich dodatkowych adnotacji, pieczęci z datownikiem, zabrudzeń i zanieczyszczeń. Najkorzystniej faktura nie powinna posiadać zagięć, czy zagniecionych rogów. Nowoczesne skanery często poprawiają stan jakości skanu faktury, np. poprzez wyprostowanie do pionu, usunięcie śladów nacięć po dziurkaczu itp. Takie poprawki, nie mają większego znaczenia, jeśli nie wpływają na treść faktury. Jednak może się zdarzyć, że podpis czy pojedyncza cyfra, zostaną zidentyfikowane jako zagięcie papieru, lub wspomniane nacięcie po dziurkaczu.  Dlatego należy jednak postarać się aby dokument był przygotowany w taki sposób, żeby wykorzystanie sztucznego poprawiania skanu nie było koniecznie.

Jak skanować dokumenty do OCR?

Ustawienia skanera mają wpływ na działanie systemu IDR. Idealne ustawienie skanera to:

  • rozdzielczość powinna być 300dpi lub wyższa
  • ustawienia kolorów: odcienie szarości lub kolor
  • format – PDF

Warto zaznaczyć, że IDR radzi sobie nawet z fakturami, które zostały przesłane do systemu z telefonu, którym wykonano zdjęcie faktury. Aczkolwiek im lepsza jest jakość skanu, tym lepszy efekt końcowy OCR-owania faktury.

Korzyści ze stosowania OCR:

  • Usprawnienie swojej pracy wprowadzania danych do systemu księgowego
  • Możliwość elektronicznej akceptacji faktury przed wprowadzeniem do systemu księgowego
  • Możliwość raportowania kosztów organizacji już od momentu zeskanowania faktury
  • Weryfikacja nieprawidłowości na fakturze (np. poprzez porównanie danych na FV z danymi z GUS czy VIES)

Ile można zaoszczędzić na wdrożeniu OCR?

Średnie wynagrodzenie księgowych w Polsce w 2016 roku wynosiło 3900 zł brutto.
Jeśli ręczne wprowadzanie faktury do systemu średnio zajmowało 3 minuty, to stanowiło wydatek 1,21 zł za czas poświęcony przez pracownika. Przy użyciu narzędzia OCR cały proces od zeskanowania do sprawdzenia danych zajmuje mniej niż minutę, a co za tym idzie, kosztuje 40 groszy.

W przypadku gdy firma dostaje 100 faktur miesięcznie, oznacza to oszczędność 80 zł w skali miesiąca, natomiast jeśli firma otrzymuje 2000 faktur miesięcznie, kwota znacząco rośnie do 1600 zaoszczędzonych złotych. Co stanowi niemalże pół etatu przeciętnej księgowej.

Jakie są konsekwencje nieużywania OCR faktur?

Wzrost kompetencji pracowników, problemy z ich znalezieniem i powiększenie kosztów pracy, stwarzają konieczność poszukiwań optymalizacji, automatyzacji i digitalizacji w każdym procesie występującym w organizacji.

Wprowadzanie faktur do systemu to żmudna czynność występująca od kilku dekad w każdym przedsiębiorstwie. Mimo że narzędzia do OCR faktur są stosunkowo nowym wynalazkiem, to ci, którzy ich używają, są zgodni co do wpływu na poprawę czasu i jakości ich pracy. W związku z tym odpowiedź na pytanie „ Czy możliwe jest w dłuższej perspektywie niestosowanie OCR?” brzmi – Tak, możliwe jest nieużywanie systemu do OCR faktur, ale czy warto? Czy odrzucenie dostępnych narzędzi w dobie postępującej technologii i rynku konkurencji, które faktycznie pomogą zaoszczędzić czas i pieniądze, jest tego warte? Odpowiedzcie sobie sami na to pytanie.

Podsumowując…

Podsumowując, program do odczytywania dokumentów to kolejny krok w optymalizacji codziennej pracy, zalety płynące z tego wdrożenia to między innymi: zaoszczędzony czasu na ręczne przepisywanie dokumentów do systemu, co może stanowić nawet pół etatu księgowej, możliwość synchronizacji systemu z elektronicznym archiwum oraz innymi systemami, możliwość elektronicznej akceptacji faktury przed wprowadzeniem do systemu księgowego oraz możliwość generowania raportów dotyczących kosztów poniesionych przez organizację. Dzięki OCR również dużo łatwiej jest zauważyć i zweryfikować nieprawidłowości, jeśli takie się pojawią.

Oczywiście, nie istnieje system nieomylny, jednak OCR faktur w połączeniu z odpowiednią bazą danych i sprawnymi algorytmami, wykazuje ogromną skuteczność. Takie połączenie znajduję się w systemie IDR, a dzięki niemu firmy mają możliwość redukcji kosztów, czasu wykonywanych zadań przez pracowników i popełnianych błędów. OCR przyniósł już wiele korzyści rozwijającym się, polskim przedsiębiorstwom i staje się coraz popularniejszym rozwiązaniem.

Jeśli szukasz najlepszego systemu umożliwiającego skanowanie faktur ocr, lub po prostu chciałabyś/chciałbyś dowiedzieć się więcej — zapraszamy do skorzystania z formularza kontaktowego, znajdującego się w górnym prawym rogu naszej strony, lub kontaktu e-mail z biuro@e-msi.pl

Aby dowiedzieć się więcej o systemie IDR, kliknij tutaj.

Umów się na bezpłatną prezentację i analizę potrzeb.

Error: Contact form not found.

    Przekazane przez Państwa dane osobowe będą przetwarzane przez e-MSI Sp. z o.o. z siedzibą w Poznaniu, KRS 0000387940, w celach związanych z udzieleniem odpowiedzi na Państwa żądanie zgłoszone za pośrednictwem formularza kontaktowego. Więcej informacji w polityce prywatności. *Pola oznaczone gwiazdką są obowiązkowe

      Opisz procesy, które chcesz zdigitalizować.
      Przekazane przez Państwa dane osobowe będą przetwarzane przez e-MSI Sp. z o.o. z siedzibą w Poznaniu, KRS 0000387940, w celach związanych z udzieleniem odpowiedzi na Państwa żądanie zgłoszone za pośrednictwem formularza kontaktowego. Więcej informacji: https://e-msi.pl/polityka-prywatnosci * Pola oznaczone gwiazdką są obowiązkowe