Jak optyczne rozpoznawanie znaków (OCR) może usprawnić biznes – praktyczne przykłady zastosowania
Jako firma wdrażająca systemy do automatyzacji i digitalizacji dokumentów, widzimy rosnące zapotrzebowanie na technologię automatycznego rozpoznawania znaków. Nasi klienci wykorzystują Jak optyczne rozpoznawanie znaków (OCR) – moduł IDR e-MSI do automatyzacji nawet bardzo skomplikowanych procesów związanych z przetwarzaniem dokumentów. Moduł ten jest wyposażony w zaawansowane algorytmy uczenia maszynowego i sztucznej inteligencji, które pozwalają na dokładne rozpoznawanie i klasyfikację różnych typów dokumentów, nawet tych o nietypowych formatach lub złożonej strukturze.
Poniżej przedstawiamy kilka praktycznych przykładów zastosowania IDR w zrealizowanych wdrożeniach.
Optyczne rozpoznawanie znaków – Proces Leasingowy
Klient:
Międzynarodowa sieć wynajmu pojazdów.
Wyzwania:
- Dokumenty papierowe: Konieczność skanowania teczki zawierającej różne typy dokumentów.
- Skuteczność procesu: Każdy błąd w kompletowaniu dokumentów powoduje duże straty czasowe (komunikacja z bankiem i przesyłanie oryginałów dokumentów) i finansowe (brak możliwości generowania przychodu).
- Różne wzory dokumentów: Część dokumentów wystawiana jest przez różnych wystawców stosujących różne wzory i formaty danych na dokumentach (np. okres ubezpieczenia w miesiącach albo daty rozpoczęcia i zakończenia ochrony).
Kontekst biznesowy:
Kompletowanie dokumentacji w procesie wnioskowania do banku o przyznanie finansowania.
Podejście:
- Zbudowanie strategii klasyfikacji dokumentów: Aby usprawnić proces skanowania dokumentów oraz uniezależnić proces od błędów ludzkich, odrzucona została koncepcja rozpoznawania początków dokumentów. Choć zdecydowanie łatwiejsza w implementacji, narażona byłaby na błędy w ułożeniu kartek w skanowanej paczce. Zamiast tego system klasyfikuje każdą stronę z osobna i przypisuje ją do jednej z oczekiwanych kategorii dokumentów. W kolejnym kroku system łączy ze sobą strony dokumentów według przypisanej kategorii.
- Określenie strategii interpretacji danych: Ponieważ zadaniem systemu jest weryfikacja, czy wszystkie wymagane typy dokumentów znajdują się w paczce oraz porównanie, czy kluczowe dane są jednakowe na każdym dokumencie, przyjęte zostało podejście wyszukiwania anomalii.
- Określony został typ dokumentu nadrzędnego (faktura), według którego mają zostać weryfikowane pozostałe dokumenty. [algorytm standardowy]
- Z dokumentu pobierane są wszystkie dane, które się na nim znajdują. Dla każdego ciągu znaków określany jest prawdopodobny typ danych (imię, nazwisko, data, kwota, nr nadwozia itp.) oraz procent określający podobieństwo do danych z dokumentu głównego. [algorytm standardowy]
- Na dokumencie polisy ubezpieczeniowej wyszukiwane są daty rozpoczęcia i zakończenia ochrony, a następnie obliczana jest ilość dni pomiędzy nimi i weryfikowany jest warunek, aby okres ten obejmował przynajmniej 13 miesięcy. [algorytm indywidualny]
- System weryfikuje, na których dokumentach dany ciąg znaków się powtarza. [algorytm standardowy]
- Na podstawie zebranych danych system przygotowuje krok weryfikacji dla użytkownika, zestawiając dane z dokumentu głównego z danymi znalezionymi na pozostałych dokumentach. Dane z odpowiednim poziomem podobieństwa do danych wejściowych prezentowane są użytkownikowi do porównania.
- Każda informacja poniżej 100-procentowego podobieństwa sygnalizowana jest odpowiednim kolorem użytkownikowi weryfikującemu.
- Użytkownik koryguje ewentualne błędy rozpoznania (brak znalezionej informacji na dokumencie, błąd w odczycie na poziomie silnika OCR). Każda korekta zasila mapę prawdopodobieństwa znalezienia informacji na przyszłych dokumentach od tego samego wystawcy (parametrem różnicującym jest tu NIP wystawcy faktury). [algorytm standardowy]
Efekty:
- Redukcja czasu potrzebnego na weryfikację dokumentów o 90%.
- Możliwość zdecentralizowania procesu weryfikacji – proces może odbywać się zdalnie, nie w miejscu fizycznego kompletowania dokumentów.
Czas przygotowania rozwiązania (analiza, implementacja i testy): 3 tygodnie.
Optyczne rozpoznawanie znaków – Koncesje
Klient:
Firma prowadząca hurtową sprzedaż alkoholu na terenie wszystkich województw w Polsce.
Wyzwania:
- Konieczność zebrania dokumentacji od klientów spółki: Sklepy prowadzące sprzedaż alkoholu rozproszone po całej Polsce muszą dostarczać dokumenty kilka razy w roku w krótkim okresie 3–4 dni.
- Konieczność weryfikacji poprawności jakości zdjęć/skanów: Na podstawie dostarczonych dokumentów podejmowana jest decyzja o współpracy w kolejnym okresie.
- Różne wzory dokumentów: Dokumenty wystawiane przez różne urzędy miast i gmin nie mają standardowego formularza.
Kontekst biznesowy:
Kolekcjonowanie i weryfikacja dokumentacji związanej z koncesją na sprzedaż detaliczną alkoholu dla większości sklepów monopolowych w Polsce (ok. 85 tys. sklepów).
Największym wyzwaniem była interpretacja różnych formatów dokumentów. Każda gmina w Polsce wydająca koncesje stosuje swój standard wydawania takich dokumentów, co oznacza przetwarzanie zarówno jednostronnych dokumentów, jak i takich, które zawierają wiele stron. Format numeracji koncesji oraz oznaczenie grupy alkoholi, których dotyczy koncesja (nisko, średnio lub wysokoprocentowych), są bardzo różne.
Podejście:
- Wykorzystanie skanera dokumentów w aplikacji mobilnej: Pracownicy kolekcjonujący dokumenty mają do dyspozycji skaner, który czuwa nad jakością oświetlenia, kątem wykonania zdjęcia dokumentu i jakością samego dokumentu przed przekazaniem do OCR.
- Automatyczna ekstrakcja danych z dokumentów różnoformatowych oraz porównanie z danymi w SAP: Po wykonaniu skanu aplikacja wysyła obraz do serwera, gdzie następuje proces OCR, inteligentne wyodrębnienie kluczowych danych i porównanie ich z danymi z SAP.
- Uruchomienie procesu obsługi weryfikacji dla nielicznych dokumentów: Jedynie w przypadku niezgodności zaangażowany zostaje dział weryfikujący.
Efekty:
- Redukcja czasu potrzebnego na weryfikację dokumentów o 90%.
- Zespół weryfikujący dokumenty zajmuje się tylko niewielkim ułamkiem całości danych (znacznie zmniejszone zaangażowanie).
- Lepsza jakość danych na końcu procesu przez eliminację pomyłek ludzkich.
Czas przygotowania rozwiązania (analiza, implementacja i testy): 9 miesięcy.
Optyczne rozpoznawanie znaków – Magazyn
Podejście:
- Skanowanie i rozpoznawanie wszystkich dokumentów WZ: Dokumenty WZ dostarczane wraz z dostawą są skanowane po weryfikacji zgodności dostawy z dokumentem WZ. Dalsza część procesu, w przypadku braku błędów, jest całkowicie automatyczna: pobranie danych zamówienia z SAP (PO), oczekiwanie na fakturę (FV), weryfikacja zgodności FV z WZ i PO.
- Skupienie uwagi pracowników na wyjaśnianiu nieprawidłowości: Jeśli system wykryje różnice w ilości dostarczonego towaru w stosunku do zamówienia lub różnice w wartości, uruchamiane jest zadanie dla pracownika. Dzięki temu uwaga może być skupiona wyłącznie na obsłudze wyjątków.
Efekty:
- Tylko kilka procesów dokumentów wymaga udziału człowieka.
- Większa uwaga skierowana na wyjaśnianie wyjątkowych sytuacji. Całość procesu w przypadku braku błędów jest zautomatyzowana.
Czas przygotowania rozwiązania (analiza, implementacja i testy): 3 miesiące.
Optyczne rozpoznawanie znaków (OCR) staje się nieodzownym narzędziem w modernizacji procesów biznesowych. Przykłady zastosowania systemu IDR e-MSI w różnych branżach – od leasingu pojazdów, przez sprzedaż alkoholu, aż po zarządzanie magazynem – pokazują, że automatyzacja i digitalizacja dokumentów nie tylko przyspiesza operacje, ale również znacząco redukuje ryzyko błędów.
Dzięki zaawansowanym algorytmom uczenia maszynowego i sztucznej inteligencji, możliwe jest szybkie i precyzyjne przetwarzanie dokumentów, co przekłada się na oszczędność czasu i zasobów oraz poprawę jakości danych. Wdrożenie takich systemów pozwala firmom na skoncentrowanie się na kluczowych aspektach działalności, eliminując czasochłonne i podatne na błędy zadania ręcznego przetwarzania dokumentów. To nowoczesne podejście do zarządzania dokumentami staje się kluczowym elementem konkurencyjności w dzisiejszym dynamicznie zmieniającym się środowisku biznesowym.