[c++] OCR

0

Mam pytanie, bo nie wiem czy się dobrze do tego zabieram.

Chcę stworzyć OCR'a, który będzie w stanie na podstawie analizy obrazu wykonać wcześniej zdefiniowane funkcje.

Ja chcę rozwiązać to tak:

Program robi sobie print screena, ładuje do analizy wybrany obszar obrazu i na podstawie analizy koloru w danym pixelu wykonuje określone zadanie.

Pomijam fakt, że nie wiem jak poradzić sobie z przesunięciem, np. liczba 966 będzie wyświetlana w innej pozycji niż liczba 166 (jedynka jest mniej rozciągnięta niż 9, co przesuwa całą liczbę) - tutaj nie wiem jak sobie z tym poradzić.

Mój pomysł jest dobry, czy może są sposoby bardziej precyzyjne? Raczkuję w tym temacie a chciałbym tworzyć solidne funkcje działające na podstawie analizy obrazu.

0

najpierw musisz obraz podzielić na ramki, czyli w taki sposób żeby mieć podzielony obraz na prostokąciki i w każdym prostokąciku jakaś litera. następnie proponuje użyć sztucznej sieci neuronowej do rozpoznawania liter.

EDIT:
ale zamiast printscreena można oszukać użytkownika. Lepiej odczytać tekst za pomocą winAPI, chyba że chodzi Ci o captcha itp..

1 użytkowników online, w tym zalogowanych: 0, gości: 1