Spolszczanie napisów

0

Cześć, mam problem z polskimi znakami. Używam morfeusza2 do wyciągania lematów z poszczególnych słów w zdaniu. Wszystko działa jak należy, ale problem pojawia się kiedy wprowadzony jest napis bez polskich znaków np. "skad cos wziac" zamiast "skąd coś wziąć". Czy istnieje jakiś sposób na "spolszczenie" takich napisów? Bądź inny analizator niż morfeusz2, który rozwiązałby problem?

0

Obawiam się, że to jest niemożliwe bardzo trudne do zrealizowania. Bez kontekstu nie jesteś w stanie stwierdzić czy ktoś chciał napisać kobieta czy kobietą.

0

Po co to, jakiś szerszy kontekst?

0

@DominC obawiam się że ciężko trochę. Możesz spróbować z jakimś słownikiem np. w jeden z poniższych sposobów:

  1. Jeśli słowa nie ma w słowniku to testujesz warianty tego słowa dodając rekurencyjnie ogonki.
  2. Liczysz odległość edycyjną i szukasz w słowniku słowa które jest najbliżej

Alternatywą jest coś jak https://github.com/agh-glk/pjn/tree/master/lab05 tylko nie wiem czy AGHowe CLP jest gdzieś dostępne publicznie czy musisz napisać do kogoś z uczelni żeby je zdobyć.

1 użytkowników online, w tym zalogowanych: 0, gości: 1