Cześć,
zastanawiam się jak zaimplementować rozpoznawanie składników (produktów), ich ilości i gramatury w przepisach kulinarnych. Mam takie dane:
Obecnie w bazie mam około 850 takich pozycji, które niekoniecznie są unikalne. Chcę po wpisaniu friendlyName
wyciągnąć amount
, selectedUnit
i foodstuffId
na podstawie nazwy składnika. Macie pomysł jak to rozwiązać?
Na początku rozważałem fuzzy search bazy, żeby wyciągać wyniki na podstawie podobieństwa + jakieś regexy może dla ilości/gramatury. Teraz myślę o użciu Apache OpenNLP i wytrenować jakoś tym model + Named Entity Recognition. Tylko też nie wiem jak, oddzielnie ilość/jednostki/składniki?
Co byście polecili?