Python czytanie plików o innych formatach niż txt

0

Tak jak w temacie, jak mam taki kod

file = 'text.doc'

try:
    f = open(file, 'r')
except IOError:
    print ('Błąd pliku')


print(f)
str = f.read()
print (str)

f.close()

to wyskakuje mi błąd kodowania
Pozdrawiam

0

Co chcesz osiągnąć?
Aby przeczytać tekst z pliku doc musiałbyś użyć jakiegoś parsera.

0

Czym jest praser? Swoja drogą chciałbym stworzyć małą bazę danych opartą o excela.

0

Parser, a nie praser.

0

Zapodał byś mi jakiś przykład np. operacji na pliku z ms word czy libre office ?

0

dziękuję

0

Jest jeszcze jedno ogarnia ktoś bibloteke pythona pyparser? Czy ona pozwoli pisać programy bazodanowe oparte np. o openoffice?

1

Nie lepiej byłoby Ci użyć zwykłej bazy danych, a później dorobić możliwość eksportu do dokumentu excela? Baza oparta na plikach dowolnego programu officowego to zły pomysł. Masa czasu będzie marnowana na odpowiedni ich zapis i uaktualnienia.

1

Pyparser kompletnie nie do tego służy, to biblioteka do tworzenia prostych gramatyk różnych języków/formatów.

Jeżeli chcesz pracować na plikami .doc w Pythonie, użyj bliblioteki, np: https://python-docx.readthedocs.org/en/latest/
Pytałeś o współpracę z OpenOffice - ma ono swoje API i implementację w Pythonie, w dodatku OpenOffice ma wbudowanego Pythona, ale jak chcesz opierać bazę danych na dokumentach worda czy openoffice to tak jak mówił @xfin, wybij to sobie z głowy ;) Dodam tylko, że jeśli to nie są jakieś ustrukturyzowane dane (typu właśnie długi tekst, maile itd) to wręcz stworzone do tego są bazy document-oriented, np. MongoDB.

1 użytkowników online, w tym zalogowanych: 0, gości: 1