Tak jak w temacie, jak mam taki kod
file = 'text.doc'
try:
f = open(file, 'r')
except IOError:
print ('Błąd pliku')
print(f)
str = f.read()
print (str)
f.close()
to wyskakuje mi błąd kodowania
Pozdrawiam
Tak jak w temacie, jak mam taki kod
file = 'text.doc'
try:
f = open(file, 'r')
except IOError:
print ('Błąd pliku')
print(f)
str = f.read()
print (str)
f.close()
to wyskakuje mi błąd kodowania
Pozdrawiam
Co chcesz osiągnąć?
Aby przeczytać tekst z pliku doc
musiałbyś użyć jakiegoś parsera.
Czym jest praser? Swoja drogą chciałbym stworzyć małą bazę danych opartą o excela.
Parser
, a nie praser
.
Zapodał byś mi jakiś przykład np. operacji na pliku z ms word czy libre office ?
dziękuję
Jest jeszcze jedno ogarnia ktoś bibloteke pythona pyparser? Czy ona pozwoli pisać programy bazodanowe oparte np. o openoffice?
Nie lepiej byłoby Ci użyć zwykłej bazy danych, a później dorobić możliwość eksportu do dokumentu excela? Baza oparta na plikach dowolnego programu officowego to zły pomysł. Masa czasu będzie marnowana na odpowiedni ich zapis i uaktualnienia.
Pyparser kompletnie nie do tego służy, to biblioteka do tworzenia prostych gramatyk różnych języków/formatów.
Jeżeli chcesz pracować na plikami .doc
w Pythonie, użyj bliblioteki, np: https://python-docx.readthedocs.org/en/latest/
Pytałeś o współpracę z OpenOffice - ma ono swoje API i implementację w Pythonie, w dodatku OpenOffice ma wbudowanego Pythona, ale jak chcesz opierać bazę danych na dokumentach worda czy openoffice to tak jak mówił @xfin, wybij to sobie z głowy ;) Dodam tylko, że jeśli to nie są jakieś ustrukturyzowane dane (typu właśnie długi tekst, maile itd) to wręcz stworzone do tego są bazy document-oriented, np. MongoDB.