Das Extrahieren Von Hyperlinks Aus Excel - (.xlsx) mit Python

Ich schaue mir meist die xlrd und openpyxl-Bibliotheken für Excel-Datei manipulation. Jedoch, xlrd derzeit nicht unterstützt formatting_info=True für .xlsx-Dateien, so dass ich nicht verwenden können, die xlrd hyperlink_map Funktion. So wandte ich mich openpyxl, haben aber auch kein Glück gehabt extrahieren Sie einen hyperlink aus einer excel-Datei. Test code unten (das test-file enthält eine einfache hyperlink zu google mit hyperlink-text auf "test"):

import openpyxl

wb = openpyxl.load_workbook('testFile.xlsx')

ws = wb.get_sheet_by_name('Sheet1')

r = 0
c = 0

print ws.cell(row = r, column = c). value
print ws.cell(row = r, column = c). hyperlink
print ws.cell(row = r, column = c). hyperlink_rel_id

Ausgabe:

test

None

Ich denke, openpyxl derzeit nicht unterstützt Formatierung komplett, oder? Gibt es eine andere Bibliothek, die ich verwenden können, um hyperlink extrahieren von Informationen aus Excel - (.xlsx) - Dateien?

  • Openpyxl die Unterstützung für die Formatierung ist jetzt ziemlich komplett. Der Grund hyperlinks sind nicht so gut unterstützt ist historisch, und auch die Art, wie Sie implementiert sind, sind in der Excel-2010-Spezifikation, die viele Umleitung.
  • Hier einige weitere experiment mit der Einschränkung der OpenPyXl mit hyperlinks. stackoverflow.com/questions/34964255/...
InformationsquelleAutor LucasS | 2013-05-21
Schreibe einen Kommentar