Wie für das Lesen zu überspringen leere Dateien mit panda in Python
Ich lese alle Dateien in einem Ordner einzeln in ein DataFrame und dann überprüfe ich Sie für einige Bedingungen. Es gibt einige tausend Dateien, und ich würde Sie gerne pandas eine Ausnahme auslösen, wenn eine Datei leer ist, so dass meine Leser funtion würde diese Datei überspringen.
Ich habe so etwas wie:
class StructureReader(FileList):
def __init__(self, dirname, filename):
self.dirname=dirname
self.filename=str(self.dirname+"/"+filename)
def read(self):
self.data = pd.read_csv(self.filename, header=None, sep = ",")
if len(self.data)==0:
raise ValueError
class Run(object):
def __init__(self, dirname):
self.dirname=dirname
self.file__list=FileList(dirname)
self.result=Result()
def run(self):
for k in self.file__list.file_list[:]:
self.b=StructureReader(self.dirname, k)
try:
self.b.read()
self.b.find_interesting_bonds(self.result)
self.b.find_same_direction_chain(self.result)
except ValueError:
pass
Reguläre Datei, die ich bin auf der Suche für eine Bedingung sieht wie folgt aus:
"A/C/24","A/G/14","WW_cis",,
"B/C/24","A/G/15","WW_cis",,
"C/C/24","A/F/11","WW_cis",,
"d/C/24","A/G/12","WW_cis",,
Aber irgendwie glaube ich nicht, jemals ValueError
aufgewachsen, und meine Funktionen sind auf der Suche leere Dateien, das gibt mir eine Menge "Leere DataFrame ..." - Zeilen in meine Ergebnisse Datei. Wie kann ich das Programm überspringen Sie leere Dateien?
- ist das nicht ein dupe dazu: stackoverflow.com/questions/2507808/...
- Mögliche Duplikate von Python - Überprüfen, ob eine Datei leer ist oder nicht
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich würde zunächst überprüfen, ob die Datei leer ist, und wenn es nicht leer ist, werde ich versuchen, es mit pandas.
hier: https://stackoverflow.com/a/15924160/5088142 Sie finden ein schöner Weg, um zu überprüfen, ob eine Datei leer ist:
Sollten Sie nicht verwenden pandas, sondern direkt die python-Bibliotheken. Die Antwort ist, es gibt: python, wie Sie überprüfen, die Datei leer ist oder nicht
Können Sie sich Ihre Arbeit mit folgenden code, fügen Sie einfach Ihre CSVs Pfad zu der Pfad variable, und führen Sie. Sollten Sie ein Objekt raw_data das ist ein Pandas dataframe.
Wie über diese