Wie, um text-Datei Lesen, die in Python mit Pandas

Ich bin neu Pandas und ich versucht habe zu tun, einem scatter-plot in Python 2.7 habe ich das dataset in .txt Datei so etwas wie dieses (durch Komma getrennt)

6.1101,17.592
5.5277,9.1302
8.5186,13.662
7.0032,11.854
5.8598,6.8233
8.3829,11.886
7.4764,4.3483



import pandas as pd
import matplotlib.pyplot as mplt

# Taking Dataset using Pandas

input_data = pd.read_csv('data.txt');
#input_data.head(5)

Wie, um eine Darstellung der oben genannten Daten in einem Punktdiagramm ohne Header auf das dataset ?

Ich gesehen habe in tutorials und Beispiele, dass, wenn das Daten-set enthält Spaltenüberschriften, dann ist es möglich, die plot scatter-plot. Ich habe versucht, x und y wie die überschriften für die beiden Spalten der Daten .txt-Datei und versucht, den untenstehenden code.

input_data = pd.read_csv('data.txt');
#input_data.head(5)
x_value = input_data[['x']]
y_value = input_data[['y']]

mplt.scatter(x_value, y_value)

Aber trotzdem bin ich immer Fehler wie unten gezeigt

Traceback (most recent call last):
  File "E:\IIT Madras\Research\Experiments\Machine Learning\Linear Regression\Linear_Regression.py", line 16, in <module>
    y_value = input_data[['y']]
  File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 1791, in __getitem__
    return self._getitem_array(key)
  File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 1835, in _getitem_array
    indexer = self.ix._convert_to_indexer(key, axis=1)
  File "C:\Python27\lib\site-packages\pandas\core\indexing.py", line 1112, in _convert_to_indexer
    raise KeyError('%s not in index' % objarr[mask])
KeyError: "['y'] not in index"

Gibt es eine bessere Möglichkeit, damit umzugehen (mit und ohne Kopfzeile) ?

EDIT:

Folgende für mich gearbeitet, nachdem Sie durch Ishan Antwort

input_data = pd.read_csv('data.txt', header =None);
x_value = input_data[[0]]
y_value = input_data[[1]]
mplt.scatter(x_value, y_value)
mplt.show()

Sie können entweder fügen Sie die Header oder Namen oder beziehen sich auf die Spalten nach Ihren numerischen Indizes. Die parameter für read_csv ist names finden Sie unter pandas.pydata.org/pandas-docs/stable/generated/...

InformationsquelleAutor Bhanu Chander | 2017-03-07

5

Versuchen die Daten zu importieren, ohne die Spaltenüberschriften und dann benennen von Spalten, die durch Ihre eigene :
```
df=pd.read_csv(r'/home/ishan/Desktop/file',header=None)
df.columns=['x','y']
import matplotlib.pyplot as plt
plt.scatter(df['x'],df['y'])
plt.show()
```
das funktionierte, benutzte ich die index 0 und 1 statt x,y

InformationsquelleAutor Ishan

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.