Konfigurieren der Funke auch auf die Arbeit mit Jupyter Notebook und Anaconda

Ich habe ein paar Tage jetzt versucht zu machen, Funke funktioniert mit meinem Jupyter Notebook und Anaconda. Hier ist, was mein .bash_profile sieht wie folgt aus:

PATH="/my/path/to/anaconda3/bin:$PATH"

export JAVA_HOME="/my/path/to/jdk"
export PYTHON_PATH="/my/path/to/anaconda3/bin/python"
export PYSPARK_PYTHON="/my/path/to/anaconda3/bin/python"

export PATH=$PATH:/my/path/to/spark-2.1.0-bin-hadoop2.7/bin
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook" pyspark
export SPARK_HOME=/my/path/to/spark-2.1.0-bin-hadoop2.7
alias pyspark="pyspark --conf spark.local.dir=/home/puifais --num-executors 30 --driver-memory 128g --executor-memory 6g --packages com.databricks:spark-csv_2.11:1.5.0"

Geben, wenn ich /my/path/to/spark-2.1.0-bin-hadoop2.7/bin/spark-shell, ich kann starten Spark Prima in meine Befehlszeilen-shell. Und die Ausgabe sc ist nicht leer. Es scheint gut zu funktionieren.

Geben, wenn ich pyspark es startet mein Jupyter Notebook in Ordnung. Wenn ich erstellen Sie eine neue Python ist3 notebook, dieser Fehler angezeigt:

[IPKernelApp] WARNING | Unknown error in handling PYTHONSTARTUP file /my/path/to/spark-2.1.0-bin-hadoop2.7/python/pyspark/shell.py: 

Sowie sc in meinem Jupyter Notebook ist leer.

Kann mir jemand helfen, lösen Sie diese situation?


Wollen einfach nur, um es klarzustellen: Es gibt nichts nach dem Doppelpunkt am Ende der Fehler. Ich habe auch versucht, mein eigenes start-up-Datei mit diesem post und ich zitiere hier, so dass Sie nicht haben, zu gehen, sehen Sie dort:

Erstellte ich eine kurze Initialisierung Skript init_spark.py wie folgt:

from pyspark import SparkConf, SparkContext
conf = SparkConf().setMaster("yarn-client")
sc = SparkContext(conf = conf)

und legte es in die ~/.ipython/profile_default/startup/Verzeichnis

Als ich dies Tat, der Fehler wurde dann:

[IPKernelApp] WARNING | Unknown error in handling PYTHONSTARTUP file /my/path/to/spark-2.1.0-bin-hadoop2.7/python/pyspark/shell.py:
[IPKernelApp] WARNING | Unknown error in handling startup files:
  • Was ist der rest von dem text der Warnung? Es ist ein Doppelpunkt am Ende der Zeile, gibt es etwas, was danach kommt?
  • Nein! Es ist leer. Es gibt nichts nach dem Komma.
  • Was ist, wenn Sie Sie löschen, die alias Linie, oder löschen Sie einige der Optionen aus oder? Tritt der Fehler ändern?
  • Nur versucht haben, entfernen Sie den alias. Kein Unterschied. Immer noch der gleiche Fehler 🙁
  • Hier ist ein Weiterführender link, das könnte vielleicht helfen, stackoverflow.com/questions/33908156/.... Hinzufügen pyspark-shell PYSPARK_SUBMIT_ARGS ist der Schlüssel.
InformationsquelleAutor puifais | 2017-12-15
Schreibe einen Kommentar