FUNKE : Fehler: `union" erwartet, aber `(' gefunden

Ich habe einen dataframe df genannt mit Spalte mit dem Feld "employee_id". Ich bin dabei:

 df.registerTempTable("d_f")
val query = """SELECT *, ROW_NUMBER() OVER (ORDER BY employee_id) row_number FROM d_f"""
val result = Spark.getSqlContext().sql(query)

Aber immer Folgendes Problem. Keine Hilfe?

[1.29] failure: ``union'' expected but `(' found
SELECT *, ROW_NUMBER() OVER (ORDER BY employee_id) row_number FROM d_f
                            ^
java.lang.RuntimeException: [1.29] failure: ``union'' expected but `(' found
SELECT *, ROW_NUMBER() OVER (ORDER BY employee_id) row_number FROM d_f

funktioniert die Abfrage funktioniert, wenn Sie direkt in Db?
SELECT t.*, ROW_NUMBER() OVER (ORDER BY employee_id) row_number FROM d_f as t
Abfrage ist in Ordnung. Sie sind immer Fehler im anderen Teil und nicht hier. Poste den kompletten query.
wie aliasing die Tabelle wäre hier eine Lösung?
Habe ich noch nicht getestet, aber logisch sollte es nicht der Fall sein. Da die Abfrage beinhaltet nur eine Tabelle aliasing ist gar nicht notwendig; in anderen Worten, in keiner Weise die DB-engine erhalten würde, die Unklarheit der Bezüge.

InformationsquelleAutor user1735076 | 2015-08-03

17

Spark 2.0+

Spark 2.0 stellt native Implementierung von Fenster-Funktionen (SPARK-8641) so HiveContext sollte nicht mehr erforderlich. Trotzdem ähnliche Fehler auf, die nicht mit der window-Funktion, kann immer noch zurückzuführen auf die Unterschiede zwischen SQL-Parser.

Funke <= 1.6

Window-Funktionen eingeführt wurden, Spark 1.4.0 und erfordern HiveContext zu arbeiten. SQLContext funktioniert hier nicht.

Werden Sie sicher, dass Sie Sie verwenden Funke >= 1.4.0 und erstellen die HiveContext:
```
import org.apache.spark.sql.hive.HiveContext
val sqlContext = new HiveContext(sc)
```
- was ist 'sc' - Eingang?
- sc ist SparkContext.
- Aber warum machen die window-Funktionen brauchen eine HiveContext? Was ist der Unterschied zwischen HiveContext und SQLContext?
- In diesem speziellen Fall ist es einfach über die Unterstützung für Hive UDAFs. Alle Fenster-Funktionen in Funke < 2.0.0 ausgedrückt werden, die mit Hive UDAF, daher kann nicht arbeiten, ohne HiveContext.
- Ich sehe, danke! Vielen Dank für die Aktualisierung der Antwort zu. Ich habe ein link zu issues.apache.org/jira/browse/SPARK-8641.
- Ich bin versucht, das gleiche zu tun mit Cassandra SQL, aber nicht funktioniert..
InformationsquelleAutor zero323
1

Ja, Es ist wahr,

Ich benutze Funken version 1.6.0 und da braucht man eine HiveContext zur Umsetzung der "dense_rank' - Methode.

Vom Spark 2.0.0 auf Worte wird es nicht mehr "dense_rank' - Methode.

Also für Spark 1.4,1.6 <2.0 sollten Sie anwenden, wie dieses.

Tabelle hive_employees mit drei Feldern ::
Ort : String,
name : String,
Gehalt : Int

val conf = new SparkConf().setAppName("denseRank test")//.setMaster("local")
```
val sc = new SparkContext(conf)
val sqlContext = new SQLContext(sc)
val hqlContext = new org.apache.spark.sql.hive.HiveContext(sc) 
```
val Ergebnis = hqlContext.sql("select empid,empname, dense_rank() over(partition by empsalary, um durch empname) als Rang von hive_employees")

Ergebnis.show()

InformationsquelleAutor Pelab

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.