Wie können wir entscheiden, die insgesamt keine. der Eimer für eine hive-Tabelle

ich bin bisschen neu für hadoop. Wie pro meine Kenntnisse Eimer fixiert sind, nicht. Partitionen in hive-hive-Tabelle und nutzt die nicht. Reduzier gleiche wie die Summe nicht. der Eimer definiert beim erstellen der Tabelle. Also kann mir jemand sagen, wie die Berechnung der Gesamtzahl nicht. der Eimer in eine hive-Tabelle. Gibt es eine Formel für die Berechnung der Gesamtzahl der Eimer ?

  • Habe eine Formel #buckets = (x * Average_partition_size) / JVM_memory_available_to_your_Hadoop_tasknode ; wobei x (>1) der "Faktor des Konservatismus". Aber nicht klar darüber. Brauchen eine klare Formel, die auf dieser
Schreibe einen Kommentar