Tag: distributed-computing

die Verwendung von mehr als einem computer, die miteinander verbunden sind, mit einer Kommunikationsverbindung zur Durchführung einer gemeinsamen Aufgabe.

Service discovery vs load balancing

4 Antworten

Ich versuche zu verstehen, in welchem Szenario sollte ich wählen Sie eine service-registry, die über einen load-balancer. Aus meinem Verständnis beide Lösungen sind für die gleiche Funktionalität. Zum Beispiel, wenn wir überlegen, Konsul.io als eine feature-Liste wir

Alternativen zu JGroups

4 Antworten

Ich möchte erstellen Sie eine verteilte Anwendungen auf der JVM, die hat eine Anzahl von Knoten, und die Notwendigkeit, eine Bibliothek, die es mir erlauben: Verwalten von cluster/grid-Mitgliedschaft, d.h. ich möchte Benachrichtigungen erhalten Sie auf leave/join Verwalten

akka akka-cluster distributed-computing jgroups

Ehcache Leistung auf einem großen cluster

3 Antworten

Möchte ich nutzen Ehcache replizierten cache, zunächst als backend Hibernate second level cache, second als Zwischenspeicher für alle Daten. Weiß ich, wie eine verteilte Caches wie memcached arbeitet, und ich weiß, es kann skalieren, um große Cluster,

distributed-computing ehcache java replication

Nicht-Hadoop-eher ein Netz als ein cluster?

1 Antworten

Ich habe gehört, der Begriff "Hadoop-Clusters", aber es scheint zu sein, im Gegensatz zu dem, was mein Verständnis einer "grid" - und "cluster" sind. Meine Verständnis ist, dass ein grid ist ein verteiltes system, bestehend aus 2+

bigdata cluster-computing distributed-computing grid hadoop

Vorbei request limit in dem Crawlen einer Website

4 Antworten

Arbeite ich an einem web-crawler, dass die Indizes der Seiten, die nicht indiziert werden sollen. Mein Erster Versuch: Ich schrieb eine c# - crawler, der geht durch jede Seite und lädt Sie herunter. Dies führte zu meiner

distributed-computing web-crawler

Einfachste Möglichkeit zur Installation von Python-Abhängigkeiten auf Spark Testamentsvollstrecker Knoten?

1 Antworten

Ich verstehe, dass Sie können senden Sie einzelne Dateien als Abhängigkeiten mit Spark Python-Programme. Aber was ist mit vollwertigen Bibliotheken (z.B. numpy)? Tut Funke eine Möglichkeit haben, verwenden Sie eine bereitgestellte Paket-manager (z.B. pip) zum installieren von

apache-spark dependencies distributed-computing hadoop shared-libraries

Update DynamoDB-Element mit DynamoDBMapper in Java

2 Antworten

Wie kann ich ein update DynamoDB-Element mit DynamoDBMapper? Habe ich mehrere Prozesse mit der DynamoDB-Tabelle, so erhalten Sie + speichern erstellen Inkonsistenz. Ich kann nicht finden, das Verfahren zum aktualisieren des Elements, das mit DynamoDBMapper. InformationsquelleAutor meeza

amazon-dynamodb distributed-computing java

wie interpretieren RDD.treeAggregate

1 Antworten

Lief ich in diese Zeile in der Apache-Spark source code val (gradientSum, lossSum, miniBatchSize) = data .sample(false, miniBatchFraction, 42 + i) .treeAggregate((BDV.zeros[Double](n), 0.0, 0L))( seqOp = (c, v) => { //c: (grad, loss, count), v: (label, features)

apache-spark distributed-computing rdd scala

Unterschied zwischen rdd.sammeln().toMap zu rdd.collectAsMap()?

2 Antworten

Gibt es Auswirkungen auf die Leistung, wenn ich collectAsMap auf meine RDD statt rdd.sammeln().toMap ? Ich habe einen Schlüssel-Wert rdd und ich konvertieren möchten, um HashMap so weit ich weiß, collect() nicht effizient auf große Datensätze, wie

apache-spark distributed-computing scala

Wie der transfer-Datei mit IOUtils.kopieren Sie die durch die Java-Sockets

1 Antworten

Zurzeit arbeite ich mit Java-Sockets. Erstellt habe ich eine server-side-code-und client-Seite code transfer file über socket. Ich habe erfolgreich übertragen der Dateien vom client zum server mit dem gleichen system, aber wenn ich versuchte, mit der die

distributed-computing java sockets

Distributed-computing-framework für Clojure/Java

4 Antworten

Entwickle ich eine Anwendung, wo ich verteilen müssen eine Reihe von Aufgaben, die über einen potenziell sehr großen cluster von verschiedenen Maschinen. Idealerweise möchte ich eine sehr einfache, idiomatische Weise, dies zu tun in Clojure, z.B. so

clojure distributed-computing java parallel-processing

Hadoop, Web-Authentifizierung mit Kerberos

1 Antworten

Ich konfiguriert hadoop verwenden von kerberos, funktioniert alles, ich kann surfen hdfs, jobs, etc. Aber fehlgeschlagen http-Authentifizierung. Ich benutze hadoop-0.20.2 in cdh3u2, die unterstützt HTTP SPNEGO. HTTP-Authentifizierung Verwandte Konfigurationen in core-site.xml sind wie folgt: <!-- HTTP web-consoles

cloudera distributed distributed-computing hadoop

Funke <Konsole>:12: Fehler: nicht gefunden: Wert sc

7 Antworten

Schrieb ich Folgendes: val a = 1 to 10000 val b = sc.parallelize(a) und es zeigt Fehlermeldung sagen: <console>:12: error: not found: value sc Hilfe? Wo ist sc definiert? sc ie. Spark-Rahmen zur Verfügung gestellt wurde, wenn

apache-spark distributed-computing scala

Wie kann ich cluster a spring mvc Anwendung?

2 Antworten

Ich habe eine web-Anwendung geschrieben mit der Feder auf einem jetty-server. wegen der Lastverteilung habe ich zum replizieren von http-Sitzungen und spring-security-Kontexte über den web-Server. Kann jemand mir ein Beispiel, wie man das möglich machen? den mvc-Controller

distributed-computing spring-mvc spring-security

java.lang.ClassNotFoundException bei RMI,keine security manager RMI class loader disabled

2 Antworten

Habe ich erstellt unter bat-Datei, um mein RMI server @echo Off set classpath=C:\Program Files\Apache Software Foundation\Tomcat 6.0\webapps\RMI_Server\bin\; set classpath=C:\policy.all; set classpath=C:\Program Files\Apache Software Foundation\Tomcat 6.0\webapps\RMI_Server\log4j-1.2.12.jar; set classpath=C:\Program Files\Apache Software Foundation\Tomcat 6.0\webapps\RMI_Server\log4j-1.2.15.jar; set classpath=C:\Program Files\Apache Software Foundation\Tomcat 6.0\webapps\RMI_Server\log4j.jar;

distributed-computing java rmi

Python Multiprocessing, Verteilte Cluster

4 Antworten

Ich bin auf der Suche nach einem python-Paket, das tun können, multiprocessing, nicht nur zwischen verschiedenen Kernen in einem einzigen computer, sondern auch mit einem cluster, verteilt auf mehrere Maschinen. Es gibt eine Menge von verschiedenen Pakete

distributed-computing multiprocessing python

Spark CollectAsMap

3 Antworten

Ich würde gerne wissen, wie collectAsMap arbeitet in der Funke. Genauer gesagt würde ich gerne wissen, wo die aggregation der Daten aller Partitionen stattfinden wird? Die aggregation erfolgt entweder im master-oder Arbeiter. Im ersten Fall wird für

apache-spark distributed-computing worker

Verteilte Job-scheduling -, management-und reporting

6 Antworten

Vor kurzem hatte ich einen spielen, um mit Hadoop und war beeindruckt, es ist Planung, management und reporting von MapReduce-jobs. Es erscheint die Verteilung und Ausführung von neuen Arbeitsplätzen ganz nahtlos, so dass die Entwickler konzentrieren sich

distributed-computing hadoop java job-scheduling

Unterschied zwischen zentralisierten und verteilten computing

9 Antworten

Ich bin verwirrt zwischen zentraler und dezentraler Datenverarbeitung.Kann einer mir sagen, Unterschiede zwischen zentralisierten und verteilten computing? vielen Dank im Voraus Scheint, es ist off-topic SO, denn es geht nicht um exakte Programmierung problem. InformationsquelleAutor user2884098 |

distributed-computing

spring-boot-Anwendung im cluster

4 Antworten

Ich bin die Entwicklung einer spring-boot-Anwendung. Seit dem Frühjahr boot erstellt ein .jar-Datei für eine Anwendung. Ich möchte cluster diese spezielle Anwendung auf verschiedene server. Können sagen, ich erstellen eine jar-Datei und lief ein Projekt, dann sollte

cluster-computing distributed-computing embedded-tomcat-7 java spring-boot

Wie zum ausführen von Java-Programmen über ssh?

3 Antworten

Sagen wir, ich machen ein Java Projekt in Eclipse, 3-10 Klassen und eine davon hat eine main(String args) - Methode, beginnt das ganze Programm und übernimmt 4 Argumente auf der Kommandozeile. Lassen Sie uns auch sagen, dass

distributed-computing java ssh terminal unix

Leader-Election-Algorithmus

3 Antworten

Ich bin die Erkundung verschiedener Architekturen in cluster-computing. Einige der beliebtesten sind: Master-Slave. RPC ... In Master-slave, der normale Weg ist, um eine Maschine als master & eine Reihe von Maschinen, die wie Sklaven controlled by master.

algorithm cluster-computing distributed-computing master-slave

shared memory vs. distributed memory und Multi-Thread-Multiprozess-vs

1 Antworten

Ich bin erlernen der parallelen Programmierung durch mich. Ich Frage mich, ob verteiltem Speicher ist immer Multiprozess-und multithread ist immer shared memory? wenn Multiprozess kann sowohl für distributed memory und shared memory? Vielen Dank und Grüße! InformationsquelleAutor

distributed-computing parallel-processing shared-memory

Fehler bei ausführen von Hadoop Beispiel auf einzelnen Knoten-cluster

2 Antworten

Ich bin mit den word count Beispiel von hadoop. Im folgenden ist die Fehlermeldung, die ich erhalte: -bash-4.1$ ./hadoop jar /home/chanders/Hadoop/bin/hadoop-examples-0.20.203.0.jar wordcount /usr/temp_hadoop /usr/output Warning: Maximum heap size rounded up to 1024 MB Warning: Maximum heap size

distributed-computing hadoop mapreduce

Was ist spark.- Treiber.maxResultSize?

1 Antworten

Den ref sagt: Grenze der Größe der serialisierten Ergebnisse aller Partitionen für jede Spark-Aktion (z.B. sammeln). Sollte mindestens 1M, oder 0 für unbegrenzt. Jobs werden abgebrochen, wenn die Gesamtgröße oberhalb dieser Grenze. Mit einem hohen Grenzwert möglicherweise

apache-spark communication configuration distributed-computing driver

pyspark : NameError: name 'Funke' ist nicht definiert

2 Antworten

Kopiere ich die pyspark.ml Beispiel aus dem offiziellen Dokument der website: http://spark.apache.org/docs/latest/api/python/pyspark.ml.html#pyspark.ml.Transformer data = [(Vectors.dense([0.0, 0.0]),), (Vectors.dense([1.0, 1.0]),),(Vectors.dense([9.0, 8.0]),), (Vectors.dense([8.0, 9.0]),)] df = spark.createDataFrame(data, ["features"]) kmeans = KMeans(k=2, seed=1) model = kmeans.fit(df) Aber, das obige Beispiel würde

apache-spark apache-spark-ml distributed-computing machine-learning pyspark

Wie verwenden Sie multi-thread-Verbraucher in kafka 0.9.0?

3 Antworten

Den doc von kafka geben einen Ansatz über mit folgenden beschreibt: Einen Consumer-Pro-Thread:Eine einfache option zu geben, ist jeder thread seine eigenen consumer > Instanz. Mein code: public class KafkaConsumerRunner implements Runnable { private final AtomicBoolean closed

apache-flink apache-kafka distributed-computing java multithreading

Erstellen einer verteilten java-Anwendung?

3 Antworten

Erste von allen, ich habe eine konzeptionelle Frage, Hat das Wort "verteilt" nur bedeuten, dass die Anwendung auf mehreren Maschinen? oder gibt es andere Möglichkeiten, in denen eine Anwendung betrachtet werden kann, verteilt werden (zum Beispiel, wenn

client-server distributed-computing java multithreading web-services

Explodierenden verschachtelten Struct in Spark-dataframe

3 Antworten

Arbeite ich durch die Databricks Beispiel. Das schema für den dataframe aussieht: > parquetDF.printSchema root |-- department: struct (nullable = true) | |-- id: string (nullable = true) | |-- name: string (nullable = true) |-- employees:

apache-spark databricks distributed-computing scala spark-dataframe

Was ist der Unterschied zwischen einem verteilten system und einem gruppierten system?

1 Antworten

Beide sind definiert als eine Gruppe von Computern, arbeiten zusammen und geben dem Endbenutzer eine Wahrnehmung von einem einzigen computer ausgeführt dahinter. Also, was ist hier der Unterschied? Soweit ich das verstanden habe, ein cluster ist in

cluster-computing distributed distributed-computing

Cloud (virtuelle) Maschinen verfügbar für kostenlos für open-source testen?

2 Antworten

Jemand wissen über die Orte, die in die cloud, wo Sie erstellen können (virtuelle) Maschinen (wie z.B. Amazon EC2) nutzen für Ihre EDV-Aufgaben - Orte, die bieten eine Reihe (mindestens 5-10) freien Maschinen, wenn Sie verwendet werden

cluster-computing distributed-computing open-source virtual-machine

Könnte Node.js laufen client-Seite in Chrome mit seinem native client (werden bald veröffentlicht)

4 Antworten

Google Chrome native client wird bald veröffentlicht. http://blog.chromium.org/2011/02/native-client-getting-ready-for-takeoff.html Wäre dies ermöglichen node.js zu werden, laufen im browser ermöglicht verteilte Anwendungen miteinander kommunizieren, ohne Umweg über den server? InformationsquelleAutor Sycren | 2011-02-22

client distributed-computing javascript node.js p2p

C++ Winsock P2P

2 Antworten

Szenario Tut jedermann haben alle gute Beispiele für peer-to-peer (p2p) - networking in C++ mit Winsock? Es ist eine Anforderung, die ich für einen Kunden, der speziell braucht, um diese Technologie zu nutzen (Gott weiß warum). Ich

c++distributed-computing p2p winsock winsockets

Was ist das Terracotta?

4 Antworten

Was ist Terrakotta? Welche Dienstleistungen bietet es an? Welche Probleme es lösen? Welche anderen Produkte lösen Probleme ähnlich denen, die Terrakotta löst? InformationsquelleAutor der Frage Derek Mahar | 2010-05-03

distributed-computing java terracotta

Zentrale Java-Protokollierung

4 Antworten

Ich bin auf der Suche nach einem Weg, zu zentralisieren die Anmeldung betrifft verteilter software (in Java geschrieben), das wäre ganz einfach, da das system in Frage, hat nur einen server. Aber wenn man bedenkt, dass es

distributed-computing java log4j logback logging

was ist Tierpfleger Hafen und seine Nutzung?

1 Antworten

Ich bin ganz neu für Tierpfleger Hafen, durch die ich komme über aus vergangenen Tagen. Ich stellte mit zookeeper-port keyword auf zwei Anlass: bei der Konfiguration von neo4j db-cluster (link) und während der Ausführung kompiliert voltdb-Katalog (link)

apache-zookeeper distributed-computing java neo4j voltdb

Bedeutung von inter_op_parallelism_threads und intra_op_parallelism_threads

1 Antworten

Kann jemand bitte erklären Sie die folgenden TensorFlow Bedingungen inter_op_parallelism_threads intra_op_parallelism_threads oder, bitte, die links zu der richtigen Quelle mit der Erklärung. Ich führte ein paar tests durch ändern der Parameter, aber die Ergebnisse sind nicht konsistent,

distributed-computing parallel-processing python tensorflow

was ist ein Daten-Serialisierung-system?

2 Antworten

laut Apache AVRO-Projekt "Avro ist eine Serialisierung system". Sagen Daten-Serialisierung-system, bedeutet es, dass die avro ist ein Produkt oder eine api? ich bin auch nicht aufhören zu wissen, was ein Daten-Serialisierung-system ist? für jetzt, mein Verständnis ist,

data-serialization distributed-computing hadoop

Spark Java-Fehler: überschreitet Integer.MAX_VALUE

3 Antworten

Ich versuche, mit Funke für einige einfache machine-learning-Aufgabe. Ich verwendet pyspark und Funken 1.2.0 zu tun, eine einfache Logistische regression-problem. Ich habe 1,2 Millionen Datensätze für das training und ich Hash-Funktionen, die Datensätze. Wenn ich die Anzahl

apache-spark distributed-computing java logistic-regression python

Suchen/Finden Sie eine Datei-und Datei-Inhalte in Hadoop

3 Antworten

Ich arbeite derzeit an einem Projekt mit Hadoop DFS. Ich merke, es ist keine Suche oder den Befehl "suchen" im Hadoop-Shell. Gibt es eine Möglichkeit suchen und finden eine Datei (z.B. testfile.doc) in Hadoop DFS? Macht Hadoop-Unterstützung

distributed distributed-computing file filesystems hadoop

Methode zum replizieren von sqlite-Datenbank auf mehreren Servern

3 Antworten

Entwickle ich eine Anwendung, die verteilt sind, und ich habe eine SQLite-Datenbank, die geteilt werden muss zwischen verteilten Servern. Wenn ich in serverA, und ändern sqlite Zeile, muss diese änderung in den anderen Servern sofort, aber wenn

distributed-computing high-availability replication rethinkdb sqlite

Wie funktioniert Spark-Aggregat-Funktion - aggregateByKey Arbeit?

2 Antworten

Sagen, ich habe ein system verteilen sich auf 3 Knoten und meine Daten verteilt zwischen diesen Knoten. ich habe zum Beispiel einen test.csv-Datei, die vorhanden ist, auf alle 3 Knoten, und es enthält 2 Spalten von: **row

apache-spark distributed-computing

Heartbeat-Protokolle/Algorithmen oder best practices

5 Antworten

Vor kurzem habe ich Hinzugefügt einige load-balancing-Funktionen, um ein Stück software, die ich geschrieben habe. Es ist ein Netzwerk-Anwendung, die einige Daten verarbeiten, basiert auf der Eingabe aus einer SQL-Datenbank. Da das Knirschen kann ziemlich intensiv habe

distributed-computing network-programming network-protocols sockets

Spark - repartition () vs coalesce ()

7 Antworten

Gemäß Learning Spark Beachten Sie, dass eine Neupartitionierung der Daten ist eine Recht teure operation. Spark hat auch eine optimierte version neu partitionieren() aufgerufen coalesce() , ermöglicht die Vermeidung von Daten-Bewegung, aber nur, wenn Sie eine Verringerung

apache-spark distributed-computing rdd

Wie schreibe ich in CSV in Spark

6 Antworten

Ich versuche zu finden, eine effektive Art und Weise speichern das Ergebnis meiner Funke Job als csv-Datei. Ich bin mit der Funke mit Hadoop und bisher alle meine Dateien gespeichert werden part-00000. Irgendwelche Ideen, wie man meine

apache-spark csv distributed-computing file hadoop

Konvertieren Sie eine einfache Zeile in RDD in Spark

1 Antworten

Habe ich eine einfache Linie: line = "Hello, world" Möchte ich konvertieren es in ein RDD mit nur einem element. Ich habe versucht sc.parallelize(line) Aber es bekommen: sc.parallelize(line).collect() ['H', 'e', 'l', 'l', 'o', ',', ' ', 'w',

apache-spark distributed-computing pyspark python rdd

Akka oder eine ähnliche Alternative für Golang, um verteilte Nebenläufigkeit zu unterstützen?

5 Antworten

Ich weiß, golang ist sehr gut auf die Parallelität mit der integrierten Unterstützung, aber es scheint zu mir, Sie werden nicht verteilt, was wäre also die framework/Bibliothek erlauben, uns zu schreiben, Erzeuger/Verbraucher-Anwendungen in einer verteilten Umgebung. InformationsquelleAutor

distributed-computing go

Ist es möglich, einem bestehenden Thema in Kafka 0.8.2 Partitionen hinzuzufügen?

2 Antworten

Habe ich eine Kafka-cluster läuft mit 2 Partitionen. Ich war auf der Suche nach einem Weg, um zu vergrößern die partition bis 3 zählen. Aber ich will nicht zu verlieren, die vorhandenen Nachrichten in das Thema. Ich

apache-kafka distributed-computing java

Verketten von Datensätzen verschiedener RDDs in Apache funken mit Scala

2 Antworten

Gibt es eine Möglichkeit zum verketten der Daten von zwei verschiedenen RDDs in der Funke? Voraussetzung ist - ich erstelle zwei intermediate RDDs mit scala, das hat die gleichen Spaltennamen kombinieren müssen diese Ergebnisse sowohl der RDDs

apache-spark apache-spark-sql distributed-computing rdd scala

"Eventuelle Konsistenz" vs "Starke Eventual Consistency" vs "Starke Konsistenz"?

1 Antworten

Stieß ich auf das Konzept der "Starken" Eventual Consistency" . Es soll stärker sein als "Eventual Consistency", aber schwächer als "Starke Konsistenz"? Könnte mir jemand erklären, die Unterschiede zwischen diesen drei Konzepten mit anwendbaren Beispielen? http://en.wikipedia.org/wiki/Eventual_consistency#Strong_Eventual_Consistency http://en.wikipedia.org/wiki/Conflict-free_replicated_data_type

distributed-computing