Tag: large-data

Große Daten sind Daten, die nur schwer zu verarbeiten und zu verwalten, weil seine Größe ist in der Regel jenseits der Grenzen des die verwendete software zur Durchführung der Analyse.

Datei-basierten merge-sort auf große Datenmengen in Java

Anzahl der Antworten 2 Antworten
angesichts der großen Datenmengen, die nicht in den Speicher passt, gibt es eine Bibliothek oder eine api zum ausführen Sortieren in Java? die Umsetzung wäre möglicherweise ähnlich den linux-Programm Sortieren. InformationsquelleAutor user775187 | 2011-06-11

Wie drucken Sie nur die ersten paar Zeilen der Ausgabe durch python-code?

Anzahl der Antworten 3 Antworten
Gibt es eine bestimmte Methode/Funktion zum drucken nur die ersten paar Zeilen der Ausgabe in der python 2.7. Wir wissen, dass im terminal könnten wir tun, dass durch "$head -3 " für das sehen in die ersten

Suche nach min()/max () - von einer "großen" Liste in python. ValueError: min () - argument eine leere Sequenz ist

Anzahl der Antworten 2 Antworten
Habe ich eine Liste von Listen, die sagen, dass E[ ][ ], wobei E hat zehn sub-Listen, die jeweils rund 500 Einträge. Mein Hauptanliegen ist, zu berechnen, maximal alle 5000 Werte, die verteilt in zehn sub-Listen. Nun,

Schnellste Möglichkeit zur übertragung von Excel-Tabelle Daten in SQL 2008R2

Anzahl der Antworten 6 Antworten
Kennt jemand den schnellsten Weg, um Daten von und in Excel-Tabelle (VBA-Array) in eine Tabelle auf dem SQL 2008 ohne Verwendung eines externen Hilfsprogramm (z.B. bcp)? Halten Sie im Verstand meine Datensätze sind in der Regel 6500-15000

SQL Server - Zusammenlegung von großen Tabellen ohne Speicherung der Daten

Anzahl der Antworten 3 Antworten
Ich habe einen sehr großen Satz von Daten (~3 Mio Datensätze), welche Bedürfnisse zu sein verschmolzen mit updates und neuen Aufzeichnungen auf einer täglichen Zeitplan. Ich habe eine gespeicherte Prozedur, die tatsächlich zerfällt der Datensatz in 1000

SELECT COUNT() vs mysql_num_rows();

Anzahl der Antworten 3 Antworten
Ich habe eine große Tabelle (60+) Millionen von Datensätzen. Ich bin mit der PHP-Skript zum navigieren durch die Tabelle. PHP-Skript (mit Seitenzählung) lädt sehr schnell, weil: Die table-engine InnoDB so SELECT COUNT() ist sehr langsam und mysql_num_rows()

teilen Sie große csv-text-Datei basierend auf Spalte Wert

Anzahl der Antworten 6 Antworten
Ich habe CSV-Dateien mit mehreren Spalten sortiert werden. Für Instanz, vielleicht habe ich Zeilen wie diese: 19980102,,PLXS,10032,Q,A,,,15.12500,15.00000,15.12500,2 19980105,,PLXS,10032,Q,A,,,14.93750,14.75000,14.93750,2 19980106,,PLXS,10032,Q,A,,,14.56250,14.56250,14.87500,2 20111222,,PCP,63830,N,A,,,164.07001,164.09000,164.12000,1 20111223,,PCP,63830,N,A,,,164.53000,164.53000,164.55000,1 20111227,,PCP,63830,N,A,,,165.69000,165.61000,165.64000,1 Ich würde gerne teilen bis die Datei auf der Grundlage der 3. Spalte, zB PLXS

Teilen Sie große excel-Datei, indem Sie die Anzahl der Zeilen

Anzahl der Antworten 3 Antworten
Ich habe eine große excel-Datei mit über 3000 Zeilen. Möchte ich aufteilen der Daten in Gruppen von 100 Zeilen Gibt es einen Befehl in excel, der mir helfen kann aufgeteilt werden diese Daten in verschiedene Blätter oder

Mit index auf inner-join-Tabelle in MySQL

Anzahl der Antworten 1 Antworten
Ich habe die Tabelle Foo mit 200 Millionen Schallplatten und Symbolleiste Tabelle mit 1000 Einträgen, mit der Sie verbunden sind viele-zu-eins. Es gibt Indizes für Spalten Foo.irgendwann und Bar.someField. Auch in der Bar 900 Datensätze someField von

importieren/exportieren von sehr großen mysql-Datenbank in phpmyadmin

Anzahl der Antworten 1 Antworten
ich habe eine db in phpmyadmin mit 3000000 Datensätzen. ich möchte zu exportieren, diese auf einen anderen pc. wenn ich jetzt den export dieser nur 200000 Einträge exportiert .sql-Datei, und das ist auch nicht importiert, auf dem

Generierung von großen Excel-Dateien von MySQL-Daten mit PHP aus Unternehmens-Anwendungen

Anzahl der Antworten 6 Antworten
Wir sind noch in der Entwicklung und Pflege von ein paar Systemen, die zum exportieren von berichten im Excel-format an den Endverbraucher. Die Berichte sind gesammelt aus einer MySQL-Datenbank mit einigen trivialen Verarbeitung und führen in der

Wie zu Lesen, nur Linien, die Erfüllung einer Bedingung aus einer csv in R?

Anzahl der Antworten 5 Antworten
Ich versuche zu Lesen, eine große csv-Datei in R. ich will nur Lesen und arbeiten mit einigen Zeilen, die Erfüllung einer bestimmten Bedingung (z.B. Variable2 >= 3). Dies ist ein viel kleineres dataset. Ich möchte diese Zeilen

Umgang mit sehr großen Datenmengen & just-in-time be -

Anzahl der Antworten 5 Antworten
Habe ich eine .NET-Anwendung geschrieben in C# (.NET 4.0). In dieser Anwendung, die wir gelesen haben, ein großes dataset aus einer Datei und zeigt den Inhalt in einem raster-Struktur. So, um dies zu erreichen, legte ich ein

Umgang mit großen Daten in select-Boxen

Anzahl der Antworten 3 Antworten
Hallo, ich bin mit jQuery und abrufen "Elemente", von einer meiner mySQL-Tabellen. Ich habe rund 20.000 "Artikel" in dieser Tabelle, und es wird als ein parameter für die Suche in meine form. Also im Grunde, Sie können

laden von großen Datenbank, in der listview

Anzahl der Antworten 2 Antworten
Ich habe eine Datenbank mit über 12000 Datensätze, die ich laden möchte in einem ListView. Ich bin mit BaseAdapter. Wenn ich Last items in der ListView, Es so lange dauert. Gibt es eine Möglichkeit zur Verringerung dieser

Lesen zip-Datei effizient in Java

Anzahl der Antworten 5 Antworten
Ich an einem Projekt arbeiten, das funktioniert auf eine sehr große Menge von Daten. Ich habe viele(Tausende) von zip-Dateien, die jeweils EINE einfache txt-Datei mit tausenden von Zeilen(ca 80k Zeilen). Was ich derzeit mache ist Folgendes: for(File

Schreiben Panda Dataframes in eine csv-Datei in chunks

Anzahl der Antworten 3 Antworten
Habe ich eine Reihe von großen Dateien (1M Zeilen x 20 Spalten). Aber nur 5 oder so Spalten, dass die Daten für mich von Interesse. Ich denke, ich kann die Dinge einfacher für mich vom erstellen von

Wie viel Daten können R Griff?

Anzahl der Antworten 4 Antworten
Durch "handle" ich meine, manipulieren multi-säulenartigen Reihen von Daten. Wie funktioniert die R-Stapel oben gegen tools wie Excel -, SPSS -, SAS -, und andere? Ist R ein brauchbares Werkzeug für die Suche "BIG DATA" (Hunderte von

Umgang mit sehr großen Datenmengen in MyBatis

Anzahl der Antworten 4 Antworten
Mein Ziel ist eigentlich, um dump alle Daten von einer Datenbank in eine XML-Datei. Die Datenbank ist nicht sehr groß, es sind über 300MB. Das problem ist, dass ich eine Speicher-Beschränkung von 256 MB (JVM). So offensichtlich

Die meisten effiziente Weise zu speichern und Zugriff auf eine riesige Daten-matrix in MySQL

Anzahl der Antworten 2 Antworten
Werde ich zum speichern einer großen Menge an matrix-Daten in eine mysqlDB, was ist der effizienteste Weg, um zu speichern und den Zugriff auf die Daten? Ist der Wirkungsgrad das wichtigste, wenn du die Daten in der

Rot-Schwarz-Baum Vergleich B-Baum

Anzahl der Antworten 2 Antworten
Habe ich ein Projekt, in dem ich um schnelle suchen, einfügen und löschen von Operationen auf Daten, angefangen von Megabyte Terabyte. Ich hatte studiert Datenstrukturen spät an und analysieren Sie. Spezifisch möchte ich Euch 3 Fällen und

Gibt es eine JSON-viewer zu öffnen, die großen json-Dateien (windows)?

Anzahl der Antworten 3 Antworten
Ich habe sehr großen JSON-Datei, die von mehreren GB. Ich bin auf der Suche nach einer effizienten JSON viewer. In der wir auch in der Lage, zum anzeigen von JSON im Baum-format. Verstehe ich solche großen Datei

Wie lese ich nur die Zeilen, die Erfüllung einer Bedingung aus einer csv in R?

Anzahl der Antworten 5 Antworten
Ich versuche zu Lesen, eine große csv-Datei in R., obwohl die Datei groß ist, ich will nur mit einigen Zeilen, die Erfüllung einer bestimmten Bedingung (z.B. Variable2 >= 3). Dies ist ein viel kleineres dataset. Ich möchte

Split große Datei nach Wert in einer Spalte (AWK)

Anzahl der Antworten 1 Antworten
Ich möchte teilen Sie eine große Datei (10^6 Zeilen) nach dem Wert in der 6. Spalte (über 10*10^3 einzigartige Werte). Jedoch, ich kann nicht arbeiten, weil die Anzahl der Datensätze. Es sollte einfach sein, aber es dauert

Was verursacht einen Python-Segmentierungsfehler?

Anzahl der Antworten 4 Antworten
Ich die Umsetzung Kosaraju ist Starke zusammenhangskomponente(SCC) graph-search-Algorithmus in Python. Das Programm läuft Super auf kleinen Datenmenge, aber wenn ich es auf eine super-große Graphen (mehr als 800.000 Knoten), es sagt: "Segmentation Fault". Was könnte die Ursache

D3: Wie man großen Dataset zeigt

Anzahl der Antworten 1 Antworten
Ich habe einen großen Datensatz besteht aus 10^5 Daten-Punkte. Und jetzt bin ich unter Berücksichtigung der folgenden Frage in Bezug auf große datasets: Gibt es eine effiziente Möglichkeit zur Visualisierung sehr großer datasets? In meinem Fall habe

Füge Zeilen zu einer Datei hinzu

Anzahl der Antworten 3 Antworten
Ich bin neu mit R. ich versuche, fügen Sie neue Zeilen in eine Datei mit meinen vorhandenen Daten in R. Das problem ist, dass meine Daten von über 30000 Zeilen und 13000 cols. Ich habe bereits versucht,

Mittelwert und Standardabweichung eines sehr großen Datensatzes

Anzahl der Antworten 4 Antworten
Frage ich mich, ob es gibt einen Algorithmus, der berechnet den Mittelwert und die Standardabweichung des ungebundenen Daten festgelegt. so bin ich zum Beispiel der überwachung einer Messgröße, sagen, elektrischer Strom. Ich möchte den Mittelwert von allen

Gemeinsam genutzter Speicher in Multiprocessing

Anzahl der Antworten 3 Antworten
Habe ich drei große Listen. Zunächst enthält bitarrays (Modul bitarray 0.8.0) und die beiden anderen enthalten arrays von ganzen zahlen. l1=[bitarray 1, bitarray 2, ... ,bitarray n] l2=[array 1, array 2, ... , array n] l3=[array 1,

"Große Daten" arbeiten mit Pandas

Anzahl der Antworten 13 Antworten
Ich habe versucht, ein Rätsel, eine Antwort auf diese Frage ist für viele Monate, während Sie lernen pandas. Ich nutze SAS für meine Tag-zu-Tag Arbeit und es ist großartig, denn es ist out-of-core-Unterstützung. Aber SAS ist schrecklich,

Parallel.ForEach kann eine "Out of Memory" -Ausnahme verursachen, wenn mit einem Enumerable mit einem großen Objekt gearbeitet wird

Anzahl der Antworten 3 Antworten
Ich versuche zu migrieren einer Datenbank, wo die Bilder, wo die in der Datenbank gespeichert, um einen Datensatz in der Datenbank zeigt auf eine Datei auf der Festplatte. Ich versuchte zu verwenden Parallel.ForEach um den Prozess zu