TypeError: ufunc 'add' enthielt keine Schleife mit Signatur-Übereinstimmungstypen

Ich Schaffe bag of words Darstellung des Satzes. Dann nehmen Sie die Worte, die es in dem Satz zu vergleichen, um die Datei "vectors.txt", um zu erhalten, Ihre Einbettung von Vektoren. Nach dem aufstehen Vektoren für jedes Wort, das existiert in dem Satz, ich bin unter Durchschnitt werden die Vektoren der Wörter im Satz. Das ist mein code:

import nltk
import numpy as np
from nltk import FreqDist
from nltk.corpus import brown


news = brown.words(categories='news') 
news_sents = brown.sents(categories='news') 

fdist = FreqDist(w.lower() for w in news) 
vocabulary = [word for word, _ in fdist.most_common(10)] 
num_sents = len(news_sents) 

def averageEmbeddings(sentenceTokens, embeddingLookupTable):
    listOfEmb=[]
    for token in sentenceTokens:
        embedding = embeddingLookupTable[token] 
        listOfEmb.append(embedding)

return sum(np.asarray(listOfEmb)) / float(len(listOfEmb))

embeddingVectors = {}

with open("D:\\Embedding\\vectors.txt") as file: 
    for line in file:
       (key, *val) = line.split()
       embeddingVectors[key] = val

for i in range(num_sents): 
    features = {}
    for word in vocabulary: 
        features[word] = int(word in news_sents[i])        
    print(features) 
    print(list(features.values()))  
sentenceTokens = [] 
for key, value in features.items(): 
    if value == 1:
       sentenceTokens.append(key)
sentenceTokens.remove(".")    
print(sentenceTokens)        
print(averageEmbeddings(sentenceTokens, embeddingVectors))

print(features.keys())

Nicht sicher, warum, aber ich bekomme diese Fehlermeldung:

TypeError                                 Traceback (most recent call last)
<ipython-input-4-643ccd012438> in <module>()
 39     sentenceTokens.remove(".")
 40     print(sentenceTokens)
---> 41     print(averageEmbeddings(sentenceTokens, embeddingVectors))
 42 
 43 print(features.keys()) 

<ipython-input-4-643ccd012438> in averageEmbeddings(sentenceTokens, embeddingLookupTable)
 18         listOfEmb.append(embedding)
 19 
---> 20     return sum(np.asarray(listOfEmb)) / float(len(listOfEmb))
 21 
 22 embeddingVectors = {}

TypeError: ufunc 'add' did not contain a loop with signature matching types dtype('<U9') dtype('<U9') dtype('<U9')

P. S. das Einbetten Vektor sieht wie folgt aus:

the 0.011384 0.010512 -0.008450 -0.007628 0.000360 -0.010121 0.004674 -0.000076 
of 0.002954 0.004546 0.005513 -0.004026 0.002296 -0.016979 -0.011469 -0.009159 
and 0.004691 -0.012989 -0.003122 0.004786 -0.002907 0.000526 -0.006146 -0.003058 
one 0.014722 -0.000810 0.003737 -0.001110 -0.011229 0.001577 -0.007403 -0.005355 
in -0.001046 -0.008302 0.010973 0.009608 0.009494 -0.008253 0.001744 0.003263

Nach der Verwendung von np.Summe bekomme ich diesen Fehler:

TypeError                                 Traceback (most recent call last)
<ipython-input-13-8a7edbb9d946> in <module>()
 40     sentenceTokens.remove(".")
 41     print(sentenceTokens)
---> 42     print(averageEmbeddings(sentenceTokens, embeddingVectors))
 43 
 44 print(features.keys()) 

<ipython-input-13-8a7edbb9d946> in averageEmbeddings(sentenceTokens, embeddingLookupTable)
 18         listOfEmb.append(embedding)
 19 
---> 20     return np.sum(np.asarray(listOfEmb)) / float(len(listOfEmb))
 21 
 22 embeddingVectors = {}

C:\Anaconda3\lib\site-packages\numpy\core\fromnumeric.py in sum(a, axis, dtype, out, keepdims)
   1829     else:
   1830         return _methods._sum(a, axis=axis, dtype=dtype,
-> 1831                              out=out, keepdims=keepdims)
   1832 
   1833 

C:\Anaconda3\lib\site-packages\numpy\core\_methods.py in _sum(a, axis, dtype, out, keepdims)
 30 
 31 def _sum(a, axis=None, dtype=None, out=None, keepdims=False):
---> 32     return umr_sum(a, axis, dtype, out, keepdims)
 33 
 34 def _prod(a, axis=None, dtype=None, out=None, keepdims=False):

TypeError: cannot perform reduce with flexible type

Kommentar zu dem Problem

Versuchen Sie np.Summe statt. Kommentarautor: JBernardo

Jetzt bekomme ich "typeError: cannot perform reduzieren mit flexibler Typ", bezieht sich auf "C:\Anaconda3\lib\site-packages\numpy\core_methods.py in _sum(a, Achse, "dtype", heraus, keepdims)" Kommentarautor: Masyaf

InformationsquelleAutor der Frage Masyaf | 2016-01-26

python python-3.x

31

Haben Sie ein numpy array von strings ist, nicht schwimmt. Dies ist, was gemeint ist dtype('<U9') -- eine little-endian-codierte unicode-Zeichenfolge mit bis zu 9 Zeichen.

versuchen:
```
return sum(np.asarray(listOfEmb, dtype=float)) / float(len(listOfEmb))
```
Jedoch, Sie brauchen nicht numpy hier überhaupt. Man kann wirklich nur:
```
return sum(float(embedding) for embedding in listOfEmb) / len(listOfEmb)
```
Oder wenn Sie wirklich auf mithilfe von numpy.
```
return np.asarray(listOfEmb, dtype=float).mean()
```
InformationsquelleAutor der Antwort Dunes

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.