cx_Oracle - Codierung Abfrage-Ergebnis zu Raw

EDIT:

Folgende Bild zeigt mein soll-Wert.

(beide sys.stdout.Codierung und sys.stdin.encoding 'UTF-8').

Warum ist der Wert der Variablen anders als Ihre print Wert? Ich brauche die roh-Wert in eine variable.

>>username = 'Jo\xc3\xa3o'
>>username.decode('utf-8').encode('latin-1')
'Jo\xe3o'
>>print username.decode('utf-8').encode('latin-1')
João

Ursprünglichen Frage:

Ich habe ein Problem das Abfragen einer BD und Dekodierung der Werte in Python.

Bestätigte ich die DB von NLS_LANG mit

select property_value from database_properties where property_name='NLS_CHARACTERSET';

'''AL32UTF8 stores characters beyond U+FFFF as four bytes (exactly as Unicode defines 
UTF-8). Oracle’s “UTF8” stores these characters as a sequence of two UTF-16 surrogate
characters encoded using UTF-8 (or six bytes per character)'''

os.environ["NLS_LANG"] = ".AL32UTF8"

....
conn_data = str('%s/%s@%s') % (db_usr, db_pwd, db_sid)

sql = "select user_name apex.users where user_id = '%s'" % userid

...

cursor.execute(sql)
ldap_username = cursor.fetchone()
...

wo

print ldap_username
>>'Jo\xc3\xa3o'

Ich habe beide ausprobiert (wieder den gleichen)

ldap_username.decode('utf-8')
>>u'Jo\xe3o'
unicode(ldap_username, 'utf-8')
>>u'Jo\xe3o'

wo

u'João'.encode('utf-8')
>>'Jo\xc3\xa3o'

wie man die Abfragen führen zurück auf die richtige 'João' ?

InformationsquelleAutor Joao Figueiredo | 2011-10-21

Schreibe einen Kommentar