sábado, 3 de agosto de 2013

     Um problema muito comum quando capturamos um HTML com o python é termos o seguinte formato de texto armazenado:

noticia = [u'IBovespa fecha a semana em alta de 2%']
     Se, neste exemplo, quisermos fazer uma comparação com a string 'IBovespa fecha a semana em alta de 2%' a resposta da nossa condicional será um false. Para resolver este problema, temos que normalizar nosso tipo unicode em ASCII, incluindo as seguintes linhas em nosso código:

import unicodedata      #para pode utilizar o comando unicodedata.normalize

noticia = [u'IBovespa fecha a semana em alta de 2%']
aux = unicodedata.normalize('NFKD', noticia).encode('ascii','ignore')

print aux
'IBovespa fecha a semana em alta de 2%'
     Isto resolve nosso problema.
     Até o próximo post!


0 comentários:

Postar um comentário