この特殊文字を削除する方法は?

python string
この特殊文字を削除する方法は?

私は次のことを観察したとき、私は私のファイルの行を統合しようとしていました。

word1 word2 + word1 word2

これらの行が結合されない理由を理解できなかったため、vimでファイルを開き、 `:set list`を使用して特殊文字があるかどうかを確認し、これを見つけました。

 word1 word2
 word1 word2

Pythonでこの単語をきれいにする方法がわかりません。 何文字上の任意の提案があるかもしれないとどのようにこれを清掃することができますか?

  11  5


ベストアンサー

U + FEFFはhttp://en.wikipedia.org/wiki/Byte-order_mark[Byte Order Mark]文字であり、ドキュメントの先頭でのみ発生します。 ドキュメントでは、http://unicode.org/faq/utf_bom.html#bom6 [これは「ゼロ幅非破壊スペース」として扱われるべきです]。 これにより問題が発生する場合は、他のキャラクターと同様に削除できます。

>>> s = u'word1 \ufeffword2'
>>> s = s.replace(u'\ufeff', '')
>>> s
u'word1 word2'

〜(Python 3.1または3.2では、文字列の前に `u`をドロップします)〜

23


`mytext.split(string.whitespace)`を試しましたか?

1


タイトルとURLをコピーしました