2020年06月09日

Python3 Unicode(UTF-16) --> SJIS 変換

・Windowsのシステムファイルは、日本語がUnicode(UTF-16)で記録されている
・そのようなデータを入力してパース処理をする際、出力をSJISに変換するサンプルコード

#入出力ファイルのオープンと入力ファイル読込
import sys,io
ifile = 'unicode.dat'
ofile = 'sjis.txt'
DAT = open(ifile, 'rb').read()
TXT = open(ofile, 'w')

#Unicode5文字分をバッファへ転送(入力ファイルの3byte目から)
jp_uni = bytes(DAT[2:12])

#SJISへ変換してテキストファイルへ出力
TXT.write(jp_uni.decode('utf-16'))

#Windowsではデフォルト文字コードがSJISのため、decodeメソッドでSJISに変換される
ラベル:Python
posted by 貝貝 at 14:37| Comment(0) | Python | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。