Pythonでディレクトリ内のファイル名を一括更新(3)
前回までで、拡張子が"txt"のテキストファイルのみを対象のディレクトリから抽出しました。今回は、その抽出されたファイルを読んで、シリアルナンバーのみを取り出すということをします。
前回も見ましたが、読みたいテキストファイルの仕様は以下のとおりです。
【Report】
日時 :YYYYMMDD
PCの型名 :PC1
PCの製造番号 :1234567CPU :Intel Core-i5 XXX
メモリ :4 GB
ディスク容量 :500GB
まずはファイルを読み込む操作をします。それにはopenという関数を用いて
open(filename,mode,encoding)
というようにします。例えばファイル名を"sample.txt"、読み込み専用"r"、encodingを"UTF-8"として読み込んだ内容をすべて変数”f”に代入する感じで
f=open("sample.txt","r",encoding="UTF-8")
のようにすればファイルの中身は変数"f"にすべて代入されます。
ただ、これだと不必要なものまで含まれてしまいますので、シリアルナンバーのみを取り出す処理が必要です。そこでまず、ファイルの中身自体を文字列として読み込むためにread()メソッドを使用します。
f.read()
こうすると、文字列として扱ってくれますが、やはりすべてを読み込んでしまうので手始めに単語ごとに分割するためにsplit()メソッドを使用します。
f.read().split()
これで単語ごとに分割されました。ここからシリアルナンバーがある単語だけを取り出したいのですが、そこは次回に回します。