【スクレイピング】取得したページの保存

スクレイピング
スクレイピング準備記事
関連記事

【やりたいこと】取得したページを保存したい!

以上の記事の続きとなります。

今回は、取得したWebページの保存についてです。

こちらも簡単なので、さっそくやってみましょう

【5分でできる】入力をちょっと変えるだけ

※ダウンロード時間は5分の中に含まれていません。

1.使用したもの

・Virtual box

Oracle VM VirtualBox

・Vagrant

Vagrant by HashiCorp
Vagrant enables users to create and configure lightweight, reproducible, and portable development environments.

・Term Term

https://ja.osdn.net/projects/ttssh2/

・Python3.4

2.手順

※下記の記事の内容を完了しているものとして、進めていきます。

①取得したページの保存

python urlopen_encoding.py > dp.html

上記を実行することで、取得したページが共有フォルダに保存されます。

②確認

共有フォルダ内を確認します。

取得したページが保存されていることが分かります。


保存したWebページを開いてみます。

Chromeで開きます。

上記の画像のように、取得したページと同じページが表示されていれば成功です。

【最後に】参考図書の紹介

以下の書籍は、私がPythonスクレイピングを勉強するにあたって、使用した書籍です。

「Python逆引き大全」は、秀和システムの技術書読み放題サービス「10×Eng」で読めます。最初の2週間は無料、それ以降は、月額900円で利用できます。

「プログラミング超初心者が初心者になるためのPython入門」はkindle unlimitedで読めます。

 

コメント

タイトルとURLをコピーしました