よくAI学習でプログラミング言語 Pythonの話題が出ますよね!でもAIと聞くだけで「難しそう」と・・・
そしてAIとPythonはセットの様な状況になっているので、AIに関わりが無いエンジニアでもPythonは少し取っつき難かったり、
Pythonを使って何をどう活かすのかが想像出来ない状況もあるかもしれないと。
今回、実際に仕事でPythonを利用してWebスクレイピングを使用する機会がありましたので、「こういうのしたかった!」、「聞いた事はあったけど、難しそうでちょっと・・・」という方の参考になればと思いますので、参考にしてみて下さい!
Windows10 64bitにPythonをインストール
※2020年4月10日時点
- Pythonを公式サイトからダウンロード
- Pythonをインストール
- Pythonが正常にインストールさいているか確認
- ライブラリ、requestsをインストール
- ライブラリ、beautifulSoupをインストール
1.Pythonを公式サイトからダウンロード
以下の、Python公式サイトWindows版ダウンロードページ、
Note that Python 3.8.2 cannot be used on Windows XP or earlierと記載されている
赤枠部分のDownload Windows x86-64 executable installerをダウンロードします。
Python公式サイト – Windowsダウンロードページ
Pythonをインストール
ダウンロードしたexeファイルを起動すると以下のインストーラー画面が表示されます。
- Add Python 3.8 to Pathにチェックを入れます
- Install Nowをクリック
以下画面、Setup was successfulと表示されていれば正常にインストールが終了です。
コントロールパネルからプログラムと機能からPythonをアンインストールし再度、インストールを行ってみて下さい。
Pythonが正常にインストールされているか確認
コマンドプロンプトを起動し、pythonと入力しEnterを押して下さい。
20~30秒待っても、何も起こらない場合は、再度Enterを押して下さい。
以下、画面と同様のバージョンが表示されれば正常にインストール成功です。
スクレイピングで利用するライブラリをインストール
Pythonのインストールが終了しましたので、次にWebスクレイピングで使用するライブラリを2つインストールします。
- requestsをインストール
- beautifulSoupをインストール
requestsライブラリをインストール
requestsはHTTPライブラリで、スクレイピングを行う該当URLページを取得する際に利用します。
コマンドプロンプトに以下を入力しEnterを押します。
py -m pip install requests
beautifulSoupライブラリをインストール
beautifulSoupはHTMLページを解析する際に利用するライブラリです。
コマンドプロンプトに以下を入力し、Enterを押します。
py -m pip install beautifulsoup4
以上で、PythonのインストールからWebスクレイピングで利用するライブラリのインストールは終了です!
pip ~ upgrade~ と表示されている場合は、pipのバージョンが古い為のwarningです。
以下、コマンドをコマンドプロンプトで入力しEnterを押す事でpipのバージョンアップが可能です。
python -m pip install –upgrade pip
次は、実際にWebスクレイピングを行って行きましょう!
