ツイッターの文字、WEBサイトの情報、アップストアー等のレビュー文言を取得するのに

スクレイピングを行い、そのデータを基にしてテキストマイニングを行っていこうと思います。

スポンサーリンク

スクレイピングでデータを取得する手順

## コマンドプロンプトを起動する(ファイル名を指定して実行→cmd 等)

# 1)pythonがインストールされている事を確認 
python -V
> Python 3.x.x

↓インストールされていない場合はこちらを参照しインストールする

http://www.aoki.ecei.tohoku.ac.jp/~ito/python_windows.html

# 2)requestsをインストールする
pip install requests

# 3)取得したいURLを指定してデータ取得

## pythonの入力モードを起動
python

## requests機能を呼び出し、指定したURLの情報を取得する
import requests
r = requests.get('{urlを指定}')
with open('test.html', 'w') as file:
       file.write(r.text)

これで実行したディレクトリ直下に、test.htmlという名前で指定したURL内のコードが取得される。

おすすめの記事