ツイッターの文字、WEBサイトの情報、アップストアー等のレビュー文言を取得するのに
スクレイピングを行い、そのデータを基にしてテキストマイニングを行っていこうと思います。
スクレイピングでデータを取得する手順
## コマンドプロンプトを起動する(ファイル名を指定して実行→cmd 等) # 1)pythonがインストールされている事を確認 python -V > Python 3.x.x
↓インストールされていない場合はこちらを参照しインストールする
http://www.aoki.ecei.tohoku.ac.jp/~ito/python_windows.html
# 2)requestsをインストールする pip install requests # 3)取得したいURLを指定してデータ取得 ## pythonの入力モードを起動 python ## requests機能を呼び出し、指定したURLの情報を取得する import requests r = requests.get('{urlを指定}') with open('test.html', 'w') as file: file.write(r.text)
これで実行したディレクトリ直下に、test.htmlという名前で指定したURL内のコードが取得される。